这匹“费马”有点酷

原文链接:https://micsun.blog.csdn.net/article/details/99827082

认识洪春涛,其实是在BDTC大会上,当时在微软亚太研究院的他还是一头长发,如今,身为费马科技的CEO,洪春涛用一头干练的短发迎接了老孙的来访。
这匹“费马”有点酷
费马到底是一匹什么“马”?

对于许多人来说,相对于微软亚太研究院,费马科技的名头就小多了。但如果聚焦到图数据库领域,这家由清华大学的多名博士联合组建,专注于图数据技术,为企业提供高性能图数据存储及分析平台的国家高新技术企业,还是颇有名气的。

关于费马的名称的由来,还有一个小故事,为了搞定这个名字,费马的团队展开了激烈的讨论,最终学霸们为项目起了个速度为王的名字:F=ma(费马)。F=ma是牛顿第二定律,意为“加速”;同时FMA也是计算机的乘加指令(比快更快),中文名字致敬了数学家皮埃尔.德.费马。从此快如电光的LightGraph和PandaGraph有了更快的名字“费马”。

而费马科技也没有辜负这个名字,基于自主研发的费马图数据平台,费马科技为金融、电商、电力和物联网等行业提供高性能可扩展的图数据存储和分析产品,以更科学的方法实现大数据关联关系分析。 目前已有包括中国工商银行、京东金融、搜狗搜索、国家电网、中国民生银行、拉卡拉在内的多家业内顶尖企业正通过费马图数据平台实现大规模图数据分析并获得数千倍的性能提升。

实际上,图数据库并不是一个很新的技术,图数据库是一种非关系型数据库,它是NoSQL数据库的一种类型,应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储“关系型”数据的效果并不好,其查询复杂、缓慢、超出预期,而图数据库的独特设计恰恰弥补了这个缺陷。

而在图数据库领域,比较出名的当属Neo4j,这也是图数据库领域的“前辈”,而费马图数据库和Neo4j比起来确实应该称作是“晚辈”,不过,相对于先行者,后来者也有自己的优势。

“Neo4j一个很大的问题是它整个设计的理念就是奔着1亿量级去的,这是由于它设计的时期是比较早,因此,1亿量级的节点,那个时候他们可能觉得就足够了,所以,Neo4j最大的问题是1亿级以下的节点上它都可以跑得很不错,但一旦超过1亿节点,性能就会急剧下降。但国

内的情况是,拥有上亿账户的用户比比皆是,因此,很容易就会突破1亿节点的规模,因此,就导致Neo4j在国内的应用效果大打折扣。此外,由于Neo4j毕竟设计的较早,所以有很多更先进的设计方法它并没有采用。而我们相当于站在他们的肩膀上,在做设计之前,我们会去看Neo4j的设计是怎么做的,他们的优缺点在哪里,我们会去根据这些做重新的设计。因此,我们从数据结构设计上以及设计目标上都会和Neo4j有很大的不同。”洪春涛侃侃而谈。

而基于这样的设计,再加上使用了效率更高的C++语言,相对于其他的图数据库,费马图数据库的性能快百倍,内存消耗少十倍。因此,从这个意义上来说,费马正如其名,实际上就是一匹动如闪电的“快马”。

为什么要创立费马

虽然费马在图数据库领域是一马当先的一匹“快马”,但同软件帝国微软比起来,几乎可以忽略不计。那洪春涛为何要舍弃在微软的优厚工作,转而走一条创业的艰辛之路呢?

“从小的目标说,做图数据的平台、图计算、图数据库这些技术,是觉得图计算技术从现实上会有用,我们既有这个历史的积累,又觉得这个有前景,所以希望去做一个最好的图计算、图数据的平台。而从更长远、更广阔的角度说,就是希望能够在国内做一家比较好的系统软件的公司,因为我们整个实验室一直在做系统软件,我自己也做过很多的系统软件,而在国内,其实是没有一个真正称得上成功的系统软件公司的。”洪春涛如此解释自己创立费马的原因。

“国内为什么一直没有比较好的系统软件公司,国内的软件公司为什么一直成长不起来,我也一直在思考这个问题,我觉得还是需要有一个商业化的运作,既要有高水平的学生、程序员加入进来,更需要有商业化的运作,可以持续的投入时间、精力以及资金。我创立这个公司也是希望能够把这条路走通,从而可以告诉国内的这些做系统软件的人,这条路是可以走通的,在中国也是可以孕育出一个好的系统软件公司的。”洪春涛坚定的说。

洪春涛接着详细的解释了中国目前没有好的系统软件公司的原因,他认为,一方面,从系统人才的培养上,国内确实起步较晚,另一方面,系统软件需要长时间积累,而由于国内起步较晚,因此,就不太可能有长时间积累的过程;第三,国内缺乏做系统软件的风气以及商业氛围,很多时候是在模仿。

“很多时候大家并不觉得这有什么太大的问题,但是作为有‘洁癖’的人。我们希望从底层就做得和人家不一样,我们要做得更彻底,彻底去掌握其中的关键技术,而不是说去稍微改一改,满足一个很低端的需求,我们更希望从整个系统的角度来掌控。”洪春涛说。

正如洪春涛所说,虽然同是做图数据库,但费马科技确实是扎扎实实的从最底层做起,团队重构了图数据系统,优化了系统可用性,内置了大量的算法,封装接口等等,支持丰富的接口和调用语言,并提供数据快速导入导出、可视化等外围工具,便于管理和使用,使其更适应商业应用场景。而洪春涛所说提及的“洁癖”,实际上是指整个开发团队,对于代码严谨性和简洁性的要求。也就是说,每段代码,都会写两遍,第一遍的目的是实现功能、跑通程序,第二遍是更合理更简洁更完美的实现,这种良好的代码编写习惯,也为费马系统的严谨性、可靠性、高效率打下了良好的基础,而这,也是费马系统快如闪电的秘密之一。

图数据库的未来

费马所”押注”的图数据库,其实在金融方面应用比较广泛,比如说,在贷款的背调工作中,图数据库就能发挥重要的作用,可以通过图数据库去研究贷款人的社交关系、交易关系,从而判断贷款人的风险等级。事实上,金融方面基本上各个领域,都同图数据库有着或多或少的联系。

此外,在公共安全方面,图数据库也有很多应用,特别是在研究关联性的领域,图数据库可以发挥非常重要的作用。但洪春涛表示,现在图数据库和图计算平台本身还是处于一个比较早期的阶段,很多方面都不标准,比如说没有一个统一的、标准的接口,因此需要像费马这样的公司,来统一标准、规范接口。另一方面,还需要有教育、培养出更多图数据库领域的人才。

此外,图数据库从系统、技术上还有很多可以做的事情,比如从性能上面,因为图计算本身很复杂,现在很多系统只要数据量大到一定的程度,就会变的非常缓慢,甚至无法使用,这就需要从系统上去进行改进,而这还需要一段很长的时间。

另外,还有一些比较现实的实践上的问题,比如说超大数据量的时候怎么处理,哪些问题应该用用图数据库来解决,哪些东西应该用图计算来解决,现在也都还没有一个比较标准的答案,所以基本上还是靠自己一个个问题去思考。

洪春涛认为,未来,图数据库肯定会和人工智能做更紧密的结合,包括图数据网络这些技术,它实际上可以帮助用户去更接近他真正要实现的场景,所以它会往场景方向上继续发展。

要做中国版的Oracle

谈到费马的目标,洪春涛坦言,数据库巨头Oracle是他最想模仿的目标。不过,洪春涛也深知要成为中国版Oracle的不易。

“做系统软件,要有一点理想主义。因为一个系统刚开始做的时候肯定不如老系统,会有一些短板,这个时候是需要坚持的,你要坚持不断改进它,慢慢赶上来。这段时间,可能是系统软件公司最容易‘死’掉的时间,所以我觉得很重要一点,就是要有一些理想主义,要坚持以自己认为对的方向走下去。而太多的国内公司会屈服于现实,为了活下去而改变自己的初衷。在这一点上,我们的整个团队还是比较一致的。而且从目前看来,整个投资的环境对我们还是比较友好的,因此,我们可以按照我们自己的节奏,一步一步的走下去!”洪春涛最后说。

————————————————

作者:CSDN孙浩峰

上一篇:spring-data-neo4j了解


下一篇:neo4j删除节点和关系