社区动态新闻资讯
墨天轮风云人物访谈录:揭开创业的神秘面纱,走出去做国际化市场
导读: 图数据库在近十年是发展最为迅猛的数据库类型。NebulaGraph 在图数据库领域表现也是相当出色。今年9月悦数科技获得了新一轮的融资,NebulaGraph 也将开启商业化征程。作为悦数科技的领航者 CEO 叶小萌是在什么机遇下进入图数据库赛道?对于国产图数据库的当前困境和发展方向又有哪些新观点?墨天轮邀请了叶小萌先生,针对国产图数据库的相关问题进行回答与解读。
—— 以下为采访全文 ——
🎤 墨天轮:近几年图数据库的发展和应用迅猛增长,请您分享一下您当时选择这个赛道创业的一些想法和契机,以及悦数和 NebulaGraph 名字的由来?
叶小萌: 选择这个赛道的原因其实不像多数人想象的那么神秘莫测。我在创业初期,其实也没有什么选择,主要是因为我自己多年图数据库的从业背景。从 Facebook 到蚂蚁金服这十几年的时间都是在做图数据库,所以是自己比较了解而且擅长的领域。当时也机缘巧合地看到了图数据库崛起的机会,所以就很自然地从蚂蚁金服出来选择了图数据库作为创业的赛道。总的来说,对这个赛道的选择算是水到渠成。
至于公司和产品名的由来:公司名其实和产品名是结合起来的,因为 NebulaGraph 中的 Nebula 其实就是星云的意思,我们希望 NebulaGraph 这款图数据库能够像星云一样容纳海量的数据;而悦数这个公司名其实也是想表达希望用户用我们的产品更高效的利用他们自己的数据,从而获得事业上的成功。那这个结果不仅让我们的用户愉悦,也让我们自己愉悦,这也就是“悦数”的由来。
🎤 墨天轮:相较于 Neo4j,NebulaGraph 有哪些差异化的优势?目前您认为 NebulaGraph 最成功的标杆应用案例是什么?
叶小萌: 相较于 Neo4j,NebulaGraph 的优势还是比较明显的。这里我从以下三点来对比一下两者的差异以及 NebulaGraph 的优势:
NebulaGraph 是一个分布式的图数据库,而 Neo4j 是一个单机版的图数据库,这里的差别本身就已经很大了。 从架构上来说,Neo4j 除了是单机版,它整个内核因为是 Java 写的,所以在压力很大的情况下性能是有问题的。 而 NebulaGraph 的内核是用 C++ 写的,相对来说在压力比较大的情况下,它整体的表现会更平稳一些。 NebulaGraph 目前是开源的,但 Neo4j 在当前阶段已经是闭源了。 至于 NebulaGraph 最成功的标杆,其实经过四年左右的发展,NebulaGraph 不管是在社区,还是在商业化方面都已经获得了一批重量级的标杆客户。 从社区的角度来说,我们有国内的支持,国内80%以上的互联网企业,包括百度、腾讯、美团、快手、小红书、知乎等,都是我们的一些标杆用户。从商业化角度来说,我们也赢得了一批金融行业的标杆客户,比如说像兴业银行、国泰君安;电信行业的标杆客户,像中国移动等;零售行业的话,像沃尔玛等。这些都可以作为我们最成功的标杆客户案例。
🎤 墨天轮:今年6月 NebulaGraph 加入了 LDBC(关联数据基准委员会),请问 NebulaGraph 在里面的职责主要是什么?目前有哪些贡献?
叶小萌: 首先我认为 LDBC 在图数据库这个领域是很重要的一个组织,这也是我们选择加入其中的一个原因。当然我们也积极参与到了 LDBC 的一些活动当中,比如参与 Fintech 的新 Benchmark 的制定。此外也积极参与到 GQL 的拓展,即参与 schema 拓展、schema 加强的标准制定。
🎤 墨天轮:最近主流关系型数据库都引入了云原生和分布式,NebulaGraph 在这两方面有哪些进展?主要提升产品哪些方面的能力?
叶小萌: NebulaGraph 本身就是一个分布式的云原生的图数据库。分布式相信大家都已经有比较强的认知了,因为 NebulaGraph 在所有图数据库里,它分布式的能力是很强的,这一点也是我们用户公认的,也就是说它具有很强的可扩展性,即 Scalability。NebulaGraph 目前是唯一一款能够支持在线与服务不通的情况下进行扩容的图数据库。
云原生方面,因为 NebulaGraph 的存储与计算分离以及 Shared-nothing 的这样一种架构,使得 NebulaGraph 能够比较容易的去支持云厂商提供的比如说云存储,云的中间件,云的消息队列等这样一些云厂商的基础服务,能够跟各个云厂商很好的做结合,从而降低用户的使用成本。
🎤 墨天轮:您之前提到想要做出海业务,NebulaGraph 在国际化发展中有哪些进展和计划?
叶小萌: NebulaGraph 在设计完成的第一天,就把国际化作为了最基本的目标之一。这其实也是我们做开源的一个原因之一。因为我们认为整个国内的数据库市场占全球数据库市场的十分之一都不到,所以说这个天花板相对还是比较低的。要想做成一个非常成功的数据库的厂商,就必须要走出去做国际市场。目前在我们1000多家知名的企业用户当中,有接近100家是海外用户,其中不乏类似 Airbnb 这样的大品牌用户。
🎤 墨天轮:中国图数据库起步较晚,正处于发展初期,你认为目前图数据库发展主要面临哪些挑战?
叶小萌: 我认为有以下两方面的挑战:一方面是技术上的挑战,一方面是整个商业化上的挑战。
从技术上的挑战来说。图数据库作为一个新的数据库品类,发展时间相对来说还比较短。因此在技术上还有很多的技术难点需要去解决,包括更有效的存储数据、如何更有效地保证数据的一致性等。
在商业化方面,现在的确已经开始有一些用户了解并使用图数据库,但是这样的比例还比较小。所以如何去教育用户,让更多的用户认识图数据库、了解图数据库能给他的业务带来怎样的帮助,这也是我们在商业化方面要去解决的一个问题。
🎤 墨天轮:目前 DB-Engines 上图数据库有38个,墨天轮排行榜上国产图数据库有27个,而且还有很多开源产品。面对种类繁多的图数据库,用户该如何选型?
叶小萌: 这个问题确实也是很多用户比较头疼的问题。因为图数据库,包括那些所谓的多模数据库,如果加在一起的话,其实数量上还是不少的。在所有这些数据库里,用户怎么来选型,我在这里给用户的建议有三点:
首先是希望用户能够了解自己的场景,然后利用自己的数据,把这些数据库放在自己场景当中,继续去进行尝试,去了解哪款图数据库是真正适合用户自己的场景和业务的。 其次,要考虑图数据库的稳定性,如果不稳,其实业务都是无法开展的。另外就是性能因素,这款图数据库产品的并发情况、响应时间等等; 除此之外,由于图数据库中有大量数据是从外部导入的,因此,也需要考虑海量数据的导入性能和时间是不是能满足业务需求。最后一点,当我们选择图数据库厂商时,也需要考虑服务持久化的问题。
🎤 墨天轮:随着云平台、自动化的技术发展,对于“即将失业”的运维DBA转行您有什么建议?在图数据库领域有哪些发展方向?
叶小萌: 我个人认为这些运维DBA 是一个非常宝贵的资源。因为他们有着丰富的数据库运维经验,并且他了解数据库的一些技术实现,对整体架构也比较了解。所以我认为,他们的转型方向可以向SA(解决方案工程师)方向去转型,这样他们可以把这些经验充分地传递给用户。
🎤 墨天轮:最后,请您分享下在您的构想中2-30年后图数据库在企业信息系统中的形态?
叶小萌: 我个人认为在两三年之后,图数据库一定会成为各行各业乃至每家企业的基础软件或者说基础架构之一。因为每家企业都一定会面临有关联关系、路径等各方面的一些需求,所以图数据库会和传统关系型数据库一样,成为IT部门必不可少的服务或者说组件之一。
本文转载自 墨天轮,参见原文链接:https://www.modb.pro/db/568603