打造中国版Oracle,PingCAP完成2.7亿美元融资

“我讲了五年‘全球化是中国软件的出路’也没人信”,说这话的是刚拿到 2.7 亿美元 D 轮融资的 PingCAP 创始人刘奇。

11 月 17 日,开源分布式数据库厂商 PingCAP 宣布完成上述融资的同时,全球数据库史上最新纪录随之诞生。

对多数人来说,PingCAP 和他们所开发的 “开源 NewSQL 分布式关系型数据库” ——TiDB,并不是一个熟悉的名字。但如果你打开微信,微信钱包十二宫格里面,有 11 个格子的产品都已或多或少地使用 TiDB 来作为业务支撑。

图 | PingCAP

就像数据库界的 “老大哥” Oracle、MySQL 一样,TiDB 也是一款基础软件,它在背后支撑着金融、保险、电信等许多产业的发展。更主要的是,它是完全由中国人发起的世界级数据库,代表着数据库行业的发展方向。如今,其分公司开到了美国硅谷,客户也遍布全球,“日本支付宝” PayPay 是其大客户之一。

该司投资人云启资本董事总经理陈昱表示:“从来没想到这种大型的基础软件,会在中国出现”。

2016 年领投 PingCAP A 轮时,陈昱用了不到一周的时间。那么,PingCAP 到底是一家怎样的公司?

TiDB 的诞生

PingCAP 创立于 2015 年,三位创始人是数据库领域的技术大牛,都曾在豌豆荚负责过基础架构和分布式系统相关工作,拥有较多基础架构、大数据和开源的经验。看到分布式数据库领域的机会后,他们决定从零开始,打造出中国的新一代数据库。

图 | PingCAP 三位创始人,崔秋、刘奇、黄东旭(从左至右,受访者供图)

数据库是信息技术革命的重要成果,更是互联网技术的基石。早期数据库主要存储在开发者个人电脑上,故被称为单机型的数据库。那时,整体数据量还不太大,Oracle、MySQL 等传统关系型数据库完全可以满足用户需求。

大数据时代到来后,数据量出现爆炸,无法做到大数据存储、高并发的单机型数据库显然吃不消。大约十年前,以谷歌 NoSQL 为代表的新一代分布式数据库应运而生。

近十年来,是 NoSQL 蓬勃发展的一段时期。但是 NoSQL 也有自己的问题,其一便是它使用的接口跟 Oracle、MySQL 这些关系型数据库很不一样,所以对传统行业来说,NoSQL 的易用性很差。

那么,能不能设计一个工具,既可以保持像原来操作 Oracle 和 MySQL 一样的易用性,让用户轻松上手,同时又能获取一个弹性伸缩架构?这便是所谓的 NewSQL 的概念。

“其实这就是这两年来我们整个数据库行业的一个最大的革命性方向,代表产品是 Google 的 Spanner”。PingCAP 联合创始人兼 CTO 黄东旭表示,该公司在此领域的作品,就是 TiDB。

TiDB 专门为企业关键业务而生,具备分布式强一致性事务、在线弹性水平扩展、故障自恢复的高可用、跨数据中心多活等企业级核心特性,可帮助企业最大化发挥数据价值。

2020 年 5 月,TiDB 推出 4.0 版本,在提供良好交易处理能力前提下,引入了基于 Raft 算法的 HTAP 架构解决方案。这套架构设计解决了以往困扰 HTAP 架构的隔离性、一致性和性能之间的矛盾,以此为基础的论文《TiDB: A Raft-based HTAP Database》被国际顶级数据库会议 VLDB 2020 收录,标志着该架构得到全球学术界的认可。

据 Gartner 预测,到 2022 年将有 75% 的数据库被部署或迁移到云上。TiDB 作为开源分布式数据库,其弹性伸缩架构天然具备云原生的特性,通过与 Kubernetes 无缝对接,TiDB 可轻松部署在公有云、私有云和混合云之上,从而降低用户的总体拥有成本(TCO),进而提升资源利用率。

2020 年 6 月,PingCAP 发布 TiDB Cloud 产品,依托公有云提供开箱即用的 TiDB 云数据库托管服务。TiDB Cloud 还可通过水平扩展,拥有近乎无限的存储容量和计算能力。

黄东旭表示,TiDB 是全球第一批在该赛道中采用新模型、新方法的新型数据库代表性产品。

谈及微众银行这一客户案例时他表示:“当前微众银行正在使用 TiDB 的 HTAP 的能力,该能力可把银行核心业务拆分成多个虚拟分行,不同虚拟分行的数据汇总和实时结算,需要一个可扩展的、能提供较好实时分析能力的交易型数据库。” 而 TiDB 恰好可以满足该需求。

图 | PingCAP 的代表用户(来源:PingCAP)

“有点像不可能完成的任务”

与 PingCAP 的三位创始人类似,云启资本的陈昱也是技术出身,之前曾在谷歌供职多年。2016 年,刚听说 PingCAP 时他非常兴奋,因为这毫无疑问代表的是数据库行业的正确发展方向;但另一方面,他也觉得这项工作挑战过于巨大,有点像不可能完成的任务。

由于 TiDB 是开源软件,陈昱查了它的设计文档和代码。在他眼中,设计文档能体现软件产品的系统架构和设计思想,而代码则能反映出团队到底有没有能力完成系统搭建。

回忆当初看完代码的感受,他说:“写的还是比较规整的,因为他们刚开始做,还处于项目早期,很多地方还很简略,但至少能看出整个骨架,我们认为有一定的概率能把这件事情做成。”

在他看来,好的创业者要满足三大元素:首先有技术,一家技术创业公司,如果没有核心技术,很难走远;其次有理想,创业者本身要有远大理想来行稳致远,同时保持正直的品行,做正确而非容易的事;最后有韧性,创业不可能一帆风顺,过程中一定有起起伏伏,学会适应失败,并且在失败中总结。

说到“有技术”,黄东旭透露了一个细节:“PingCAP 用的编程语言是 Rast,该编程语言创始团队的几位成员已经加入我们,我们应该是中国首家把自己用的编程语言的创始成员变成员工的公司。”

在云启资本入股之前,很多投资机构看不懂 PingCAP,一直没有伸出橄榄枝。PingCAP 也曾一度面临着很大的困难,好在云启资本雪中送炭,及时投来数百万美元。

在之后与 PingCAP 三位创始人的接触过程中,陈昱进一步印证了自己的判断。团队里,三位创始人在性格和专业上十分互补。而且,不单是技术领先,他们在生活中也是非常有趣的人,比如黄东旭既会写论文、还会玩摇滚,而刘奇则做得一手地道湖南菜、羽毛球也打得很好。崔秋则是开源社区的忠实爱好者。

一个打造世界级基础软件的机遇

在大数据、云计算领域,开源公司不止 PingCAP 一家,陈昱也交过学费。后来他发现,整个赛道都没有大成的公司。一个很重要的原因是,很多公司只是基于别人的开源代码去做解决方案。

这就导致产品同质化十分严重,为赢得订单,个别公司只能靠商务关系或压低成本的方式来获客。这样一来,作为技术公司,拼的却不是技术,而是关系、价格和服务。

但 PingCAP 完全不同,公司大部分钱永远花在技术上。从公司创立到现在,超 70% 的员工都是程序员,他们日复一日地打磨产品。而 PingCAP 吸引人才也主要靠愿景和理想。

不少员工都面对过其他公司的高薪诱惑,但还是选择加盟 PingCAP,就是因为能亲手打造一个世界级的基础软件,这样的机会一辈子也不会有多少次。

此外,PingCAP 在开源社区上也做了很多工作。

“我们现有员工 300 多人,代码贡献者 1200 多人,从人数上面就能看到,我们在调动很多外部资源来做事,这也是一个很重要的护城河。大家一起在社区里持续讨论和完善产品” ,黄东旭表示。

在他看来,PingCAP 的核心竞争力并不只是产品和内核,还有开源社区带来的快速迭代能力和占领市场的速度。

经过多年发展,PingCAP 在今年终于开始走向商业化。虽然变现速度不算快,但陈昱有自己的见解:“它的单子一签都是几百万一年。一开始做原创的东西难,长远来说原创要比在别人基础上修修补补、或做解决方案来得好。”

云启资本的投资蓝图与逻辑

谈及 PingCAP 在疫情期间的“逆风”融资,陈昱表示: “这对整个中国的基础软件来说是一个很大的鼓舞。首先,大家不会再有偏见,说中国做不出好的基础软件出来。其次,会激励更多的创业者投身于这个领域,做的人越多,中国以后出现伟大的基础软件公司的概率就会越大。至少在基础软件这个层面,中国的落后局面就会得到扭转。数据库是一个‘卡脖子’技术,中国已经开始在慢慢追赶,但在其它领域,例如操作系统、AI 芯片,还有很多值得发力的地方。只要这些技术通过市场打拼,得到市场验证,资本对它的高估值就会激励更多人投身于该行业,最后实现行业的大发展。”

除了 PingCAP,云启资本也通过早期领投和连续每年投资 ZILLIZ、Jina AI 等项目,完成了该领域的系统性布局。

作为 PingCAP 的 CEO,刘奇则有着更大的野望:“PingCAP 要做全球 Database 领域最好的数据库......Software 的复制成本和传播成本很低,相对其他集装箱货物来说,它可以很快到达全世界。前提是整个东西易用性要很强,即大家能快速用起来。”

但对于目前只有 TiDB 一款产品的 PingCAP,刘奇淡定表示:“Oracle 营收那么高,市值也能做到一两千亿美金,所以单一产品是有足够空间的,可能哪天我们做到了 500 亿美金(市值),或许会考虑一下产品矩阵,但在今天我们还是希望能够更加专注。”