墨天轮章芋文:用十年打造中国的数据库生态体系

2020-11-27 13:34:00

看得出来章芋文很忙!

当同事将章芋文从2020数据技术嘉年华大会现场请到采访间的时候,他还来不及放下手中的笔记本。“抱歉,真的很忙,”刚刚进来的章芋文先致了歉,然后直入正题:“之前我们沟通的问题,我也准备了一些简单的回答。”因为同期墨天轮还要承载PGConf.Asia 2020大会5个并行分论坛的线上直播,都需要身为墨天轮社区负责人的章芋文和他的团队做后台技术保障与支持。不过,他依旧在繁忙之中抽出时间接受了我们的采访。

章芋文做过多年的数据库服务工作,有着数据库行业一线的从业经历,对数据库技术和行业发展有着自己的理解。同时,在墨天轮生态平台的工作,也让他拥有了高瞻远瞩的行业视野。工科技术人出身的他在回答问题时认真、细致,追求描述的准确性,并对于记者因回答不断衍生出的问题,也给予了细致的解答。因此,采访时间从最初预计的半小时延长到了40多分钟。

墨天轮

墨天轮社区负责人章芋文(左)与中国IDC圈记者

我们有能力:从模仿追赶到并驾齐驱

11月20-21日召开的2020数据技术嘉年华是由墨天轮和中国DBA联盟(ACDU)共同主办的一场中国数据库产业的知名盛会,今年已经是第十届。数百名如章芋文一样的数据库行业精英聚集于此,共话数据库产业发展的未来。所以我们的话题就从数据库产业聊起。

本届2020数据技术嘉年华的主题为“自研·智能·新基建”,这三个关键词可以说阐明了中国数据库产业未来的发展趋势和方向。曾经,中国的数据库市场,甚至整个数字化产业的市场,几乎被国际巨头垄断,也即俗称“IOE”的天下。随着国内数据中心产业的蓬勃发展,x86服务器逐渐成为各类数字化项目,特别是云计算的首选硬件。但在数据库方面,高端数据库依旧面临着国产替代不足的问题。

“云原生、分布式数据库已经是主流的发展方向。”章芋文表示,情况正在发生变化。这些年来,国产数据库正在努力创新,并且摆脱了国外巨头划定的发展路线,走上了云原生、分布式的创新道路。2019年,包括阿里、华为在内的众多国内数据库企业都开始了云原生、分布式数据库的研发,并且取得了优秀的成果,很多国产数据库产品在性能上已经不弱于任何国际巨头。

“数据库是一个投入产出比很高的产业。”章芋文对于国内数据库市场的发展非常看好。他解释说,数据是一种重要的资产,是现代企业业务发展的核心,所以对此有认知的企业对数据库产品的付费意愿都非常高。

章芋文表示,尽管研发数据库前期投入的人力物力会很大,周期也较长。但一旦成功,就有可能成为下一个国际巨头,占领全球数据库市场。因此,无论是市场环境,还是未来发展,资本也非常看好数据库产业的发展,乐于投资其中。

因此,无论是技术还是市场,中国数据库行业的能力都已经具备了国际一流的水准。在本届嘉年华的主办方致辞中,ACDU理事长盖国强先生表示:“自研数据库在中国市场上占据了越来越重要的位置,国产数据库也正在登上国际舞台。在我们国家内循环、新基建政策引导之下,我们迎来了数据库从业者最好的时代。”

我们有人才:从独立摸索到自主研发

数据库的发展,离不开人才的支撑。章芋文介绍说,数据库作为三大IT基础软件之一,不仅需要对操作系统、芯片、存储、内存等底层系统和硬件协调稳定工作,还要优化让所有资源发挥出最大的价值,这就需要数据库内核研发工程师必须有跨领域的理论储备和多年的实践能力。

不过,目前为止,国内并没有专门的数据库内核研发人才培养体系。甚至,在某国际数据库巨头企业年前败走国内市场的时候,同期爆出了该公司创始人的狂言:坚决不能让中国培养出比美国还多的人才。

因此,我国数据库人才的培养陷入了既无本土体系,又断绝了外援的困境。好在,国内的技术精英们没有放弃对数据库领域的探索。通过业务需求逐渐摸索学习,靠自我成长来满足发展需求——这也是目前国内数据库内核研发人才的主要来源。

章芋文对数据库内核研发人才的最低标准是“要会写一个操作系统”。虽然数据库内核研发人才要求极高,但只需要精通资源调度、优化以及机器与代码交互的底层逻辑,再使用高效的开发语言,就可以自己摸索着入门。

“我们的数据库人才现状是人少而精。”对于国内数据库人才的现状,他认为是远远不够的,不过并不悲观。他表示,国外数据库产业有4、50年的发展,我们不过是近些年才起步。但在这种现状下,国内很多互联网大厂、专业的独立数据库企业依旧不断有优秀的产品和人才出现。

我们缺什么?生态

当一个运维人员可以在资料库里查询到一切遇到的问题,

当一个新用户可以在社区得到关于产品的任何回答,

当一个应用场景可以在平台中轻易找到使用的第三方工具

……

这样的数据库产品必然是被广大用户所认可并乐于使用的。但是中国目前并没有一款这样的数据库产品。

“我们差的是一个生态环境。”章芋文谈到这个问题时,明显少了几分技术人员常见的沉稳,变得更加感性起来。当他谈到中国数据库产业的这个“痛点”时,似乎真的让他痛了起来。

我们有技术,我们有市场,我们有人才。但国产自研数据库只能说“迎头赶上”,虽然走了“云原生、分布式”的弯道,却没有实现真正的“超车”。在很多重要的领域,国际巨头产品的霸主地位依旧是难以撼动。这其中固然有产品迭代、技术惯性的问题,但国产自研数据库无法让用户真正体验到优势也是原因之一。

章芋文表示,国内目前有100多家专业的数据库企业,每家企业的客户数量也都不多,大部分国产数据库产品只有数家企业在使用。无论是环境复杂度,还是场景丰富度,软件的应用深度都达不到进一步挖掘产品潜力和问题的程度。因此,章芋文呼吁国内企业应该多尝试一下国产的数据库系统。

“经过市场验证的技术才是成熟的。我是说,市场验证!”章芋文强调到。对于目前数据库企业百花齐放,“采花者”却寥寥无几的情况,章芋文感到担忧。“我说市场验证的意思,不是一家两家企业使用,而是要有大规模的市场应用。”

此外,这些数据库企业彼此之间并没有太多的交流,整个数据库行业都处在单打独斗的状态之下。技术人员之间也缺乏足够的交流平台和条件,难以在技术上互相认证、一同成长。就此,章芋文谈到了数据技术嘉年华的愿景,谈到了墨天轮成立的初衷:要建立一个‘聚焦、开放、分享’的专业社区。

章芋文介绍说,墨天轮早期原本只是提供在线的数据库运维服务,在多年的服务中,接触到了国内种种类型的数据库,也深入地了解了中国数据库的应用环境。因此,墨天轮积累了各种常见的、罕见的,简单的、复杂的,常规的、特异的种种能够遇到的问题,也为此研发、积累了无数的技术和经验。

墨天轮社区正是在这些丰富的数据库资源以及积累的经验基础之上建立起来的数据库生态平台,可谓是一本真正的国产数据库领域的“百科全书”。而章芋文和他的同事们要做的,是在新时代下打造更具创新性的学习形态、构建完整的数据知识体系、承载技术人的持续成长,共同建设一个有温度的技术社区和全新的数据社群聚合体,围绕数据人的学习成长提供一站式的全面服务,持续促进数据领域的知识传播和技术创新。

目前,墨天轮社区已经快速成长为国内规模最大、资料最全面的数据库专业技术平台,平均每天有超过5万的浏览量。这个数字对于一个以数据库这样底层技术为主题的垂直社区来说,已经具备了向生态平台发展的人气基础。

对于困难,章芋文有了充分的预估;对于问题,也有了解决的方案;对于路线,也已经规划好;对于未来,他没有说太多。

“有人问我,国产数据库需要多长时间才能替换传统数据库?我觉得这个时间很大程度上取决于国产数据库的生态如何,即具体有多少国产数据库专家、互联网上积累了多少国产数据库资料、积累了多少成功案例?我觉得这个时间差不多要10年,当然墨天轮的初衷就是要加速推动国内数据库行业的发展,希望这个时间能够早日到来,我们拭目以待吧。”数据库生态布道者章芋文如是说。