阿里云以 Apache 2.0 许可证开源 PolarDB 分布式数据库

数据库技术
376
0
0
2022-04-12

5 月 29 日,阿里云开发者大会上,阿里云宣布开源云原生数据库能力,开源关系型数据库 PolarDB for PostgreSQL,将阿里内部沉淀多年的技术分享出来,服务于百万开发者。目前,该项目已在阿里云官网及 Github 上发布,后续将引入分布式事务、单机高性能等能力。

阿里云数据库负责人李飞飞表示:

“我们希望将阿里云在数据库技术上积累的丰富经验,通过标准技术组件和系统的方式开放出来,共建开源数据库生态。”

数据库是基础软件中的刚需,与芯片、操作系统并列为“全球技术三大件”。开源模式广受数据库用户欢迎,被认为是互联网场景的标配。

PolarDB 是阿里云自研的数据库产品家族,采用存储计算分离、软硬一体化设计,既拥有分布式设计的低成本优势,又具有集中式的易用性,可满足大规模应用场景需求。计算能力最高可扩展至 1000 核以上,存储容量最高可达 100TB,集群版单库最多可扩展到 16 个节点,性能比 MySQL 高 6 倍。PolarDB 系列产品已连续多年稳定支撑天猫双 11,处理峰值高达创纪录的 1.4亿次/秒。

为满足用户多样化的需求,PolarDB 针对不同的数据库协议开发了不同的兼容版本,包括兼容 MySQL、PostgreSQL 和 Oracle 的版本,及每个版本的分布式形态。

此次阿里云开源的是 PolarDB for PostgreSQL 分布式版,包括数据库内核、相关插件、工具脚本、测试用例以及设计文档,适用于中大型企业核心业务场景。本次开源遵循 Apache 2.0 许可证,以全共享并尊重原作者著作权的模式开源,代码可以修改和再发布。

这让我想起来前一段时间 MariaDB 宣布了将它的分布式 SQL 引擎 Xpand 作为其 DBaaS 服务的 SkySQL 系统引擎之一,然而 Xpand 是一个专有的软件。这引起了业界对开源服务之上的专有服务的隐忧,因为这失去了开源的重要优势 —— 避免供应商锁定。

在业界,开源数据库众多,但是能将分布式能力也开源出来的罕有,而能形成产品级的、可以利用现有数据库基础设施的开源产品更是不多。因此,PolarDB for PostgreSQL 的这次开源可谓是不但给 PostgreSQL 注入了一剂强心针,而且也与 Xpand 这种开源引擎之上的专有服务形成了鲜明对比。

在对李飞飞的采访中,他谈到了为什么要开源 PolarDB:

“我们开源的目的是非常纯粹的,我们在开源这一部分没有任何商业化的目的,就是要把开发者的生态做起来。”

而且,他认为没有必要重新建立一个新的生态,在原本非常繁荣的 PostgreSQL 生态上“助力一把火,让它烧得更旺。我们希望让开发者可以在现有的 PostgreSQL 上做的更好。本质上就是把我们在 PostgreSQL 上积累多年的能力开源出来,回馈给社区,而且以插件的方式。”

而且,为了鼓励社区能参与进来,阿里云也体现了极大的诚意,采用了更加宽松、自由的开源许可证 Apache 2.0,“你可以再开发,你可以商用,都没有问题,我们完全鼓励。”

为什么这样做呢,李飞飞谈到:“通过这样把开发者生态建立起来以后,我们从中获得了什么?我们获得的是开发者对 PostgreSQL 整个大生态的持续的关注和投入,然后最终我们也会从中受益,因为我们会从开发者贡献的代码里面去汲取对我们有用的部分,我相信其他的厂商不管是云厂商数据库厂商可能也会因此受益。但没关系,我们认为水涨船高,只要整个的社区做起来,我们阿里云还一定会是领导者,我们有自信,所以我们愿意去做这件事。”

李飞飞认为:

“我个人认为开源是建立生态的非常关键的一个抓手,非常关键的抓手。它和商业化一定要非常好的平衡,但绝对不是说天然的就是矛盾的两面,矛盾的地方绝对有,不然的话大家不会这么纠结,但是我个人认为要处理好平衡,是需要有非常强的定力和判断力,但你一旦处理好,它并不一定就一定会发展成矛盾体,这是我个人的一个观点。”

我想,这应该就是阿里云坚定开源战略的主要原因之一。

但是同时他也表示,不要走到另外一个极端:

“大家千万不要落到另外一个陷阱里面去,认为‘开源就是灵丹灵丹妙药,开源就能解决问题了’。我个人也是非常反对这个观点,关键还是看你后续社区的运营,是不是真的用心在做这个社区,是不是真的有高质量的贡献出来,让大家真正的从里面能够受益。我觉得这个是后面的挑战。”

根据披露的 PolarDB for PostgreSQL 开源路线图,阿里云是有计划、有步骤的将主要的、完备的部分向社区开放。我想,这将揭幕云原生数据库的新时代。