阿里云云原生数据库是什么?
本文目录
对话阿里云李飞飞:关于云原生数据库的五大预判
作者:王慧贤
数据存储、数据分析、数据安全......如今,围绕“数据”的话题越来越多,离人们的生活也越来越近。
从陌生到熟悉,数据不仅“出圈”,甚至已然站在了C位。去年,中央发布的《关于构建更加完善的要素市场化配置体制机制的意见》中明确表示,继土地、劳动力、资本、技术后,数据成为第五大生产要素。
步入信息化时代后,数据库、操作系统与中间件作为计算机最基础的三大软件,支撑着企业的正常运行。
当数据成为生产要素后,必然会迎来爆发式增长,企业的数据存储和处理需求将进一步释放。更重要的是,疫情加快了数字化转型的脚步,更加速了企业的上云速度。
从信息化到数字化,时代的变革,总会带来商业世界的变化。如何在云原生架构下使用数据库,成为企业的痛点和云厂商的机会,亚马逊AWS的CTO Werner Vogels曾多次强调:“数据库是云计算的终极之战。”
在数智化时代,云原生到底意味着什么?云原生数据库和传统数据库相比,核心优势是什么?是否把数据库搬上云就是云原生?基于这些问题,雷锋网与阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞展开一场对话。
国产云原生数据库,摆脱「切肤之痛」
如今,数据库的商业世界,因为云的出现与发展,分成了两大派系。
一派是以Oracle为代表的传统商用数据库,一派是以国外AWS、国内阿里云为代表的云原生数据库,去“IOE革命”下的产物。
其实,早期较为火热的数据库种类有三种,层次式数据库、网络式数据库和关系型数据库。
在《浪潮之巅》一书中,作者吴军写下了这样的观点:“Oracle的兴起很大程度上靠的是它最早看到关系型数据库的市场前景,并且在商业模式上优于 IBM。”
因此,在云原生数据库“入世”之前,数据库的天下一直是Oracle的,国内大部分互联网公司都不得不采用Oracle+IBM小型机+EMC的模式来维持正常运营。
高昂的费用,使得对于数据库需求较大的互联网巨头“忍无可忍”。
2009年,阿里巴巴的Oracle RAC集群节点数达到了创记录的20个。可由于Oracle并没有弹性扩展的功能,只能按照峰值流量购买小型机和数据库,导致阿里将业务上涨带来的大部分利润,都支付给了Oracle。
第二年,阿里便开始走上了去“IOE”之路,根据开源MySQL搭建了AliSQL,并顺利经过了淘宝双11的考验,国产云原生数据库算是正式摆脱了“切肤之痛”,逐渐受到市场的真正认可。
另一边,国外的AWS在2015年公布了基于云计算的自研数据库Amazon Aurora。Aurora是一个关系型数据库,可以跨3个可用区域复制6份数据,其最大的特性就是高性能和高可用性。
云计算巨头的入局,让云原生数据库在国内外一步步成为主流。据Gartner预测,到了2021年,云数据库在整个数据库市场中的占比将首次达到50%,到2023年,75%的数据库都要跑在云平台之上。
关于云原生数据库,随着逐步的出圈,也让人们关心的焦点从“是啥?”转变为“还能解决哪些问题?”
但云原生数据库存在着数据孤岛的问题,无法打通多个数据系统的情况下,企业在数据加工和数据管理上就会“压力较大”,甚至在数据安全方面还存在隐患。
传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求。
因此,在李飞飞看来,云原生数据库已经走到2.0阶段。这个阶段要解决的问题,就是上述存在的痛点。
9月26日,在阿里云数据库创新上云峰会上,阿里云发布了首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,使企业的在线数据可以释放出更大的价值。
相较于传统方案,阿里云一站式敏捷数据仓库解决方案有4大核心优势:
1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%;
2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内;
3、支持复杂实时数据加工、计算逻辑;
4、低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景。
除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。
传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。
针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。
此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。
谈起未来数据库的发展趋势,李飞飞提到以下五点:
1、云原生+分布式一定是数据库的标配,分布式已经是必选项。分布式数据库由多个相互连接的数据库组合而成,面向用户则是以单个数据库的形态出现。云原生分布式数据库具备易用性、高扩展性、快速迭代、节约成本等特征,从资源池化到弹性扩展,再到智能运维,再到离在线一体化,解决企业用户的核心诉求。
2、AI for DB(database,指数据库)和 DB for AI将是主流趋势。用AI将数据库运维管控智能化,尤其在云原生+分布式这个前提下更重要,因为数据库不仅是内核的能力弹性高可用、可拓展性,更重要的是部署后应用和运维的复杂度要大大降低。在数据库里,面对越来越多非结构化的数据,分析能力十分重要。
3、数据的安全可信,在今天这个大环境下变得愈发重要,如何确保整个数据库系统,在处理数据全链路过程中提供加密能力、多方安全计算能力、隐私保护的能力,也是很重要的趋势。
4、多模数据处理能力将越来越重要。比如,新型数据库多模态的处理能力,在新能源汽车企业打标签、智能电池化预测等应用场景中,将发挥越来越重要的作用。
5、一份数据,多个数据处理引擎:实现仓库一体、仓库联动、仓库打通,数据之间无缝流转。
以上判断,也从侧面反映出阿里云数据库的走向,这点毋庸置疑。但除此之外,业界最关心的,还有开源。
近半年,国内很多厂商相继提出开源战略,背后缘由显而易见,为了打造生态。就在今年的阿里云峰会上,阿里云智能总裁、达摩院院长张建锋(花名行癫)将2021年阿里云的发展关键词归纳为:做好服务、做深基础、做厚中台、做强生态。
做好服务与生态,成为如今厂商们不约而同的目标,而开源,就是最好的选择。
当雷锋网问到:“未来,阿里云数据库会不会把所有能力都开源?”这一问题时,李飞飞给到的回答是:“不会。”
之所以有这样的回答,是因为对于开源,他有着一些判断和看法。
李飞飞表示,这些部分,本就是阿里云数据库的商业化版本。
事实上,业界大多数的数据库厂商都不会针对自身的核心能力开源,如TiDB的核心管控组件、TiFlash。
与像MongoDB,、Cassandra、CouchDB这些以开源起家的数据库厂商不同,开源只是阿里云数据库的战略,不是阿里云数据库的命脉。
前几年,有业内人士表示,在面向开源时,国产数据库首先需要解决信任以及开源知识产权等问题。“开源会让厂商更加认真思考版权还有专利的问题,事实上,选择开源后,对于数据库厂商提出了更高的要求。”
李飞飞认为,开源只是一种选择,数据库开源成功并不代表着商业化就能够成功,不开源也不能代表厂商不先进。
更准确的说,开源只是一种有效手段。
最终,阿里云数据库希望客户能够通过开源版本把阿里云数据库产品技术快速用起来,并能够参与到技术产品的迭代过程中,在一些高阶能力上,借鉴团队专业能力和阿里云的服务能力,成为良好的商业合作伙伴,这是李飞飞以及阿里云数据库对于开源的一些基本思考。雷锋网雷锋网雷锋网
阿里云云原生助力安永创新驱动力实践探索
阿里云云原生赋能:安永探索创新之路
云原生正在重塑企业的生产力格局,成为企业创新的数字化基石。12月1日,2023年云原生产业大会在北京盛大举行,阿里云云原生专场亮点纷呈。安永科技咨询合伙人王祺在大会上分享了深度洞察,以及安永如何借助阿里云的容器服务、消息传递、微服务引擎和可观测性等技术,实现创新驱动力的实战应用。
作为全球领先的咨询机构,安永致力于数字化转型和云技术应用,提供定制化的解决方案,提升客户体验。他们坚信,云原生是企业发展的必然选择,是推动持续成长的不二法门。王祺强调,单纯将应用迁移到云并非云原生的全部,通过微服务、容器和API设计,企业能构建出可扩展、弹性且可管理的应用,从而实现长远的成本效益提升。
安永在探索过程中,通过将核心业务平台迁移到阿里云的ACK(容器服务)、ACR(容器镜像服务)、Kafka(消息队列)以及ARMS(可观测服务)等技术,实现了全面的云原生架构升级。这一转型带来了显著成果:服务器资源利用率提升超过30%,发布周期缩短近40%,业务稳定性显著增强。
遇到的挑战如自建集群的稳定性问题和早期的Kubernetes部署问题,在阿里云的帮助下,安永得以解决。通过ACK Serverless,他们实现了业务系统的弹性应对,迅速扩容,且节省了大量运维成本。融入云原生能力,使业务覆盖了Java和.NET应用的可观测性,简化了运维流程,确保业务连续性无中断。
安永大中华区的领导层也积极参与,顾卿华先生和支伟先生代表安永出席了授予“2023阿里云云原生优秀实践案例”的仪式,分享了他们如何在阿里云的助力下,克服技术挑战,优化成本,提升云原生度,进而驱动业务创新和增长的故事。
总结来说,云原生不仅是技术革新,更是战略抉择。王祺坚定表示:“云原生是企业发展的必经之路,我们将借助技术的力量,持续提升创新力,保持竞争优势。”通过与阿里云的紧密合作,安永的创新实践不仅展示了云原生的力量,也为企业展示了如何通过云原生技术实现业务的稳健增长和敏捷创新。
阿里云李飞飞:全面向「云原生数据库2.0」演进
阿里巴巴集团副总裁,阿里云数据库产品事业部负责人李飞飞
钛媒体注:是钛媒体年终策划专题,邀请各行业TOP创业领袖一起回顾过去一年的行业变化和企业成长,同时共话新逻辑、展望2022。本文为
阿里巴巴集团副总裁,阿里云数据库产品事业部负责人李飞飞
对话钛媒体App栏目,以下为
李飞飞
对行业未来的展望。
2021年数据库行业的关键词,可以用云原生、一站式、全链路、HTAP、智能化来概括。
云深处,新世界。数据库行业最大的变化是全面向演进,阿里云打造的,将云计算领域非常重要的云原生技术和分布式技术合二为一:上层是分布式,下层以云原生的方式实现,每个分区都可以享受云原生带来弹性、高可用的能力,同时上面有分布式带来的水平拓展的能力,解决高并发可能带来的瓶颈问题。
在这个基础上,打造面向不同应用场景和需求的专属数据库和数据仓库系统,做到专库专用。同时,利用HTAP、智能化、离在线一体化等核心技术,实现数据处理与分析的融合,以及数据在不同应用场景和系统之间的自由流转。最后,通过在线数据管理平台实现一站式全链路数据管理与服务,为企业数据生产集成、实时处理与存储、分析和发现、开发和管理提供全链路、全生命周期的服务。
阿里云数据库坚持以客户需求为核心,扎根国内市场,同时积极拓展海外市场,加速出海国际化。回顾过去一年,简单从三个方面分享阿里云数据库的发展:
业务层面:
权威机构Gartner公布2021年度全球云数据库魔力象限评估结果,阿里云再次入选领导者象限,数据库综合实力稳居全球第一阵营,阿里云也是唯一被评为全球数据库领导者的中国企业。
权威市场机构IDC发布的《2020年中国关系型数据库市场研究报告》中,阿里云以超28%的市场份额排名第一,并蝉联云关系型数据库市场第一。在云关系型数据库市场上,阿里云以绝对优势领跑。
产品技术层面:
三层解耦,PolarDB将云原生进行到底。PolarDB实现三项创新:业内首次实现内存与计算、存储的三层解耦,实现内存池化,使得弹性能力呈数量级提升,并大幅降低成本;上线多主架构,进一步提升可用性、并发处理、弹性能力,高效应对像双11一样的流量洪峰;基于共享内存池的IMCI成为真正的HTAP数据库系统,可同时处理OLTP和OLAP型混合负载。
离在线一体化,AnalyticDB让数据分析实时化、在线化。AnalyticDB推出云原生+离在线一体化技术架构重大升级版本。云原生架构版本基于资源池化和弹性存储能力,结合传统MPP数据库架构、离在线一体化技术以及Serverless技术创新,实现了存储计算分离、分层存储、秒级扩缩容以及多实例数据实时共享等新特性,最高可降低10倍存储成本,大幅提升了计算和写入性能。
库仓一体,DMS让数据自由流动。发布首个一站式敏捷数据仓库解决方案,结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB,实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能企业业务在线化。
开放生态层面:
正式开源PolarDB数据库,已对外开放云原生关系型数据库PolarDBforPostgreSQL及云原生分布式数据库PolarDB-X的源代码,分享自研云原生分布式核心技术,推动云原生分布式数据库发展。
过去一段时间,国家出台了《十四五数字经济发展规划》等系列政策,将对数字经济和基础软件的重视程度提升到了前所未有的高度。随着新一轮科技革命和产业变革的发展,数字经济已经深入传统互联网、制造业、金融、政府、电信、交通、能源、物流等各行各业,海量数据爆发式增长,数据库技术在数字经济发展的各个模块中发挥着核心作用。政策鼓励中国企业通过开放、公平的市场竞争方式,提升国产数据库的竞争力,国家也提供了非常好的环境。
新技术的产生,像云原生、分布式、智能化、面向物联网的多模数据的处理、安全可信、新硬件以及开源,这些维度是今天以及未来很长一段时间,各个数据库厂商会展开激烈竞争的赛道。
越来越多的企业级用户会选择云的部署方式,这为阿里云数据库进入传统政企市场提供了非常好的机遇。同时,企业对一站式全链路数据管理与服务的需求越来越强烈,让数据更简单、更易用,充分发挥数据的价值。











