创·问|PingCAP 刘松:AI 即将重塑数据库,未来为 Agent 而生
2015年,PingCAP (平凯星辰)创业第一天记录下第一行代码时,“开源”就成为这家分布式数据库厂商最大的标签。此后十年时间里,PingCAP 服务了超过 45 个国家的4000家企业,创立的分布式数据库产品 TiDB,更是在 GitHub 上总计获得超过 37000 颗星,是数据库领域有着极大影响力的开源项目。
正因为信奉开源,PingCAP 企业文化中的决策民主、开放自由吸引了很多人加入,其中就包括 PingCAP 副总裁刘松。
作为软件行业 20 多年的从业者,刘松先后在 Oracle、阿里云任职,他给自己的标签是“互联网原教旨主义者”和“AI降临派”。很多人把 AI 看作今天一个新的技术范式,刘松却觉得 AI 技术是互联网技术的延伸,正是得益于互联网过去沉淀的数据和云基础设施,AI 才变得如此强大。
所以面对这波 AI 技术浪潮,刘松想到了不同的隐喻。他认为AI带着“弑父”的技术属性的同时,也因为缺乏场景、用户、流量等,不可避免背着“丫鬟命”。
而对数据库行业而言,刘松判断 AI 会成为“云+全球化+开源”以外的第四足,将来不仅会重新改写数据库厂商的估值,也会重塑整个行业的竞争格局。
信通院发布的《数据库发展研究报告(2025年)》显示,过去一年,中国的数据库厂商减少了64家,竞争在加剧,面对 Oracle 等传统巨头,PingCAP 拒绝做简单的平替,而是希望靠产品力和生态胜出。而经过十年打磨,PingCAP 的产品无论在国内还是全球,都得到了验证。不仅在国内市场中杀出一条血路,也在海外市场的商业化方面获得巨大突破。
近日,刘松接受了「创·问」编辑部的访谈,谈到了他对数据库与 AI 融合的趋势判断,也分享了 PingCAP 如何深耕国内市场的同时,还走出了一条高度本地化的出海之路。
如果说上一代互联网公司改变了中国人的生活和运用技术的方式,那刘松希望 PingCAP 能塑造一种新的公司范式——成为世界上最好且最受尊敬的基础软件公司。
全文分享如下:
Q:华创资本
A:PingCAP 副总裁刘松
01 AI 技术的属性是弑父
华创资本:你在今年1月就预测 DeepSeek 会带来重大转折,后来的确应验了,从你的视角观察,这一波AI技术的浪潮意味着什么?
刘松:关于这一代 AI,我有两个隐喻。
第一个是“弑父”,新的技术只要一出来,原有的技术,不管是“爷爷”还是“父亲”全部都没有意义了, 就像 GPT 对于NLP的颠覆一样,之后下一代出来的东西很有可能也会把当前 GPT 的模式完全杀掉,所以这种“弑父”属性,让 AI 具备了特别强的颠覆能力。
第二个是“丫鬟命”,AI 技术就算再强大,目前也只是工具型的技术,它自己本身并不构成一个用户层级的赛道,还需要找到一个有场景、有用户、有流量的“豪门”,这也是为什么扎克伯格要花1亿美金去 OpenAI 挖人的原因。所以我认为五年之内,AI+流量还是 AI 应用的主航道。尤其对于 AI 领域的创业者,如果想不清楚 AI 技术模式和流量怎么叠加,那后续的商业模式也会很难。
华创资本:那你怎么看待 AI 这两年给软件行业带来的冲击?
刘松:在大模型出现之前,数字化互联网解决的其实是信息不对称、协同效率等问题,而结合了高质量数据的大模型,带来的是一场认知革命。
过去我们熟悉的移动互联网,本质上还是数据+算法驱动,无论刷淘宝还是刷抖音,都是依靠推荐算法、依赖数据库技术而不是脑力。但推理大模型本身就具备了认知能力,它在很多方面都比人做得更好。相比之下,人的优势可能只剩下一些隐含式的经验了。
所以 AI 带来最大的变革,是从上一代的云计算时代的数据驱动,走向了认知革命。
华创资本:随着 AI 和大模型融合发展,“数据库”的角色是否也正在发生变化?
刘松:我认为会发生根本性的变化。我们CTO 黄东旭说过一个基本逻辑:“未来的数据库一定是面向 Agent 的,因为之前的数据库是面向数据工程师和 DBA 的。”
每个 Agent 就是一个智能代理,它的上层是 UI,下面是知识检索,中间有流程引擎、知识图谱,基础是数据。有了这样的 Agent,很多助理、运营、营销、客服等岗位做的事情,就很容易被自动化。我们做了两件事来提升 RAG 效果:第一,构建动态知识图谱;第二,通过定向训练模型的思维链,来动态规划 RAGFlow (开源项目 StackVM) ,我们认为未来的 Agent 会是:定向训练的推理模型+上下文工程+工具调用+记忆。
当业务 Agent 去访问数据时,数据库越来越成为一个大的记忆体,那它如何跟业务 Agent 有效交互呢?CEO 们都希望把自然语言变成 SQL,然后自动获得一个答案。但这会面临一个难题:CEO 们问的问题空间是无穷的,但它转化成 SQL 能理解的范围以及数据里面已有的准备是有限的,而且今天这个问答的准确率最多也就到85%,甚至不到90%。
所以 Agent 在从 To C 到 To B 的逐步演进里,如果能从 do thing right 到 do right thing,就说明它变得越来越成熟、越来越靠谱了,也就像人类一样,形成了感知、理解、规划、决策、执行的闭环。
华创资本:PingCAP服务的客户来自各行各业,从他们的需求来看,AI 在企业中落地的最大推动力和变化是什么?
刘松:我见了很多互联网、金融等行业的客户,不管是证券、保险还是医疗,在以前,AI 项目基本是 IT 人的活儿,其他人是不太在意的。
但从今年2月份开始,我看到最大的变化是所有业务人员都认为我要做好自己的 AI,他们突然都变得非常积极,追着 IT 人员说我要上 AI 项目。他们已经看到能用 AI 解决生活中的很多问题,为什么工作上不能呢?所以就希望IT 部门帮他们训一个 Agent,提升精确度。好的业务 Agent 需要业务人员输入自己的专业知识,培养出一个“老专家”,这样就能减少自己日常的工作量,这是 AI 解决的知识自动化的问题。
就像当年 APP 盛行的时候一样,之所以2012年成为一个拐点,就是所有人都开始用智能手机来解决生活问题,然后解决工作问题。现在 Agent 就是那一代的升级版,只是有了推理能力后,变成了一个更加自动化的脑力工具。它的形态就是在 APP 上叠加了一层更快速地自动分析和执行的逻辑。
未来最理想的情况就是大家都能把自己的数字分身——行业 Agent 模型训出来,然后把常规的工作都交给 AI,人只负责规划和创意,我觉得这可能是值得期待的未来。因为对于中国的职场人,最现实的事情不就两个:不被 AI 替代以及不用加班,后者是未来五年最值得努力的目标。
作为一个“降临派”,我觉得 AI 首要的意义是解放人,而对中国社会的正面目标在于:第一,不加班也不裁员;第二, 增加工作的意义和乐趣;第三,老有所养;第四,给弱者公平且非歧视性的幸福权利。
华创资本:AI 时代到来后,你刚刚提到的那些客户,对数据库是不是也提出了一些新的要求?
刘松:最近我刚在上海见了一个客户就很有前瞻性,首先他们说根本不关心应用,因为分分钟可以做出来,真正的护城河其实是数据。其次,做出来的Agent 虽然效果也不错,但他们更关心如何把精度从 75% 提升到95%。而背后的技术关键点其实就在数据库和 RAG 里面。
因为现在一个基本的 Agent 组合,在大多数企业里面,上面有一个开发框架,像Dify;中间有一层 RAG,比如我们现在做的是有一层开源的框架,叫 AutoFlow,这是一套 GraphRAG 框架,开发者可以直接使用 AutoFlow 提供的封装好的组件,组合使用,提高开发效率;再下面一层,是一个 All-in-One 的 Database,支持向量/全文/图数据等多模态存储。
今天,全球 TOP10 的数据库公司里已经有 6 家是 All-in-One 架构,这意味着 SQL Database 已经整合了向量检索、全文检索和图数据处理功能,这种四库合一 All-in-One 的 Database 在底层,通过统一的存储引擎实现多模态数据管理。
未来可能的演进是下一代的 Data Agent,这一层一定是靠 AI 技术和数据技术结合的。而这一层做好了,就成为回答业务 Agent 的一个代理人。比如业务 Agent 问一个问题:未来五天北京到大理,国航的机票,时间最好的,哪一天最便宜?那这个 DataAgent 将自动完成 :跨数据库检索、多维度条件过滤、结果智能比对。业务 Agent 无需关心底层是 SQL 、向量数据库还是图数据库,这些都被中间这层屏蔽了。所以,可能数据库的边界也会发生变化,数据库包括大数据技术,在原有的范式里,它留在了存储和 CRUD,就是我都存储好了,你用 SQL 来问,这种模式可能不够了。因为业务 Agent 要用自然语言来问问题,所以中间这层——Data Agent 这层会越来越厚,现在的雏形就是 RAG 和 GraphRAG。
GraphRAG 解决什么问题呢?举个例子,我们有一个 TiDB 知识问答机器人,叫 TiDB.AI(https://tidb.ai/),可以用来问有关 TiDB 的任何问题。我们把过去 10 年 1 万份技术文档都丢进去训,当我们南美的客户碰到问题,他只需要问 TiDB.AI 就能解决,不需要专门的运维工程师去解答。
这里面的学问在于,这一万份文档在不断更新,丢进去以后,文档里面的知识点是怎么动态地被重新连接起来的?比如在数据库运维场景里面,要把 TiDB 从 7.5 升级到8.1,我能不能用 Agent 的问答来执行?它是不是把所有严肃性的边界条件都 check 到了?我能不能相信它给我的建议和诊断?在这样一个问题里面,要的是绝对知识的精度,所以仅仅用向量数据库就不够了,因为向量数据库是以图搜图、找近似回答的逻辑。要考虑每个知识点的连接、严谨性和动态性,所以我们通过强化学习训练一个小模型,在知识图谱上进行有效的检索来提升精度。
这是个工程问题,概括来说就是 GraphRAG 可能比朴素的 RAG 稍微走远了一层,它将分散的知识点关联在一起形成知识图谱。而我们更进一步,通过训练模型来不断优化知识图谱的结构,以及在检索时通过模型推理更精准地查找答案。
华创资本:假设 Agent 以后非常智能,它能绕过一般 SQL 或向量搜索,直接从数据库中拿到想要的查询结果吗?
刘松:从长远看来,有可能会实现,但这里有一个“悖论”。想要那样聪明的“老师傅” Agent 出现,首先还是要把老师傅的经验和知识教给它才行。换句话说,要实现你说的“直取数据”,恰恰需要数据库架构师、工程师把 Data Agent 给做出来。
表面上,用户用自然语言一问,数据就自动出来了,好像跳过了数据库。但其实,背后的存取过程一个步骤都没少,只是被自动化以及对用户隐藏了。这背后涉及海量的专业“窍门”:数据是怎么分布的?不同类型的数据怎么关联?如何把一个看似简单的查询,用最高效的方式执行出来?这样大量的 Know-How,不在大模型的脑子里,还是在数据库这一群人的脑子里。
所以,用自然语言直取数据方式的最终实现,解铃还须系铃人。以用户角度思考,Agent 什么时候能变得我想要的那么聪明?还得那个行业领域的人把聪明和认知装在里面,把推理能力、数据能力包括知识的动态更新的机制,全部做成一个真正的知识型的 Agent 才可以。
表面上看,Data Agent 把捞数或者是一个任意自然语言问答自动化了,但这个过程本身很复杂。随着它自己越来越智能和自动化,AI 的能力需要更深入地与数据层结合。
然后再往底层,数据库自己未来肯定也需要让 AI 降临,比如优化查询速度、自动管理数据分布(像 TiDB 的自动分片、自动伸缩、Serverless 能力),甚至用 AI 来改进数据库内核(这就是所谓的“AI for DB”)。
目前最关键的环节是怎么让数据库更好地服务业务 Agent。大家普遍认为,需要一个中间的 Data Agent 或者叫“数据智能体”来充当桥梁,解决数据访问的智能化问题,这一层现在尤为重要。
华创资本:数据库在AI Agent系统中扮演什么角色?是“记忆体”、“知识库”还是“决策引擎”?
刘松:都有。原来数据库的边界,最下层可以被认为是一个总体的数据存储,或者多模态的数据存储。
而中间这一层——Data Agent 这一层,这几个角色都有。它离具体业务很近,理解业务输入和安全边界,同时又能利用大模型的能力。这一层的核心任务,是把原始数据变成真正有用的业务知识。它不仅仅是加工数据,要考虑在这一层,怎么能够在数据和知识的处理、优化、沉淀方面提升,从而提炼出数据背后的“知识”; 最终目标是实现更高级的“认知”,让系统能像人一样理解和推理。这一层直接服务于上层的业务 Agent,不是原来的数据库产品覆盖的。
广义来看,我们把它定义为“数据智能体”,它会跟上一层的应用层——业务 Agent 去打交道,会变得越来越厚、功能越来越丰富,包括MCP等能力都可能集成进来, 甚至可能催生新的协议和行业标准。
在公有云环境里,它一定是以 API 的形式出现,且是一个组合。就像 AWS 发布的 Agent 智能体开发套件那样,既提供构建上层业务 Agent 的工具和流程,也包括底层的数据处理和安全保障能力。
这一层厂商现在还没有定义,大家都会去做,边界还没有那么清晰。数据库、云、大模型的公司都会想要参与,因为这一层是现在的刚需。
02 拒绝简单的平替
华创资本:近日,Oracle 市值盘中突破7000亿美元,这个一度被人认为“传统”的数据库巨头,用 AI+云的组合拳打破了增长天花板。你怎么解读这一现象?
刘松:我在 Oracle 有过十年的工作经历,所以我非常理解拉里·埃里森(Oracle董事长兼CTO)的思维,作为一个创始人,当他面对一项新的技术比如大模型时,他的取舍是什么?转化方式是什么?其实本质上就是这两件事情。
他的取舍是不做大模型,但做大模型必须的 AI Infra,为此他又做了三件事:第一,找老黄(英伟达联合创始人兼首席执行官黄仁勋)买了很多GPU ,构建出一个 AI Infra。Oracle 的云一直排第四,但它借助 GPU Cloud 拉来了更多的客户,因为不管做大模型的训练还是推理,总得用 GPU 吧?这里面有一个基本的认知—— AI 的应用只有在云上才会进化得更快,因为云是今天软件技术的集大成者。
第二,除了 GPU 以外,肯定还需要数据库,在这方面,本来就有大量用户用的是 Oracle,原本他们并不想搬到云上,但 Oracle 为用户提供了一个更全面的云平台。所以AI 带动了 Oracle 云从线下向线上的加速迁移。
第三,Oracle 原来的 SaaS 类别以 Fusion Cloud ERP 和 NetSuite Cloud ERP 等后台解决方案为主导,只有在公有云上才会使用,很多 SaaS 还需要叠加大模型的能力,于是 Oracle 就把它进行了改造,所以 Oracle 反而变成这波AI里完全不在大模型上做投入,但仅仅围绕 AI Infra 做了最好转化的一家公司。
华创资本:这是否反映了市场对拥有深厚企业客户根基和完整数据栈的传统巨头在 AI 时代变现潜力的重新评估?
刘松:我觉得这里面很多东西值得思考,如果不做大模型,怎么去定义大模型需要的东西?怎么结合你原来的优势?对 Oracle 来说,GPU 不是优势,但有云这个基础;数据库是原来的优势,但它们需要转化;整个应用或者 SaaS,需要叠加 AI。
其实Salesforce也一样,它也不做大模型,但加了 AI 后,对客户的效率也提升了很多,所以在整个 ToB 领域,本质上是转化、叠加的逻辑,而在 ToC 一侧,可能是颠覆逻辑。
所以每一个传统IT 厂商,其实最重要的思考就是在大模型改变未来范式的时候,那个客户需要的、不变的东西是什么?我需要+ AI 把它呈现出来,然后这个客户就会继续用我的产品。
AI 到来之后,任何一个 ToB 领域的 CEO、创始人, 都应该思考的问题就是我的取舍、我的边界以及既有的客户资产是不是发生了变化?这三样东西想清楚了以后,模型怎么跑跟我无关,但模型能力越强,就能越变成我的拉力,然后才能转化成商业模式,所以我觉得 Oracle 这个例子很值得思考。
这里面还隐含了一个逻辑:在 ToB 领域,无论推理能力多么强大,永远离不开流程、数据,以及很关键的安全。比如在模型问答方面,客户得到的回答是否超过了他的权限?怎么确保他问到的问题里面是有护栏能够识别的?可以暴露给他多少信息,这些都需要做好。
华创资本:对于 PingCAP 这样的新兴厂商,在 AI 时代与传统数据库巨头的竞争焦点会是什么?
刘松:作为原生分布式的厂商,PingCAP 独立研发的新型数据库产品TiDB,最大的标签就是高扩展性,其次是 HTAP 混合负载、云原生,这两年又增加了 AI,我们本身服务的都是数据量大、高速增长,并且有混合负载需求的客户,场景更多集中于泛互联网和金融。在 All-in-One 方面,我们既有的客户想增加AI的能力,我们可以让他不用修改习惯就能够做 AI 相关的事情,这是我们一个很大的甜点。
我过去半年在国内观察到一个很有意思的现象,在 ToB 垂直领域,有大概50% 的 AI 项目的负责人,原来可能都是管数据库的,因为大模型本身已经很强了,要想把一个 ToB 的项目做好,花在数据上的时间可能要接近60%,通常数据的脏活累活最多。
虽然行业都在吃这块甜点,但我们的定位会有差异。我经常用一个比喻:集中式数据库 Oracle 已经是顶峰了,它相当于是油车,而 PingCAP 这种分布式的架构相当于电车。同样都是开车,解决的问题最终是一样的,但引擎的处理方式不一样。分布式架构就像电车一样,你的性能上限是更容易达到的。我们很多国内的大客户,如银行、保险、证券、运营商、能源、医疗等行业,有大量客户从 Oracle 、MySQL 改用 TiDB 的,总体成本肯定会更低、扩展性和混合分析的能力也会更强,这是技术的红利。
华创资本:基于这样的技术红利,PingCAP 要做些什么事情来持续深耕中国市场?
刘松 :全世界没有任何一个市场像中国这样,对于数据处理有这么极致的要求。美国也没有双十一这样体量的购物节,没有像中国的银行业这么庞大的客户体量,7 × 24 小时的服务,还有手机银行、数字支付、即时到账、内部报表等等各种对数据极致的需求。
所以无论从交易数据量、分析能力、互联网化等方面,中国在整个数据市场里面都是一座珠穆朗玛峰,连 Oracle 都觉得中国市场的需求是他们创新的一个源泉。
对于 PingCAP 来说更是如此,我们成立这十年来最看家的本事,有七成都是国内市场最重要的金融和互联网客户教会我们的,而且我们前五年大部分的商业化贡献,也是来自国内广义的互联网和金融机构,我们才得以到今天这样的市场地位。
所以,我们到了美国、日本、欧洲,都是降维打击,就是因为过去十年,在中国这个最卷的技术市场,有最多的工程师红利、最挑剔的客户场景和最严格的合规规定,在这样的环境中,PingCAP 杀出了一条血路。
如果想做一家世界级的数据库公司,中国无疑是一个需求的大本营,也始终是我们竞争力的基石,而且 PingCAP 大部分研发工程师都在中国境内,我们希望把自己在国内打磨的产品、积累的经验延伸到海外。
最近针对国内特有的单机部署需求,我们平凯数据库(TiDB企业版)做出了敏捷模式,未来针对中国市场还会推出新的版本。
华创资本:对数据库厂商来说,当下是国产化替代的红利吗?
刘松:数据库“国产化”不是简单的平替,我们也拒绝这样的平替,因为平替对客户除了合规的意义外,没有带来新的价值。
PingCAP 创业到现在,除了互联网和金融外,也有很多其他行业的客户,比如运营商、能源、医疗、交通,都对数据量要求很高。其实早在三四年前,就有大量医疗行业的客户已经从 MySQL 迁移到 TiDB 了,因为它数据量很大,我们单体的医疗客户就有 100 个 TB 这样的级别,所以医疗也是未来我们非常看重的领域。此外,还有交通等领域,也对 7 × 24 小时高可用有很大的需求。
所以,我们做的事情,更重要的意义在于给这些行业创造价值,是不是让数据库能够处理更大的数据量?是不是有更好地数据共享能力,并且也能支持 AI 的应用?从这个角度看,不仅不是简单的平替,反而还可能会增加成本。
尤其单机部署的数据库,因为没有足够的灵活性,在处理 AI 应用方面会遇到很大瓶颈,所以未来面对数据量越来越大、AI 需求涌现,这二者结合时会对新一代数据库提出更高的要求,这也是未来三、五年行业一个比较大的变化。事实上,市场已经在收缩了,最近《数据库发展研究报告(2025年)》显示,过去一年中国的数据库厂商从 167 家变成了103家,减少了64家。
华创资本:为什么会有这么大的收缩?
刘松:因为数据库在国产化的过程中,第一批客户已经开始能够分出好坏了,我们已经接到了大量二次替代的要求。
TiDB 一直靠开源社区打磨,有些客户在前期试用时就能体会到好用。过去几年,很多客户先后用过 Oracle、 MySQL,后来发现不管是数据量还是合规的角度,这些数据库已经不能满足他们的需求,希望能换成像 PingCAP这样更新一代的数据库。
所以未来两三年数据库国产化进程中,厂商比拼的还是“好用”这个关键点。因为一个客户有上百个系统,需要 7 × 24 小时地跑,每天应用的调用次数可能是上千万甚至上亿次,所以未来要从替代走向好用。此外,在 AI 这个时代,数据库都要开始做到 AI ready,解决面向 AI 的扩展性的问题。这些因素叠加,都会导致市场竞争格局的变化。
数量收敛对产业总体来说是一件好事,因为全世界的数据库现在也就不到400家,美国和中国就分别有146家和103家。未来谁能胜出,首先一定要靠产品力,其次是生态,包括上下游的生态和人才的生态。所以我们打磨了十年的开源产品,是经过了中国和全球用户的验证,才慢慢转化成我们的客户的。
03 全球化需要高度本地化
华创资本:如果拿 TiDB 的成功经验来说,在海外为什么能这么成功?做到了什么?
刘松:数据库这个软件本身是通用的,这是一个基础。然后要去看数据库全球市场份额哪个国家大,就先去哪。美国占40%,日本可能有15%,欧洲也得布局,这是我们出海的基本逻辑,就是你的产品边界决定了你全球的重心。
在全球化的成功路径上,对我们来说最重要的、决定性的意义就是开源+云。
TiDB 以开源为主,出海的时候面对复杂的地缘政治,我们作为一个完全开源的产品,客户信任这个最难的问题已经解决了。接下来,云解决了商业模式的问题,因为云数据库在 2018 年以后已经被验证了,只要你能做出一个云数据库,客户就愿意采买,你只需要证明自己在某方面比亚马逊、谷歌、微软做得更好就可以。所以如果没有这两个,全球化就会很难。
此外,还有一个关键就是完全的本土化,比如我们在日本的员工,可能 70% 都只会说日语;我们在印度也有一个很小的分部,也都是印度人。
包括我们的文化是 Remote-Friendly,远程友好,这对于我们在海外招聘亚马逊、Snowflake 等硅谷大厂人才时是一个很有吸引力的选项。
从成立第一天起,PingCAP 的企业文化就是技术文化、工程师的文化,全世界的程序员们都希望晚点起、尽量不去公司,很自由,才有创作灵感,这就很世界大同。
华创资本:但管理上的挑战是不是会更复杂,会影响效率吗?
刘松:如果只用一个词来形容 PingCAP,就是“分布式”,连我们三个创始人都是三副本的,他们各司其职,形成了一个小闭环。美国的同事就解决美国的问题,日本同事解决日本的问题,印度同事解决印度的问题,决策时尊重每位员工的意见。所以在我们公司里面可能有一个传统,任何一件事情,不管什么情况,只要有一个员工提出反对意见,我们都要严肃地去听他的理由是什么?就像我们数据库的共识算法一样,最终达成一致才能继续往下执行。
因为要顾及尽量多人的意见,可能决策效率没有那么快,但肯定也屏蔽了很多快速决策的坑。这可能很适合数据库公司,因为这个赛道是长期主义的,我们不追求绝对的快,数据库已经被很多人用起来了,稳定是第一位的,其次是在这个基础上再增加很多功能,这是我们行业的业态决定的。
所以回头看,这十年 PingCAP 做过的明显错误的决定比较少,我们不会因为短期利益去做出一个快速的决策,这可能也是文化上的差异吧。
华创资本:我们看到一个现象,很多 AI native 的软件创业公司在成立第一天就选择了出海,这跟上一代大多数软件创业者非常不一样。你说过,出海这件事,选择大于努力,那在数据库领域如何具象化?
刘松:数据库和 AI 可能还不太一样,在中国是能打磨出一个世界级数据库产品的,而 AI 首先要解决快速获得流量以及技术栈的低成本问题。
选择大于努力的意思是即使出海,有些国家就是更容易成功,比如做数据库,就不得不做美国这个市场,因为它最大;但如果做 AI 游戏,可能在东南亚更容易成功,毕竟文化壁垒更小。
今天中国消费类互联网的玩法,比如小红书、抖音,和美国、欧洲都是有区别的,这背后还不是一个简单的选择,里面有好多参数,尤其做应用,涉及到文化、习惯、宗教、合规、隐私保护等等,所以壁垒还是比较多的。
华创资本:你曾说“云+全球化+开源”是数据库公司持续成功的铁三角——但AI 时代来了,这个铁律要改写吗?
刘松 :我认为要再加一个 AI,现在是这四样东西在塑造,甚至直白点说,五年以后数据库厂商的估值就跟这四个东西有关。
其实数据库是一个接近 50 年历史的赛道了,它古老而年轻,最开始解决的问题很简单,就是 ERP 时代的存储问题,为什么又年轻了呢?因为数据的需求不断在改变。
第二,它是“四世同堂”的,就是几代技术都还活着,Oracle 在,我们这种新一代的公司也在,但过去十年,数据库主要是被开源和云定义的,云数据库的崛起以及开源数据库变成了主流的方向。因为开源数据库可以跑得更快,现在又叠加了 AI,“开源+AI+云”三者形态又有一个化学反应。
反过来讲,这两年大模型开源也是个话题,DeepSeek 就证明开源大模型会跑得更快,所以 AI+的领域都要考虑这四样。
华创资本:作为软件行业过去 20 多年的一个亲历者和观察者,从 Oracle、阿里云到 PingCAP,你的技术和商业视角有什么转变?对行业的理解有哪些认知上的变化?
刘松:2007 年时,我还在 Oracle,但我那个时候就对互联网比较感兴趣,决定开始写 blog。“博客”这个词现在已经很古老了,但那是我互联网原教旨主义的起点,你只有变成一个 blogger,写了三四百篇文章,你才能知道互联网是怎样一个世界,我的网感就是那个时候培养出来的。
我当时算是外企IT人里面一直在关注互联网技术和模式的,当时我就认为互联网是先进生产力。后来“棱镜门”事件发生,再加上公有云已经开始,我觉得应该靠近一个互联网公司,所以后来就去了阿里云,让我对互联网积累了很多 Know- How。
这几段职业经历,让我意识到公有云始终是所有新一代IT 技术的集大成者,哪怕 AI,也要基于云才能有力量。因为某种意义上讲,大模型要做Agent,也需要用底层的云资源,要用数据、开发工具、算力、GPU 等。
云最大的价值,就是回到互联网原教旨主义,相信一个绝对低的门槛,通过网络的东西会带来奇迹。所以过去十年,其实是公有云推动了整个中国互联网的发展和全球化。
华创资本:你觉得数据库行业未来最重要的技术上的拐点可能会是什么?
刘松:从云的角度,放眼全球,Serverless 肯定是一个关键的技术,它会越来越普及,因为它符合未来更灵活、更高扩展性的一体化的消费模式;第二,是 AI 与数据库的结合,Data+AI ,尤其是 Data Agent,肯定是未来非常关键的赛道,它甚至独立于数据库本身;最后一点就是数据库未来的形态,5 年以后的数据库,是不是能很好地服务 Agent,我觉得这几个是未来最关键的拐点。
(来源:钛媒体)