(文/陈济深 编辑/张广凯)

"去年的东西都是nothing。"

在5月20日阿里云峰会后的媒体沟通会上,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光谈起Token收入时,反复强调,在一个高速增长的市场里,任何基于去年数据的份额讨论都已经没有意义。

去年底,刘伟光曾公开表态"阿里云的目标是拿下2026年中国AI云市场增量的80%"。在当时引发了不少质疑。

但过去5个月发生的事正在让这个数字变得不那么遥远。据《财经》杂志报道,阿里云的MaaS日均收入5个月增长了约15倍,月度Token收入已达到数亿元级别。

5个月15倍:Token收入的拐点已经来了

Token支出在企业IT预算中的占比到底有多大?

半年前,刘伟光的答案是"可能都不到1%"。这一次他的判断发生了明显变化。对AI原生创业企业来说,Token支出可以占到IT支出的100%。中国互联网类企业当中,这个比例已经到了15%到20%。传统企业还在5%以下,但增速很快。

他给销售团队定的目标是,每个客户的MaaS收入占比年底不低于20%。对于坐拥大量企业和开发者客户的阿里云而言,这意味着一个巨大的增量空间。

真正让Token收入大爆发源于大模型Coding能力的跃升。他认为AI的核心价值不是把人现在的效率提升两倍,而是"创造人类现在做不了的工作"。没有程序员会所有编程语言,AI程序员可以。

他还做了一个更激进的判断:AI Coding的价值不止于生成新应用,更大的一波机会在于解锁那些70年代、80年代写的COBOL应用和C应用。"那些程序太老了,不能搬上云,写注释的程序员都退休了。"这类"从来不存在的工作",才是AI Coding真正要干的事。

他对这个判断的确信程度很高,在现场连说了三遍"我非常有理由相信"。

而对阿里云的销售团队而言,这种变化体现得更直接。刘伟光坦言,在云计算时代,盘点客户IT预算时有一块钱他们始终吃不到:企业内部的软件开发和人力外包。"现在正好反过来,这些部分恰恰是AI Coding可以100%命中的点。"

Token收入的定价终局,刘伟光认为"一定是结果付费"。但他也承认,中国目前阶段还是按量收费为主,按结果付费的案例正在推进中,已经出现有一定的苗头。

大语言模型和视频模型不应混在一起算

对于阿里云而言,一个避不开的话题是Token市场份额。过去一年,阿里云和火山引擎围绕"谁是第一"的问题各引不同机构的数据,在机场广告牌上打了一场隔空交锋。

刘伟光的观点是:不能强行把视频模型和大语言模型放在一起统计。

从技术原理看,视频生成和大语言模型推理是两种不同的方式。国际上的通行做法也是把两者分开统计。不然会模糊真实的市场结构。

刘伟光表示,在大语言模型的MaaS市场,阿里云就是第一。

这背后也是业界对赛道优先级的判断。视频市场是一个有潜力的垂直市场。但和Coding和Agent方向的未来市场空间相比,不是一个量级。

阿里云把Coding和Agent作为最核心的火力方向,因为大语言模型改变的是"整个人类通用的生产力"。Coding产生Agent,Agent产生AI应用,Agent又回到云上消耗算力。这构成了一个完整的Token经济循环。

两类模型对Token的消耗逻辑也截然不同。视频模型的Token消耗本质上是一次性的,生成一段视频,任务就结束了。但Coding场景是一个自我进化的过程:模型写出代码,代码变成应用,应用部署到云上运行,运行过程中又需要调用模型,模型再生成更多代码。这种循环意味着Coding产生的Token消耗是持续性的、可叠加的,和视频的"一次性交付"在商业模型上有本质区别。

要让自研芯片和模型协同跑出最高性能

本次,阿里云峰会的另一个重头是平头哥自研芯片真武M890的发布,以及真武系列芯片路线图的首次公开。

据透露,截至目前,真武系列AI芯片累计出货56万片,在阿里巴巴内部、蚂蚁集团、智能驾驶、金融、政务、运营商等20多个行业得到广泛验证之后,才开始正式对外发布路线图。

除了成本控制等,阿里做芯片还有一个更深层次的动机。

刘伟光用谷歌做类比。谷歌将TPU芯片与自研大模型深度绑定,在深度学习框架中跑出了最高的性能。"这也是我们未来希望走的方向。如果阿里云自研芯片能在同等模型下跑出更多、更高质量的Token,就比对手更有优势。”

按照阿里云峰会公布的路线图,平头哥未来两年将陆续推出算力更强的真武V900和真武J900两代芯片。

AI正在打开云厂商吃不到的市场

在2026阿里云峰会上,演讲嘉宾们反复提及的判断是"AI for everything"。

刘伟光把这个抽象概念拆成了一个又一个具体场景,用来说明云的作业空间正在被AI撑大。

以汽车行业为例,阿里云最早只做车企的ERP系统上云,后来拓展到智能驾驶的算力和云底座,再后来做座舱的大模型对话。"现在更不一样了,连汽车的广告营销都可以做了。这在过去是无法想象的。"

金融领域的变化同样显著。他以券商为例,过去阿里云没法跟人谈那些专业领域。现在投顾、投研、量化私募等客户主动找阿里云谈合作,因为这些业务必须跟大模型深度结合。"我们甚至还为金融行业打造了一些专门的智能体,这在过去不是阿里云的业务范畴。"

保险行业也出现了新场景:业务人员谈完一个企业客户后,模型自动生成一套保险方案。"如果没有AI这是不可能实现的。"

他还特别提到了一个出乎意料的行业:看起来非常传统的畜牧企业正在大规模拥抱AI。

刘伟光从这些场景里得出的结论是:以前AI和云是两件事,现在做着做着发现云计算变成了AI的组成部分。"AI的cover更大了,它脱离了原来IaaS那条小路。"Token正在切入企业的营销、BI、内部运营管理,而不只是IT基础设施。"整个MaaS的天花板变高了。"

这也是为什么他认为未来衡量Token市场规模的参照物不应该是企业IT支出的百分比,而应该是企业total cost的百分比。

GPU云和CPU云并不对立

刘伟光还提到了一个产业界讨论已久的问题:GPU云是不是就等于AI云,CPU云是不是就是传统云。

刘伟光给出了否定的回答。

他引用了一个来自实际运营数据的观察:当Token消耗被换算成GPU等价算力时,每部署一块GPU所带动的CPU云资源消耗接近1:1的比例。换句话说,AI Agent在运行时不只需要GPU做推理,还需要同等规模的CPU资源做后端支撑。

他以MiniMax的龙虾(OpenClaw)为例。龙虾每开一个沙箱实例,会在阿里云后台自动激活一系列云资源,包括数据库、虚拟机和存储。"一天之内完成的云计算开通,可能过去是我们人要干两周的活。"这些被Agent自动激活的云资源,主要就是CPU云。

"整个阿里云今天都是为AI服务的。"他说,"没有很强大的CPU云,怎么去服务这些Agent?"

把GPU云和CPU云对立起来,在刘伟光看来"是不成立的"。

这也是阿里最新财报电话会中披露的三个收入增长点之一:除了MaaS的Token收入和私有化部署收入之外,第三个增长点就是传统CPU云产品在Agent带动下的同比飞速增长。

阿里财报电话会上的另一组数字也在印证刘伟光的判断。截至2026年3月,阿里云AI相关产品收入已占外部收入的30%以上,百炼平台客户数同比增长了8倍。MaaS和应用的年化经常性收入(ARR)在季度超过80亿元,管理层预计年底将突破300亿元。

同一天,阿里巴巴集团主席蔡崇信和阿里CEO吴泳铭联合发布了致股东信,措辞更明确:"AI业务已跨越初期投入阶段,正式迈入商业化回报周期。"信中宣布将持续加大AI基础设施建设和自研芯片的投入,目标是"将AI+云打造成阿里巴巴又一个增长动力"。

阿里云峰会的连串发布和阿里的致股东信,事实上指向同一个判断:卖Token比卖资源更重要,MaaS将成为阿里云最大的收入产品。

这个转变能不能完成,接下来几个季度的财报会给出答案。