欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年03月27日 星期五 农历:丙午(马)年-二月-初九
您现在的位置是:首页 > AI

Token用量暴增,大模型正从训练时代走向推理时代

沄森™2026-03-27
  【大河财立方 记者 陈玉静】“现在的token用量就像当年每个月只有100兆流量一样,还处于早期阶段。”无问芯穹联合创始人兼CEO夏立雪在3月27日2026中关村论坛年会的一场AI开源前沿论坛上,用这样一个形象的比喻,道出了当下大模型发

  【大河财立方 记者 陈玉静】“现在的token用量就像当年每个月只有100兆流量一样,还处于早期阶段。”无问芯穹联合创始人兼CEO夏立雪在3月27日2026中关村论坛年会的一场AI开源前沿论坛上,用这样一个形象的比喻,道出了当下大模型发展的前夜。

  从智谱上线首个面向OpenClaw场景深度优化的基座模型,到小米、港大团队等各方玩家纷纷布局,一场关于OpenClaw与开源的深度对话正在展开。

  OpenClaw爆火,让顶尖模型不再只是程序员或极客的专利

  论坛伊始,月之暗面创始人杨植麟向嘉宾抛出了一个广为关注的问题:在日常使用OpenClaw或者类似产品时有哪些印象深刻的体验?从技术视角又如何看待其演进?

  智谱CEO张鹏很早就开始使用OpenClaw,他最大的感受是顶尖模型不再只是程序员或极客的专利,普通人也能比较方便地使用。“我更愿意把它称作一个‘脚手架’,它在模型的基础上搭建了一个牢固、方便又灵活的脚手架,大家可以按照自己的意愿去使用底层模型,原来受限于技术能力的一些想法,现在通过简单交流就能完成,这对我的冲击很大。”

  无问芯穹联合创始人兼CEO夏立雪坦言,最初使用OpenClaw时感觉“反应好慢”,但很快意识到,这并非之前的聊天机器人,而是一个能完成大型任务的人。“当开始提交更复杂的任务时,我发现它能做得很好。”但这也对系统能力提出了更高要求。他以公司数据为例,透露自1月底起,token量每两周翻一番,到现在为止翻了10倍,上次见到这个速度还是3G时代手机流量的感觉。现在的token用量就像当年每个月只有100兆流量一样,这种情况很多资源需要更好地优化和整合。

  小米MiMo大模型负责人罗福莉将OpenClaw视为Agent框架的革命性事件。她指出,尽管深度编程者可能首选其他工具,但OpenClaw在Agent框架设计上的领先性不容忽视。“它带来的核心价值在于开源让社区能深入参与和改进,此外,它让国内一些水平没有非常接近闭源模型但水平还是在次闭源模型的这一赛道上的模型的上限拉得很高,同时又把下限保证得很好,更重要的是,OpenClaw让更多人发现,在大模型之外,智能体也有很大的想象空间。”

  香港大学助理教授、Nanobot团队负责人黄超则从交互模式的角度剖析了OpenClaw走红的原因。他认为,OpenClaw带给人一种“活人感”,更接近人们想象中的个人“贾维斯”。OpenClaw带来的是一种“玩起来”的心态,撬动了整个生态里的所有工具。随着Skills等机制的发展,越来越多人可以设计面向OpenClaw这类系统的应用,这和开源生态结合得非常紧密。

  Agent时代,需要打造更智能化的“Token工厂”

  近日,智谱推出全球首个面向OpenClaw场景深度优化的基座模型——GLM-5-Turbo,同时上调了GLM-5-Turbo的API价格,幅度为20%。

  对于为何提价,张鹏在现场回应称,让聪明的模型做复杂的任务token的消耗量非常大,所以智谱做了一些优化,让其在面临复杂任务的时候,有更高的效率。提价方面,因为现在不再是简单的问答,完成一个任务需要的token量可能是原来的十倍甚至百倍,推理成本相应提高,回归到正常的商业价值,长期靠低价竞争不利于行业发展,提价也能让智谱在商业化上形成良性闭环,能持续优化模型能力。

  随着token量爆发,大模型可能正从训练时代走向推理时代。从基础设施层面看,推理时代意味着什么?

  夏立雪表示,当前最紧迫的是解决OpenClaw带来的token量暴增带来的系统效率问题。他们的做法是软硬件结合,接入了几乎所有种类的计算芯片和几十个不同的算力集群。资源不足时,第一是把能用的资源都用起来,第二是让每个算力都用在刀刃上。但面向Agent时代,这些还不够,需要打造更智慧化的“Token工厂”,更长远看,基础设施本身也应该是智能的——这个工厂能自我进化,有一个Agent当CEO来管理整个基础设施,根据AI客户的需求自己迭代。基础设施和AI的发展不应该隔离,应该产生丰富的化学反应。

  未来12个月,大模型面临最大的问题是算力

  大模型发展一日千里,未来12个月,大模型发展有哪些趋势?

  黄超的关键词是“生态”。他认为,现在Agent让大家很活跃,但未来真的要让它从“好玩”变成“好用”,从个人助手真正转化为“打工人”或“搬砖工具”,成为真正的同事,需要整个生态的努力。未来的软件可能不再面向人类,而是面向Agent原生使用的。

  罗福莉的关键词是“自进化”。在她看来,自进化是唯一能创造新东西的地方——不是替代现有人的生产力,而是像顶尖科学家一样探索世界上还没有的东西。一年前罗福莉认为这需要三到五年,但近期她认为可能就在未来一到两年,大模型叠加自进化的Agent框架就能实现科学研究至少呈指数级的加速。

  夏立雪提出“可持续”。他表示,从基础设施角度看,资源终究是有限的,他们作为Token工厂,能否持续稳定、大规模地提供Token,让顶尖模型继续为下游服务,是很重要的问题。所谓“可持续”也是想把“中国特色”token经济学做起来,过去我们叫Made in China,现在我们想做有点像AI Made in China,成为世界的Token工厂。

  张鹏指出,未来12个月面临的最大问题是“算力”,所有技术、智能体框架让大家创造力和效率提升了十倍,但前提是用得起、用得上,不能因为算力不够导致思考半天也不出答案,连研究进展也会受阻,这可能需要大家一起来想办法。

  责编:金怡杉 | 审校:张翼鹏 | 审核:李震 | 监审:古筝

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com

相关标签: