我国日均Token调用量超140万亿
3月24日,国新办举行新闻发布会,介绍第九届数字中国建设峰会有关情况。
国家数据局局长刘烈宏在现场表示,到今年3月,我国日均Token(词元)的调用量,已经超过140万亿。相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,增长了40%多。日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段。
在即将举办的第九届数字中国建设峰会上,工业和信息化部将主办数据要素赋能新型工业化的专题会议。
将实施六大专项行动
日常的智能助手、产业端的智能分析等,离不开海量高质量的数据作为支撑,国家数据局在推进高质量数据集赋能人工智能发展方面做了哪些工作,接下来还有哪些安排?
刘烈宏表示,国家数据局高度重视数据要素赋能人工智能创新发展的工作,针对高质量数据集建设“小和散”的问题,会同26个部门组织遴选了72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例,构建了链主带动、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态,持续推动高质量数据集的建设。
为推动数据标注产业发展,国家数据局布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,指导举办了7次数据标注的供需对接会。下一步,国家数据局将面向科技创新强、发展基础好、产业特色优的地区,聚焦“知识密集型”和“技术驱动型”这两个方向,梯次布局一批技术先进、特色鲜明、高效赋能的数据标注产业创新试验区。
刘烈宏进一步指出,国家数据局还持续培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。支持数据流通服务平台、数据商等机构提供流通交易的服务,鼓励各类数据流通服务机构探索多样化的高质量数据集流通利用模式,推动高质量数据集供需有序对接,支持行业高质量数据集流动起来。
我国高质量数据集的建设工作取得了阶段性的成效,截至2025年年底,全国已建成的高质量数据集超过10万个,总体量超过890PB(计算机存储容量单位),相当于中国国家图书馆数字资源总量的310倍左右。到今年3月,我国日均Token调用量,已经超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,增长了40%多。
“日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力也显著增强,现在热议的Token出海,就是产业竞争力增强的一个标志。从数据的维度来看,也标志着数据集的供给在大量增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。”刘烈宏介绍。
刘烈宏强调,下一步,国家数据局将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready(AI就绪度)高质量数据集,实现高质量数据集供给的量质提升。
推动工业数据标准研制
《每日经济新闻》记者还注意到,近日,工业和信息化部印发通知,启动工业数据筑基行动,开展面向人工智能赋能的高质量行业数据集建设先行先试。后续将如何进一步推进?
工业和信息化部信息技术发展司司长王彦青表示,下一步,为做好先行先试,工业和信息化部要继续做好三方面的工作。
一是要加强支撑保障。联合地方的工信以及数据主管部门,做好对先行先试联合体的资源保障和指导支持,及时跟进解决遇到的问题,汇聚经验,加快形成可推广的成果。
二是要强化政策引导。推动出台数据要素赋能新型工业化的政策文件,印发工业场景数据要素应用参考指引,加强发展的引导和模式的宣介。
三是要培育良好的生态。加快推动工业数据标准的研制,发展壮大数据咨询、数据治理、数据标注等数据服务企业,支持举办一批技术研讨会、供需对接会等,同时要做强做优人工智能开源社区,打造高质量开源数据资源聚集的高地。特别是在即将举办的第九届数字中国建设峰会上,工业和信息化部将主办数据要素赋能新型工业化的专题会议,会邀请先行先试单位的代表来分享一些经验。同时,还要启动2026年数据要素赋能新型工业化的大赛。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com