中昊芯英发布新一代高性能TPU AI专用算力芯片“须臾”

创始人2026-06-30 22:14:14

　　上证报中国证券网讯(记者王子霖)2026年6月30日，中昊芯英正式发布新一代全自研高性能TPU AI专用算力芯片“须臾”，同步推出搭载“须臾”芯片构建的软硬件一体化智算底座——泰则2.0AI高性能智算平台。作为初代“刹那”芯片、初代泰则

　　上证报中国证券网讯(记者王子霖)2026年6月30日，中昊芯英正式发布新一代全自研高性能TPU AI专用算力芯片“须臾”，同步推出搭载“须臾”芯片构建的软硬件一体化智算底座——泰则2.0AI高性能智算平台。作为初代“刹那”芯片、初代泰则智算服务器的全面升级产品，“须臾”与泰则2.0在底层架构、算力峰值、片上存储、集群互联、计算能效等方面皆实现跨越式提升。

　　作为国内最早投身于TPU架构AI专用算力芯片研发的企业之一，中昊芯英在2023年成功流片了国内首枚高性能TPU AI专用算力芯片“刹那”并实现量产和产业化。基于“刹那”三年规模化落地的实践经验，中昊芯英完成新一代芯片“须臾”的架构革新，针对性解决超大模型、长上下文、海量词元交互场景下传统算力存在的访存延迟、能耗偏高、并行效率不足等痛点。

　　据了解，单颗“须臾”芯片深度优化大模型专属张量计算逻辑，扩容寄存器与大容量片上缓存，核心性能参数实现大幅跃升。据悉，单芯片混合精度浮点算力达896TFLOPS，性能是上一代芯片“刹那”的3倍；8-bit推理算力可达1792TOPS，适配海量词元高并发推理场景。功耗方面，单芯片额定功耗600W，相较于算力性能持平的传统算力芯片，功耗降低50%，天然适配绿色低碳智算中心建设。

　　“须臾”延续中昊芯英全自研TPU技术路线，实现芯片IP核、专属指令集、底层算子加速库、整机系统软件完整自主研发，无海外核心技术依赖。公司核心技术完整覆盖芯片设计、电路开发、编译工具、模型适配全链条，可快速高效完成新模型和迭代模型的适配和部署，满足政务、金融、电网等关键行业的信息安全合规要求。

　　本次同步推出的泰则2.0AI高性能智算平台中标准的最小计算单元(即“泰则2.0智算节点”/单机)由两路高性能CPU处理器与8片高性能TPU处理单元互联构建而成，从物理形态上形成1台通用的CPU服务器外接1台高性能TPU算力加速设备，算力达7.168P(混合精度)，同等任务下整机能耗仅为传统GPU服务器的80%。

　　值得一提的是，软件层面实现了全主流AI框架兼容，原生支持PyTorch、vLLM、SGLang等开发工具，训练场景适配DeepSpeed、Megatron-LM分布式套件；已完成Qwen全系列、DeepSeek、GLM、MiniMAX等数十款大语言、多模态模型深度适配，开发者无需大规模代码改造即可快速完成模型迁移，大幅降低国产算力替换门槛。

　　中昊芯英的初代“刹那”芯片已在多个行业实现大规模客户交付与成熟落地。目前，公司产品已成功部署于由深圳联通、天津移动、太极股份（002368）、江西上饶等运营商、政府机构、及科技企业建设的多个超大规模智算中心，并已在高校、科研机构等的科研计算平台与教学实验环境中投入使用，辐射至金融、传媒、教育、医疗等广泛行业领域。

　　面向未来，中昊芯英将继续依托已有的大规模客户基础，持续进行技术迭代，优化TPU芯片算力、能效与片上存储架构，适配更多大规模大模型与多智能体集群的运算需求；同时联合主流大模型厂商、云服务商及系统集成商，深化软硬件协同开发，进一步扩展自主可控算力产业链的落地版图。

所有文章未经授权禁止转载、摘编、复制或建立镜像，违规转载法律必究。

举报邮箱：1002263188@qq.com

中昊芯英发布新一代高性能TPU AI专用算力芯片“须臾”

为高校人工智能通识教育注入文化灵魂

市场监管总局发布173种产品抽检细则安防及消防品类成重点关注对象

交通运输部副部长李兴湖：加快构建现代化水运体系

四大核心变化，券商金融“五篇大文章”专项评价办法迎来修订

中昊芯英发布新一代高性能TPU AI专用算力芯片“须臾”

为高校人工智能通识教育注入文化灵魂

市场监管总局发布173种产品抽检细则 安防及消防品类成重点关注对象

交通运输部副部长李兴湖：加快构建现代化水运体系

四大核心变化，券商金融“五篇大文章”专项评价办法迎来修订

市场监管总局发布173种产品抽检细则安防及消防品类成重点关注对象