欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年07月01日 星期三 农历:丙午(马)年-五月-十七
您现在的位置是:首页 > AI

单芯片混合精度浮点算力达 896TFLOPS,中昊芯英新一代 TPU 芯片「须臾」发布

创始人2026-06-30 23:06:22
   IT之家6月30日消息,中昊芯英今天宣布推出新一代全自研高性能TPU AI专用芯片“须臾”,软硬件一体化智算底座“泰则2.0”也在今天同步亮相。  据介绍,须臾的单芯片混合精度浮点算力可达896TFLOPS,性能是上一代芯片“刹那”的

   IT之家6月30日消息,中昊芯英今天宣布推出新一代全自研高性能TPU AI专用芯片“须臾”,软硬件一体化智算底座“泰则2.0”也在今天同步亮相。

  据介绍,须臾的单芯片混合精度浮点算力可达896TFLOPS,性能是上一代芯片“刹那”的3倍;8-bit推理算力可达1792TOPS,适配海量词元高并发推理场景。须臾的显存、芯片内部互联速率均有大幅提升,支持超长上下文。单卡额定功耗600W,相比传统算力芯片功耗降低50%,助力低碳数据中心建设。

  同时,须臾的芯片IP核、专属指令集、底层算子加速库、整机系统软件均是完整自主研发,无海外核心技术依赖。满足政务、金融、电网等行业的安全合规要求。

  而“泰则2.0”则是高性能智算平台中标准的最小计算单元,它搭载两路高性能CPU处理器与8片高性能TPU处理单元,从物理形态上形成1台通用的CPU服务器外接1台高性能TPU算力加速设备,算力达7.168P(IT之家注:混合精度),同等任务下整机能耗仅为传统GPU服务器的80%。

  此外,该平台从软件层面实现了全主流AI框架兼容,原生支持PyTorch、vLLM、SGLang等开发工具,训练场景适配DeepSpeed、Megatron-LM分布式套件;已完成Qwen全系列、DeepSeek、GLM、MiniMAX等数十款大语言、多模态模型深度适配,开发者可快速完成模型迁移。

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com

相关标签: