北京人形机器人创新中心拿下双冠王 具身智能里程碑
最近,全球网民通过直播见证了Figure AI的人形机器人在物流传送带上连续工作几十个小时,不间断地分拣包裹。这一过程完全依靠机器人的视觉系统自主完成识别、抓取和分拣动作,标志着具身智能的一个重要里程碑。
当前具身智能的核心是智能体(Agent)。如今,机器人已迈向基于模型的端到端推理阶段,不再只是按照预设程序完成单一动作,而是要依靠自身视觉系统识别环境、理解目标、规划动作,并在持续变化的物理世界中完成任务。谁能更好地让机器人看懂世界、推理任务、想象后果并执行动作,谁就更接近通用具身智能的核心。

国内具身智能领域传来一个重要进展,北京人形机器人创新中心在全球权威评测WorldArena中取得突破。其发布的Pelican-Unify 1.0具身大一统模型登顶榜单,EWM Score稳居榜首,3D Accuracy接近满分。此前,北京人形发布的WoW具身世界模型也曾在WorldArena Data Engine赛道上获得Hugging Face官方推荐,并被斯坦福等顶尖团队引用。这意味着北京人形成为全球唯一同时登顶WorldArena两大核心赛道的机构,跻身具身大脑能力世界第一梯队。

从榜单成绩来看,Pelican-Unify 1.0以66.03的得分位居榜首,在多维度评估中表现出色。特别是在3D Accuracy上达到了98.12,接近满分,显示出该模型具备接近真实世界的空间建模能力。这不仅意味着模型生成的画面质量高,更重要的是它能准确理解和重建场景中的空间关系,对机器人至关重要。

自2025年以来,智能体成为AI行业的热门词汇。OpenAI、谷歌等公司纷纷押注,国内大模型厂商也积极参与。智能体的核心逻辑是让模型不仅能回答问题,还能完成任务,感知环境、制定计划、调用工具、持续执行。这一逻辑在数字世界尚可实现,但在物理世界中面临更多挑战。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com