Anthropic自曝下一代Claude训练内幕 揭秘核心方法论
沄森™2026-05-24
Anthropic的产品负责人Alex Albert在一次35分钟的访谈中,首次详细披露了Claude模型的研发全过程
Anthropic的产品负责人Alex Albert在一次35分钟的访谈中,首次详细披露了Claude模型的研发全过程。Alex是打造下一代Claude模型的核心人物,在与科技博主Peter Yang的对话中,他几乎毫无保留地分享了内部造Claude的方法论,包括研发逻辑、内部评估流程、性格训练方法以及正在推进的意识研究。

Claude的每一代模型在预训练前就被明确规划好其擅长的能力,如编程能力、知识工作能力和Excel表格处理能力等。这些决策基于企业客户的反馈和Anthropic员工在日常工作中遇到的问题。Anthropic团队将模型视为一个产品来对待,确保每个新模型在训练前就明确定义其核心能力。

Alex还介绍了Anthropic内部的一个核心决策框架——“单向门”(One-Way Door),即不可逆的决策。例如,在预训练之前选定模型架构就是一个典型的单向门决策。但随着技术的发展,许多过去被认为是单向门的决策现在变得可逆。这使得开发时间大大缩短,以前构建一个MVP需要2-4周,现在只需1天。Anthropic自己也是Claude最苛刻的用户,通过使用Claude来训练Claude,形成了一个闭环。

为了评估Claude的表现,Anthropic采用了用户反馈、聚类分析、生成合成数据并转化为评估基准的方法。这些合成问题最终会成为测试下一代Claude能力的标准评估集。评估必须锚定在真实用户的真实任务上,只有当评估与实际场景对齐时,研究团队才会投入资源进行修复。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com