欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年05月24日 星期日 农历:丙午(马)年-四月-初八
您现在的位置是:首页 > 头条

Anthropic自曝下一代Claude训练内幕 揭秘核心方法论

沄森™2026-05-24
Anthropic的产品负责人Alex Albert在一次35分钟的访谈中,首次详细披露了Claude模型的研发全过程

Anthropic的产品负责人Alex Albert在一次35分钟的访谈中,首次详细披露了Claude模型的研发全过程。Alex是打造下一代Claude模型的核心人物,在与科技博主Peter Yang的对话中,他几乎毫无保留地分享了内部造Claude的方法论,包括研发逻辑、内部评估流程、性格训练方法以及正在推进的意识研究。

Anthropic自曝下一代Claude训练内幕

Claude的每一代模型在预训练前就被明确规划好其擅长的能力,如编程能力、知识工作能力和Excel表格处理能力等。这些决策基于企业客户的反馈和Anthropic员工在日常工作中遇到的问题。Anthropic团队将模型视为一个产品来对待,确保每个新模型在训练前就明确定义其核心能力。

Anthropic自曝下一代Claude训练内幕 揭秘核心方法论

Alex还介绍了Anthropic内部的一个核心决策框架——“单向门”(One-Way Door),即不可逆的决策。例如,在预训练之前选定模型架构就是一个典型的单向门决策。但随着技术的发展,许多过去被认为是单向门的决策现在变得可逆。这使得开发时间大大缩短,以前构建一个MVP需要2-4周,现在只需1天。Anthropic自己也是Claude最苛刻的用户,通过使用Claude来训练Claude,形成了一个闭环。

Anthropic自曝下一代Claude训练内幕 揭秘核心方法论

为了评估Claude的表现,Anthropic采用了用户反馈、聚类分析、生成合成数据并转化为评估基准的方法。这些合成问题最终会成为测试下一代Claude能力的标准评估集。评估必须锚定在真实用户的真实任务上,只有当评估与实际场景对齐时,研究团队才会投入资源进行修复。

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com