Anthropic发布 Claude Fable 5,称这是公司迄今能力最强的公开模型。按照Anthropic的说法,Fable 5属于“Mythos级”模型,但经过安全限制后向普通用户和企业开放;同一天发布的 Claude Mythos 5 使用同一底座,但只面向少数网络防御和关键基础设施合作方开放。 几个普通读者更容易理解的成绩是:Fable 5在编程能力测试 SWE-Bench Pro 中拿到 80.3%,在电脑操作测试 OSWorld-Verified 中拿到 85.0%;在综合难题测试 Humanity’s Last Exam 中,无工具得分为 59.0%,使用工具后为 64.5%;……
分类: Claude
-
Anthropic向全人类发出警告:AI自我改进逼近,必须准备停止开发
Anthropic 在最新政策文章中警告,前沿 AI 模型正在接近“递归自我改进”门槛,也就是模型可能通过编写和改进自身代码来继续提升能力。公司认为,这还没有真正发生,也并非必然发生,但一旦临界点到来,人类对模型进展的直接监督和干预空间可能迅速变小,因此全球主要 AI 实验室需要提前准备协调机制。Anthropic 提出的核心不是立刻关闭所有 AI 研究,而是在风险明显升高时,保留暂停或放缓前沿模型开发的选项,给监管、企业和社会留下调整时间。文章由 Anthropic 内部研究负责人 Marina Favaro 和政策负责人 Jack Clark 撰写,重点指向最强模型的开发节奏,而不是普通应……
-
Anthropic 完成 650 亿美元融资,投后估值升至 9650 亿美元
Anthropic 已完成 650 亿美元 Series H 融资,投后估值达到 9650 亿美元,接近 1 万亿美元。按公开报道,这一估值已高于 OpenAI 最近一轮约 7300 亿美元估值,也让 Claude 背后的公司成为当前估值最高的 AI 创业公司之一。这轮融资与 Claude 需求增长、企业级 AI 市场扩张和 IPO 预期直接相关。Anthropic 同日还推出 Claude Opus 4.8,继续强化编码和专业工作能力,显示资本市场押注的不只是聊天机器人流量,而是企业 API、云平台分发和开发者工具生态。风险在于,近万亿美元估值意味着 Anthropic 需要持续证明收入增长……