这条 Claude Mythos 新闻的核心,是 Anthropic 下一代模型可能出现了一次明显跨级提升。外部流传材料称,Claude Mythos 在写代码、解决复杂学术问题和网络安全任务上,都比上一代高端模型 Claude Opus 4.6 “大幅更强”。这不是普通版本更新,因为 Opus 4.6 本身已经很强:在真实软件项目修 bug 的测试里,它已经能解决约 80.8% 的问题;在研究生级科学问答里得分约 91.31%;在抽象推理测试里约 68.8%;在数学竞赛题测试里接近满分,达到 99.79%。 更直接地说,如果这些泄露说法属实,Claude Mythos 的意义是:AI 可能不……