Anthropic联合苹果谷歌启动AI安全计划，防止模型演变为黑客工具

作者：

在

据Wired报道，Anthropic正与多家科技企业及机构展开合作，推动一项名为 Project Glasswing 的新计划，目标是在生成式人工智能能力持续提升的同时，提前评估并遏制其被用于网络攻击的风险。该项目将联合 Apple、Google 以及其他数十家组织，共同测试一款名为 Claude Mythos Preview 的新模型，重点检验其在网络安全场景中的能力边界与潜在滥用方式。报道指出，这一合作释放出明确信号：随着AI系统在代码理解、自动化操作和漏洞利用方面不断增强，行业正试图以更协作的方式建立防护机制，而不是等风险全面显现后再被动应对。Anthropic希望借助跨机构测试，加快识别高风险能力，并为更严格的安全评估与治理提供依据。

来源：Wired
原始发布时间：Tue, 07 Apr 2026 18:49:50 +0000

Anthropic联合苹果谷歌启动AI安全计划，防止模型演变为黑客工具

更多文章

Anthropic企业支出增势明显，正逼近OpenAI

Sam Altman回应争议报道，并谈及住所遭袭事件

Reddit热议：什么样的“当语言模型 AI 能做到 X，我才会佩服”时刻能打动你？

Reddit热议：使用 AI 工作 6 个月：哪些真正惊艳，哪些被过度吹捧，哪些暗藏风险