据Wired报道,Anthropic正与多家科技企业及机构展开合作,推动一项名为 Project Glasswing 的新计划,目标是在生成式人工智能能力持续提升的同时,提前评估并遏制其被用于网络攻击的风险。该项目将联合 Apple、Google 以及其他数十家组织,共同测试一款名为 Claude Mythos Preview 的新模型,重点检验其在网络安全场景中的能力边界与潜在滥用方式。报道指出,这一合作释放出明确信号:随着AI系统在代码理解、自动化操作和漏洞利用方面不断增强,行业正试图以更协作的方式建立防护机制,而不是等风险全面显现后再被动应对。Anthropic希望借助跨机构测试,加快识别高风险能力,并为更严格的安全评估与治理提供依据。
来源:Wired
原始发布时间:Tue, 07 Apr 2026 18:49:50 +0000