Anthropic称Claude内部出现类似“情绪”的功能表征

作者：

在

据Wired报道，Anthropic的研究人员在分析其大模型Claude的内部机制时发现，模型中存在一些可被识别的表征与人类“情绪”在功能层面呈现相似之处。报道指出，这些表征并非意味着Claude具有人类意义上的主观感受或自我意识，而更像是一组在计算过程中起到调节作用的内部状态：它们可能帮助模型在面对不同语境、目标与风险时，稳定输出风格、控制回应强度，并在交互中更好地对齐安全与帮助性等行为要求。Anthropic将其描述为一种“功能性情绪”的研究线索，意在为理解大模型如何形成复杂行为提供更可检验的解释框架。该发现也再次引发外界对“拟人化描述”的边界讨论：在强调能力与安全的同时，如何准确呈现模型内部信号的含义，避免将工程现象误读为真实情感。

来源：Wired
原始发布时间：Thu, 02 Apr 2026 16:00:00 +0000

Anthropic称Claude内部出现类似“情绪”的功能表征

更多文章

Anthropic企业支出增势明显，正逼近OpenAI

Sam Altman回应争议报道，并谈及住所遭袭事件

Reddit热议：什么样的“当语言模型 AI 能做到 X，我才会佩服”时刻能打动你？

Reddit热议：使用 AI 工作 6 个月：哪些真正惊艳，哪些被过度吹捧，哪些暗藏风险