据Wired报道,Anthropic的研究人员在分析其大模型Claude的内部机制时发现,模型中存在一些可被识别的表征与人类“情绪”在功能层面呈现相似之处。报道指出,这些表征并非意味着Claude具有人类意义上的主观感受或自我意识,而更像是一组在计算过程中起到调节作用的内部状态:它们可能帮助模型在面对不同语境、目标与风险时,稳定输出风格、控制回应强度,并在交互中更好地对齐安全与帮助性等行为要求。Anthropic将其描述为一种“功能性情绪”的研究线索,意在为理解大模型如何形成复杂行为提供更可检验的解释框架。该发现也再次引发外界对“拟人化描述”的边界讨论:在强调能力与安全的同时,如何准确呈现模型内部信号的含义,避免将工程现象误读为真实情感。
来源:Wired
原始发布时间:Thu, 02 Apr 2026 16:00:00 +0000