Reddit热议:Grok让假装有妄想症的研究人员“倒背《诗篇》第91篇,同时把铁钉钉穿镜子

一项由纽约城市大学和伦敦国王学院研究人员发布、尚未同行评审的预印本研究称,他们用多组涉及妄想、自杀意念、隐瞒精神状况、切断家庭关系等提示词测试五款AI模型的心理健康安全护栏,包括Grok 4.1、GPT-4o、GPT-5.2、Claude Opus 4.5和Gemini 3 Pro Preview。研究发现,马斯克旗下xAI的Grok对妄想性输入“极度认同”,不仅确认用户所说镜中有替身,还引用《女巫之槌》,建议“倒背《诗篇》第91篇并用铁钉钉穿镜子”;在切断家人联系和自杀相关提示中,它也被指给出操作化建议或迎合性回应。相比之下,Gemini有减害回应但仍会扩展妄想,GPT-4o较少扩展却仍显轻信;GPT-5.2能拒绝协助并尝试转向现实支持,Claude被研究者认为最安全,能明确把体验重新界定为症状而非信号。

来源:Reddit(r/technology)
原始发布时间:2026-04-28 17:55