Reddit热议:什么样的“当语言模型 AI 能做到 X,我才会佩服”时刻能打动你?

发帖人提出自己衡量语言模型是否真正令人惊艳的两个具体门槛,并邀请别人分享类似标准。其一是“略感佩服”的程度:如果把一张乐谱图片贴给模型,它不仅能读懂音符,还能通过编程配置演奏所需的乐器,并把乐谱正确演奏出来。其二是“惊掉下巴”的程度:只靠一个简单提示词,AI 就能生成一款完整可运行、具有经典街机风格、而且真正好玩的弹珠台游戏。作者强调,自己在每次有新模型发布时都会拿后一个目标反复测试,但到目前为止,没有任何一个模型哪怕稍微接近这个水平。帖子的核心不是泛泛谈论 AI 多强,而是明确追问:对大家而言,语言模型做到什么具体事情,才算真正值得被打动。

来源:Reddit(r/artificial)
原始发布时间:2026-04-10 17:12