作者表示自己花了整个上午在 ChatGPT 中测试 GPT-5.5,最强烈的感受是它在“代理式推理”和复杂任务处理上的提升非常明显。帖子重点提到,它能够规划多步骤工作流,较好地使用工具,还会检查自己的输出,不再像以往那样在任务推进到一半时开始胡编或失控。作者认为,这种表现让它第一次像是一个真正适合严肃知识工作和编程的前沿模型,不需要用户持续在旁边盯着、纠正和接管。整篇帖子并没有给出具体测试案例或量化对比,而是基于个人试用体验表达惊讶,并邀请其他已经尝试的人分享他们让 GPT-5.5 完成过的最酷或最有趣的事情。
来源:Reddit(r/OpenAI)
原始发布时间:2026-04-27 15:53