阿里巴巴旗下通义千问 Qwen3.7-Plus 被披露已支持文本、视频和图像输入,价格为每 100 万 token 0.4/1.6 美元,这意味着开发者可用同一模型处理多种内容,而不必分别接入文本、图像或视频模型。它与传统纯文本大模型的差异在于,能把视频画面、图片和文字放到同一交互流程中理解;但与部分开放权重模型不同,Qwen3.7-Plus 是专有模型,企业在私有化部署、二次训练和底层可控性上会受到平台规则限制。目前素材未给出跑分、上线范围、输出价格对应关系或与 GPT、Claude、Grok 等模型的实测对比,因此只能确认其多模态输入和计费信息,不能据此判断性能领先。据VentureBeat报道。
来源:VentureBeat
原始发布时间:Tue, 02 Jun 2026 22:40:00 GMT