Mistral开源语音生成模型Voxtral TTS,瞄准企业语音助手场景

据TechCrunch报道,法国AI公司Mistral发布一款开源文本转语音模型Voxtral TTS,面向语音AI助手及企业级应用,如客服支持、销售与客户互动等语音坐席场景。该举措也让Mistral在语音生成赛道上与ElevenLabs、Deepgram以及OpenAI等厂商形成直接竞争。官方介绍称,Voxtral TTS支持九种语言,包括英语、法语、德语、西班牙语、荷兰语、葡萄牙语、意大利语、印地语和阿拉伯语,并强调可在多语言间切换时尽量保持声音特征一致。Mistral方面表示,这一模型体量更小,可部署在智能手表、手机、笔记本等边缘设备上,面向企业落地时有望降低推理与部署门槛。同时,模型可基于少于五秒的语音样本适配定制音色,并尽量保留轻微口音、语调起伏与不规则停顿等细节,以提升交互的自然度与可控性。

来源:TechCrunch
原始发布时间:Thu, 26 Mar 2026 11:30:00 +0000