汇通财经网

MiniMax语音模型Speech-02登顶双榜

  在国际最权威的 Artificial Analysis和Hugging Face TTS Arena两大语音评测榜单上,上海AI独角兽MiniMax带着新一代语音大模型Speech-02登顶。

国际权威语音评测榜单Artificial Analysis

MiniMax语音模型Speech-02登顶双榜
图片来源于网络,如有侵权,请联系删除

Hugging Face TTS Arena评测榜单

  在技术指标上,字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也更自然、真实。具体来看,与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的WER,表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。

  值得一提的是,Speech-02的商用定价仅为全球头部模型ElevenLabs的四分之一。通过超高性能和极致性价比双重优势,推动国产AI语音技术大规模商业化落地。

  这意味着中小公司再也不用为昂贵的语音技术发愁,智能客服、语音交互、AI教育等行业直接“原地起飞”。目前,MiniMax已经和阅文集团、高途教育等多家国内企业达成合作,甚至在AI玩具、汽车智能座舱等硬件场景玩出了新花样。

  在“语言天赋”上做到32种语言无缝切换,方言、小语种全拿捏。MiniMax海外生态负责人Linda介绍,“这次发布的Speech-02能够轻松驾驭32个语种的不同口音和不同情绪,我们相信通过AI,通过对稀缺小语种的支持,未来将多语种的声音以当地最地道的发音传向全世界,帮助全球每一种语言都被听见、每一种文化都被理解”。

  从年初的Speech-01支持17种语言,到现在Speech-02覆盖32个语种,MiniMax只用了短短几个月,就完成了“技术迭代+全球落地”的双重跨越。这种“中国速度”背后,是中国AI企业“技术+商业”的双轮驱动——不仅能做出世界顶尖的技术,还能快速让技术变成实实在在的生产力。

  从语音克隆到多语种切换,从技术登顶到普惠定价,Speech-02的横空出世,不仅是MiniMax的胜利,更是中国AI的又一次“破圈”,中国公司已经在用技术和实力重新定义行业规则。

【纠错】 【责任编辑:周靖杰】
    阅读下一篇:
      深度观察
      • 新华全媒头条丨“地瓜经济”与“三个浙江”
      • 新华全媒+丨小村新事:天津“农业潮牌”养成记
      • 新华视点丨一些中小学劳动课为啥沦为“走过场”?
      • 追光丨0:1到3:1,广厦是如何做到的?
      • 新华每日电讯丨何以中关:走进“神州第一村史馆”
      • 文旅新探丨用传统摄影工艺给自己留个影
      • 国际观察丨特朗普宣布解除对叙制裁有何考量
      • 云南彝良:“宝藏村”里见乡愁
      • “河北净菜”如何变“北京好菜”

              推荐阅读:

              专家学者共议构筑未成年游戏防沉迷有力屏障

              人保车险|车损险保障范围如何?

              人保车险|别错过,交强险最新行业动态!

              助力山区儿童学会自我保护 字节跳动公益启动“益童普法小课堂”

              沉迷“抽卡”亟须纠偏,也应看到新兴行业的正向价值

              保险为自动驾驶系上“安全带”

              高通推出全新骁龙座舱至尊版平台和Snapdragon Ride至尊版平台

              2024年10月23日今日现货乙二醇最新价格多少钱一吨

              聚酯开工季节性下滑 乙二醇供应压力或将再度回升

              10月23日收盘乙二醇期货持仓较上日减持1738手

              相关推荐