汇通财经网

MiniMax语音模型Speech-02登顶双榜

  在国际最权威的 Artificial Analysis和Hugging Face TTS Arena两大语音评测榜单上,上海AI独角兽MiniMax带着新一代语音大模型Speech-02登顶。

国际权威语音评测榜单Artificial Analysis

MiniMax语音模型Speech-02登顶双榜
图片来源于网络,如有侵权,请联系删除

Hugging Face TTS Arena评测榜单

  在技术指标上,字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也更自然、真实。具体来看,与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的WER,表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。

  值得一提的是,Speech-02的商用定价仅为全球头部模型ElevenLabs的四分之一。通过超高性能和极致性价比双重优势,推动国产AI语音技术大规模商业化落地。

  这意味着中小公司再也不用为昂贵的语音技术发愁,智能客服、语音交互、AI教育等行业直接“原地起飞”。目前,MiniMax已经和阅文集团、高途教育等多家国内企业达成合作,甚至在AI玩具、汽车智能座舱等硬件场景玩出了新花样。

  在“语言天赋”上做到32种语言无缝切换,方言、小语种全拿捏。MiniMax海外生态负责人Linda介绍,“这次发布的Speech-02能够轻松驾驭32个语种的不同口音和不同情绪,我们相信通过AI,通过对稀缺小语种的支持,未来将多语种的声音以当地最地道的发音传向全世界,帮助全球每一种语言都被听见、每一种文化都被理解”。

  从年初的Speech-01支持17种语言,到现在Speech-02覆盖32个语种,MiniMax只用了短短几个月,就完成了“技术迭代+全球落地”的双重跨越。这种“中国速度”背后,是中国AI企业“技术+商业”的双轮驱动——不仅能做出世界顶尖的技术,还能快速让技术变成实实在在的生产力。

  从语音克隆到多语种切换,从技术登顶到普惠定价,Speech-02的横空出世,不仅是MiniMax的胜利,更是中国AI的又一次“破圈”,中国公司已经在用技术和实力重新定义行业规则。

【纠错】 【责任编辑:周靖杰】
    阅读下一篇:
      深度观察
      • 新华全媒头条丨“地瓜经济”与“三个浙江”
      • 新华全媒+丨小村新事:天津“农业潮牌”养成记
      • 新华视点丨一些中小学劳动课为啥沦为“走过场”?
      • 追光丨0:1到3:1,广厦是如何做到的?
      • 新华每日电讯丨何以中关:走进“神州第一村史馆”
      • 文旅新探丨用传统摄影工艺给自己留个影
      • 国际观察丨特朗普宣布解除对叙制裁有何考量
      • 云南彝良:“宝藏村”里见乡愁
      • “河北净菜”如何变“北京好菜”

              推荐阅读:

              2023年10月11日乙二醇价格行情今日报价查询

              2023年10月13日今日乙二醇价格最新行情消息

              AIGC海报丨2022年中国研发经费投入总量突破3万亿元 投入强度持续提升

              “品质至上·共赢未来”瑞幸咖啡合作伙伴大会举行 打造全球高品质供应链

              (2023年10月23日)今日乙二醇期货最新价格行情查询

              2023年10月23日今日现货乙二醇最新价格多少钱一吨

              (2023年10月24日)今日乙二醇期货最新价格行情查询

              10月24日乙二醇期货持仓龙虎榜分析:乙二醇期货后市是否能维持上行趋势

              西部(重庆)科学城产业发展基金正式成立 总规模300亿元

              “抖音直播院团专项”陕西行:地方文艺院团如何在直播间“破圈”?

              相关推荐