小米开源首个原生端到端语音大模型

发布时间：2025-09-19

点击次数：

每经AI快讯，据Xiaomi MiMo微信公众号消息，9月19日，小米正式开源首个原生端到端语音模型——Xiaomi-MiMo-Audio，它基于创新预训练架构和上亿小时训练数据，首次在语音领域实现基于ICL的少样本泛化，并在预训练观察到明显的“涌现”行为。据介绍，在通用语音理解及对话等多项标准评测基准中，MiMo-Audio大幅超越了同参数量的开源模型，取得7B最佳性能；在音频理解基准MMAU的标准测试集上，MiMo-Audio超过Google闭源语音模型Gemini-2.5-Flash；在面向音频复杂推理的基准Big Bench Audio S2T任务中，MiMo-Audio同样超越了OpenAI闭源的语音模型GPT-4o-Audio-Preview。

每日经济新闻

（责任编辑：王治强 HF013）

上一篇：港股异动 | 马斯克辟谣特斯拉机器人万台订单三花智控(02

返回列表

下一篇：港股概念追踪|机器人市场需求旺盛激光雷达企业订单大增（附概念

852-4684165

imtoken介绍
imtoken简介
imtoken官方下载
imtoken官方安卓下载 imtoken官方网站
imtoken官网下载
行业新闻公司新闻
imtoken钱包下载
imtoken钱包下载地址 imtoken钱包app下载安卓

E-mail

imtoken@youweb.com

扫一扫，添加微信

友情链接：

imtoken imtoken中心 imtoken下载 imtoken下载安卓 imtoken官网app