关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4849人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美伊协议草案或将在数小时内公布

财联社 浏览 190

西方媒体称中国对伊朗"见死不救" 官方回应来了

环球网资讯 浏览 117604

稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆

快科技 浏览 3278

连衣裙+运动鞋,今秋最美穿法!舒适又时髦!

Yuki女人故事 浏览 3938

解放军报:日本军国主义大有卷土重来之势

极目新闻 浏览 3568

汽车图谱㉔|1月车市调整:上汽销量居首,吉利逆势增长

贝壳财经 浏览 2927

部分苹果 iPhone 17 Pro/Max 用户反馈机身褪色

IT之家 浏览 4182

何超欣出席阿联酋策展,与胡兵同台交流

素素娱乐 浏览 3013

昔日“神车”众泰突然大规模招聘!内部人士:已收到不少简历

红星资本局 浏览 3006

飞象老师爆火背后:AI进课堂,先要过教师这一关

学申论的谈妹 浏览 212

看来看去这些才是适合普通人穿搭,不必花枝招展,简单又舒适

静儿时尚达人 浏览 6494

惨!拍完被雪藏8年,李幼斌耗资1亿拍战争大片,没上映就被判死刑

靠谱电影君 浏览 3916

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 3179

高市早苗再有新动作日本准备拥有核武 中俄要早做准备

头条爆料007 浏览 45630

9系还没打完8系就来掀桌 2026年8系新车大剧透

Autolab 浏览 3403

一天两失利!国家队和民营航天双双遇挫!股民最担心的事来了

深蓝财经 浏览 3098

伊朗指责美以策划动乱 哈梅内伊呼吁伊朗人民保持团结

环球网资讯 浏览 3142

拉斯帕多里:意大利拥有成功所需的一切;我对加盟马竞很满意

懂球帝 浏览 3630

稳定输出,亚历山大22中11砍35分7板6助,三分9中3&11罚10中

懂球帝 浏览 3900

2025蔚来日在杭州成功举办

财经无忌 浏览 4904

史上最强财报背后,苹果仍差临门一脚

虎嗅APP 浏览 3960
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1