关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3492人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

保时捷4S店暴雷背后 两记“暴击”都是新势力给的

小李车评李建红 浏览 1976

丰田连续第八届参展进博会,全面展示本地化成果

观察者网 浏览 2522

27分钟28+8早早打卡!亚历山大场下观赛脸都笑烂了 雷霆24胜1负

颜小白的篮球梦 浏览 2097

哥伦比亚挫败一起针对军方设施的未遂袭击

国际在线 浏览 2444

限制赎回风波后,当红PE Blue Owl为数据中心专项基金募资17亿美元

华尔街见闻官方 浏览 2226

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 2924

牛弹琴:美印突然和好 一个与俄方有关的细节很不寻常

现代快报 浏览 4994

她复出拿奖,这次没人笑得出来

独立鱼 浏览 2617

缅甸军方两次爆破KK园区:用了无人机 浓烟弥漫数分钟

每日经济新闻 浏览 8218

63.3度电池+60L油箱 小鹏X9增程版续航1602公里

网易汽车 浏览 2779

苹果iOS 26.2开发者预览版Beta发布:大批功能改!锁屏也能自定义液态玻璃

快科技 浏览 2548

短剧《还珠》:有些明星不火,真的是必然!

海绵宝宝的心事 浏览 2506

6万人欢呼!西蒙尼带队狂飙:儿子助攻 西甲4场10分杀进前4

叶青足球世界 浏览 2773

沃什被提名次日 特朗普:不降息就把他告到裤子都不剩

极目新闻 浏览 7982

阿维塔汽车12月销量10470辆,2025全年突破12万辆

IT之家 浏览 1836

全球最大容器镜像库Docker Hub安全调查:10000+镜像泄露敏感密钥

IT之家 浏览 2135

费迪南德:穆帅处理维尼修斯事件确有不当,但他绝非种族主义者

懂球帝 浏览 966

续航或超800km?后驱长续航版特斯拉Model Y现身工信部目录

Nice好车 浏览 2935

反对马斯克 1 万亿美元薪酬方案,多个活动组织将举行抗议行动

IT之家 浏览 2529

67岁梁家辉春晚彩排现场 三鞠躬视频刷屏网络

黄大姐 浏览 1433

普京酝酿的“重大行动”,会给中国带来机遇?

浏览 25517
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1