关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4846人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

斯塔默:中国已崛起 英国需要承认这种现实的对华政策

环球时报 浏览 22323

巴尔韦德:皇马有我信任的理疗师,我都听他的

懂球帝 浏览 2174

一塌再塌!36岁檀健次与大二女生谈恋爱,他的高跟鞋就是锤

严肃八卦 浏览 3297

利空突袭!暴跌50%!

券商中国 浏览 3245

百色"锅底"村庄积水不退 村民:明年不想再种地 白费劲

澎湃新闻 浏览 7042

博主虚构成本数据,编造“利益输送”,胖东来再发声明

大象新闻 浏览 889

邮报:内维尔“惊讶红军球员没揍马丁内利”言论收到576起投诉

懂球帝 浏览 3104

天翎科旗舰飞行器L600真机下线,累计获得近千架意向订单|最前线

36氪 浏览 3973

大回血,股票型ETF一周猛增1000亿元!上周两明星产品遭“反噬”,但资金“越跌越买”|ETF规模周报

每经牛眼 浏览 4129

以军空袭加沙 特朗普:哈马斯不守规矩就会被消灭

新京报 浏览 4014

AI成核心方向 银行启动博士后招聘

北京商报 浏览 3748

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者 浏览 3059

乌克兰决定与尼加拉瓜断交

参考消息 浏览 3211

贷款炒金的"黄金赌徒"后悔了:有人3天亏掉2个月工资

第一财经资讯 浏览 9403

红魔授权服务中心・售后网点最新进展公布,覆盖全国62城

IT之家 浏览 3613

邮轮爆发可人传人致命病毒:30人下船 多国开始追踪

中国新闻周刊 浏览 90722

《镖人》坚持宣传吴京李连杰,遭下沉市场排斥

萌神木木 浏览 3126

限韩令太正确!全智贤辱华不道歉,林允儿发文挑衅,韩星嚣张得治

不八卦会死星人 浏览 4770

石油巨头裹足不前的心理阴影:委内瑞拉与美国的百年石油恩怨

澎湃新闻 浏览 3150

纯爽片,真用心,值得被更多人看见!

吐槽电影院 浏览 2463

苏格兰11月世预赛大名单:麦克托米奈、罗伯逊领衔

懂球帝 浏览 3890
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1