关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4386人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿里云计算如何让大语言模型吃得更聪明

科技行者 浏览 2522

5月开车撞利物浦球迷的司机承认故意撞人,预计12月15日宣判

懂球帝 浏览 3148

燃油+电动全都配 全新宝马4系最新消息曝光

乐选爱车 浏览 2404

排除乌欧参与引发解读 普京与美特使谈了5小时

环球网资讯 浏览 3079

4月21日上市 2026款乐道L90官图发布

车质网 浏览 782

热度破9000,赵丽颖谭松韵令观众成功入坑,这部年底压轴剧太生猛

娱乐圈笔娱君 浏览 2877

这一次,抖音美妆让36万用户来定义美

时尚COSMO 浏览 2144

同演女将军,18岁黄杨钿甜和38岁赵丽颖对比

肆季娱乐 浏览 1107

30亿元“炸弹”入场!千问烧钱搅动AI春节红包大战

华夏时报 浏览 2456

阿隆索:我们在安菲尔德跑动太少?不能凭一场比赛下结论

懂球帝 浏览 3513

泽连斯基称乌将在柏林和哥本哈根设立武器出口办事处

环球网资讯 浏览 3284

努诺未来明确,西汉姆联确认新团队成员

绿茵情报局 浏览 2634

恰20:今天我们运气不错,我们要努力达到我们应得的位置

懂球帝 浏览 3410

朱啸虎们押注的300元AI玩偶,先得跑赢「退货潮」

豹变 浏览 3539

朝鲜进行远程战略巡航导弹发射训练

国际在线 浏览 2719

鲍威尔回应遭刑事调查:都是借口 想逼美联储降息

红星新闻 浏览 12840

美国团队研发新型机器人:可变换数百种形状,还能征服复杂地形

IT之家 浏览 3770

评论丨网购衣服上的“密码锁”,是商业诚信的刺眼“疤痕”

红星新闻 浏览 3556

乐聚机器人已完成股改,正推进IPO计划,刚完成15亿元融资

红星资本局 浏览 3728

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

极目新闻 浏览 16380

上海AI实验室ImgCoder:AI实现科学手绘图精准生成

科技行者 浏览 2513
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1