关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1689人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

燃油车不行?大众在华却卖了300万辆

汽车公社 浏览 12813

快讯|阿里国际站在欧美6国同步上线半托管

网易科技频道 浏览 12178

张翰和吴宣仪加入《妻子的浪漫旅行》第五季

趣看热点 浏览 26110

汪涵老婆自曝独自住院,素颜憔悴没人陪

大龄女一晓彤 浏览 1060

配激光雷达+磁悬浮底盘,深蓝L06将于11月18日上市

隔壁说车老王 浏览 694

那个被纪梵希炒掉的“大妈”,却在优衣库封神了

InsDaily 浏览 15221

韩国首部限制级被禁,前后修改3次

陈意小可爱 浏览 1074

NVIDIA团队发明超高效视频生成黑科技:让4K视频制作速度提升15倍

科技行者 浏览 860

马赛官方:球队签下伯尔尼年轻人后卫球员乌利塞斯-加西亚

懂球帝 浏览 12685

春天不建议大家买的3件衣服,看着洋气,实际土气没档次,不实用

潮人志Fashion 浏览 12588

王思聪与买超夜店寻欢 懒理美女搭讪

叶公子 浏览 16593

2000万美元重注强脑科技,三七互娱落子脑机接口新纪元

钛媒体APP 浏览 733

春节见闻|高速充电量同比增长近七成,电车取号排队频现

第一财经资讯 浏览 12476

NBA战报:马刺133-104大胜步行者取NBA5连胜,文班亚马17+12+1

懂球帝 浏览 958

赵丽颖7月暂无行程,被曝与冯绍峰有望复合

深剖娱乐圈 浏览 15606

剧组撞死猫风波持续发酵

小撇说事 浏览 855

凯恩:若卡尔继续表现出色,他绝对有机会为德国队踢世界杯

懂球帝 浏览 784

别再穿“运动鞋”了!冬季这3双鞋子增高时髦,中年女人必备

静儿时尚达人 浏览 13413

伊朗伊斯兰革命卫队在该国东北部地区举行军演

央视新闻客户端 浏览 12660

现在穿v领毛衣,刚好

Yuki女人故事 浏览 867

了解今年早春的3个流行趋势,真是好看不挑人,再不怕显土了

静儿时尚达人 浏览 11618
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1