关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家4389人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

妻子家中枉死丈夫被疑雇凶杀人 27年后真凶浮出水面

环球网资讯 浏览 9011

许利民:曾凡博确实非常优秀,祝贺他回归首秀奉献如此精彩表现

懂球帝 浏览 2735

最高预增超32倍 283只医药股“剧透”业绩

北京商报 浏览 2423

联合国对达成加沙地带停火协议表示欢迎

极目新闻 浏览 3764

洪都拉斯3-0大胜海地,奎奥托建功,安东尼-洛萨诺破门

懂球帝 浏览 3700

特斯拉Q3销量首超梅赛德斯奔驰,一个时代终结了?

江瀚视野 浏览 3743

欧摩威展示单雷达AEB方案!已获国内头部主机厂定点,明年将量产

车东西 浏览 3522

乌克兰全境频遭空袭 中使馆发布重要提醒

每日经济新闻 浏览 2584

埃迪-豪面对前东家伯恩茅斯7场不胜,并列英超主帅最长不胜纪录

直播吧 浏览 4289

陈晓最新露面瘦脱相!新剧要和陈妍希对打,女方离婚后状态更好

萌神木木 浏览 3197

球员是否因阿森纳输球更有动力?瓜帅:我建议他们专注于自己

懂球帝 浏览 2445

30个项目脱颖而出!大赛让AI与实体经济深度“握手”

上游新闻 浏览 3585

嫁给汪涵17年,细扒杨乐乐心酸现状,她的选择真的对吗?

不八卦会死星人 浏览 3850

王健林“限高”已取消,万达知情人士最新回应

红星资本局 浏览 4117

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 13212

1.2亿辆车被召回,超半数源于监管调查,车企自查缺陷就这么难?

DearAuto 浏览 3503

【IT之家开箱】口袋中的完全体哈苏:OPPO 哈苏专业影像套装图赏

IT之家 浏览 3775

车企“灵魂论”彻底“失声”?

盖世汽车 浏览 4246

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 2684

4岁娃吃席打翻盘子被要求道歉 父亲:"娃儿小"不是借口

封面新闻 浏览 18102

涉及中国 日本高官公开道歉并撤回错误言论

环球时报国际 浏览 35631
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1