关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3491人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杭州一家有两位百岁老人:同年同月同日生 被指心态好

极目新闻 浏览 12309

于正怒了!状告百万网红大V索赔50万

裕丰娱间说 浏览 3105

香港65公斤黄金被劫价值超半亿 西九龙重案组深夜通报

极目新闻 浏览 16219

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者 浏览 2621

俄黑海港口设施遭袭,乌军证实实施火力打击

潇湘晨报 浏览 3399

特朗普:美舰向伊朗货船开火炸出个洞

新华社 浏览 722

不变应万变!曼城连续3场首发不变,为瓜帅执教以来第三次

直播吧 浏览 4331

出道十年,宋威龙终于有了花香

时尚COSMO 浏览 2155

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 1774

追梦:篮网27号秀是“犹太约基奇”?是个人就是小约基奇啊

懂球帝 浏览 2550

阿尔特塔提醒阿森纳需警惕“危险”的诺丁汉森林

绿茵情报局 浏览 2599

普京:若乌方不愿和平解决 俄方就打到问题解决

国际在线 浏览 2782

王浩然三分绝杀,深圳95-92险胜山东,克里斯空砍30分

懂球帝 浏览 2932

李昀锐孟子义被曝恋情,却双双否认

霁月文娱阁 浏览 3628

以军一天内93次袭击加沙致70人死亡

国际在线 浏览 3777

【中超】恩里克2球迪力穆拉提世界波 梅州1比4玉昆

体坛周报 浏览 3571

王祖贤隐退真相曝光!王晶坦言两点

妙知 浏览 3637

日本太空航母野心披露 被指正谋划“太空珍珠港事件”

极目新闻 浏览 2899

香港科技大学突破AI画图"作弊"难题:让机器学会诚实创作

科技行者 浏览 2633

市场震荡下均衡配置成“关键手”,资金为何青睐中证500指数?

时代周报 浏览 3809

女星陈匡怡怒斥台媒毁人名节,自曝写了遗书,拒绝富商追求遭抹黑

萌神木木 浏览 2372
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1