关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者3490人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025年首例被北交所暂缓审议的企业出炉 永大股份上市缘何待考?

叩叩财讯 浏览 3285

对标丰田4Runner 本田新款Passport最新消息曝光

乐选爱车 浏览 3758

快手“沦陷”之夜:1.7万僵尸账号

影像温度 浏览 2309

特朗普被指非常重视"和平峰会" 以色列哈马斯或不参加

环球网资讯 浏览 7586

冲击330万目标!尹同跃再“吹牛”:AI追赶特斯拉,推17款AI车

明镜pro 浏览 2503

迪亚曼蒂:在广州有卖鳄鱼肉和鳄鱼皮的,简直不可思议

懂球帝 浏览 4237

佟丽娅最新古装近照曝光!比李沁还漂亮,42岁第一次演仙侠剧

温柔娱公子 浏览 2975

王晶大谈力捧谢霆锋原因,狄波拉是恩人,谢贤更是讲义气

温柔娱公子 浏览 3584

东南欧小国选举 俄罗斯、乌克兰和欧盟"异常罕见"关注

上观新闻 浏览 36702

俄乌“和平计划”磋商顿巴斯成焦点

环球网资讯 浏览 2980

郑智化发声道歉!坦言自己情绪上头用词不当,两次发文惹祸上身

振华观史 浏览 3519

法媒:美国将德国最大贸易伙伴地位拱手让给中国

参考消息 浏览 8449

不少老人宁愿挨冻也不敢开暖气,让人痛心!河北农村取暖问题,不能再耽搁了

每日经济新闻 浏览 2625

"希腊船王"继承人战胜癌症 被虫子咬一口莫名其妙死了

新民晚报 浏览 23609

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 2922

前曼城助教:08年曼城曾为梅西报价3000万镑,这惹怒了巴萨

懂球帝 浏览 2988

对阵纳什维尔3球1助,梅西达成连续17年上演帽子戏法成就

懂球帝 浏览 3122

国星宇航“星算”计划 02 组星座发布

IT之家 浏览 3784

天空:曼联在关注雷恩中卫雅凯,他冬窗不太可能加盟

懂球帝 浏览 2709

金价暴跌 不少上海人跑外地买黄金:就像在抢大白菜

极目新闻 浏览 6658

伊姐周日热推:电视剧《太平年》;电视剧《暗恋者的救赎》......

伊周潮流 浏览 2516
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1