关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2667人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刘强东“10年1元年薪”之约到期,律师解构高净值人群如何妥善处理财产

红星资本局 浏览 4286

限时先享价25.98万 吉利银河M9黑金智曜版正式上市

网易汽车 浏览 505

陶虹与朋友相聚,17岁女儿五官与神态似徐峥

黔乡小姊妹 浏览 2907

加油枪喷油导致男子严重烧伤 加油站:不存在任何过错

大风新闻 浏览 21726

领克10/领克10+全球首秀 1秒补能2公里/3.2秒破百

网易汽车 浏览 1079

特朗普被指一边喊一边咒骂 让乌方把顿巴斯地区给俄方

红星新闻 浏览 9324

莱巴金娜送蛋逆转夺冠进总决赛形势大好,安德列娃已失去主动权

网球之家 浏览 3651

媒体:自家老牌车企落后中美 欧盟恐对中国车厂下手

澎湃新闻 浏览 10682

马卡:桑托斯与内马尔将合作,制定平衡俱乐部与国家队的计划

懂球帝 浏览 2915

重庆8D交通“路考”全国首块L3车牌,开起来够稳吗?|封面测试

封面新闻 浏览 2737

女网红被"开盒"收大量骚扰信息全家被迫搬离 本人发声

环球网资讯 浏览 23785

冬奥总结:雪上项目当主角 中国刷新境外参赛最佳

体坛周报 浏览 2058

深夜,全线崩跌!发生了什么?

券商中国 浏览 3133

TA:热刺想要加拉格尔已近三年,如今才终于签下他

懂球帝 浏览 2535

刚说完战争很快结束 特朗普改口

参考消息 浏览 1724

赵露思这段戏火了,陈伟霆当初没说错

刘蕳爱下厨 浏览 4086

泽连斯基向特朗普展示俄境内潜在打击目标地图

环球网资讯 浏览 3663

微博视界大会:杨幂丰满有料,白鹿珠圆玉润,迟蓬赢麻了

娱乐圈笔娱君 浏览 3491

让AI学会"边看边判断":韩国GIST团队突破视频实时事件分割技术

科技行者 浏览 3366

三年半亏19亿,行政处罚超400条,享道出行IPO了

市值Observation 浏览 3451

泽连斯基:俄罗斯正为更大规模冲突做准备

红星新闻 浏览 5459
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1