关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2665人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牵手长安汽车,京东、宁德时代继续拓新

观察者网 浏览 3788

蔚来公司12月交付新车48,135台 同比增长54.6%

网易汽车 浏览 2754

留几手为闫学晶叫屈?称网友自卑敏感

小徐讲八卦 浏览 2658

众星在大S雕像前拍照,小S双手合十感谢外界,悼念致辞全场哽咽

萌神木木 浏览 2413

这些年轻科学家不再满足于“追赶美国”

知识分子 浏览 4152

300万以内无敌手 莲花首款插混SUV定名For Me

网易汽车 浏览 3056

2026款五菱扬光预售:限时一口价6.98万起,动力续航加量不加价

IT之家 浏览 2047

金价跌破3900美元 大学女生下跌时补仓结果亏得更多

每日经济新闻 浏览 14061

曲婉婷近照疑曝光!眼神闪躲像躲债

小徐讲八卦 浏览 2614

张柏芝不再隐瞒,三胎生父早有答案?

石场阿鑫 浏览 2834

照赫本这样穿,灰色很时髦!

Yuki女人故事 浏览 2595

国常会重磅部署!

数据宝 浏览 3549

全国首个!华为、联通把5G-A上行速率飚到1Gbps

快科技 浏览 2447

刚刚,全线大反攻!发生了什么?

券商中国 浏览 3753

TA:德罗认为自己在巴萨没有清晰的发展路径,巴萨对此很无奈

懂球帝 浏览 2457

李想汽车研究院:让AI从"工具使用者"进化为"工具创造者"

科技行者 浏览 2316

首款可折叠iPhone最新消息:或在2026年秋季发布

环球网资讯 浏览 3065

王嘉尔东京开唱,日本名流圈组团来“团建”?

情感大头说说 浏览 3480

初三男生杀害女同学前检索会担什么责 出庭时变胖变白

红星新闻 浏览 7484

白酒巨头一季报业绩普降,白酒拐点临近还是拐点远未到来?

郭施亮 浏览 482

牛弹琴:伊朗和美以停火又悬了 有三点实在太诡异

现代快报 浏览 1021
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1