关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2666人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

12306汽车托运服务订单火爆 客服:目前有9条线路可选

极目新闻 浏览 21343

五星级酒店被一双拖鞋打败了?酒店巨头的问题出在哪了?

江瀚视野 浏览 4231

女生在马来西亚丢手机 找回后发现相册里多了两段视频

极目新闻 浏览 9213

高速公路未批先建致企业受牵连关停 申请赔偿9年未果

大风新闻 浏览 8733

美国德州仪器与优必选达成战略合作

IT之家 浏览 2931

美国1-1厄瓜多尔,恩纳-瓦伦西亚破门,巴洛贡扳平

懂球帝 浏览 3720

塔帅:若顺利哈弗茨未来几天能进名单;我们想赢得重要奖杯

懂球帝 浏览 2646

六王表演赛:辛纳2-0横扫阿卡,带走600万美金和一把纯金球拍

懂球帝 浏览 3550

男导演曝丑闻 蒋欣的含金量还在上升

刘森森 浏览 3436

铜铜铜,快要高攀不起了

每日资本论 浏览 3005

比速腾L略小 入门级的全新速腾S将发布

网易汽车 浏览 2652

“反对标题党,绝不是反对把标题写得有吸引力”

深蓝财经 浏览 2606

刘涛为95花作配,国民女星的资源降级还是新机遇?

八卦三缺一 浏览 4374

先索尼后徕卡,为何这些国际巨头都被中国企业吞下?

BT财经 浏览 2417

38岁后单赛季为意甲升班马攻入至少4球,瓦尔迪是历史第二人

懂球帝 浏览 3112

乔治亚理工和微软团队重磅推出:让AI推理更聪明的"思维开关"技术

科技行者 浏览 3551

1499元飞天茅台上线“秒空”,茅台金融属性退潮是伪命题吗?

郭施亮 浏览 2732

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 3688

AMD ROCm 软件堆栈更新至 7.0.2 版本,支持 Radeon RX 9060 显卡

IT之家 浏览 3822

围巾,女人气质的延伸

Yuki女人故事 浏览 3263

丰田辟谣与比亚迪技术合作,网友的评论,能让丰田章男能背过气去

小李车评李建红 浏览 2821
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1