关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2388人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杨鸣:北控伤病多比赛结果不能作参考,魔鬼三连客大家要保持专注

懂球帝 浏览 2907

袁悦苦战182分钟惨胜后遭调侃打球兼项马拉松,吴易昺疑似又伤了

网球之家 浏览 2663

科技巨头AI竞赛转向表外融资,万亿债务定时炸弹成危机前兆?

华尔街见闻官方 浏览 3568

中国9系新旗舰 长城魏牌V9X正式亮相

网易汽车 浏览 1795

4岁女童在温泉酒店泳池溺水 两名女子跪地抢救20分钟

红星新闻 浏览 92262

哈梅内伊次子接任伊朗最高领袖:一直身居幕后

极目新闻 浏览 1750

马斯克暗示 SpaceX明年IPO?

北京商报 浏览 3026

穆尼奥斯:队员们的努力配得上这场比赛,只是结果没达到预期

懂球帝 浏览 4377

美将暂停实施对华海事等301调查措施一年

财联社 浏览 9709

深度解读“碱基编辑技术”:首个定制基因编辑疗法案例获成功

DeepTech深科技 浏览 2524

何超莲评论区沦陷!跟窦骁结婚后态度变化大,遭讨伐骗婚功利心重

萌神木木 浏览 3672

蔡依林《PLEASURE》巡回演唱会首站启幕

环球网资讯 浏览 2681

香港大学AI程序员超越人类:一键将科学论文变成完整代码库

科技行者 浏览 2640

全红婵夺金 新搭档身份不简单 赛后发文信息量大

白面书誏 浏览 3364

巴勒斯坦多派别谴责以方持续违反停火协议

国际在线 浏览 2395

“京圈恶少”王烁:睡遍娱乐圈女星,殴打继母王艳,枪指刘涛老公

史潎的生活日记 浏览 2588

小米YU7内掏出不明零件最新进展 市监局介入处理

网易汽车 浏览 3593

服装店起火老板带3孩子跳楼逃生 5人被烧伤已花160万

红星新闻 浏览 25078

乐摩科技八成设备“躺”在影院

北京商报 浏览 3181

又一中将在俄境内被炸死 俄方或实施对等定点清除行动

新民晚报 浏览 30376

全面革新 全新一代轩逸将2月24日上市

网易汽车 浏览 1962
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1