关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2908人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

礼来和诺和诺德的“网红减肥药”有望进美国医保!千元减肥药或降价85%

华尔街见闻官方 浏览 3897

碳酸锂价格,巨震!

证券时报 浏览 3699

两女生称花90多元入住成都民宿 在空调管道发现摄像头

极目新闻 浏览 106612

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 3423

刘强东"10年1元年薪"到期 网友曾调侃章泽天离婚分5元

红星资本局 浏览 21848

宽基ETF被抢筹,市场风格走向何方?

国际金融报 浏览 3435

“纸质书+VR”开启科普新形态 《寻梦天宫:中国空间站建设纪实》在京发布

封面新闻 浏览 3284

摸吉祥物女演员胸部,前塞尔塔队长马略被判赔偿1000欧

懂球帝 浏览 3685

皮尔斯:雷霆像善于地面缠斗的UFC选手,把你拖垮直到精疲力尽

懂球帝 浏览 855

卧底记者给美容院"拉客" 顾客消费16190记者拿80%返利

鲁中晨报 浏览 9944

拟剥离银座商管 福瑞达继续瘦身

北京商报 浏览 4258

白宫黑手伸进委总统卧室!一场践踏国际规则的“黑夜绑架”

国是直通车 浏览 3261

董卿母子现身看电影,13岁儿子身高超160

娱乐圈圈圆 浏览 2955

深圳联通官宣可预约上门办理eSIM业务,暂定截至10月31日

IT之家 浏览 4077

或搭载激光雷达 长城硬派越野车谍照曝光

车质网 浏览 3462

卡内基梅隆大学团队揭秘:AI绘画无需人工标注也能学会"听话"

科技行者 浏览 3972

前英超裁判:桑德兰绝杀切尔西的进球因越位应被取消

懂球帝 浏览 4054

DeepSeek开源新模型:单张A100日处理可超20万页数据

第一财经资讯 浏览 4084

全网泪目!《马踏樱花》一夜刷屏

手工制作阿歼 浏览 3613

吉利汽车集团:银河品牌全系电混车型纯电续航突破200公里

IT之家 浏览 2558

王中磊夫妇转战短视频,影视一哥到底怎么了?

BT财经 浏览 2946
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1