关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3171人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗伊斯兰革命卫队:击落一架美军搜救飞机

财联社 浏览 1522

退赛5个月,全红婵传喜讯,人民日报亲自官宣

揽星河的笔记 浏览 4182

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者 浏览 3982

一图看懂|朝鲜庆祝空军成立80周年 展示了哪些新式武器

澎湃新闻 浏览 3501

有4S店0成交,购置税新政实施6天,哪些车依然好卖?

路咖汽车 浏览 3185

演绎日式豪华MPV 全新日产Elgrand新车图解

车质网 浏览 3545

快看漫画多位早期投资者和高管退出,创始人曾是千万粉丝网红,行业正经历深度调整

红星资本局 浏览 2916

福建舰入列在即 8万吨排水量成世界最大常规动力航母

极目新闻 浏览 10252

古巨基官宣二胎!妻子57岁高龄产子挑战生育极限,网友质疑代孕

萌神木木 浏览 3310

登上热搜!王欣瑜激战阿尼西莫娃

网球之家 浏览 3072

AGI for Science:关于科学未来的6个问题

知识分子 浏览 4616

美媒:美两架军机坠入南海或与燃油无关

北京晚报 浏览 3872

账面1000多亿,却隐藏20多年,整个互联网都找不到它长什么样

壹只灰鸽子 浏览 3063

揭秘!印巴冲突突然停火背后五大关键因素

浏览 7824

1000万人围观,爆红的「老辈子文学」

最人物 浏览 3462

9系大六座旗舰SUV又添一员 智己LS9预售33.69万起

网易汽车 浏览 3889

微星回应黄端16针电源接口松动,属于“缺陷”批次

IT之家 浏览 2533

重新定义边界,吉利全域安全进入 2.0 时代

网易汽车 浏览 3457

“这条裙子”今年春天又火了!配这4双鞋减龄又好看

LinkFashion 浏览 2269

伊朗:将以“最强硬方式”回应美任何攻击

环球网资讯 浏览 2925

过了元旦 苹果会对 iPhone 18 系列陆续测试量产线

威锋网 浏览 3452
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1