关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1704人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

今年冬天最时髦保暖的4组搭配,照着穿美出新高度!

LinkFashion 浏览 1598

雷佳音回应作品太多惹人烦,自己新剧也牵涉其中

手工制作阿歼 浏览 2898

格力再强调暂无铝代铜计划!铝和铜各方面存在较大差距

快科技 浏览 1518

深圳福田首批"政务龙虾"上线 仅有3000多行代码

红星新闻 浏览 31182

站在4000点的十字路口,这六位“固收+”强将值得一看

证券市场周刊 浏览 2602

这家中国民企,破解了“迪拜之眼”难题,还拿下30多项“世界第一”!

国是直通车 浏览 2607

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

硅谷101 浏览 2532

文联春晚录制现场好真实!大咖太多没人惯着

萌神木木 浏览 1509

《唐朝诡事录3》第一波真实口碑出炉!

娱乐圈笔娱君 浏览 2583

美国“恢复核试验表态”背后有何考量

环球网资讯 浏览 2558

中金公司出席第19届亚洲金融论坛,以国际化投行实力融通世界

时代周报 浏览 1599

纯电续航215km 全新阿尔法T5增程版10月底将上市

网易汽车 浏览 3033

小S复出拿奖瞬间泪崩,多次提及姐姐大S求保佑

萌神木木 浏览 2675

女友BELLA+封面 | SUPER JUNIOR-D&E 双子星的友情叙事诗

伊周潮流 浏览 4316

哈格里夫斯:枪手拥有英超最顶级的四名边卫,其中廷贝尔最强

懂球帝 浏览 1784

俄议员:美国扣押油轮是"21世纪的海盗行为"

极目新闻 浏览 12398

AI“一路狂飙”,南京如何用产业攻坚书写答案?

现代快报 浏览 1996

孔蒂:球迷应忽略球队的谣言;欧洲裁判比意甲好?我不聊这个

懂球帝 浏览 2587

入职要姓“鼠”?三只松鼠工作人员回应

第一财经资讯 浏览 2287

中国公民需谨慎前往日本 四大原因披露

环球网资讯 浏览 41936

“工装混搭风”今年爆火!全世界的时髦女人都在穿

LinkFashion 浏览 1418
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1