关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro3173人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

长城魏牌汽车,到底被谁“逼急”了?丨正经深度

正经社 浏览 3125

9系大六座旗舰SUV又添一员 智己LS9预售33.69万起

网易汽车 浏览 3892

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 3061

百亿资产转让频现 银行加速甩包袱

北京商报 浏览 4195

伊姐周六热推:电视剧《许我耀眼》;电视剧《命悬一生》......

伊周潮流 浏览 4294

大S雕像揭幕仪式曝光,S妈具俊晔雨中挽手同行,前夫汪小菲未露面

扒虾侃娱 浏览 2966

美方被指仍在追截第三艘油轮 并拟增派力量强行登船

环球网 浏览 3309

“六小龙”齐聚乌镇背后:前沿技术已经“飞入寻常百姓家”

贝壳财经 浏览 3993

“爆冷”又如何?陈法拉的人生本就是一场逆袭大戏

时尚COSMO 浏览 1301

巴列卡诺2-1马略卡,帕拉松点射、德弗鲁托斯破门

懂球帝 浏览 3071

直击海上训练场!多舰协同补给现场震撼来袭

环球网资讯 浏览 179

央剧《生命树》播出4天,43岁杨烁口碑实现逆转

观察者海风 浏览 3026

短剧男主遇上长剧男主,谁是天然帅哥谁是滤镜美男,差距一目了然

娱乐圈笔娱君 浏览 3739

最近最火的,是这只狼?

仙女事件簿 浏览 3033

《红舞鞋》风波升级!用脚踩烈士纪念碑还撞死猫,劣迹斑斑遭抵制

萌神木木 浏览 4248

苏州大学突破:新型注意力机制赋能AI语境适应性对话

科技行者 浏览 2955

美国宣布针对伊朗实施新一轮制裁

上观新闻 浏览 2912

法拉利撞上护栏后迅速起火 知名游戏大佬被困车内身亡

每日经济新闻 浏览 31382

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 4201

小米汽车2026年月销稳站3万+台阶

盖世汽车 浏览 10

大国放大招,交割日要注意了

大猫财经Pro 浏览 3141
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1