关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2925人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“电池车”全面压过“发动机”一头?油车时代的辉煌,被彻底终结

少数派报告Report 浏览 2187

孙艺珍最新生图撞脸老公玄彬,43岁显出老态,剪短发装嫩太违和

萌神木木 浏览 2824

章泽天播客翻车删帖,网友怒斥怕批评就别出门

萌神木木 浏览 1640

深夜,全线大跌!“超级风暴”突袭!

券商中国 浏览 997

赫斯基:斯洛特应该调整战术体系,将萨拉赫撤出首发

懂球帝 浏览 2745

入职要姓“鼠”?三只松鼠工作人员回应

第一财经资讯 浏览 2287

又一中将在俄境内被炸死 俄方或实施对等定点清除行动

新民晚报 浏览 29480

芒果这部剧,让人读懂“太平”二字的千钧重

娱乐圈笔娱君 浏览 1516

还是王慧文有眼光,Kimi又融了35亿

字母榜 浏览 1928

河北公务员,干出200亿乳品王国

创业家 浏览 1509

2025秋冬大衣流行趋势

LinkFashion 浏览 2740

马竞战博德闪耀大名单:格列兹曼缺阵,小蜘蛛、瑟洛特在列

懂球帝 浏览 1567

载有马杜罗的飞机抵达美国纽约

财联社 浏览 1389

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 2868

一加 15 手机跑分曝光:骁龙 8 Elite Gen 5 芯片

IT之家 浏览 3591

北航团队突破:让AI学会像人一样思考,不必每次都说出来

科技行者 浏览 1403

北溪爆炸案一嫌犯身份曝光 案发时为乌军现役士兵

财联社 浏览 1991

特朗普邀请普京加入和平委员会 欧洲官员:实属荒唐

澎湃新闻 浏览 11118

郑恺晒与陈赫等10人合影,被扒P掉7处烟盒打火机,遭吐槽一群老登

萌神木木 浏览 2175

新不如旧!这4件时髦“旧衣服”今年太火了

LinkFashion 浏览 1616

新增蓝牙数字钥匙 迈腾3000万辆甄选款17.49万起

网易汽车 浏览 2869
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1