关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4372人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

OPPO Find X9 系列实拍:定位“旅拍神器”,口袋里的哈苏相机

IT之家 浏览 4049

米体:尤文愿承担恩-内斯里400万欧年薪,奥托利尼已到土耳其

懂球帝 浏览 3062

全智贤新剧跌破平台下线,迪士尼2亿投资亏本,业内直言堪称灾难

萌神木木 浏览 3745

天空体育:若利物浦向塞门约发出邀约,球员就会选择加盟

懂球帝 浏览 3396

凌晨3点皇马出战!赢球=8连杀+反超巴萨登顶 姆巴佩冲60球

叶青足球世界 浏览 4131

德黑兰传出防空系统拦截声 以宣称考虑恢复对伊军事行动

极目新闻 浏览 908

连打工人出差都住不起亚朵了?日益昂贵的亚朵该咋看?

江瀚视野 浏览 4959

英超本赛季平均每场持续100分36秒,但净比赛时间只有54.7%

懂球帝 浏览 4324

最近很火的5条裤子,腿粗、腿不直女孩一定要试试!

Yuki女人故事 浏览 6470

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 4319

台学者:高市会让北京确信"台独"与日本右翼势力结盟

环球网资讯 浏览 46773

iPhone17来了!华强北最新实探

中国基金报 浏览 4871

牛弹琴:中国的强烈愤怒还在继续 日本有三个没想到

北京日报客户端 浏览 43972

韩剧女神,被吐槽“断崖式衰老”?

寻艺 浏览 3021

比亚迪连放三招,蒸干城市NOA最后的溢价池丨电厂

电厂 浏览 6

波兰外长访乌 泽连斯基称愿与波兰分享实战经验

看看新闻Knews 浏览 4855

336万年薪请来的CEO,上任两个月就“失联”,高鑫零售的转型阵痛期

红星资本局 浏览 2888

陈晓最新露面瘦脱相!新剧要和陈妍希对打,女方离婚后状态更好

萌神木木 浏览 3722

美拉德过时了?今年冬天最火的4个颜色竟然是它们

LinkFashion 浏览 3131

埃迪-豪联赛对前东家伯恩茅斯7场不胜,并列英超最长纪录

懂球帝 浏览 4953

出行场景升级/还支持餐厅排队 方程豹钛7推送第二次OTA

网易汽车 浏览 3195
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1