关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4376人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

为了挡住豆包,腾讯撒出10亿红包

中国企业家杂志 浏览 2954

音频实证日本有意滋扰中方训练

玉渊谭天 浏览 2460

秦雯袭警风波升级!新剧开播前四天紧急撤档,上星困难唐嫣被牵连

萌神木木 浏览 4174

东部第一!活塞双杀步行者13连胜平队史纪录 坎宁安24+11+6

醉卧浮生 浏览 3691

杨迪回应爬山过程中朋友被救护车拉走

封面新闻 浏览 14

天空记者:若能在伤缺后恢复健康,梅努仍有望重返首发

懂球帝 浏览 3388

莱巴透露战斯瓦泰克的两大关键,丝袜称气温还这么高会手足无措

网球之家 浏览 3043

从“海燕”到“波塞冬” 俄密集官宣捷报有何考量?

极目新闻 浏览 4127

曾毅手表事件休整后首次露面,发布新团队全家福

迷迭香的记忆a 浏览 3406

阿里发布生态级AI助手数字人形象——千问“小酒窝”

大象新闻 浏览 1318

田中碧:日本球员水平在提升,想知道与巴西的差距就得比一场

懂球帝 浏览 4315

超34.2万人爆仓,比特币一度跌破10万美元关口

观察者网 浏览 3927

王楚钦退赛:突然背部不适 一度不太能动得了

北京日报 浏览 8445

芒米Pocket Max掌机:模块化设计、大容量电池与强芯片的结合

IT之家 浏览 3128

太癫了,又一个国民女神翻车了

独立鱼 浏览 4233

乌国家科学院人口研究所:乌人口规模或将下降三成

红星新闻 浏览 3498

江苏88-84逆转天津获赛季首胜,庞峥麟34分,贾尔斯25+13

懂球帝 浏览 3330

老派,但是好看

电影最TOP 浏览 2971

王一博风波升级!吐槽肖战等十几位明星

阿废冷眼观察所 浏览 2436

普通人真该看看这些穿搭!短上衣配裙子、颜色选好,自然得体

静儿时尚达人 浏览 4319

左手并购芬兰Dispelix,右手合作全球头部大厂瑞声科技加速XR布局

爱集微 浏览 3752
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1