关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4373人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

谢林汉姆:雅克松经验丰富,切尔西不应该放他离开

懂球帝 浏览 4195

美军机沿伊朗边界飞行 伊朗寻求外交支持

新华社 浏览 3177

将于3月10日首发 奔驰VLE国内测试车曝光

车质网 浏览 2961

特朗普取消"特普会"对俄追加制裁 俄发出强烈威慑信号

上游新闻 浏览 8435

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 3421

年度总结|| 2025年学会的8件小事

黎贝卡的异想世界 浏览 3249

研究发现:若告知消费者广告是由AI生成的,点击率会减少31%

IT之家 浏览 3608

英国正为乌克兰研发新型导弹:可深入打击俄境内目标

环球网资讯 浏览 3103

对话深投控何建锋:当好耐心资本、长期资本、大胆资本|连线两会

中国企业家杂志 浏览 2288

香港科技大学突破AI画图"作弊"难题:让机器学会诚实创作

科技行者 浏览 3141

特朗普签行政令征收25%新关税 加密货币超24万人爆仓

每日经济新闻 浏览 9311

碧姬·芭铎,“穿衣自由”概念的祖师奶

时尚COSMO 浏览 2545

消费股大爆发,但背后另有玄机!

君临财富 浏览 3903

国家外汇管理局副局长刘斌:研究长期限、多品种、小币种等外汇市场发展问题|2025外滩年会

国际金融报 浏览 4102

伯利再挖布莱顿,邮报:前布莱顿技术总监威尔加盟斯特拉斯堡

懂球帝 浏览 3959

1.5亿利润与12亿负债,祥源文旅为何景区造血,债务“起飞”?

华夏时报 浏览 3975

媒体:欧洲在委主权问题上"选择性失语" 很快遭遇反噬

极目新闻 浏览 13628

日本知名女星结婚:酷似高圆圆 曾和林志玲老公交往

新民周刊 浏览 7539

电池都能紧急弹射了,什么时候整拦截技术?

汽车公社 浏览 4422

1-10月累计同比增长57.1% 深蓝汽车10月全球销量36792辆

网易汽车 浏览 3861

世界杯仅剩15天!内马尔警报:一瘸一拐离开医院 足协担忧

叶青足球世界 浏览 194
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1