关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3873人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

五星级酒店被一双拖鞋打败了?酒店巨头的问题出在哪了?

江瀚视野 浏览 4230

中方连对美"重拳出击" 特朗普这才看清楚中国留了一手

空天力量 浏览 3615

26款奇瑞冰淇淋/小蚂蚁上市 报废双补价3.4万元起

网易汽车 浏览 2629

气场拉满:泰国改装厂让长城坦克300“变身”Brabus G63

IT之家 浏览 2728

与众07实车曝光!长超4米8+续航558km

Ai爱车 浏览 2841

2025款比亚迪海狮05 EV完全评价报告

车质网 浏览 3529

AI浪潮已至,重磅嘉宾云集,乌镇再启新汽车之问

AutoBusiness 浏览 3446

CBA再无全胜球队!广东31分惨败北京,最新积分榜:卫冕冠军登顶

侃球熊弟 浏览 2895

迷雾剧场新剧:超越悬疑,窥见人心

吐槽电影院 浏览 3622

新年第一顶帽子,就要不基础

时尚COSMO 浏览 2134

靠创新药结束连续8年亏损局面,百济神州烧百亿研发终迎转机

览富财经网 浏览 4260

美股反弹!纳指收涨2.21%,黄金、白银期货飙涨创历史新高

中新经纬 浏览 3784

老外到中国看病会不会挤占医疗资源 三级医院院长回应

每日经济新闻 浏览 4762

怒批赵睿破坏民族团结后,新疆官媒明着夸胡金秋 疑暗讽男篮队长

念洲 浏览 1985

指控闻泰科技的安世荷兰高管 大幅提高了自己的薪水

澎湃新闻 浏览 31536

NCAA常规赛:俄勒冈85-88失利,林葳14中8砍新高23分+三分绝平

懂球帝 浏览 2681

这谁能想到!能伸手“救”日产汽车一把的,会是比亚迪

小李车评李建红 浏览 3559

西汉姆联助理教练帕科·赫梅斯澄清与努诺·埃斯皮里托·桑托的场边争执

绿茵情报局 浏览 2421

诺贝尔经济学奖获得者放话:欧洲不能让中美赢了

澎湃新闻 浏览 9004

吴向东一场前所未见的白酒直播,亮出珍酒李渡的里子和面子

斑马消费 浏览 749

帧帧美若油画,库布里克大神杰作告别放映!

幕味儿 浏览 2593
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1