关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻965人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一句话点评10月紧凑型SUV:燃油车不仅没有死,居然还愈战越勇了

汽车公社 浏览 401

北约秘书长呼吁解除乌用西方武器打击俄本土限制

环球网资讯 浏览 11027

多省公安厅长密集调整 5名“70后”履新

中国新闻周刊 浏览 91364

出厂即改装,全新荣威i5 GT售8.79万元起

汽车头条APP 浏览 20125

标配功能很牛 雪佛兰发布全新一代探界者

网易汽车 浏览 12507

44岁阿娇自曝手抖出肝不太好,已戒酒一年多

小咪侃娱圈 浏览 853

76岁许绍雄去世:叔公参与创立黄埔军校 姑婆是许广平

红星新闻 浏览 12207

倪妮的七夕礼物已锁定,别怪我没叫你抄作业!

瑞丽伊人风尚 浏览 15038

鲁媒谈准入:新赛季会带给更多球队机遇,想获红利需守住阵地

懂球帝 浏览 78

新外号?网友:哼导也是第一次进主场吧? 刘维伟:是的

直播吧 浏览 19085

鸿蒙版微信一周年:从“能用”到“好用” 超2000万下载量背后的进化史

快科技 浏览 1007

记者:巴黎引进维加交易取得进展,希望球员本周末完成体检

直播吧 浏览 15193

林志玲一家三口同框!混血儿子亮相

娱絮 浏览 16436

努比亚Z60 Ultra正式发布 售价3999元起

网易科技报道 浏览 13230

阿里京东,洗牌余波未了

市界 浏览 15510

媒体:高市涉台言论后又蹬鼻子上脸 野田佳彦在放鱼饵

新民周刊 浏览 15720

网民辣笔小球正式被批捕,侮辱戍边烈士将被依法公诉

趣看热点 浏览 173431

外观设计微调/功能升级 新款山海T2将于四季度上市

网易汽车 浏览 1551

玻利维亚决定与以色列断绝外交关系 以色列外交部回应

环球网 浏览 80235

普京批准俄罗斯与古巴军事合作协议

上观新闻 浏览 965

全新奔驰C级纯电版曝光,续航或750公里,2025年上市

Nice好车 浏览 12663
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1