关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3869人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中行风险总监卸任,薪酬曾超131万元

华美财经 浏览 2622

美伊海上对峙升级 阿联酋拦截伊朗导弹、无人机

央视新闻客户端 浏览 279

奇瑞的2025年,一场教科书级的“协同战”

车评社Auto 浏览 2804

弗里克:我以前没遇到过这种情况,明天想把不可能变成可能

懂球帝 浏览 1927

上汽大众首款“9系旗舰” ID. ERA 9X实车曝光

网易汽车 浏览 2626

特朗普威胁"美军轰炸会更猛烈" 伊朗:美国会后悔的

每日经济新闻 浏览 24873

极氪8X官宣3月16日举办技术发布会,并开启预售

网易汽车 浏览 1794

美媒:美国下水一艘新军舰中国已造好三艘 差距惊人

澎湃新闻 浏览 13381

吴磊大瓜牵扯多位明星!爆料女主骂赵露思骚扰吴磊,曝何猷君出轨

萌神木木 浏览 2503

萧蔷原来这么有趣,看了浪姐后越来越喜欢她了

TVB的四小花 浏览 992

蒙特利尔大学团队发现让AI"分段思考"的惊人秘密

科技行者 浏览 3402

中国女足在进攻三区传球成功率仅为64%,为四强球队中最低

懂球帝 浏览 1688

辛纳2-0德米纳尔,12连胜对手晋级ATP500维也纳站决赛

懂球帝 浏览 3630

1399元,JBL SOUNDGEAR CLIPS琉璃扣耳机预售

IT之家 浏览 3208

斯基拉:尤文、罗马、国米都在关注热那亚中场弗伦德鲁普

懂球帝 浏览 3567

科学家发现首批 45 亿年前“原始地球”痕迹,揭示太阳系早期秘密

IT之家 浏览 3612

E句话| 袁惟仁去世,前妻发长文送别

仙女事件簿 浏览 2420

外媒:马克龙在最后一刻加入反对阵营 "背叛"了默茨

澎湃新闻 浏览 8596

环球:中国实施稀土出口管制 美方没必要过度反应

环球网资讯 浏览 7223

官方:帕拉迪诺成为亚特兰大新主帅,签约至2027年6月

懂球帝 浏览 3297

3岁女童16楼走道坠亡 父母起诉开发商、物业索赔51万

红星新闻 浏览 15937
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1