关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3872人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

警方通报小米成都车祸: 驾驶员涉嫌酒后驾驶

网易汽车 浏览 3803

“塌房失败”的李雪琴给所有人上了一课

乡野小珥 浏览 3273

关店100家!潘多拉败走中国,营收萎缩至1%,消费者:质量太差

木禾投研 浏览 3652

在国家德比爆发冲突后,亚马尔社媒取消对卡瓦哈尔的关注

懂球帝 浏览 3629

冬天的毛衣,越“大”越好看!

LinkFashion 浏览 2531

成功冲乙,厦门壹零贰陆主帅:厦门是一座有足球底蕴的城市

懂球帝 浏览 3767

泽连斯基:美提议举行美俄乌国家安全顾问级别会议

国际在线 浏览 2933

普京穿军装看俄白军演:试戴热成像战术眼镜 装填手枪

新京报 浏览 3318

沃勒尔:德国队首发门将仍存在变数,特狮必须稳定上场才行

懂球帝 浏览 2898

今年最强阵容的大片,杀疯了

独立鱼 浏览 3272

日间为虫,夜晚化蝶,CHANEL的多变性

时尚COSMO 浏览 1759

一网友称车辆在京东养车做保养后发动机报废

大象新闻 浏览 2898

又有一批A股龙头进军商业航天了!

君临财富 浏览 2653

韩国延世大学AI新突破:让视频生成快65%的"拼配"技术

科技行者 浏览 2698

颜骏凌:武磊赛前对球队做了动员,我们争冠经验丰富没有包袱

懂球帝 浏览 3503

CBA常规赛第26轮最佳阵:周琦阿不都沙拉木领衔,姜伟泽在列

懂球帝 浏览 1635

BBA的心态,快被华为搞崩了

少数派报告Report 浏览 2968

新华社权威快报|我国生成式人工智能用户规模超5亿

新华社 浏览 3683

「寻芯记」上市后首个大动作!摩尔线程公布全功能GPU架构路线图,国产芯片发起生态冲刺

华夏时报 浏览 2896

刚性需求凸显,新型储能产业发展按下快进键!多家企业加码布局

览富财经网 浏览 1772

哈马斯高级领导人:准备撤出“黄线”以内武装人员

财联社 浏览 3251
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1