
头把交椅易位,但游戏还在不息。
在 R2 屡次传闻更新然后被"鸽"之后,Deepseek 又挤了一丝牙膏。
10 月 20 日,DeepSeek 团队在 Hugging Face 与 GitHub 上线并开源了 DeepSeek-OCR,参数鸿沟约 3B,继承了"视觉 - 翰墨压缩"有盘算,相较传统 OCR 模子普及了的扫描恶果。DeepSeek-OCR 的出现,有望补上 DeepSeek 在器具模子鸿沟的又一块拼图。
但是,最近两个月,这家火爆 2025 的 AI 独角兽,在 C 端用户鸿沟上碰到了头号竞争敌手——豆包的反超。凭证 QuestMobile 此前露馅的数据,中国破钞级 AI 助手的榜首在近期易位,8 月数据露出,"豆包"月活(MAU)约为 1.57 亿,环比增长 6.6%,反超 DeepSeek 约 1.43 亿升至第一。在一些业内分析视角,"豆包"的反超源于其多模态智商的庸碌应用,以及与抖音生态的深度接入。
不外,DeepSeek 方面似乎肯定凭借模子工夫迭代,也可以走出相反化谈路。在最新的 OCR 模子发布阐发中,团队再次强调了"基础智商"的迫切性——这个模子不仅能识别中英文搀和文本,还能处理手写体、复杂表格等高难度场景,准确率在多个公开数据集上刷新了记录。跟着 AI "六小龙"为代表的 AI 创业公司在 2025 年若干齐呈现出一些"看法诊治"的态势,Deepseek 似乎成为了国内独逐一家与" OpenAI 模式"访佛的企业:凭借出色的模子智商在 C 端市集冲到当先位置,并抓续深耕超大参数模子赛谈。
如若把 2025 年看作国内 C 端 AI 的"分水岭",上半场无疑是 DeepSeek 以开源与推聪敏商拉动的"工夫爆炸时刻",下半场豆包的反超,则更像是互联网巨头在深度整合股源后的"反击时刻"。而让出 C 端市集头把交椅的 Deepseek,却迟迟莫得对旗下主力模子进行大版块更新。本次 DeepSeek-OCR 的"挤牙膏",似乎是这家国内顶流 AI 创业公司,工夫链路优先理念的又一次延续。
01
OCR,一项大家并不目生的工夫,指将文本图像鼎新为机器可读文本色式的经过。和此前的 OCR 系统 / 模子不同,Deepseek-OCR 继承了"视觉 - 翰墨压缩"有盘算,这么一个惟有 3B 大小的模子,却在 OmniDocBench 测试中,仅使用 100 个视觉绚丽就胜过了 GOT-OCR 2.0,后者用了 256 个视觉绚丽。而在绚丽数目少于 800 个的情况下,它也打败了 MinerU 2.0,后者每页需要卓越 6000 个绚丽。
另一方面,百度在此前厚爱发布并开源其自研的多模态文档理解模子 PaddleOCR-VL。这一模子在全球泰斗的文档理解评测榜单 OmniBenchDoc V1.5 中,以 92.6 分的成绩登顶全球第一。而 Deepseek 紧随后来发布的 Deepseek-OCR 的操作,在一些行业社群中被冠以"阻击竞争敌手"的标题。
回到 Deepseek-OCR 的"视觉 - 翰墨压缩"有盘算,时常情况下,废话语模子在延长 OCR 任务时筹谋本钱极高——处理的翰墨单位越多,筹谋量就会呈二次方增长。传统的 OCR 系统在识别一页文档时,时常需要处理上千个翰墨绚丽身手完成用户辅导。
而在 Deepseek-OCR,模子工程东谈主员尝试了一种更高效的旅途:应用视觉话语模子(VLM),径直在语义层濒临图像中的翰墨信息进行压缩,将原来需要千千万万翰墨绚丽身手抒发的内容,映射为更一丝、更具语义密度的视觉绚丽,从而权贵镌汰全体筹谋本钱。

此外,DeepSeek-OCR 还领有"深度理解模式",能将财务类图表径直弯曲为结构化数据,自动生成 Markdown 表格与图像。这意味着,一份包含数字、弧线、图注的财报截图,不再需要东谈主工复制粘贴或二次整理,系统就能收复出可裁剪的分析稿体式。
这套系统的中枢由两部分构成:负责图像融会的DeepEncoder,以及基于DeepSeek-3B-MoE架构的翰墨生成模块。DeepEncoder 约有 3.8 亿参数,专诚分析图像并生成压缩后的视觉特征;而翰墨生成部分启用了 5.7 亿个活跃参数,用于凭证这些视觉特征生成高精度的翰墨姿色。
据了解,Deepseek-OCR 在 10 倍压缩下解码精度可达 97%,即使在 20 倍压缩下也能保抓 60% 的准确率。这意味着一张图像仅需 LLM 所需 token 的一小部分,即可暗示整篇文档。
从工夫维度看,该模子代表着 DeepSeek 正在从"话语模子+Chatbot "中枢旅途,向更多的用户场景拓展。伴跟着 Deepseek-OCR 的厚爱开源,其有关智商有望进一步家具化,在长文本、表格、跨页文档的压缩与索取场景均有应用空间。
回来 Deepseek 的通用大模子家具线不难发现,OCR 智商一直是 R1 系列的智商短板。此前,尽管 DeepSeek R1 在本钱效益和逻辑性能方面具有澄澈的上风,但 PDF 解读等场景与其他顶级模子(Claude Opus 4 和 ChatGPT-5)比较仍然较为有限。缺少原生 OCR、文献大小规则以及文献 API 缺失,使得 DeepSeek R1 无法成为齐全的文档贬责有盘算。
是以,DeepSeek-OCR 既有可能养殖出稳重器具家具,也可能是后续通用模子迭代的"工夫积累"行为。而传闻中的大版块更新,凭证《The Information》在此前的报谈中露馅,"尽管 DeepSeek 工程师昔日数月一直在高强度诱导 R2 模子,但 CEO 梁文锋对新模子的性能推崇并不欢叫。"
R2 的面世时间也因此一拖再拖,但家具鸿沟的竞争敌手却照旧拍马赶到。就在几周前,另一款 AI App 取代了 Deepseek ,成为了新的 C 端 AI 应用月活冠军。豆包,带着字节系家具的庞杂生态,不才半年卷土重来。
02
凭证 QuestMobile 数据,2025 年 8 月,豆包月活用户数约为 1.57 亿,环比增长约 6.6%;同期 DeepSeek 月活约为 1.43 亿。豆包时隔两个季度,在国内 C 端 AI 应用市鸠合再行夺回头部地位。
夺回"月活冠军",豆包的得手离不开其生态上风与用户触点积累。和 Deepseek 不同,豆包定位为面向通盘"大家用户"、强调场景化体验,在语音、图像、应付共享等鸿沟均延展了模子智商,镌汰了用户使用门槛。与此比较,DeepSeek 虽在工夫上推崇强盛,却更像 ChatGPT 模式的聊天应用,进口单一、使用门槛相对更高。
具体而言,豆包关于 Deepseek 的包围主要体现时以下三个鸿沟:一方面,豆包自然可以借助抖音等字节系应付平台的分发智商。从豆包面世以来,字节方面在 AI 家具投放上蕴蓄了大齐教导,在一些视频网站上,多样"剧情"的豆包告白百鸟争鸣,好多新用户时常在这一过程中被迫战斗并弯曲。
另一方面,豆包在立项一启动就对准了最庸碌的受众,家具体验面更宽。以至在两个家具的名字上就可以侦查一二。比较起" Deepseek "的极客风,"豆包"这个名字,关于国内用户也相对更琅琅上口。在 APP 的 logo 假想上,豆包也聘用了愈加拟东谈主化的处理。据了解,在豆包立项之初,东谈主格化交互智商即是豆包智商建造的板块之一,随豆包一同公测的还有聊天 Agent "小宁",可以说,奉陪 / 拟东谈主的属性在一启动即是豆包基因的一部分。

此外,凭借着字节在语音 / 视频生成等多鸿沟建设起的模子矩阵,如今的豆包号称 AI 圈的超等 APP。援手多种多模态(文本、语音、图像、视频生成)功能,功能混乱的同期也有明晰的用户率领逻辑,小白用户上手快,让"非 AI 玩家"也能有可以的体验。
《WIRED》在此前露馅的一篇专栏中这么刻画"豆包":"它就像 ChatGPT、Midjourney、Sora、Character.ai、TikTok、Perplexity 等广漠功能集成在一个应用递次中。"事实诠释,这种大而全的一体化 AI 贬责有盘算,关于 0 基础的 AI 家具用户确乎相对友好。
据《南华早报》报谈,本年 1 月,爆火的 DeepSeek 取代 ChatGPT,一度夺得 App Store 好意思区榜首位置。但在随后一段时期,国内几大 AI 巨头纷纷启动发力,C 端 AI 应用市集堕入了投流和"内卷"的竞争中,除了刚刚夺回第又名宝座的豆包,腾讯旗下的元宝在 8 月也收货了 22.4% 的用户增长,MAU 达到 3300 万。蚂息争团旗下的 AQ 健康应用也冲进了榜单前十,该应用于 6 月推出,8 月用户数环比增长 60.1%。
而据 QuestMobile 数据露出,5 月份离开 DeepSeek 的用户中,约有 40% 转投豆包。在"好用"和"好玩又好用"之间,关于大部分泛泛用户而言,后者的引诱力澄澈更大一些。
在这场头名竞逐中,豆包和背后的字节卓越领有了科技巨头级的体量、数据和全球布局,而 DeepSeek 的上风在于天真、学院派的筹商范式,以及一条更"专注"的工夫途径。而在 2025 年 10 月的节点,是豆包凭借着更大的生态体量,得手挤到了戎行最前边。
03
尽管 DeepSeek 在 2025 年头曾得回引东谈主鼎新的用户增长与工夫窒碍,但后来增长势头出现减缓迹象。商讨公司罗兰贝格此前露馅的阐明指出,适度 2025 年 2 月,DeepSeek 与豆包在中国 Top 10 AI 应用中比肩,但彼时 Deepseek 当先豆包约 3600 万 MAU。尔后,豆包在 8 月完成反超。
从家具更新节律看,DeepSeek 在 2024 年底发布 V3 模子,本年 5 月发布 R1-0528,优化了 R1 模子的幻觉问题。但在这之后,尽管大版块更新传言不停,但传闻中的 R2 却迟迟未现真身。在本次 OCR 模子发布之前,Deepseek 不才半年的主要行为是更新了 V3.1 模子,援手搀和推理模式以及 128K tokens 的长潦倒文输入。

而在月活榜单被豆包挤到第二名后,Deepseek 也并未在 App 端交互 / 生态上作念出大幅优化行为。事实上,从年头爆火到于今,Deepseek App 一直沿用着访佛" ChatGPT "作风的交互逻辑,莫得豆包里多样第一方 / 第三方 Agent,坚决走在"模子即家具"的谈路上。
在计策旅途上,Deepseek 长久坚抓"工夫深耕"的途径。本次更新的 Deepseek-OCR 模子也阐发,这家 AI 独角兽在 LLM 鸿沟仍然有着当先的工夫探索智商。但濒临竞争敌手们庞杂的生态上风,Deepseek 脚下的家具理念和作风,关于用户鸿沟的弯曲恶果仍有待不雅察。
不外,DeepSeek 确乎没意义太过张惶,即使被豆包反超,Deepseek 仍然坐拥 1.5 亿月活,在 C 端鸿沟照旧打响了口碑。而在工夫目的上,Deepseek 也一直在延续超大参数模子策略,V3 系列总参数目高达 671B,同期 AI "六小龙"其他的开源模子,如智谱 GLM-4.5 惟有 355B。
此外,在一些业内视角看来,DeepSeek-OCR 的发布,一方面在 C 端器具类场景有着可以的应用出路,同期也可能成为模子磨练的"催化剂"。据了解,Deepseek-OCR 每天可以在单个 Nvidia A100 GPU 上处理卓越 20 万页数据。如若使用 20 台管事器,每台管事器运行 8 块 A100 处理器,蒙眬量将跃升至每天 3300 万页。
这么的蒙眬恶果,可以灵验匡助构建其他大模子的磨练数据集。关于走超大参数途径的 AI 企业而言,LLM 磨练中时常需要海量高质料文本,而 DeepSeek-OCR 出现,无疑在这一鸿沟指向了一条更高效的贬责链路。
改日,DeepSeek 如若念念要在后续和豆包"掰掰手腕",生态身分仍然是不得不商酌的身分。强如 OpenAI,插足 2025 年后,也在积极拓展模子智商在各鸿沟生态的构建,无论是参与 AI 玩物等硬件有盘算的筹商,照旧 Sora2 以短视频平台的格式与用户碰头,OpenAI 照旧给 Deepseek 留住了参考模板。
换言之 凯时体育游戏app平台,Deepseek 脚下的重大事,除了加快下一代模子的迭代外,应用好手上的庞杂的 C 端用户鸿沟一样至关迫切。由于模子家具线不同,Deepseek 短期内澄澈无法复刻字节 /OpenAI 的生态策略。但关于这家工夫底色浓厚的 AI 独角兽而言,在 C 端生态上能否搞出一些相反化的途径,将是它能否再度向豆包发起冲击的迫切身分。