图为中国大陆人工智能初创公司Deepseek的资料照。(宋碧龙/大.纪.元;)
2025年中国传统新年时,中国人工智能初创公司DeepSeek推出R1大语言模型,以每百万输入和输出Token仅为0.5美元、2.19美元的破坏性定价(仅为OpenAI同期产品5%),迅速席卷市场。DeepSeek官网流量暴增,市占率飙升至7.5%,登顶美国苹果和谷歌应用商店,两周内海外安装量突破1,000万次。
中共官媒将其包装为“弯道超车”典范,公司创始人梁文峰甚至受邀参加国务院座谈会并亮相央视,社交媒体上“DeepSeek秒杀ChatGPT”“中国AI崛起”的标题刷屏。然而,短短四个月后,热潮迅速消退。官网流量骤降29%,市占率跌至5%,使用率从50%暴跌至3%,活跃用户锐减。
R2模型原定于2025年5月发布,但至今未见踪影。与ChatGPT(增长40.6%)、Claude(增长36.5%)、Gemini(增长85.6%)和Grok(增长247.1%)的强劲表现相比,凸显DeepSeek竞争力快速消退。这场“从凤凰到土鸡”的反转,背后究竟有什么深层次原因?
从全民狂热到集体弃用:DeepSeek的体验崩塌
DeepSeek的爆红源于低价策略与官媒引发的民族情绪。用户对百度等国内搜索引擎不满,加上“中国AI崛起”的舆论热潮,让R1迅速成为焦点。然而,关键性能、数据质量和过滤机制缺陷,使R1无法成为高质量对话工具,导致用户转向ChatGPT、Claude等竞品。其在用户体验层面有以下五大缺陷:
第一,响应延迟严重。首Token输出延迟长达数秒,远超PowerSell、Friendly的近零延迟和微软Azure的表现。这种延迟无法满足用户即时性需求,即使价格更贵,用户还是转向更流畅的竞品。
第二,上下文窗口受限。R1的64K上下文窗口远低于主流的128K—256K,限制了长文档处理与复杂编程场景的应用。相比之下,Lambda、Navias以相同价格提供2.5倍容量,用户自然流向更优选择。
第三,交互速率低。R1生成速度仅为每秒25个Token,远低于Astrobic Cloud(45个)和OpenAI(60个),在高频对话场景中表现不佳,进一步削弱用户体验。
第四,响应性能差:为压缩成本,DeepSeek采用GPU高密度批处理,导致延迟剧增、吞吐下降,大幅牺牲了响应性能,令用户体验显着恶化。
第五,数据与过滤机制缺陷:R1早期通过蒸馏ChatGPT数据保持较高输出质量,但接入简中互联网后,吸收大量低质量内容(如营销帖、伪科学),导致“小说变历史、童话当报告”的内容混淆,幻觉率高达14.3%(行业平均约5%)。
更糟糕的是,DeepSeek为了遵守中共信息审查制度,设置了“史上最严苛”的过滤系统,对超过35万敏感词一律拒答或回避。这不仅限制了模型的表达能力,也让用户失去了对AI输出质量的信任。
技术瓶颈与战略失误:DeepSeek的致命缺陷
DeepSeek出现危机的根源是由于其在技术和战略上处于双重困境。技术层面,三大瓶颈暴露DeepSeek核心竞争力不足:
首先,是算力短缺。DeepSeek高度依赖英伟达芯片,但2025年美国升级芯片禁令,切断了其算力供应链。国产替代品(如华为昇腾910B)性能仅为H100的60%,价格却高30%,企业难以负担。算力短缺导致DeepSeek无法支撑高并发需求,R2模型开发受阻。
其次,是原创性技术不足。R1依赖知识蒸馏,通过向OpenAI等模型大量提问获取答案,低成本复制已有成果。这种方式涉嫌侵权,且缺乏原创性。DeepSeek算法多借鉴Meta的LLaMA,核心技术依赖国外开源框架,难以形成独特竞争力。
最后,是数据质量瓶颈。R2需更大规模高质量数据,但国内简中数据池受限于低质量内容和严格审查,屏蔽国际资讯、历史资料及政治讨论。低质量数据导致输出不可靠,中共严苛的审查机制阻碍用户反馈,限制模型优化。
从战略方向选择来看,DeepSeek还存在着以下三大误判:
第一,选择低价策略,放弃用户体验。由于算力不足,DeepSeek将资源优先分配给内部通用人工智能(AGI)研发和ATI实验项目,而非外部推理服务。低价虽能引来流量,却无法留住用户。
第二,夸大技术实力,误导用户。DeepSeek宣称具备“671B”参数规模,造成一种在体量上可比肩GPT-4o的假象,而实际运行时仅激活37B。
第三,用户数据存储在中国,被国际市场孤立。由于担忧用户数据可能被泄露给中共政府。美国、澳大利亚、意大利、德国和韩国等国以数据安全和隐私为由,明令禁止在政府设备中使用DeepSeek应用,导致其国际市场出海之路被堵死,陷入“孤岛化”发展。
两个AI世界:国产模型正走向孤立
事实上,DeepSeek所代表的中国大模型阵营,与OpenAI、Anthropic等海外主流AI之间,正逐步形成“两套AI体系”的割裂现象,这不仅是一个技术分歧的问题,更深层地反映了中美在AI发展路径、算力结构、市场机制等多方面的分歧。
首先,国外AI走的是“认知智能+通用能力”的道路,不断拓展Agent、多模态、工具链和代码协同能力,如OpenAI的GPT-4o已将语音、图像、代码深度整合;而中国AI则陷于“卷参数、卷榜单、卷成本”的低维竞争中,缺乏通用性和生态转化能力,难以走出闭环测试环境。
其次,国外AI已进入平台化阶段,国产AI仍处于“Demo级产品”阶段。ChatGPT通过多轮对话优化(ReACT)、原生插件系统、与Microsoft365、Azure生态深度融合,已经从一个聊天工具成长为“个人工作助理+企业生产力平台”。
而DeepSeek等国内AI多数没有完整的插件平台与工具链支持;模型接口调用频繁调整,API生态不稳定;面向企业的能力壁垒高,缺乏真实生产力工具的结合方式。
最后,两者落地能力差距显着。OpenAI的ChatGPT、Anthropic的Claude、Google的Gemini等已经在教育、办公、编程、金融服务等多个场景实现大规模应用并实现变现。反观中国AI企业,“找不到买单场景”几乎成了业内共识,商业化路径模糊。
国内外AI对比(笔者整理)
“国产大模型”与国际主流技术生态严重割裂:无法稳定对接OpenAI插件体系、缺乏可靠API市场、开发者生态薄弱,形成两个平行的“AI世界”。
虚假繁荣的缩影:中国AI产业的深层危机
DeepSeek的坠落并非个例,而是中国AI产业虚假繁荣的缩影,它揭示出中国AI行业在技术、资源和生态上的深层危机。曾在2024年风头无两的“杭州六小龙”等大模型公司,近期相继传出融资困难、技术团队流失、核心业务收缩的消息。
第一,表面繁荣与实际困境。国内有260个以上大模型,但实际活跃者不足10家(活跃用户超百万),多数平台重度亏损,Token调用极低,靠政府补贴维持。大模型厂商普遍面临缺场景、缺数据的困境,降低价格门槛成为获取用户和数据的重要手段。
第二,资源与技术断裂。中国AI算力80%依赖英伟达,国产芯片替代率仅15%,许多企业通过参数膨胀、廉价芯片和政策保护追求短期流量,产品性能差、服务不稳定,API接口频繁宕机,难以满足复杂需求。此外,中国AI缺乏原创算法,依赖PyTorch、LLaMA等开源技术,创新能力有限。
第三,审查机制进一步压缩创新空间。中共新出台《人工智能服务管理暂行办法》要求AI内容符合“主旋律”,信息封锁限制数据多样性,政治管控阻碍自由交流,与开放性的AI生态形成根本差距,更像是“一个可控的舆论工具”。连“天安门”问题都无法回答的AI,难以在全球竞争中立足。
第四,资本退潮。2025年05月,中国AI行业融资总额比去年同期减少85%,资本对国产AI增长神话的信心崩塌。相比于OpenAI凭借ChatGPT打造付费订阅模式、Azure接入企业服务体系,中国的AI公司普遍依赖政府补贴与投资热潮维持运营,缺乏市场自驱力。
结语
过去几年,中共政府主导、资本热炒、技术搬运构成了中国AI产业的表面繁荣,DeepSeek的坠落标志着国产大模型“堆量取胜”模式的终结。低价策略、虚假宣传与审查机制掩盖不了技术短板、算力危机与生态缺陷,AI竞争的核心在于稳定、低延迟、高质量的用户体验,而非低价或情怀。
AI突破需开放数据环境、自由学术交流及全球技术合作,而当前中共的信息封锁与审查机制严重制约数据多样性与模型优化。DeepSeek的教训警示中国科技产业:没有开放的数据环境、自由的创新土壤和以用户为中心的产品思维,任何“弯道超车”神话都将最终破灭。