搜索
出售我的作品
用户头像

又壹耳设计工作室

你还没有自我介绍哦~
用户头像

您还未登录

登录后即可体验更多功能
立即登录

搜索

搜索按钮
搜索历史
热门搜索
医疗
后台
电商
后台管理系统
CRM
ERP
大屏
您当前还不是平台作者,
立即申请成为作者?

温馨提示

本次下载需扣除1
剩余下载免费作品5
今日有效(每日获得1次)
当前剩余:1/1
 
永久有效(参与活动获得)
当前剩余:6/10
 
立即下载
获取更多下载次数
绑定手机号
发送验证码
根据《中华人民共和国网络安全法》要求,使用互联网服务需进行身份信息验证。请绑定手机号验证,感谢您的支持和理解
立即绑定

获取更多下载次数

免费下载产品原型,提高工作效率

添加小师妹微信
微信扫一扫添加
注意:添加完后记得刷新哦
复制以下链接地址,邀请好友访问
复制链接
客服头像
在 线 咨 询
象天尺客服二维码 微信扫一扫咨询 >
返回顶部

曾经火爆全球的DeepSeek,其实已在变了

2026-04-17 发布 199 次浏览

自从2025年开始,DeepSeek就已经被迫将大量资源投入华为昇腾芯片适配,从英伟达CUDA生态全面迁移至华为CANN框架,训练阶段频繁崩溃、精度对齐耗时巨大。与此同时,核心团队(R1作者郭达雅、OCR负责人魏浩然等)被大厂以2-3倍薪酬挖角,代码生成能力已被Claude 4系列超越。V4或许不再是刷屏的王炸模型,但可能成为证明中国前沿模型可在国产硬件上可用的产业里程碑——这是DeepSeek的妥协,也是中国AI自主可控的代价。

 

 

现在中国互联网只剩下一个问号:DeepSeek V4,到底发不发?

过去一年多,全球模型竞争早已进入拼刺刀模式。

OpenAI、Anthropic、Google等巨头基本保持2-3个月甚至1个月一次大迭代,新版本快速推向市场验证、迭代再验证。

而DeepSeek在过去15个月,大版本更新放缓,V4多次延期,节奏明显落后,已从行业领跑者变成了慢半拍的那个。

等待的焦虑演变成猜疑的漩涡。

4月初,有媒体突然放出风声:V4可能在未来几周发布,但不要对DeepSeek V4有太高期待。

为什么期待已久的发布,要提前打预防针?

这一年,DeepSeek到底发生了什么?

01 国产化的重任

真相或许藏在一条被大多数人忽略的新闻里。

2025年1月,路透社报道透露了一个细节:Deepseek R1发布后,有关部门鼓励DeepSeek采用华为昇腾处理器,而非继续使用英伟达。

“鼓励”二字,在当时的语境下,重量远超字面意思。

DeepSeek不是普通的创业公司,它是中国AI打破美国技术封锁的第一个成功样本。

这种象征意义,让DeepSeek迅速从一家技术公司,变成了国家自主可控战略棋局上的关键棋子。

紧接着,2月份梁文峰参加了那场万众瞩目的民营企业座谈会。

他被安排坐在第一排,和马化腾、任正非、雷军等科技大佬,并肩成为新质生产力的国家队代表。

政策导向的齿轮,由此开始转动。

据外媒报道,DeepSeek在2025年初确实尝试过用华为昇腾910C芯片训练下一代模型。

但过程遭遇多重技术障碍:训练稳定性不足,大规模分布式场景下频繁崩溃,芯片间通信速度未达预期。

华为派遣工程师团队前往DeepSeek办公地点提供现场支持,最终仍未能解决训练阶段的适配问题。

结果是妥协性的,DeepSeek训练阶段继续切回英伟达GPU,昇腾芯片仅用于推理环节。

这意味着,至少在训练这一核心环节,DeepSeek用了近一年时间在试错。

但适配工作并未停止。2026年,V4版本传出新动向。

据爆料,DeepSeek没有提前给英伟达开放测试权限,反而优先把预发布版本交给华为新一代昇腾950PR芯片做适配。

同时为分散风险,还同步适配了寒武纪芯片。

但技术挑战依然显著。

据媒体报道,这次的目标是从底层代码层面完成迁移,从英伟达CUDA生态全面迁移至华为CANN框架,实现训练与推理全链条的国产化替代。

据接近项目的人士透露,适配工作的核心难点在于精度对齐,确保模型在不同硬件生态下输出一致,这涉及大量底层代码调整。

时间成本由此产生。

当全球主流厂商保持2-3个月模型迭代节奏时,DeepSeek却越来越慢,期间可能有相当大比例的技术资源投入了国产芯片适配。

毕竟国产芯片与英伟达在代际性能、生态成熟度、工具链完备性上确实存在差距,模型适配过程耗时巨大。

这与DeepSeek当初纯粹追求模型性能提升的路径,形成明显分野。

产业链层面的联动也在同步发生。

2026年初,市场传出阿里、字节、腾讯已向华为下单数十万颗昇腾950PR芯片。

一种合理的猜测是:头部云厂商在等待DeepSeek V4的验证结果,以评估国产芯片在大规模AI训练中的实际可用性。

若V4成功跑通,华为950PR将从技术样品转化为可商用产品。若未能达到预期,相当于为行业探明了当前国产芯片的能力边界。

考虑到梁文锋对模型发布的要求一贯极高,达不到预期绝不发的标准,V4终于即将亮相,很可能在推理侧已通过效果测试。

如果真的验证成功,这将是DeepSeek乃至整个中国AI转向自主可控的关键一步。

02 身份转型的代价

DeepSeek主动承担国产算力生态验证的重任,这种选择让它更像一家国家使命型公司,而非纯粹逐利的市场化玩家。

但转型的代价显而易见:短期节奏放缓、人才压力增大、竞争力暂缓。

根据2026年3-4月多家独立评测和社区数据,DeepSeek在第三方基准测试中,代码生成能力已被Claude 4系列(Opus 4.6 / Sonnet 4.6)显著超越。

DeepSeek的多模态处理能力也主要局限于文本+图像,远落后于Claude和GPT在图像分析、计算机使用和视频理解上的表现。

进入2026年,DeepSeek将产品重点转向更具挑战性的Agent系统工程。

根据当前社区反馈,DeepSeek在代码Agent和中文搜索Agent领域已接近第一梯队,但在多工具协同、长链路任务执行以及真实环境鲁棒性上,仍与OpenAI、Google等国际顶尖模型存在明显的系统工程差距。

这种差距,不一定是技术能力的衰退,更像是在市场竞争与国家战略之间做出权衡后的结果。

组织层面的代价同样显性。

2025年下半年起,DeepSeek核心团队成员开始出现松动。

据晚点LatePost确认,王炳宣(第一代大模型核心作者)、郭达雅(R1核心作者)、魏浩然(OCR负责人)、阮翀(多模态负责人)相继离职。

这些名字背后,是DeepSeek从V1到R1的技术积淀。

流失的动因复杂,但薪酬体系的相对劣势是显性因素。

猎头透露,竞争对手开出的条件是DeepSeek的”两到三倍”,部分大厂直接给出八位数总包。

DeepSeek作为未外部融资的初创公司(母公司为幻方量化),薪酬虽绝对值不低,但无法匹配字节、阿里、腾讯等市场化巨头的股权激励和估值溢价。

梁文锋已开始推动公司估值工作,明确期权定价,给团队更多确定感。

但在智谱、MiniMax等同行上市、股价高涨的背景下,留住顶尖人才的压力依然不小。

如今的DeepSeek正在陷入一种身份的模糊。

它仍然需要商业化,仍然需要留住人才,但同时它又被赋予了国产化适配的期待。

这种双重身份带来的冲突,或许正是DeepSeek这一年越来越慢的深层逻辑。

因此,市场对V4的性能预期也在下调。

它未必会成为又一次刷屏的王炸模型,但可能是一个产业意义上的里程碑,证明中国前沿模型可以在国产硬件生态上达到可用水平。

V4的答卷,对于中国AI产业的长期走向可能更为重要。

收藏 收藏 收藏 0
阅读排行榜
    加载数据中...
声明:象天尺内网友所发表的所有内容及言论仅代表其本人,并不反映任何象天尺之意见及观点。
登录 后评论
全部评论
文章信息
创作时间
2026-04-17