一直以“技术硬核”著称的DeepSeek今日凌晨在其官方社交媒体账号上发布了一条神秘指令,随后自曝DeepSeek V4已完成最后阶段的训练,并将于近期开启灰度测试。据悉,V4版本将采用业内罕见的“万亿级参数MoE架构”。
Readhub与量子位纷纷转发了这一消息。DeepSeek V4被定位为全能型AGI原型机,其核心亮点在于对Token消耗的极致优化。据泄露的技术文档显示,V4通过自研的“信息无损压缩算法”,在同等计算资源下,其推理上下文能力提升了约10倍。这意味着用户可以在极低的成本下处理长达数百万字的技术手册或法律条文。
更受关注的是DeepSeek V4在多模态视觉理解上的进步。不同于以往的视觉大模型,V4能够实现“时空连续性分析”,即通过理解视频中的前因后果来预测后续动作。这一能力在自动驾驶和具身智能领域具有极大的应用潜力。尽管DeepSeek尚未公布正式发布日期,但其“深夜自曝”的行为已让不少科技巨头感受到了压力。业内预测,V4的推出将彻底重塑高性价比大模型的市场格局。

