转载本文请注明出处:https://yudonglee.me/deepseek-roadmap/ | 作者:yudonglee 本文是 DeepSeek 论文专题系列的序章。我把 DeepSeek 从 2024 年 1 月到 2026 年 4 月发表的 30+ 篇 paper 按四条主线和五大技术创新串成一个完整脉络。读完这一篇,你应该可以——把 DeepSeek LLM、MoE、Math、V2、V3、R1、V3.2、V4 这些名字之间的关系全部理清;说出 MLA、GRPO、Auxiliary-Loss-Free、FP8 训练、mHC 这些技术分别诞生在哪一篇论文、解决了什么问题;理解为什么 V4 不只是 V3 的规模升级,而是在底层范式上与之存在本质差异的新一代模型。 引言:DeepSeek 现象到底是什么 在过去两年半最具影响力的中国 AI 公司中,DeepSeek 是一个无法绕开的名字。 先把基本数据摆出来: 论文产出:2024-01 到 2026-04,30+… Continue Reading →
© 2026 Yudong‘s Blog — Powered by WordPress
Theme by Anders Noren — Up ↑