AI Research & Engineering: RecSys, Search, NLP, Generative AI and Beyond

Tag DeepSeek

DeepSeek 技术路线图:从 2024-01 LLM 到 2026-04 V4 的两年半完整演进史(30+ 论文导读 · 系列序章)

转载本文请注明出处:https://yudonglee.me/deepseek-roadmap/ | 作者:yudonglee 本文是 DeepSeek 论文专题系列的序章。我把 DeepSeek 从 2024 年 1 月到 2026 年 4 月发表的 30+ 篇 paper 按四条主线和五大技术创新串成一个完整脉络。读完这一篇,你应该可以——把 DeepSeek LLM、MoE、Math、V2、V3、R1、V3.2、V4 这些名字之间的关系全部理清;说出 MLA、GRPO、Auxiliary-Loss-Free、FP8 训练、mHC 这些技术分别诞生在哪一篇论文、解决了什么问题;理解为什么 V4 不只是 V3 的规模升级,而是在底层范式上与之存在本质差异的新一代模型。 引言:DeepSeek 现象到底是什么 在过去两年半最具影响力的中国 AI 公司中,DeepSeek 是一个无法绕开的名字。 先把基本数据摆出来: 论文产出:2024-01 到 2026-04,30+… Continue Reading →

© 2026 Yudong‘s Blog — Powered by WordPress

Theme by Anders NorenUp ↑