Tag DeepSeek-Prover

DeepSeek-Prover 详解（V1 + V1.5）：用合成数据与树搜索把开源 7B 推到 Lean 4 形式化证明的 SOTA（DeepSeek 系列第 7 篇）

DeepSeek-Prover V1（arXiv:2405.14333）与 V1.5（arXiv:2408.08152）详解：autoformalization 合成数据 + RLPAF + RMaxTS 蒙特卡洛树搜索，把 7B 模型在 Lean 4 形式化证明 benchmark miniF2F 上推到 63.5%，并为后续 R1 reasoning 训练提供方法论起点。

2026-03-07 1

Theme by Anders Noren — Up ↑

AI Research & Engineering: RecSys, Search, NLP, Generative AI and Beyond

Tag DeepSeek-Prover

DeepSeek-Prover 详解（V1 + V1.5）：用合成数据与树搜索把开源 7B 推到 Lean 4 形式化证明的 SOTA（DeepSeek 系列第 7 篇）