AI Research & Engineering: RecSys, Search, NLP, Generative AI and Beyond

Tag DeepSeek-Prover

DeepSeek-Prover 详解(V1 + V1.5):用合成数据与树搜索把开源 7B 推到 Lean 4 形式化证明的 SOTA(DeepSeek 系列第 7 篇)

DeepSeek-Prover V1(arXiv:2405.14333)与 V1.5(arXiv:2408.08152)详解:autoformalization 合成数据 + RLPAF + RMaxTS 蒙特卡洛树搜索,把 7B 模型在 Lean 4 形式化证明 benchmark miniF2F 上推到 63.5%,并为后续 R1 reasoning 训练提供方法论起点。

Loading

© 2026 Yudong‘s Blog — Powered by WordPress

Theme by Anders NorenUp ↑