DeepSeek-Coder(arXiv:2401.14196)详解:从 file-level 升级到 repo-level 训练 + 拓扑排序、FIM 双模混合 (50% PSM + NTP)、16K 长上下文,让 6.7B 模型在 HumanEval / MBPP 上追平 CodeLlama-34B。
© 2026 Yudong‘s Blog — Powered by WordPress
Theme by Anders Noren — Up ↑