是否有在 C500 上微调 DeepSeek-R1 满血版的文档教程

查看全部 · 发表于 2025-4-10 16:12:14

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

您好，是否有在 C500 上微调 DeepSeek-R1 满血版的文档教程？

只看到了较小的模型 Qwen2.5-Math-1.5B 的 SFT 的方法（使用DeepSeek-Factory），如果要使用 TP + PP 的并行方式（类似 megatron ）在 4 x 8卡C500 环境微调较大的模型，比如 72B，应该如何执行？比如指定 TP=8, PP=4。

或者是否可以有适配使用 Megatron LM 训练框架的镜像和对应的例子？