沐曦开源仓(持续更新)

[复制链接]
85 1

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
一、FlashMLA
GitHub-MXMACA/FlashMLA
Gitee-MXMACA/FlashMLA
    基于FlashAttention2在MXMACA平台上适配了DeepSeek开源FlashMLA算法,支持大模型解码过程中的性能提升。

二、DeepEP
GitHub-MXMACA/DeepEP
Gitee-MXMACA/DeepEP
    DeepEP是为混合专家(MoE)和专家并行(EP)量身定制的通信库。它提供了高吞吐量和低延迟的全对全GPU内核,也称为MoE调度和组合。该库还支持低精度操作,包括FP8。

三、3FS
GitHub-MXMACA/3FS
Gitee-MXMACA/3FS
    Fire-Flyer文件系统(3FS)是一种高性能分布式文件系统,旨在解决智算训练和推理工作负载的挑战。它利用现代ssd和RDMA网络提供共享存储层,从而简化了分布式应用程序的开发。DeepSeek自研训练场景的文件加速系统,代码没有使用CUDA加速库,为独立第三方文件加速系统,使用方式为替换原生文件读写API为3FS文件读写接口实现。

四、MXMACA Courses
    MXMACA课程是一系列面向GPU开发者和编程爱好者的实践课程,旨在通过项目驱动的方式提高学员的实际GPU编码能力。
Gitee-MXMACA Courses

五、Performance Tuning Guide
    Kernel性能优化和编写指南。
Gitee-PerformanceTuningGuide

六、MX-OpenKylin-SIG
Gitee-MX-OpenKylin-SIG

七、MetaX ModelZoo
    为方便更多开发者使用MetaX ModelZoo,我们后续将继续增加典型网络和相关预训练模型。 当前阶段支持部分开源onnx模型和paddlepaddle模型的预处理、推理及精度性能的测试。
GitHub-MX/ModelZoo
Gitee-MX/ModelZoo








精彩评论1

MS600  新手上路  发表于 2025-3-4 22:49:43 | 显示全部楼层
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

©沐曦 沪ICP备2020031767号-1
快速回复 返回顶部 返回列表