秦伯 发表于 2025-3-2 11:25

周末DeepSeek扔出“王炸”

本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

泉府上士 发表于 2025-3-2 11:47

谢谢分享,学习了。

秦伯 发表于 2025-3-2 15:03

泉府上士 发表于 2025-3-2 11:47
谢谢分享,学习了。

谢谢关注。DeepSeek真是火,后续动作值得持续关注

md_7039 发表于 2025-3-3 15:35

谢谢分享,学习了

md_7039 发表于 2025-3-3 15:38

好好学习天天向上
页: [1]
查看完整版本: 周末DeepSeek扔出“王炸”