找回密码
 立即注册

QQ登录

只需一步,快速开始

广告载入中...
查看: 95|回复: 4

周末DeepSeek扔出“王炸”

[复制链接]
发表于 2025-3-2 11:25 | 显示全部楼层 |阅读模式

马上注册,享用更多功能,让你轻松玩转本论坛。

您需要 登录 才可以下载或查看,没有账号?立即注册

×

本周以来,DeepSeek开启“开源周”,给人工智能领域扔下数颗“重磅炸弹”。回顾DeepSeek这五天开源的内容,信息量很大,具体来看:

  周一,DeepSeek宣布开源FlashMLA。FlashMLA是DeepSeek用于Hopper GPU的高效MLA解码内核,并针对可变长度序列进行了优化,现已投入生产;

  周二,DeepSeek宣布开源DeepEP,即首个用于MoE模型训练和推理的开源EP通信库,提供高吞吐量和低延迟的all-to-all GPU内核;

  周三,DeepSeek宣布开源DeepGEMM。其同时支持密集布局和两种MoE布局,完全即时编译,可为V3/R1模型的训练和推理提供强大支持等;

  周四,DeepSeek宣布开源Optimized Parallelism Strategies。其主要针对大规模模型训练中的效率问题;

  周五,DeepSeek宣布开源Fire-Flyer文件系统(3FS),以及基于3FS的数据处理框架Smallpond。

  因此,有网友评论称:“《DeepSeek-V3/R1推理系统概览》技术文章是‘开源周彩蛋’,直接亮出了底牌!”

  至此,DeepSeek“开源周”的连载或许要告一段落了,但DeepSeek后续动作依然值得持续关注。

评分

1

查看全部评分

发表于 2025-3-2 11:47 来自手机 | 显示全部楼层
谢谢分享,学习了。
回复

使用道具 举报

 楼主| 发表于 2025-3-2 15:03 | 显示全部楼层
泉府上士 发表于 2025-3-2 11:47
谢谢分享,学习了。

谢谢关注。DeepSeek真是火,后续动作值得持续关注
回复

使用道具 举报

发表于 2025-3-3 15:35 | 显示全部楼层
谢谢分享,学习了
回复

使用道具 举报

发表于 2025-3-3 15:38 | 显示全部楼层
好好学习天天向上
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表