量线擒龙 发表于 2026-4-26 10:26

云天励飞 GPNPU 架构与 IFWA 智能融合软件栈完成

4月24日,DeepSeek-V4 系列模型发布。围绕该模型 CSA/HCA 混合注意力机制带来的新型计算需求,云天励飞依托自研 GPNPU 架构及 IFWA 智能融合软件栈,通过 PyTorch 插件 torch_ifwa,完成了面向 GPNPU 平台的关键机制适配验证。此次适配验证主要面向 DeepSeek-V4 中 CSA/HCA 混合注意力机制的计算特征,验证了 IFWA 软件栈对新型注意力结构的快速响应能力,以及 GPNPU 架构面向前沿大模型演进的适配潜力。该进展为后续 DeepSeek-V4 系列模型在 GPNPU 平台上的工程化部署、算子优化和性能验证奠定了基础。CSA/HCA 混合注意力机制:DeepSeek-V4长上下文效率优化的重要创新

阳光柠檬 发表于 2026-4-26 13:12

好好学习天天向上
页: [1]
查看完整版本: 云天励飞 GPNPU 架构与 IFWA 智能融合软件栈完成