李飞飞团队训练出媲美DeepSeek R1的推理模型云计算费用不到50美元,股海明灯，量学官网，量学知识股票论坛。

众衫小 发表于 2025-2-6 18:14

李飞飞团队训练出媲美DeepSeek R1的推理模型云计算费用不到50美元

《科创板日报》6日讯，李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。
研究人员表示，s1对Qwen2.5-32B-Instruct模型，使用通过蒸馏法由Gemini Thinking Experimental模型提炼出来的1000个样本小型数据集，进行了监督微调。使用16个英伟达H100 GPU进行了26分钟的训练。
小K注：“不到50美元”仅为云计算服务费用，不包括服务器、显卡等硬件投入费用，因这部分已经由云厂商承担。

大老郭 发表于 2025-2-6 21:06

好好学习天天向上

王运成 发表于 2025-2-7 08:10

感谢提供信息分享。

md_0014 发表于 2025-2-7 16:47

假的不能再假了

页: [1]

股海明灯官网's Archiver

李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元

李飞飞团队训练出媲美DeepSeek R1的推理模型云计算费用不到50美元