李飞飞团队“50美元”复现DeepSeek R1,基座为阿里云Qwen模型
李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。s1模型的训练是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”建立在已具备强大能力的开源基础模型之上。(财联社)
往期推荐
- 谷歌:商用量子计算应用将在5年内到来2025-02-07
- OpenAI:免费开放ChatGPT搜索,无需注册2025-02-07
- 2024年我国规上电子信息制造业增加值同比增长11.8%2025-02-07