李飞飞团队“50美元”复现DeepSeekR1，基座为阿里云Qwen模型-

您现在的位置：首页 > 动态资讯 > 行业观察

李飞飞团队“50美元”复现DeepSeek R1，基座为阿里云Qwen模型

发布时间：2025-02-07 信息来源：财联社字体：【大中小】

李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用，成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现，据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。s1模型的训练是基于阿里云通义千问（Qwen）模型进行监督微调。这意味着，s1模型的神奇“低成本”建立在已具备强大能力的开源基础模型之上。（财联社）

往期推荐

友情链接

国新咨询有限责任公司版权所有京ICP备2022033196号-1
联系我们| 法律声明

国新咨询有限责任公司版权所有
京ICP备2022033196号-1
联系我们| 法律声明

微信

小程序