导读 内容总结近期,斯坦福大学和华盛顿大学的研究人员成功训练出了一款名为s1的AI推理模型,其训练成本不足50美元,性能却与OpenAI的o1模型相当
内容总结
近期,斯坦福大学和华盛顿大学的研究人员成功训练出了一款名为s1的AI推理模型,其训练成本不足50美元,性能却与OpenAI的o1模型相当。s1已在GitHub上公开,供其他研究者使用。研究团队采用蒸馏技术,利用谷歌的Gemini2.0模型进行微调,实现了高效的推理能力。这一成果引发了AI模型商品化的深思。此外,s1的训练使用了监督微调方法,比DeepSeek的大规模强化学习方法更便宜。
未来,Meta、谷歌和微软计划在AI基础设施上投资数千亿美元。尽管蒸馏技术能以较低成本再现AI模型,但并未显著提升新模型的表现。研究团队还计划进一步提升s1的推理性能。