李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型

i黑马  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

近日,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提炼出来的,使用16个英伟达H100 GPU进行了26分钟的训练。

文章评价
李飞飞团队用不到50美元训练出媲美DeepSeek R1的AI推理模型 匿名用户
发布
发布

    随意打赏

    提交建议
    微信扫一扫,分享给好友吧。