OpenAI称DeepSeek和Kimi发现o1的秘密，Kimi研究员解密破解过程

i黑马 • 5天前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

据月之暗面消息，近日，OpenAI发布研究报告称，DeepSeek和Kimi通过独立研究，利用思维链学习方法显著提升模型在数学解题与编程挑战中的综合表现。Kimi研究员Flood Sung发文表示，长思维链的有效性曾在内部得到验证，在实际训练中发现模型会随着训练提升表现并不断增加 token数，证明强化训练过程中模型可以自己涌现。1月20日,DeepSeek、Kimi同天发布推理模型R1和k1.5。