OpenAI称DeepSeek和Kimi发现o1的秘密,Kimi研究员解密破解过程
据月之暗面消息,近日,OpenAI发布研究报告称,DeepSeek和Kimi通过独立研究,利用思维链学习方法显著提升模型在数学解题与编程挑战中的综合表现。Kimi研究员Flood Sung发文表示,长思维链的有效性曾在内部得到验证,在实际训练中发现模型会随着训练提升表现并不断增加 token数,证明强化训练过程中模型可以自己涌现。1月20日,DeepSeek、Kimi同天发布推理模型R1和k1.5。
据月之暗面消息,近日,OpenAI发布研究报告称,DeepSeek和Kimi通过独立研究,利用思维链学习方法显著提升模型在数学解题与编程挑战中的综合表现。Kimi研究员Flood Sung发文表示,长思维链的有效性曾在内部得到验证,在实际训练中发现模型会随着训练提升表现并不断增加 token数,证明强化训练过程中模型可以自己涌现。1月20日,DeepSeek、Kimi同天发布推理模型R1和k1.5。