DeepSeek 或提前发布 R2 模型
2月26日消息,今日有媒体报道称,DeepSeek 计划加速推进 R2 模型,这款模型原计划在 5 月初发布,现在有可能会提前,DeepSeek 此前曾表示,希望新模型有更强的编码能力,并且能支持英语以外语言的深度推理。
对此,幻方、DeepSeek 相关人士表示,以官方消息为准。目前,DeepSeek 还在进行持续一周的开源活动,今日他们分享了 FP8 通用矩阵乘法 (GEMM) 加速库。DeepSeek 也在今日下调了夜间(00:30 至 08:30) API 价格,R1 降幅达 75%。
文章评价

发布
发布