DeepSeek发布开源第一弹！让大模型在GPU上跑得更快

i黑马 • 4小时前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

2月24日，DeepSeek启动“开源周”，开源了首个代码库FlashMLA。简单来说，FlashMLA 是一个能让大语言模型在 H800这样的GPU上跑得更快、更高效的优化方案，尤其适用于高性能AI任务。这一代码能够加速大语言模型的解码过程，从而提高模型的响应速度和吞吐量，这对于实时生成任务（如聊天机器人、文本生成等）尤为重要。

文章评价

匿名用户

发布

随意打赏

金山云完成阶跃星辰最新两款开源多模态大模型适配

砍柴网 • 2小时前

金山云已完成对阶跃星辰最新开源的两款多模态大模型的适配，包括全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。目前，用户可登陆金山云官方网站进行体验。*登陆金山云账号控制台选择裸金属服务器-新建实例Step-Video-T2V模型金山云针对Step-V
DeepSeek开源周第二日：开源DeepEP通信库

砍柴网 • 5小时前

2月25日，DeepSeek官宣，今日开源DeepEP，第一个用于MoE模型训练和推理的开源EP通信库。特点有：高效、优化的全员沟通；节点内和节点间均支持NVLink和RDMA；用于训练和推理预填充的高吞吐量内核；用于推理解码的低延迟内核；原生FP8调度支持；灵活的GPU资源控制，实现计算-通信重叠。【来源：
苹果加快引爆技术竞赛新格局，百度/微美全息DeepSeek开源生态重构商业版图

砍柴网 • 1天前

据彭博社援引知情人士消息报道，苹果正积极筹备，计划于今年年中面向中国市场iPhone推出其人工智能功能——Apple Intelligence，全力推进人工智能功能在中国市场的落地。据悉，苹果将运用自身AI模型，并计划与这两家公司携手，共同推动AI在中国的落地。苹果的目标是最早在2
DeepSeek启动开源周 FlashMLA代码库发布

砍柴网 • 1天前

2月24日，DeepSeek宣布启动“开源周”，首个开源的代码库为Flash MLA，这是针对Hopper GPU优化的高效MLA解码内核，针对可变长度序列作了优化，目前已投入生产。【来源：凤凰网科技】
DeepSeek超越150万模型：成全球最受欢迎开源大模型

砍柴网 • 1天前

2月24日消息，今天凌晨3点，全球最大开源平台之一huggingface联合创始人兼首席执行官Clement Delangue发布了最新数据：中国开源大模型DeepSeek-R1在150万模型中，成为该平台最受欢迎的开源大模型，点赞超过1万。前不久，Clement还特意发文恭喜DeepSeek-R1的下载量超过1000
DeepSeek将于下周开源5个代码库每日解锁新内容

砍柴网 • 4天前

2月21日，DeepSeek宣布，接下来一周，将开源5个代码库，每日解锁新内容，进一步分享新的进展。DeepSeek介绍，当前在线服务的模块已经在生产中记录、部署和实战测试。 DeepSeek公司将自己定义为小公司，并表示，每一次分享都会成为加速旅程的集体动力，DeepSeek还表示，这个领域没有高高在上的象牙
李彦宏回应文心大模型4.5开源：DeepSeek让我们明白要将最优秀模型开源

砍柴网 • 6天前

2月19日消息，日前，百度创始人李彦宏在百度2024年四季度及全年财报电话会上回应为何将开源文心大模型4.5系列。李彦宏表示，从DeepSeek身上，我们学到了一件事，那就是开源最佳模型能大大促进人们使用或采纳这个模型。当一个模型开源时，人们自然会出于好奇想尝试，这有助于更广泛的采用。李彦宏称，文心大模型4.5将是百度
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels

砍柴网 • 7天前

2月18日，昆仑万维开源中国首个面向AI短剧创作的视频生成模型 SkyReels-V1、中国首个SOTA级别基于视频基座模型的表情动作可控算法 SkyReels-A1。 1. SkyReels-V1：Human-Centric Video Foundation Model，中国
吉利汽车、阶跃星辰开源两款大模型：一个参数最大、一个最懂中国话！

砍柴网 • 7天前

2月18日消息，阶跃星辰、吉利汽车集团联合宣布，双方合作的阶跃两款Step系列多模态大模型，正式向全球开发者开源，即日起可在跃问APP内体验。其中，阶跃Step-Video-T2V是目前全球范围内参数量最大、性能最好的开源视频生成模型，阶跃Step-Audio则是行业内首款产品级的

提交建议