大模型之家2024年5月大模型热力榜:阿里、百度、智谱AI领衔降价狂潮,应用或成创企新方向 | 速途网
五月以来,国内人工智能领域正式迎来降价狂潮。字节跳动的豆包大模型和火山引擎的豆包Pro模型价格大幅下降,降幅达到惊人的99.3%;阿里云的通义千问大模型也进行了大幅度降价,降幅高达97%;智谱AI的GLM-3 Turbo模型调用价格从5元/百万Tokens降至1元/百万Tokens,降幅达到80%。此外,文心大模型两大主力产品也全面免费开放……
在2024年《5月大模型热力榜》中,大模型之家榜单共统计166家大模型及其所属企业,较上月新增15家。其中,百度文心一言再次占据热力榜第一名。央企大模型星辰AI首次上榜。
百川智能王小川表示:随着国内外大模型厂商纷纷降价,市场对于AI时代前景的乐观情绪愈发明显。他认为厂商们愿意以零价格进入市场,这不仅显示了厂商对AI能力的信心,更是对这个时代前景的无限憧憬。
5月11日,智谱AI宣布入门级大模型GLM-3-Turbo(上下文长度128k)的价格从0.005元/千tokens降低到0.001元/千tokens,降幅高达80%。
根据智谱 AI 大模型开放平台信息,GLM-3Turbo适用于对知识量、推理能力、创造力要求较高的场景,比如广告文案、小说写作、知识类写作、代码生成等,上下文长度128K,可满足企业和个人的入门级需求。
5月15日,字节跳动正式公布了其豆包大模型的定价信息。豆包通用模型的pro-32k版本,模型推理的输入成本仅为每千Tokens 0.0008元;而pro-128k版本,模型推理的输入成本则为每千Tokens 0.005元。
通过这一定价策略,用户只需支付1元,即可获得豆包主力模型的125万Tokens,这相当于200万个汉字的输入量。
5月21日上午,阿里云对外宣布通义千问系列中的GPT-4级别核心模型Qwen-Long,其API接口的输入费用从每千tokens 0.02元大幅下调至0.0005元,降价幅度达到了惊人的97%。
经过降价后,用户只需支付1元,就可以购买到200万tokens,此外,Qwen-Long模型还支持最高1000万tokens的长文本输入,这在同类产品中是非常罕见的。Qwen-Long模型的价格仅为GPT-4的1/400,创下了全球AI模型价格的新低。
5月21日,百度智能云宣布文心大模型的两款主力模型ENIRE Speed、ENIRE Lite全面免费。这两款大模型在3月发布,均支持8K和128k上下文长度。据了解,ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE Speed则是百度自研高性能大语言模型,适合作为基座模型进行精调,更好地处理特定场景问题,同时具备极佳的推理性能。
5月22日,百川智能发布最新一代基座大模型Baichuan 4,并同期推出首款AI助手“百小应”。值得一提的是,百川智能发布最新一代基座大模型Baichuan 4,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。
Baichuan 4相较Baichuan 3 在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%。同时,Baichuan 4还具备行业领先的多模态能力,在各大评测基准上表现优异,领先Gemini Pro、Claude3-sonnet等多模态模型。