Meta版ChatGPT遭开源代码泄漏,开发者称新 AI 大模型推理速度优于GPT|钛媒体焦点
Meta版ChatGPT遭开源代码泄漏,开发者称新 AI 大模型推理速度优于GPT|钛媒体焦点
林志佳
· 2023.03.06 15:59
LLaMA不会像ChatGPT一样形成消费级(C端)产品,而是更强调行业应用。
Meta版ChatGPT遭开源代码泄漏,开发者称新 AI 大模型推理速度优于GPT|钛媒体焦点
Meta公司参展2022年上海进博会(图片来源:钛媒体App编辑拍摄)
继微软、谷歌之后,脸书(Facebook)母公司Meta Platforms(Nasdaq:META)也加入了人工智能(AI)军备竞赛。
全力押注元宇宙的Meta公司于2月下旬发布了新的开源 AI 语言生成大模型(LLM),名为LLaMA(Large Language Model Meta AI),在帮助研究人员更好推进 AI 相关应用工作。
Meta宣称,尽管LLaMA参数规模仅为竞争对手ChatGPT的“十分之一”,但性能却优于OpenAI的GPT-3模型。目前Meta提供70亿、130亿、330亿和650亿四种参数规模的LLaMA模型。
3月5日,一位名为@Enryu 的开发者在Medium平台发文,比较了LLaMA和ChatGPT在多个开发挑战任务中的效果。结果显示,LLaMA训练过程算法大部分比ChatGPT训练更快、更便宜。他认为,与ChatGPT相比,LLaMA架构更小,但训练过程和单GPU(图形处理器)芯片推理速度更快,成本更低,而且该库还支持所有LLaMA模型架构,用户可对模型进行微调等。
与此同时,3月6日,国外匿名论坛4chan 泄露了 LLaMA 成品库,并且种子文件被合并到了Meta Research的 GitHub 上,同时一些项目维护者给予了批准,目前该项目在GitHub上已收获7000多个星。
Meta首席执行官马克·扎克伯格(Mark Zuckerberg)表示,LLaMA模型旨在帮助研究人员推进工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面有很大的前景。
这意味着,LLaMA不会像ChatGPT一样形成消费级(C端)产品,而是更强调行业应用。
据悉,大模型(LLM)又称为预训练模型、基础模型等,是“大算力+强算法”结合的产物,通过大规模无标注数据上进行训练,然后基于大模型进行应用开发与微调,就可以完成多个应用场景的任务。OpenAI推出的ChatGPT,是通过其AI大模型、1750亿参数GPT-3的基础上通过指令微调后得到的,即13亿参数的InstructGPT。基于深度学习框架Transformer以及GPT技术,ChatGPT不仅可以更好地答题、翻译、写文章,还带有一些数学计算的能力等。
因此,根据Meta的说法,训练LLaMA等较小的基础模型是理想的,用极低的计算能力和资源来测试、验证和探索新的用例,更好适应各种任务定制。比如谷歌推出的Bard,使用的是轻量级LaMDA模型,相比标准版本,轻量化版本模型所需要的运算能力较小,能面向更多使用者开放,使其参与体验。
Meta AI 团队隶属于前身Facebook人工智能研究中心 (FAIR),于2013年9月成立,旨在开发各种形式的人工智能,改进增强现实和 AI 技术。FAIR由纽约大学深度学习教授、图灵奖获得者杨立昆(Yann LeCun)领导,核心研究包括学习模型支持的记忆网络、自我监督学习和生成对抗网络、文本分类与翻译等方面。2017年,FAIR发布开源机器学习框架PyTorch,随后被用于多种深度学习技术,例如Tesla的自动驾驶技术等。2022年,该团队在两周内利用 AI 预测了6亿种潜在蛋白质形状。
Meta AI 在其研究论文中指出,在一些基准测试中,LLaMA 130亿参数规模的模型性能优于OpenAI推出的GPT-3,且能跑在单个GPU上;650亿参数的LLaMA模型能够和DeepMind 700亿参数的Chinchilla模型、谷歌5400亿参数的PaLM模型竞争。一旦经过更广泛的训练,LLaMA-13B 可能会成为希望在这些系统上运行测试的小型企业的福音,还可以在单个数据中心级 Nvidia Tesla V100 GPU 上运行。但是,它要让它脱离开发者独立工作,还有很长一段路要走。
与其他大型语言模型一样,LLaMA的工作原理是将一系列单词作为输入,并预测下一个单词以递归生成文本。不过有趣的是,LLaMA是继Glactica和Blender Bot 3之后,Meta发布的第三个大规模语言模型,前两个大模型在实际应用效果不尽如人意后立即被关闭。
Meta首席AI科学家杨立昆称,团队将致力于这种开源模型的研究,新模型会开源给整个 AI 研究社区使用,并授予大学、非政府组织和行业实验室访问权限。另外,Meta表示其还有更多研究需要做,以解决大型语言模型中的偏见、有害评论等风险。
实际上,这场 AI 军备竞赛仍在持续。
- 3月2日凌晨,OpenAI发布了Beta版本的ChatGPT API,并以收费形式提供给用户使用。据介绍,本次开放的API背后模型被命名为GPT-3.5 turbo,使用了与ChatGPT相同的模型。截至目前已经有五家公司宣布接入了ChatGPT API;
- OpenAI 投资人、重返世界首富的特斯拉CEO马斯克(Elon Musk)也开始表达对 AI 的兴趣。3月3日消息指,马斯克正在接洽研究人员,希望组建一个新的研究实验室,开发能够研发ChatGPT替代产品。
近期Meta披露的2022年第四季度财报显示,该公司已连续三个季度出现营收同比下滑,四季度营收312.54亿美元,同比下降4%。其中,广告为Meta的支柱业务,为第四季度的总营收贡献超97%,报告期内,尽管广告展现量增长了23%,但单位广告价格下滑了22%。
截至美东时间3月3日收盘,Meta股价涨6.14%,报收185.25美元/股。相比2022年股价大跌6成,今年初至今,Meta股价出现回调,大涨近49%。(本文首发钛媒体App,作者|林志佳)
487篇资讯
2.5万关注
林志佳
钛媒体作者。交流请加微信:1393525745;工作邮箱:zhijialin@tmtpost.com
最近资讯
- Meta版ChatGPT遭开源代码泄漏,开发者称新 AI 大模型推理速度优于GPT|钛媒体焦点
- 第四范式港股IPO申请失效,上周被美国列入“实体清单”|钛快讯
- 2023两会芯片、AI相关提议增多,科技互联网代表委员完成一次新旧更替
声明:文章内容仅供参考、交流、学习、不构成投资建议。
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里。
敬原创,有钛度,得赞赏
-
钛粉30456 赞赏了
不与雅迪、小牛抢饭吃,海归电动两轮车品牌「号外」卷...
2023-02-22 14:32 -
钛粉79015 赞赏了
IQAir Atem X空气净化器评测:旗舰级家用...
2023-02-17 17:42 -
钛粉41049 赞赏了
负债高企,深陷亏损泥潭,科陆电子叒要募资补流
2023-02-14 18:37 -
钛粉82099 赞赏了
从卖火柴的小男孩到“宜家掌舵者”,商业天才的经营哲...
2023-02-11 18:47 -
正见Tru... 赞赏了
SaaS十词,“点火”2023
2023-02-03 17:40 -
小团子97... 赞赏了
一文速览【2022 中国经济年报】:人口首现历史性...
2023-01-18 02:02 -
钛好257... 赞赏了
国产电动车的沸腾2023:走向更残酷的牌桌
2023-01-16 07:45 -
钛粉61583 赞赏了
华宝新能:坚守长期主义,缔造商业之上的价值
2022-12-31 00:06 -
钛a66t... 赞赏了
跨界咖啡,是个好副业吗?
2022-12-30 17:11 -
赚赚 赞赏了
小红书给流量“削藩”
2022-12-30 00:36 -
钛粉81950 赞赏了
东北下岗往事轮回,一个家庭时隔20年的两次失业创伤
2022-12-20 10:24 -
钛富279... 赞赏了
蜜雪冰城「向下」的烦恼
2022-12-09 08:48 -
钛粉41450 赞赏了
遭阿里减持8000万股的商汤科技,何时盈利?
2022-11-24 22:45 -
钛粉81947 赞赏了
历史进程中的茅台与6次暴跌
2022-10-28 12:23 -
钛粉48375 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 19:53 -
想暴富25... 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 17:18 -
钛粉61006 赞赏了
7种傲慢与偏见,导致互联网人改造传统行业失败
2022-10-20 16:41 -
AIBEN 赞赏了
月费不到100块、1分钟出图,AI作画要打翻多少设...
2022-10-17 15:10 -
钛粉36011 赞赏了
身处风口却“一桩难求”,一文看懂充电桩产业全景|钛...
2022-10-14 14:27 -
钛粉36716 赞赏了
身处风口却“一桩难求”,一文看懂充电桩产业全景|钛...
2022-10-14 14:24 -
钛精378... 赞赏了
那些"上不了席面”的私房美味
2022-10-10 13:04 -
钛粉18902 赞赏了
中集李凌寒:数字化供应链的动因、要素及实践|202...
2022-10-01 11:40 -
有颜有钱5... 赞赏了
中集李凌寒:数字化供应链的动因、要素及实践|202...
2022-09-30 19:02 -
钛粉29232 赞赏了
割韭菜、白嫖、疯狂AMA……在30多个元宇宙Web...
2022-09-15 15:45 -
钛小773... 赞赏了
沈抖发布百度智能云新战略,回答了“木星”与“蜻蜓”...
2022-09-10 09:33 -
钛粉07914 赞赏了
钛媒体Pro创投日报:9月2日收录投融资项目25起
2022-09-03 03:20 -
钛粉65687 赞赏了
银泰百货“破产第一案”背后:苦涩退场,西安城改的挽...
2022-08-19 17:41 -
钛粉61539 赞赏了
对话蚂蚁集团副总裁何勇明:“支付宝不对标抖音”
2022-08-06 13:53 -
钛粉60785 赞赏了
近10亿募资闲置理财如今又推14亿定增,泽璟制药持...
2022-07-27 14:44 -
在天空中自... 赞赏了
钛媒体Pro创投日报:7月21日收录投融资项目32...
2022-07-22 16:40 -
钛粉14772 赞赏了
寻找下一个“玻色因”,国货抗衰盯上了蓝铜胜肽
2022-07-22 10:47 -
单晶冰糖啦... 赞赏了
宁德时代依靠钠电池可以维持万亿市值吗?
2022-07-22 10:37 -
钛友趣64... 赞赏了
女性专属时尚座驾,欧拉芭蕾猫上市19.3万元起售
2022-07-12 23:58 -
钛粉93105 赞赏了
TapTap塌房,“中国Steam”的故事结束了
2022-07-12 14:02 -
已注销用户 赞赏了
【医疗健康周报】第26周:“康诺亚生物”获得1.9...
2022-07-07 15:05 -
钛粉97884 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 22:21 -
钛粉97003 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 21:58 -
钛粉97388 赞赏了
零和游戏与非零和玩家:InterSystems的数...
2022-06-29 21:50 -
钛粉11323 赞赏了
丰谷酒业换帅!李寒松出任党委书记、董事长
2022-06-28 17:09 -
钛粉97508 赞赏了
海外港口货物积压,商家提前备货,今年外贸旺季来得有...
2022-06-24 18:44 -
钛粉36186 赞赏了
习酒划转茅台集团财务公司5%股权,上市仍在“激烈博...
2022-06-21 15:25 -
钛粉66633 赞赏了
重新定义“一体化”?HR SaaS产品PaaS化之...
2022-06-16 08:51 -
碧天黄地 赞赏了
未来汽车如何实现创新与融合?几位大佬有话说
2022-05-30 21:37 -
钛友趣76... 赞赏了
批量招聘难题何解?他们发现了HRSaaS的新机会 ...
2022-05-26 23:38 -
单晶冰糖啦... 赞赏了
钛媒体华南中心成立 全财经战略布局再进一步
2022-05-25 11:30 -
钛粉89798 赞赏了
郑大一附院,一家“超级医院”的双面特写
2022-05-21 06:19 -
钛粉00698 赞赏了
大厂深蹲,时代向前
2022-05-19 10:27 -
刘成军 赞赏了
中国信通院院长余晓晖:加快构建我国特色的工业互联网...
2022-05-18 14:09 -
已注销用户 赞赏了
Netflix真的会为「卖广告」掏出真心吗
2022-05-17 10:19 -
钛田097... 赞赏了
黑海粮仓“起火” ,全球粮食失衡
2022-05-09 19:50 - 查看精彩文章,打开钛媒体客户端
挺钛度,加点码!
- ¥ 5
- ¥ 10
- ¥ 20
- ¥ 50
- ¥ 100
支付方式
支付
支付金额:¥6
赞赏金额:¥ 6
赞赏时间:2020.02.11 17:32
账户【未登录】提示!
个人中心将无法记录并同步您的赞赏记录,
是否进行登录
分享文章
Oh! no
您是否确认要删除该条评论吗?
猜你感兴趣
分享文章