拿推特数据训练AI 马斯克要起诉微软

砍柴网 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

拿推特数据训练AI 马斯克要起诉微软

马斯克要起诉微软

《AI哨所》北京时间4月20日消息，推特公司CEO埃隆·马斯克(Elon Musk)周三威胁要起诉微软公司，指控微软非法使用推特的数据来训练其人工智能(AI)模型。

就在马斯克发出这一威胁前，科技博客Mashable和其他媒体报道称，微软拒绝向推特的应用程序接口(API)付费，将把推特从其广告平台移除。微软的广告平台允许广告买家对其所有的社交媒体账号进行一站式管理。

这惹恼了马斯克。“他们非法使用推特数据进行训练，”马斯克发推文称，“诉讼时间(到了)。”马斯克在去年12月已表示，推特将“暂停”OpenAI对其数据库的访问。他还宣布计划在他的一家名为TruthGPT的公司中建立自己的大型语言模型。

拿推特数据训练AI 马斯克要起诉微软

马斯克称微软非法使用推特数据

不过，马斯克经常在推特上发布一些从未实现的计划，目前似乎还没有提起诉讼。微软、推特尚未置评。

马斯克的这一威胁再次表明，数据所有权正迅速成为生成式AI热潮中一个令人担忧的战场。大型科技公司正在努力开发像OpenAI的GPT这样的尖端AI模型，但是数据所有者正寻求阻止企业使用其数据或对其内容的使用收费。

凤凰网科技《AI哨所》了解到，微软开发了自己的所谓大型语言模型(LLM))，并出售OpenAI模型的使用权。微软去年以一笔结构不同寻常的交易向OpenAI 投资了100亿美元。马斯克曾是OpenAI联合创始人，在2018年离开了OpenAI董事会。他最近抱怨称，OpenAI已从非营利模式转变为一项受微软影响的高价值业务。

像GPT这样的大型语言模型需要大量训练数据，其中大部分是从Reddit、StackOverflow和推特等网站上抓取的。来自社交网络的训练数据很有价值，因为它捕捉到了非正式的、来回交流的对话。

但是，随着这些新的AI模型从研究实验室和大学进入企业界，数据的所有者开始提出要求。例如，社交新闻平台Reddit本周早些时候表示，它将向访问其编程界面的公司收费，该界面用于将Reddit用户之间的对话输入AI训练软件。环球音乐集团本周也表示，利用旗下艺人的音乐上训练AI，“既违反了我们的协议，也违反了版权法”。此前，一段声称使用AI模仿说唱歌手德雷克(Drake)的歌曲视频在网上疯传，环球音乐的声明是对于这个视频的回应。

与此同时，图片数据库Getty Images正在起诉Stable Diffusion，指控后者复制其内容来训练其AI图像生成器。凤凰网科技《AI哨所》对此将持续关注。

【来源：凤凰网科技】