拿推特数据训练AI 马斯克要起诉微软
《AI哨所》北京时间4月20日消息,推特公司CEO埃隆·马斯克(Elon Musk)周三威胁要起诉微软公司,指控微软非法使用推特的数据来训练其人工智能(AI)模型。
就在马斯克发出这一威胁前, 科技 博客Mashable和其他 媒体 报道称,微软拒绝向推特的应用程序接口(API)付费,将把推特从其广告平台移除。微软的广告平台允许广告买家对其所有的 社交 媒体账号进行一站式管理。
这惹恼了马斯克。“他们非法使用推特数据进行训练,”马斯克发推文称,“诉讼时间(到了)。”马斯克在去年12月已表示,推特将“暂停”OpenAI对其数据库的访问。他还宣布计划在他的一家名为TruthGPT的公司中建立自己的大型语言模型。
马斯克称微软非法使用推特数据
不过,马斯克经常在推特上发布一些从未实现的计划,目前似乎还没有提起诉讼。微软、推特尚未置评。
马斯克的这一威胁再次表明,数据所有权正迅速成为生成式AI热潮中一个令人担忧的战场。大型科技公司正在努力开发像OpenAI的GPT这样的尖端AI模型,但是数据所有者正寻求阻止企业使用其数据或对其内容的使用收费。
凤凰网科技《AI哨所》了解到,微软开发了自己的所谓大型语言模型(LLM)),并出售OpenAI模型的使用权。微软去年以一笔结构不同寻常的交易向OpenAI 投资 了100亿美元。马斯克曾是OpenAI联合创始人,在2018年离开了OpenAI董事会。他最近抱怨称,OpenAI已从非营利模式转变为一项受微软影响的高价值业务。
像GPT这样的大型语言模型需要大量训练数据,其中大部分是从Reddit、StackOverflow和推特等网站上抓取的。来自社交网络的训练数据很有价值,因为它捕捉到了非正式的、来回交流的对话。
但是,随着这些新的AI模型从研究实验室和大学进入企业界,数据的所有者开始提出要求。例如,社交新闻平台Reddit本周早些时候表示,它将向访问其编程界面的公司收费,该界面用于将Reddit用户之间的对话输入AI训练软件。环球音乐集团本周也表示,利用旗下艺人的音乐上训练AI,“既违反了我们的协议,也违反了版权法”。此前,一段声称使用AI模仿说唱歌手德雷克(Drake)的歌曲视频在网上疯传,环球音乐的声明是对于这个视频的回应。
与此同时,图片数据库Getty Images正在起诉Stable Diffusion,指控后者复制其内容来训练其AI图像生成器。凤凰网科技《AI哨所》对此将持续关注。
【来源: 凤凰网科技 】