社交媒体收紧隐私策略依然无法阻止第三方公司收集用户数据
Instagram联合创始人凯文·斯特罗姆
腾讯科技讯 4月29日据国外媒体报道,虽然Facebook旗下的图片社交平台Instagram开始限制开发者向用户提供的数据量,但依然还有一些第三方公司找到了别的解决办法:让大量的机器人“读取”公开的社交媒体账户,就像任何一个普通人能做的事情一样。
Facebook和其它社交媒体平台正在严厉打击非法数据使用和分享问题。此前,数据分析公司Cambridge Analytica使用了不恰当的方式获取了Facebook用户的信息,用来具有针对性的投放政治广告,而这些都在欧洲出台《一般数据保护条例》这项新法律之前。
因此,一些营销和媒体公司开始越来越依赖自动程序,即所谓的机器人,在没有明确许可的情况下,获取想要的用户信息。他们不需要征询用户的意见,只要是公开发布的信息或者来自于信息平台的内容,都可以大批量获取。
实现这样的操作难度变大,而且完全合法,即使社交媒体平台会通过技术手段阻止这样的事情,但效果并不好。
这些机器人收集的信息,通常不会像直接从平台内部获取的数据那样详细或有用,但第三方公司会将其用于特定但非常有限的目的,比如寻找新的目标来跟踪广告活动的有效性。一旦有了正确的数据,就可以用来投放广告。
绕过Instagram的“围追堵截”
Instagram最近取消了平台API的费率限制,这就意味着开发者不能再用以前的速度获取大量用户的信息。
原本这些公司通过API来从用户Instagram上的个人资料中获取基本数据,比如评论、点赞、关注者以及照片上的标签,而且收集这些数据的速度很快。他们还可以获得照片的拍摄时间和地点。同时该API还允许账户与第三方服务连接,而第三方服务可以让企业做很多事情,包括在活动中发布Instagram帖子,或者在产品上打印出Instagram的照片。
而这一切都在4月初发生了改变。根据Recode的说法,开发者之前可以每小时拨打5000次电话,而从4月2日开始下降到200次。还有一些开发者表示根本无法访问这些数据。一位广告业的高管在接受CNBC采访时表示发现了这些变化,Instagram也向CNBC证实,该公司已经对原本比较老旧的API平台进行了调整,作为转向新API平台计划的一部分。
作为回应,几家公司都表示,目前已经增加了机器人的使用力度,用来追踪品牌内容活动的有效性,寻找其它商业机会。
已经有一家媒体公司为员工的电脑浏览器上安装了扩展,用来识别新的社交媒体明星用户,并且希望与其合作追踪数据。这个应用程序通过社交媒体资料作为驱动力,由机器人主导搜索过程,然后在内部数据库中记录喜欢、评论、关注或其它公开的可用信息。这家公司在Instagram和YouTube上都使用了这一策略。
还有一家营销公司表示,使用机器人来浏览社交媒体平台,获取公共信息,识别新的趋势和有影响力的用户,并且与第三方公司使用相同的策略。它将这些信息与用户的数据放到一起使用,用户可以直接获得他们的数据。
另外还有公司表示,新的API只允许从Instagram官方的业务中分享数据,目前所使用的账户中有35%还没有开放权限。在获得最有效方法之前,已经开始使用机器人获得的公开数据。
难度和法律问题
广告技术公司SteelHouse首席执行官马克-道格拉斯(Mark Douglas)说:“这并不是说我们可以继续在网站上抓取秘密信息。开发这样的工具代码其实很简单,普通的大学生都可以做到这一点。”同时他强调自己的公司并未参与数据收集。
这种行为也完全合法。去年8月,旧金山联邦法官裁定,hiQ Labs从领英的个人资料页面收集数据,帮助企业发现“技能缺口和人员流动的风险”,这种行为是公司的权利。
在线营销和广告欺诈监测公司eZanga首席执行官瑞奇-卡恩(Rich Kahn)认为,使用机器人来收集大量信息的做法其实很常见。
卡恩说,旅行网站会在廉价航空公司的网站上使用机器人来扫描网上公布的廉价机票信息,然后通过一种更直观、更容易使用的方式呈现出来。
道格拉斯也指出,就连谷歌这样的科技巨头也使用了类似的方法来抓取网上的内容,帮助其完善搜索引擎技术。如果机器人被禁,那么谷歌就无法提供像今天这样快速又准确的搜索服务。
同时他还强调,社交平台可以非常容易的检测到大量的机器人流量。如果这些公司愿意的话,可以阻止某家公司使用机器人在网站中获取信息,并且以违反使用条款为理由。
Instagram对CNBC表示,将会对其平台上的机器人抓取行为采取行动。
“我们不允许在平台上使用机器人,Instagram承诺在平台上保持有效的活跃度,我们致力于检测和清除垃圾邮件,并且识别关闭虚假账户。除了技术措施之外,我们还会对违反我们使用条款的手段进行法律强制执行。”Instagram发言人表示。
YouTube也表示会禁止这种行为。
YouTube一位发言人也表示:“YouTube的服务条款和开发者政策都禁止机器人对网页信息的抓取。一旦发现使用侵权工具或服务,我们将采取适当的行动。”
但对于专业营销人员来说,由于需要大量的维护手段来应对不断变化的策略,因此就算禁止使用机器人,也有办法应对新的措施。
例如,通过使用浏览器扩展可以变换公司的IP地址,作为识别计算机的唯一地址代码,这会让社交平台监测虚假流量变得更困难。
道格拉斯还认为,社交平台在打击这一手段时并不严格,因为自己的内容从某种程度上来说被更广泛的搜索对自己也有好处,包括让自己的内容更容易被第三方网站展示,可以帮助其提高浏览量。甚至还可以为平台的用户创造创造更多的商业机会,从而提高用户的忠诚度。
而需要被保护的个人信息则无法被这种手段获取,因此没有机器人可以收集这些信息。
卡恩说:“有些人不希望在任何一个网络上曝光任何信息,他们有权利这么做。但绝大部分普通用户都愿意公开展示一些基本的资料和信息,这就给机器人提供了获取信息的基本内容。”(编译/音希)