谷歌为何不再提供网页快照?
据媒体报道,谷歌2023年底开始不再在搜索结果页面提供网页快照 (亦称“缓存链接”) 功能,一名谷歌员工也在社交媒体上证实了此事,称该功能“旨在帮助人们访问页面,因为以前网站页面经常无法加载出来。如今情况已经有了很大改善,因此 (谷歌) 决定将该功能退役。实际上百度早在2022年就不再提供这个功能了,但百度不提供的原因可能也和国内对互联网平台从严监管有关,今天就和大家聊聊相关的法律规定。
一、网页快照的功能
作为搜索引擎最古老的功能之一,网页快照在互联网发展中功不可没,笔者让人工智能模型Claude总结了其功能,然后做了一些修正:
1. 缓存网页副本。 快照允许搜索引擎存储网页的缓存副本,即使原始网站不可用,也可以显示结果。这提供了更高的可靠性。
2. 显示直观预览。 快照为用户提供页面的直观预览,以帮助他们在点击结果之前判断其是否相关。这改善了用户体验。快照还可以显示常规搜索列表中看不到的网站结构和组织的部分内容。
3. 查看存档/旧内容。 快照可以作为旧网页内容的存档,这些内容后来可能已更改或删除。它允许访问历史页面。这有助于事实检查和研究,记者和研究人员可以使用快照根据网站过去发布的内容核实声明。因为搜索引擎的独立性,网页快照在诉讼中也可以作为证明事实的证据使用。
4. 快速访问网页和移动端优化。 加载快照的速度可以比加载完整的实时网站要快,特别是在连接速度较慢的情况下。快照允许针对较小屏幕进行优化,而不是缩小整个网站。
5. 网站归属信息。 快照包含出版者信息、时间戳和其他元数据,这有助于归属内容。
二、网页快照的法律风险
搜索引擎快照是一个互联网发展较早期出现的产品,但互联网的发展早已过了田园时代,能存活至今的主流搜索引擎无一不是互联网巨擘,所以他们的身份也从早期的万众期待能改变世界的初创公司,变成了今天世界各国都高度警惕的利维坦。而 搜索引擎快照虽然能有助于公众行使知情权,但其留存的部分被删除的信息也会成为很多利益和秩序的破坏者,所以存在多重法律风险。
1. 版权侵权风险
网页快照这个产品很特殊, 其把原网页的信息复制后保存在搜索引擎的服务器上,天然就有“未经许可复制他人作品”的版权风险, 所以法律上对其限制不小。最高院信息网络传播权司法解释规定对快照功能侵权认定的逻辑是:默认提供网页快照构成侵权,但搜索引擎可以证明快照不影响作品正常使用,未不合理损害权利人合法权益的,可以认定不侵权。
北京高院网络知识产权案审理指南对如何判断网页“快照”提供行为是否属于不影响相关作品的正常使用,且未不合理损害权利人对该作品合法权益做了规定:搜索引擎提供快照要有明确用途,权利人认为快照侵权的,需要向搜索引擎发投诉通知,搜索引擎在收到通知,未采取措施的,构成侵权。如果搜索引擎及时删除快照的,可以豁免侵权责任,但从侵权快照中直接获利的,则不能豁免。
2. 个人信息和隐私风险
根据《网络安全法》《个人信息保护法》, 未经个人信息主体单独同意,搜索引擎技术提供方抓取个人信息的行为构成违法使用个人信息。 而搜索引擎技术提供方通过搜索功能抓取第三方公开网页上含个人信息的内容并形成网页快照,呈现在搜索结果页面有很大的可能违法,但有时也可以进避风港。该抓取行为是否合法,关键在两方面:
“知情同意”规则的适用。 如果网站拒绝搜索引擎抓取,且在网站robots协议中排斥搜索引擎的,如果搜索引擎抓取到了网站内的个人信息或隐私信息并放在快照中的,则有很大的可能被法院认定为侵犯了个人信息或隐私,因为网页上的个人信息属于个人权利,未经许可抓取违反了“知情同意”规则,所以其行为同时涉嫌侵权个人信息。
“通知删除”规则的适用。 如果网站同意搜索引擎抓取内容,但网站内存在侵犯个人信息内容的,此时,搜索引擎通常被认定为中立的技术服务提供者,对快照内容仅承担间接侵权责任。也就是说,如果搜索引擎遵循“通知删除”规则,在收到个人信息主体的侵权通知后,及时删除了快照内相关信息的,可以免责,反之则可能要和被抓取的网站共同承担部分连带侵权责任。
以上规则并不仅仅是我国的规定,而是目前主流国家的通行规则。此外, 欧盟还有个特殊的“被遗忘权” (right to be forgotten) 规定,是指信息主体对已经被发布在网络上有关自身不恰当的、过时的、继续保留会导致其社会评价降低的信息,要求信息控制者予以删除的权利。 简单来讲,如果一个人想被世界遗忘,相关主体应该删除有关此人在网上的个人信息。
“被遗忘权”已经被欧盟写进了《通用数据保护规则》 (GDPR) ,成为了欧盟的法律规定,所以也是搜索引擎在欧盟运营不得不遵从的规则。这个在搜索引擎快照的对立面的权利,可能也是谷歌下架快照服务的原因之一。
3. 违法内容风险
在要求互联网平台压实主体责任的我国,快照这种可以让用户访问被删除内容的产品,其中的违法和不良信息肯定不会少,所以给平台带来的麻烦可想而知,这可能也是百度会先于谷歌取消网页快照的重要原因。相关的法规非常多,下面摘录两部法规:
《全国人大常务委员会关于维护互联网安全的决定》列举了十多项可能构成犯罪的违法行为,包括利用互联网造谣、煽动颠覆国家等构成犯罪,利用互联网销售伪劣产品、侵犯知识产权构成犯罪,利用互联网侮辱、盗窃等行为等,搜索引擎如果不及时删除快照,都可能会涉及犯罪。
《关于进一步压实网站平台信息内容管理主体责任的意见》则要求互联网平台加强信息内容管理,完善审核机制,以依法合规经营推动互联网行业健康发展,其中和快照监管相关的内容包括:
网站需要明确规范、健全制度、完善规则,压实网站信息管理责任,防范风险隐患。 需加强信息审核机制,建立样本库、完善审核流程、加强重点信息审核,确保信息安全。坚持依法合规经营,履行许可手续、安全评估、诚信运营,推动互联网行业健康发展。
最后, 快照功能给用户提供了多方面的帮助,但搜索引擎自己也要背负很大的责任和风险, 而在这样一个敏感的时代,这种责任可能会成为他们不可承受之重,所以这个功能才会在今天消亡。
参考文献:
[1] https://arstechnica.com/gadgets/2024/02/google-search-kills-off-cached-webpages/
[2] https://baike.baidu.com/item/%E8%A2%AB%E9%81%97%E5%BF%98%E6%9D%83/2482166?fr=ge_ala
本文作者:游云庭(上海大邦律师事务所高级合伙人,知识产权律师),电话:8621-52134900,Email: yytbest@gmail.com,本文仅代表作者观点。