谷歌让验证码更简单
许多互联网公司使用验证码技术(全自动区分计算机和人类的图灵测试)判断用户是人类还是机器。验证码技术包括将图片中的字母和数字输入文本框。验证码通常在用户在博客上发表评论,创建服务账户,买票或者填写「忘记密码」表单的时候出现。
2009 年谷歌为了创建旧报纸和书籍可检索存档,收购了一个叫做 reCAPTCHA 的公司。reCAPTCHA 公司由卡耐基梅隆大学的几个计算机科学家成立,它要求用户输入从旧报纸和书籍中照的扭曲的两个单词。一个单词系统已经知道,但是另一个单词则由于时间的推移,报纸和书籍的油墨和纸张变得模糊不清,无法通过光学字符识别(OCR)识别。
人类已经通过识别扭曲的文字帮助 reCAPTCHA 公司数字化了数百万的报纸文章和书籍。纽约时报得以在 reCAPTCHA 的帮助下将其 1200 万的文章数字化。谷歌则通过创建验证码确定街景和地图影像中的可见文字,使用 reCAPTCHA 提高他们现实世界的数据,增加街景和地图服务的准确性。
尽管验证码在阻止垃圾邮件发送者和数字化传统文本方面非常有效,但是也有局限性。验证码没有音频选项,无法让视障人群进入被保护网站。没有视力问题的用户也抱怨,因为有些文字太难认。四年前,斯坦福大学的一群研究者收集了 30 多万个谷歌、雅虎和微软使用过的验证码,进行了一项研究。研究者在 caption-bypass.com 和亚马逊土耳其机器人系统让用户辨别验证码。研究人员向三个不同的人展示验证码,但是他们都同意正确答案的几率只有 71%。
另一个问题是利用多种多样的算法验证码也能遭到破解。今年早些时候,谷歌街景和 reCAPTCHA 团队的成员发表了一篇论文,论文内容是他们用于破解自家的验证码的一种算法。谷歌在一篇博文中表示:「我们最近的研究说明,现在的人工智能技术能以 99.8% 的正确率识别最扭曲最有难度的验证码文字。因此扭曲文字不再是一种可靠的测试方法了。」验证码还有很大的改进空间。因此诞生了 No CAPTCHA reCAPTCHA。
No CAPTCHA reCAPTCHA
谷歌最近发布了一种新的应用程序界面(API),叫做 No CAPTCHA reCAPTCHA,它大大简化了判断用户是人类与否的步骤。通过 No CAPTCHA reCAPTCHA,用户只需要简单的点击「我不是机器人」这句话边上的复选框就可以确定他们是人类了。No CAPTCHA reCAPTCHA 已经整合到了 WordPress,Snapchat 和 Humble Bundle 等服务中了。No CAPTCHA ReCAPTCHA 可能看起来更容易被垃圾邮件发送者破解,但是谷歌开发了一套复杂的高级风险分析后端在决定用户是人类的过程中分析用户参与识别的情况。
大多数用户可能很容易就点击复选框然后继续了,但是可疑的人类或者机器人可能会强制回答电脑屏幕上的验证码或者移动设备上的动物配对测试:
谷歌表示 No CAPTCHA 早期的采用情况很棒。比如,WordPress 上超过 60% 的流量以及 Humble Bundle 超过 80% 的流量都从 reCAPTCHA 转到了 No CAPTCHA。reCAPTCHA 作为一项免费的服务提供给网站,用于防止垃圾邮件,点击 https://www.google.com/recaptcha/intro/index.html 上的「获得 reCAPTCHA」按钮就可使用。
来源: Forbes
标签: 谷歌 验证码 破解 改进