科普:验证码到底有什么用

2016-01-10 19:13 来源:新华网

在春运的网络购票高峰中,中国铁路客户服务中心的12306图形验证码系统让很多购票者“吐槽”。人们不禁要问,那么复杂的验证码系统,到底有什么用?

其实,验证码存在的最大意义,就是区分在页面上进行输入操作的是人还是自动化的软件。就拿12306验证码来说,它的“进化史”就是一部不断与黄牛和抢票软件“斗智斗勇”的历史,从一开始的简单数字、字母、加减法,再到闪烁变形字母、干扰线变形字母……由于数字和字母组合可被抢票软件自动分析识别,自今年3月16日起,12306又启用了图形验证码。

验证码有一个充满科学气息的名字——“全自动区分电脑和人类的图灵测试”(简称CAPTCHA)。众所周知,图灵测试是通过计算机回答人类提出的一系列问题来鉴别对方是人还是机器,而验证码则是一场机器向人提问的“反图灵测试”。

随着计算机技术的进步,验证码设计得越来越复杂是必然趋势,这也显示出人工智能的不断进步,程序员正在与破解者进行着一场仿佛没有终点的“拉锯战”。美国斯坦福大学的一项研究发现,近两年来,互联网的验证码正变得越来越难以识别,并且每个网站平均有五分之一的用户因为复杂的验证码而离开网站。

不过,验证码在进化过程中也有了新的应用意义。美国卡内基-梅隆大学的路易斯·冯·安等人设计出了reCAPTCHA系统,将验证过程用于古籍的数字化。古籍经扫描后,会出现一些难以准确辨识的字符,人工核对工作量巨大。对电脑前的单个人来说,辨认验证码字符所花的几秒时间也许微不足道,但如果把全球数以亿计的网民辨认的字符收集起来,情况会怎样呢?

于是reCAPTCHA派上用场了,把无法识别的古籍文字制成验证码,派发给网站用户验证,根据不同用户反馈回来的单词答案,就可以轻松得到典籍模糊字符的正确结果了!原来,每一次烦人的验证都在为人类典籍数字化作贡献。reCAPTCHA后来被谷歌买走,谷歌还把这个概念应用到谷歌街景的门牌号识别中。

越来越复杂的验证码终究还是给很多网友带来烦恼。为此,谷歌公司正在实施一项工程,试图“杀死验证码”。

去年年底,谷歌推出了全新的验证码识别系统“No Captcha reCAPTCHA”,繁杂的验证码系统被一个简单的复选框所取代,用户只需勾选“我不是机器人”这个选项即可。其实,通过收集用户在单击前的鼠标轨迹,谷歌就判断出了人与机器之间的细微差异。

这一新系统会在“不经意间”收集用户的IP地址等变量,然后根据这些数据对比用户当前的行为是否与在互联网上历史行为一致,来判定究竟是人还是机器人在操作。但是,也有人批评这个“验证码杀手”系统有泄露用户隐私的嫌疑。

责编:王吉华
转发