unCAPTCHA利用语音转换文字技术,将语音版CAPTCHA的语音切割成个别的数字音频,再利用线上的语音转文字服务,将回传结果修改为数字,将答案回覆给语音版CAPTCHA。

美国马里兰大学(University of Maryland)的4名研究人员近日发表一自动化系统unCAPTCHA,宣称可破解由Google打造的语音版reCAPTCHA,且准确率高达85.15%,并已藉由GitHub释出了该系统。
Google的reCAPTCHA为全球最受欢迎的CAPTCHA系统之一,透过图像来验证来者是人类或机器人,以保护网路服务不被庞大的机器人所侵袭,估计至少有数十万个网站采用reCAPTCHA。至於语音版的reCAPTCHA则是专为视障人士所设计,它在吵杂的背景环境中以不同的速度、音调或口音念出数字,并要求使用者填入所听见的数字。
而unCAPTCHA系统即是基於语音转换成文字的技术,先下载语音版的CAPTCHA,把这些语音切割成个别的数字音频,再将各个数字音频上传到网路上的各种语音转文字服务,然後把这些服务的回应修改成数字,例如倘若听起来像是「True」,那麽可以假设这个数字是「Two」,整合这些不同服务的结果,并将数字回传至答案上。
unCAPTCHA所利用的线上语音转换文子服务涵盖了IBM、Google Cloud、Google Speech Recognition、Sphinx, Wit-AI与Bing Speech Recognition。
在研究人员的测试中,unCAPTCHA辨识个别数字的准确率高达92%,而整串CAPTCHA的准确率也达到85%以上。