验证码强力搜索引擎

强力搜索引擎  时间:2021-02-27  阅读:()
研究开发01子图验证码!
何培舟!
温向明!
郑!
伟!
(北京邮电大学通信网络综合技术研究所北京"##$%&)摘!
要:本文提出一种简单的方法用于区分人类用户和计算机程序,称之为子图验证码.
在子图验证码中,采用中文随机特征码,通过设置字体、背景加噪、扭曲图像等步骤完成对子图验证码的预处理.
之后,以子图形式把子图验证码呈现出来.
考虑到计算机程序在识别中文、噪声、粘连字符、扭曲图像、分离图像等方面的缺陷,人类用户很容易被区分出来,子图验证码正是利用这一特点来区分人类用户和计算机程序.
最后,子图验证码采用'(语言并结合技术实现.
关键词:')+/'0)01+2'3子图"!
引言随着14567465技术的发展,869服务变得无处不在,人机交互模式大有取代人人交互模式的趋势.
真人互动校对(0:;6+7@@A,01+)是一组真人用户可以友好交互而计算机程序很难仿真的策略.
其中,全自动区分计算机和人类的图灵测试('@;BCD656DE):5@;=/:7>4G/6H55@/6DD'@;C:567H;CE,K@4G@,+1L,声音,K;45等[N],这些验证码可以简单地分成三类:文字验证码、图像验证码和声音验证码.
验证码应用广泛[NOP]:它可以用于阻止网页蜘蛛(Q69HC>F67H)和蝇蛆(Q699@5H)参与选举投票,可以阻止暴力攻击,可以阻止网页机器人在博客上添加广告,可以阻止机器人搜索引擎索引私人网页,可以阻止垃圾邮件制造者大量群发送垃圾邮件,可以对数字文档进行鉴定防止假冒,等等.
本文剩余部分的组织结构如下:第二部分介绍了验证码的前期研究,第三部分详细地描述了子图验证码的生成算法.
第四部分分析了子图验证码的性能.
最后,在第五部分对子图验证码进行了总结.
I!
相关研究)D5H5K7@F67和他的团队在I##"年取得了该项技术的专利权.
J>;CE方法由卡内基·梅隆大学提出,用于区分真人用户和计算机程序.
J>;CE验证码生成方法如下:选择特征词,腐化、扭曲、并显示在一个图片中.
S;CE验证码的一个简单版本———.
UOJ>;CE来阻止广告制造者在聊天室内兜售广告和机器人自动注册免费邮件.
["]图"!
S#6>@,0$>#A6>@).
它的基本思想是利用多图作为验证码,打破传统单图验证码的限制,把生成的验证码图像自动分割成9个子图,或者更多个子图,这些子图按固定顺序显示,相互之间都有空隙,由这些子图组合在一起共同构成验证码.
子图验证码采用汉字作为随机特征码,之所以选用汉字,是因为汉字比数字和英文字符的字库更大,识别难度更高,更难被B>C软件攻破.
当然,也可以采用数字、英文字符和汉字的任意组合作为随机特征码,这样生成的子图验证码更难被B>C软件识别.
子图验证码的实现非常简单,下面以9子图中文验证码为例,对其实现过程进行介绍:(.
)设置子图验证码的长度.
验证码长度要适当,长度太短,容易被B>C软件攻破;长度太长,又会增加人类用户输入的时间,给人类用户造成麻烦.
验证码一般由9至+个字符组成,最小长度为9,最大长度为+.
本文默认验证长度为D,即D个汉字字符.
(!
)设置子图验证码字体型号、风格和颜色.
字体大小可以根据实际需要进行设置,但字体不能太小.
如果字体太小会影响子图验证码的性能,增大B>C软件攻破难度的同时,也增大了真人用户识别的难度.
字体型号和颜色可以预先设置,也可以随机生成.
字体和颜色的多样性可以轻易增加B>C软件的识别难度,但对真人用户的影响较小.
本例中字体类型默认为宋体,字号大小为9/像素,字体风格为粗体,字体颜色随机生成,为每个汉字随机生成一种颜色.
!
"2334年第4期计算机系统应用研究开发01(!
)设置子图验证码的背景颜色.
背景颜色一方面可以突出子图验证码,降低人类用户的识别难度;另一方面能够增大"#$软体识别难度,降低被攻破的概率.
本例中默认的背景颜色为红珊瑚颜色.
(%)添加随机噪声.
添加噪声的目的是模糊验证码内容,增大"#$软件识别难度.
噪声密度越大,识别难度越大.
噪声可以是噪声点,也可以是噪声线.
本例中采用噪声点,颜色采用黑色,大小采用像素块,输出个数为&'个,输出位置随机选择.
(()进行扭曲处理.
人类用户可以很轻易地识别扭曲过的图像,而计算机程序却很难.
进行扭曲处理的目的,是在不增加人类用户识别难度的情况下,增加"#$软件的识别难度,从而更好地区分人类用户和计算机程序.
本例中采用公式'正弦曲线来扭曲图像,扭曲后的随机特征码会出现粘连效果.
除了使用正弦曲线外,还可以使用余弦曲线、正切曲线、余切曲线、对数曲线,等等.
11!
"#2!
3)1111!
-#.
/$0[1"(!
"23)](2)公式)中*表示+坐标值,,-.
/010*/23表示子图验证码的图像高度.
公式'中,4表示波形的幅度倍数,4值越大扭曲程度越高;5表示波形的相位倍数,5值越大,扭曲程度越高;#表示波形的起始相位,取值区间在[6,'!
].
(7)生成子图.
根据扭曲后的图像来生成子图,可以均匀分割,也可以随机分割,分割的份数越多,识别难度越大.
并不是分割的份数越多越好,而是要以不增加人类用户识别难度为前提.
本例中把扭曲后的图像从中间均匀分割成四个子图,效果如图%所示.
7个汉字随机特征码被分成多个部分.
其中,第!
个汉字被分成%个部分,其它汉字均被分成'个部分,四个子图组合在一起共同构成一个完整的子图验证码.
(&)输出子图验证码并显示.
子图验证码的各个子图要按固定顺序显示,顺序改变后会增加人类用户识别的识别难度,甚至会出现人类用户无法识别的情况.
由于各个子图之间有空隙,会出现隔裂的效果,人类用户识别没有问题,但是"#$软件就很难了.
根据上述算法,我们采用#8语言,结合49:;技术在*@ABCBD3E*CF.
G93FH*B'66(平台上进行了仿真实现,效果如图%所示.
图%I子图验证码样例%I性能分析J*-KL等传统文字验证码把随机特征码显示在一张图片上呈现给用户,这张生成的图片就是验证码.
子图验证码打破了这一思维的限制,把随机特征码显示在多张图片呈现给用户,这些图片共同构成一个验证码.
真人用户只要轻轻一瞥就可以很快识别出相互分离的物体,而计算机程序却很难识别,子图验证码正是利用了这一识别上的差别.
子图验证码采用中文作为随机特征码,中文特征码优点是字符集大,计算机程序识别困难.
缺点是只能适用于中文环境,而且还可能出现生僻字,给人类用户识别造成困难.
)MN6年国家颁布了汉字编码的国家标准J5'!
)',共包含7&7!
个汉字和7N'个其它符号,后来又公布了国家标准J5)N6!
6,对J5'!
)'字符集进行了扩充.
本文采用了J5'!
)'字符集,为了便于用户轻松识别,子图验证码随机生成的汉字应该是人们熟悉的和常用的汉字,应当尽量避免生僻字的出现,而J5'!
)'字符集除了包含人们常用的汉字以外,还包含一些不常用的汉字.
因此,在随机生成汉字时我们需要根据汉字编码原理对照《汉字区位码表》进行编码,避免生僻字的出现.
在设计验证码时,需要平衡有效抵挡计算机程序攻击和人类用户轻松识别之间的关系.
在设计子图验证码时,需要平衡子图个数、子图间空隙大小、噪声密度、噪声大小、字体类型、字号大小、字体颜色、字体间距、背景颜色、扭曲程度等辅助手段和用户识别难度之间的关系.
我们采用的方法可以让人类用户轻松通过,而计算机程序却很难攻破.
子图验证码属于文本!
"计算机系统应用2445年第5期0研究开发1验证码,此类验证码的共同特点是需要读取验证码图片中的文字,这也给!
"#软件留下了机会,但相比于其他文本验证码,子图验证码的攻破难度更大,性能更好.
$%结束语本文提出一种简单的方法用于区分人类用户和计算机程序,即子图验证码.
子图验证码利用了计算机程序在识别中文、噪声、粘连字符、扭曲图像、分离图像等方面的弱点,可以很轻易地区分出人类用户和计算机程序,人类用户可以轻松通过验证,而计算机程序却很难攻破.
子图验证码在保证网络安全方面能起到积极作用,使用子图验证码相当于为用户登陆设置了一道防火墙,它可以用于阻止计算机程序进行恶意&'()*+')(注册,可以用于阻止计算机程序自动添加留言和自动发送广告,可以用于阻止计算机程序群发垃圾邮件,可以用于阻止机器人搜索引擎自动索引私人网页,可以用于阻止计算机程序自动投票等.
除了以上应用外,子图验证码还可以扩展到,-.
、手机等设备,用于保证,-.
、手机等设备的安全,如何对子图验证码进行扩展是我们下一步工作研究的重点.
参考文献2345,6/,74+-(8'(,947$8>8=8>%-@"&0,A=-/.
,"0",B860-/$0C&>6D,C&-.
",Q4Q$6%4K#K06/60"%*";"(R)C(:SFEC0'=8>%-0-&-,G#C(:=8>C#&$0$E$B,H9,G(C0")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJU4INPFINX4MK4YC#'"%,C#&$0$E$B,H9,G(C0")T0$0"#:K(R#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJO4PU2FPUP4O4T45$C%),Q4>-.
$046/$(K(0"%$&0C+*-&6/"(0K/$:"8($,B#C#4K(C(:M0'K8>!
K(0"%($0C-($,[-%W#6/"(08($,B#C#TB#0"/#47-()-(,GQ:T.
%C(:"%FZ"%,$:,IJJI4MJUFM2X4U='$(,%-&"")C(:#-;0'"K(0"%($0C-EC0'8%0C;C&C$,K(0",,C:"(&"4K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(R:C(""%#K(&,IJJN4IIOFINI4X^%":3-%C,9C0"()%$3$,CW4!
"&-:(CVC(:_D@"&0#C(8)R+"%#$%C$,=,600"%:5%"$WC(:$ZC#6$,=8>%-&"")C(:#-;0'"IJJNKSSS=-/.
60"%T-&C"0B=-(R60"%ZC#C-00"C0C-(4>C#&$0$E$B,H9,G(C0")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJN4K'2NPFK'2PP4L^%":3-%C,9C0"()%$3$,CW4S#0C/$0C-(C#&$0$E$B,H9,G(C0R")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:CR60"%T-&C"0B,IJJP422INF22IX42J"(%BT45$C%),3C&'$",843-,,,T6CF\6[$(:,T&$00"%RC#&$0$E$B,H9,G(C0")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJM4LNMFLNL42234T'C%$,CFT'$'%"V$,T4T'C%$,CFT'$'%"V$4*%$ERC(:=8>%"A"63"%+4&")4#&-+"%B:-+"%&-/4(64D>40-04(4(%-.
"$(9-(C"A"63"%+4&"#(E9FA3GHI),JHHI:KL8MK@J130"+"(E@9;"%N4(#O4,P"(=@Q'$-,5-))*,R(0'-(B*,!
$()BS@T$0;@R(R%&'40"&0>%"C-%$3"&>%"3"%+4&"*4#&-+"%B3"%+4&"@U(:V4C0'R((>$,U(0"%($04-($,9-(C"W-64,"9-/.
>04(W@!
-0$04-(3&5%$(#,$04-(!
"#4,4"(0A$0"%/$%O4(%40B,0'"3"&-()S>()%")(U(0"%("0)="$%#@U(0"%("0:%-0-&-,7->%($,,94#&-3B#0"/#,$()7>(2YYY,J(J):2H@Z1=4($(8=>(A"4,$()3'$-85$(@P>4,)4(%40B^$0"N$B:W"&'$(4#/#,:"%C-%/$(&"E+$,>$04-(,U/.
,"/"(0$04-(,$()U##>"#@UEEE9-//>(4&$04-(3>%+"B#$()5>0-%4$M,X-@2,0'4%)D>$%0"%,JHHJ@(上接第JL页)19-(C"5"4&$04-(#$()U(0"%($04-($,9-(C"U(0"%("0$()A"6R.
.
,4&$04-(#$()3"%+4&"#@:4#&$0$N$B,X7,_(40")30$0"#:U(#040>0"-CE,"&0%4&$,$()E,"&0%-(4&#E(0"%3-&4"0B,JHHI@2KA"(8S>(0"-CE,"&0%4&$,$()E,"&0%-(4&#E(0"%3-&4"0B,JHHI@22\Y822ZK@2MW@3'4%$,483'$'%";$,3@3'4%$,483'F(,4("9-,,$,04/")4$U(0"%$&04+"3"%+4&"#@:4#&$0$N$B,X7,_(40")30$0"#:U(#040>0"-CE,"&0%4&$,$()E,"&0%-(4&#E(0"%3-&4"0B,JHH\@LZ8LZ@!
!
JHHZ年第Z期计算机系统应用

HostYun全场9折,韩国VPS月付13.5元起,日本东京IIJ线路月付22.5元起

HostYun是一家成立于2008年的VPS主机品牌,原主机分享组织(hostshare.cn),商家以提供低端廉价VPS产品而广为人知,是小成本投入学习练手首选,主要提供基于XEN和KVM架构VPS主机,数据中心包括中国香港、日本、德国、韩国和美国的多个地区,大部分机房为国内直连或者CN2等优质线路。本月商家全场9折优惠码仍然有效,以KVM架构产品为例,优惠后韩国VPS月付13.5元起,日本东京...

提速啦(24元/月)河南BGP云服务器活动 买一年送一年4核 4G 5M

提速啦的来历提速啦是 网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑 由赣州王成璟网络科技有限公司旗下赣州提速啦网络科技有限公司运营 投资1000万人民币 在美国Cera 香港CTG 香港Cera 国内 杭州 宿迁 浙江 赣州 南昌 大连 辽宁 扬州 等地区建立数据中心 正规持有IDC ISP CDN 云牌照 公司。公司购买产品支持3天内退款 超过3天步退款政策。提速啦的市场定位提速啦主...

cyun29元/月,香港CN2 GIA云服务器低至起;香港多ip站群云服务器4核4G

cyun怎么样?cyun蓝米数据是一家(香港)藍米數據有限公司旗下品牌,蓝米云、蓝米主机等同属于该公司品牌。CYUN全系列云产品采用KVM架构,SSD磁盘阵列,优化线路,低延迟,高稳定。目前,cyun推出的香港云服务器性价比超高,香港cn2 gia云服务器,1核1G1M/系统盘+20G数据盘,低至29元/月起;香港多ip站群云服务器,16个ip/4核4G仅220元/月起,希望买香港站群服务器的站长...

强力搜索引擎为你推荐
主页改不了怎么改不了主页淘宝收费淘宝都什么服务是收费的?快速美白好方法脸部快速美白有什么好方法啊硬盘人克隆一个人需要多少人多长时间啊开机滚动条开机滚动条要很长时间怎么解决?qq空间打扮QQ空间怎么打扮如何打扮人人逛街为什么女人都喜欢逛街?谢谢了,大神帮忙啊商标注册查询官网怎么查商标是否注册成功小米手柄小米手柄怎么用?系统分析员系统分析师是做什么 的
厦门虚拟主机 已备案域名出售 购买域名和空间 台湾服务器 namecheap linode 服务器cpu性能排行 java虚拟主机 php空间购买 双12 免费ftp web应用服务器 学生服务器 789电视剧网 脚本大全 sonya windowsserverr2 服务器机柜 卡巴斯基免费版下载 以下 更多