验证码强力搜索引擎

强力搜索引擎  时间:2021-02-27  阅读:()
研究开发01子图验证码!
何培舟!
温向明!
郑!
伟!
(北京邮电大学通信网络综合技术研究所北京"##$%&)摘!
要:本文提出一种简单的方法用于区分人类用户和计算机程序,称之为子图验证码.
在子图验证码中,采用中文随机特征码,通过设置字体、背景加噪、扭曲图像等步骤完成对子图验证码的预处理.
之后,以子图形式把子图验证码呈现出来.
考虑到计算机程序在识别中文、噪声、粘连字符、扭曲图像、分离图像等方面的缺陷,人类用户很容易被区分出来,子图验证码正是利用这一特点来区分人类用户和计算机程序.
最后,子图验证码采用'(语言并结合技术实现.
关键词:')+/'0)01+2'3子图"!
引言随着14567465技术的发展,869服务变得无处不在,人机交互模式大有取代人人交互模式的趋势.
真人互动校对(0:;6+7@@A,01+)是一组真人用户可以友好交互而计算机程序很难仿真的策略.
其中,全自动区分计算机和人类的图灵测试('@;BCD656DE):5@;=/:7>4G/6H55@/6DD'@;C:567H;CE,K@4G@,+1L,声音,K;45等[N],这些验证码可以简单地分成三类:文字验证码、图像验证码和声音验证码.
验证码应用广泛[NOP]:它可以用于阻止网页蜘蛛(Q69HC>F67H)和蝇蛆(Q699@5H)参与选举投票,可以阻止暴力攻击,可以阻止网页机器人在博客上添加广告,可以阻止机器人搜索引擎索引私人网页,可以阻止垃圾邮件制造者大量群发送垃圾邮件,可以对数字文档进行鉴定防止假冒,等等.
本文剩余部分的组织结构如下:第二部分介绍了验证码的前期研究,第三部分详细地描述了子图验证码的生成算法.
第四部分分析了子图验证码的性能.
最后,在第五部分对子图验证码进行了总结.
I!
相关研究)D5H5K7@F67和他的团队在I##"年取得了该项技术的专利权.
J>;CE方法由卡内基·梅隆大学提出,用于区分真人用户和计算机程序.
J>;CE验证码生成方法如下:选择特征词,腐化、扭曲、并显示在一个图片中.
S;CE验证码的一个简单版本———.
UOJ>;CE来阻止广告制造者在聊天室内兜售广告和机器人自动注册免费邮件.
["]图"!
S#6>@,0$>#A6>@).
它的基本思想是利用多图作为验证码,打破传统单图验证码的限制,把生成的验证码图像自动分割成9个子图,或者更多个子图,这些子图按固定顺序显示,相互之间都有空隙,由这些子图组合在一起共同构成验证码.
子图验证码采用汉字作为随机特征码,之所以选用汉字,是因为汉字比数字和英文字符的字库更大,识别难度更高,更难被B>C软件攻破.
当然,也可以采用数字、英文字符和汉字的任意组合作为随机特征码,这样生成的子图验证码更难被B>C软件识别.
子图验证码的实现非常简单,下面以9子图中文验证码为例,对其实现过程进行介绍:(.
)设置子图验证码的长度.
验证码长度要适当,长度太短,容易被B>C软件攻破;长度太长,又会增加人类用户输入的时间,给人类用户造成麻烦.
验证码一般由9至+个字符组成,最小长度为9,最大长度为+.
本文默认验证长度为D,即D个汉字字符.
(!
)设置子图验证码字体型号、风格和颜色.
字体大小可以根据实际需要进行设置,但字体不能太小.
如果字体太小会影响子图验证码的性能,增大B>C软件攻破难度的同时,也增大了真人用户识别的难度.
字体型号和颜色可以预先设置,也可以随机生成.
字体和颜色的多样性可以轻易增加B>C软件的识别难度,但对真人用户的影响较小.
本例中字体类型默认为宋体,字号大小为9/像素,字体风格为粗体,字体颜色随机生成,为每个汉字随机生成一种颜色.
!
"2334年第4期计算机系统应用研究开发01(!
)设置子图验证码的背景颜色.
背景颜色一方面可以突出子图验证码,降低人类用户的识别难度;另一方面能够增大"#$软体识别难度,降低被攻破的概率.
本例中默认的背景颜色为红珊瑚颜色.
(%)添加随机噪声.
添加噪声的目的是模糊验证码内容,增大"#$软件识别难度.
噪声密度越大,识别难度越大.
噪声可以是噪声点,也可以是噪声线.
本例中采用噪声点,颜色采用黑色,大小采用像素块,输出个数为&'个,输出位置随机选择.
(()进行扭曲处理.
人类用户可以很轻易地识别扭曲过的图像,而计算机程序却很难.
进行扭曲处理的目的,是在不增加人类用户识别难度的情况下,增加"#$软件的识别难度,从而更好地区分人类用户和计算机程序.
本例中采用公式'正弦曲线来扭曲图像,扭曲后的随机特征码会出现粘连效果.
除了使用正弦曲线外,还可以使用余弦曲线、正切曲线、余切曲线、对数曲线,等等.
11!
"#2!
3)1111!
-#.
/$0[1"(!
"23)](2)公式)中*表示+坐标值,,-.
/010*/23表示子图验证码的图像高度.
公式'中,4表示波形的幅度倍数,4值越大扭曲程度越高;5表示波形的相位倍数,5值越大,扭曲程度越高;#表示波形的起始相位,取值区间在[6,'!
].
(7)生成子图.
根据扭曲后的图像来生成子图,可以均匀分割,也可以随机分割,分割的份数越多,识别难度越大.
并不是分割的份数越多越好,而是要以不增加人类用户识别难度为前提.
本例中把扭曲后的图像从中间均匀分割成四个子图,效果如图%所示.
7个汉字随机特征码被分成多个部分.
其中,第!
个汉字被分成%个部分,其它汉字均被分成'个部分,四个子图组合在一起共同构成一个完整的子图验证码.
(&)输出子图验证码并显示.
子图验证码的各个子图要按固定顺序显示,顺序改变后会增加人类用户识别的识别难度,甚至会出现人类用户无法识别的情况.
由于各个子图之间有空隙,会出现隔裂的效果,人类用户识别没有问题,但是"#$软件就很难了.
根据上述算法,我们采用#8语言,结合49:;技术在*@ABCBD3E*CF.
G93FH*B'66(平台上进行了仿真实现,效果如图%所示.
图%I子图验证码样例%I性能分析J*-KL等传统文字验证码把随机特征码显示在一张图片上呈现给用户,这张生成的图片就是验证码.
子图验证码打破了这一思维的限制,把随机特征码显示在多张图片呈现给用户,这些图片共同构成一个验证码.
真人用户只要轻轻一瞥就可以很快识别出相互分离的物体,而计算机程序却很难识别,子图验证码正是利用了这一识别上的差别.
子图验证码采用中文作为随机特征码,中文特征码优点是字符集大,计算机程序识别困难.
缺点是只能适用于中文环境,而且还可能出现生僻字,给人类用户识别造成困难.
)MN6年国家颁布了汉字编码的国家标准J5'!
)',共包含7&7!
个汉字和7N'个其它符号,后来又公布了国家标准J5)N6!
6,对J5'!
)'字符集进行了扩充.
本文采用了J5'!
)'字符集,为了便于用户轻松识别,子图验证码随机生成的汉字应该是人们熟悉的和常用的汉字,应当尽量避免生僻字的出现,而J5'!
)'字符集除了包含人们常用的汉字以外,还包含一些不常用的汉字.
因此,在随机生成汉字时我们需要根据汉字编码原理对照《汉字区位码表》进行编码,避免生僻字的出现.
在设计验证码时,需要平衡有效抵挡计算机程序攻击和人类用户轻松识别之间的关系.
在设计子图验证码时,需要平衡子图个数、子图间空隙大小、噪声密度、噪声大小、字体类型、字号大小、字体颜色、字体间距、背景颜色、扭曲程度等辅助手段和用户识别难度之间的关系.
我们采用的方法可以让人类用户轻松通过,而计算机程序却很难攻破.
子图验证码属于文本!
"计算机系统应用2445年第5期0研究开发1验证码,此类验证码的共同特点是需要读取验证码图片中的文字,这也给!
"#软件留下了机会,但相比于其他文本验证码,子图验证码的攻破难度更大,性能更好.
$%结束语本文提出一种简单的方法用于区分人类用户和计算机程序,即子图验证码.
子图验证码利用了计算机程序在识别中文、噪声、粘连字符、扭曲图像、分离图像等方面的弱点,可以很轻易地区分出人类用户和计算机程序,人类用户可以轻松通过验证,而计算机程序却很难攻破.
子图验证码在保证网络安全方面能起到积极作用,使用子图验证码相当于为用户登陆设置了一道防火墙,它可以用于阻止计算机程序进行恶意&'()*+')(注册,可以用于阻止计算机程序自动添加留言和自动发送广告,可以用于阻止计算机程序群发垃圾邮件,可以用于阻止机器人搜索引擎自动索引私人网页,可以用于阻止计算机程序自动投票等.
除了以上应用外,子图验证码还可以扩展到,-.
、手机等设备,用于保证,-.
、手机等设备的安全,如何对子图验证码进行扩展是我们下一步工作研究的重点.
参考文献2345,6/,74+-(8'(,947$8>8=8>%-@"&0,A=-/.
,"0",B860-/$0C&>6D,C&-.
",Q4Q$6%4K#K06/60"%*";"(R)C(:SFEC0'=8>%-0-&-,G#C(:=8>C#&$0$E$B,H9,G(C0")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJU4INPFINX4MK4YC#'"%,C#&$0$E$B,H9,G(C0")T0$0"#:K(R#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJO4PU2FPUP4O4T45$C%),Q4>-.
$046/$(K(0"%$&0C+*-&6/"(0K/$:"8($,B#C#4K(C(:M0'K8>!
K(0"%($0C-($,[-%W#6/"(08($,B#C#TB#0"/#47-()-(,GQ:T.
%C(:"%FZ"%,$:,IJJI4MJUFM2X4U='$(,%-&"")C(:#-;0'"K(0"%($0C-EC0'8%0C;C&C$,K(0",,C:"(&"4K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(R:C(""%#K(&,IJJN4IIOFINI4X^%":3-%C,9C0"()%$3$,CW4!
"&-:(CVC(:_D@"&0#C(8)R+"%#$%C$,=,600"%:5%"$WC(:$ZC#6$,=8>%-&"")C(:#-;0'"IJJNKSSS=-/.
60"%T-&C"0B=-(R60"%ZC#C-00"C0C-(4>C#&$0$E$B,H9,G(C0")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJN4K'2NPFK'2PP4L^%":3-%C,9C0"()%$3$,CW4S#0C/$0C-(C#&$0$E$B,H9,G(C0R")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:CR60"%T-&C"0B,IJJP422INF22IX42J"(%BT45$C%),3C&'$",843-,,,T6CF\6[$(:,T&$00"%RC#&$0$E$B,H9,G(C0")T0$0"#:K(#0C060"-;S,"&0%C&$,$()S,"&0%-(C&#S(:C(60"%T-&C"0B,IJJM4LNMFLNL42234T'C%$,CFT'$'%"V$,T4T'C%$,CFT'$'%"V$4*%$ERC(:=8>%"A"63"%+4&")4#&-+"%B:-+"%&-/4(64D>40-04(4(%-.
"$(9-(C"A"63"%+4&"#(E9FA3GHI),JHHI:KL8MK@J130"+"(E@9;"%N4(#O4,P"(=@Q'$-,5-))*,R(0'-(B*,!
$()BS@T$0;@R(R%&'40"&0>%"C-%$3"&>%"3"%+4&"*4#&-+"%B3"%+4&"@U(:V4C0'R((>$,U(0"%($04-($,9-(C"W-64,"9-/.
>04(W@!
-0$04-(3&5%$(#,$04-(!
"#4,4"(0A$0"%/$%O4(%40B,0'"3"&-()S>()%")(U(0"%("0)="$%#@U(0"%("0:%-0-&-,7->%($,,94#&-3B#0"/#,$()7>(2YYY,J(J):2H@Z1=4($(8=>(A"4,$()3'$-85$(@P>4,)4(%40B^$0"N$B:W"&'$(4#/#,:"%C-%/$(&"E+$,>$04-(,U/.
,"/"(0$04-(,$()U##>"#@UEEE9-//>(4&$04-(3>%+"B#$()5>0-%4$M,X-@2,0'4%)D>$%0"%,JHHJ@(上接第JL页)19-(C"5"4&$04-(#$()U(0"%($04-($,9-(C"U(0"%("0$()A"6R.
.
,4&$04-(#$()3"%+4&"#@:4#&$0$N$B,X7,_(40")30$0"#:U(#040>0"-CE,"&0%4&$,$()E,"&0%-(4&#E(0"%3-&4"0B,JHHI@2KA"(8S>(0"-CE,"&0%4&$,$()E,"&0%-(4&#E(0"%3-&4"0B,JHHI@22\Y822ZK@2MW@3'4%$,483'$'%";$,3@3'4%$,483'F(,4("9-,,$,04/")4$U(0"%$&04+"3"%+4&"#@:4#&$0$N$B,X7,_(40")30$0"#:U(#040>0"-CE,"&0%4&$,$()E,"&0%-(4&#E(0"%3-&4"0B,JHH\@LZ8LZ@!
!
JHHZ年第Z期计算机系统应用

DiyVM:50元/月起-双核,2G内存,50G硬盘,香港/日本/洛杉矶机房

DiyVM是一家比较低调的国人主机商,成立于2009年,提供VPS主机和独立服务器租用等产品,其中VPS基于XEN(HVM)架构,数据中心包括香港沙田、美国洛杉矶和日本大阪等,CN2或者直连线路,支持异地备份与自定义镜像,可提供内网IP。本月商家最高提供5折优惠码,优惠后香港沙田CN2线路VPS最低2GB内存套餐每月仅50元起。香港(CN2)VPSCPU:2cores内存:2GB硬盘:50GB/R...

触碰云高性价20.8元/月,香港云服务器,美国cn2/香港cn2线路,4核4G15M仅115.2元/月起

触碰云怎么样?触碰云是一家成立于2019年的商家。触碰云主营香港/美国 VPS服务器、独立服务器以及免备案CDN。采用的是kvm虚拟构架,硬盘Raid10,Cn2线路,去程电信CN2、移动联通直连,回程三网CN2。最低1核1G带宽1M仅20.8元/月,不过这里推荐香港4核4G15M,香港cn2 gia线路云服务器,仅115.2元/月起,性价比还是不错的。点击进入:触碰云官方网站地址触碰云优惠码:优...

pacificrack:超级秒杀,VPS低至$7.2/年,美国洛杉矶VPS,1Gbps带宽

pacificrack又追加了3款特价便宜vps搞促销,而且是直接7折优惠(一次性),低至年付7.2美元。这是本月第3波便宜vps了。熟悉pacificrack的知道机房是QN的洛杉矶,接入1Gbps带宽,KVM虚拟,纯SSD RAID10,自带一个IPv4。官方网站:https://pacificrack.com支持PayPal、支付宝等方式付款7折秒杀优惠码:R3UWUYF01T内存CPUSS...

强力搜索引擎为你推荐
如何建立一个网站怎样能创建一个网站iphone越狱后怎么恢复苹果手机越狱后怎么恢复硬盘人克隆一个人需要多少人多长时间啊神雕侠侣礼包大全神雕侠侣先手礼包在哪领bluestackbluestacks下载的东西在哪分词技术中文分词的应用分词技术怎么在SEO中学会运用关键词分词技术网站优化方案几种常用的网站优化方法发邮件怎么发怎样发送邮件网络虚拟机虚拟机网络怎么连接
万网域名注册 免费网站域名注册 万网域名空间 本网站服务器在美国维护 阿里云os arvixe cdn服务器 免备案cdn koss iisphpmysql 贵州电信宽带测速 淘宝双十一2018 北京双线机房 hostloc 广州服务器 国外视频网站有哪些 备案空间 net空间 华为k3 腾讯网盘 更多