PHP的curl常用的5个例子curl_setopt($ch,CURLOPT_URL,http://localho st/mytest/phpinfo.phpcurl_setopt($ch,CURLOPT_HEADER,false);curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1);//如果把行注掉的就会直接出$result=curl_exec($ch);curl_close($ch);
2使用代理行抓取
什要使用代理行抓取呢以google例吧 如果去抓google的数据 短 内抓的很繁的你就抓取不到了 。google你的ip地址做限制个候你可以代理重新抓。?p hp
$ch=curl_init();curl_setopt($ch,CURLOPT_URL,http://blog.51 yip.comcurl_setopt($ch,CURLOPT_HEADER,false);curl_setopt($ch,CURLOPT_RETURNTRANSFER, 1);curl_setopt($ch,CURLOPT_HTTPPROXYTUNNEL,TRUE);curl_setopt($ch,CURLOPT_PROXY, 125.21.23.6:8080);
//url_setopt($ch,CURLOPT_PROXYUSERPWD, ‘user:password’);如果要密的 加上个$result=curl_exec($ch);curl_close($ch);
3 post数据后抓取数据
独一下数据提交数据 因用curl的候很多候会有数据交互的所以比重要的。?p hp
$ch=curl_init();
/*在里需要注意的是要提交的数据不能是二数或者更高
*例如array(‘name’=s erializ e(array(‘tank’,’zhang’)),’s ex’=1,’b irth’=‘20101010’)
*例如array(‘name’=array(‘tank’,’zhang’),’s ex’=1,’b irth’=‘20101010’) 会 的*/
$data=array(‘name’=‘te st’,’s ex’=1,’b irth’=‘20101010’);curl_setopt($ch,CURLOPT_URL,’http://localho st/mytest/curl/upload.php’);curl_setopt($ch,CURLOPT_POST, 1);curl_setopt($ch,CURLOPT_POSTFIELDS,$data);curl_exec($ch);
在upload.php文件中 print_r($_PO ST);利用curl就能抓取出upload.php 出的内容Array( [name]=te st [s ex]=1 [b irth]=20101010)
4抓取一些有面 控制的面
以前写一篇 面 控制的3 方法有趣的可以看一下。
如果用上面提到的方法抓的会以下
You are not authorized to view this page
Youdonot have permission to view this directoryorpage using the credentials that you suppliedbecause your Web browser is sending a WWW-Authenticate header field that the Web server isnot configured to accept.
个候 我就要用CURLOPT_USERPWD来行 了
?p hp
$ch=curl_init();curl_setopt($ch,CURLOPT_URL,http://club-china
/*CURLOPT_USERPWD主要用来破解面 控制的
*例如平我所以htpasswd生面控制等。*/
//curl_setopt($ch,CURLOPT_USERPWD, ‘231144:2091 XTAjmd=‘);curl_setopt($ch,CURLOPT_HTTPGET, 1);curl_setopt($ch,CURLOPT_REFERER,http://club-chinacurl_setopt($ch,CURLOPT_HEADER,0);
$result=curl_exec($ch);curl_close($ch);
5模登到s ina
我要抓取数据 可能是登以后的内容 个候我就要用到curl的模登功能了 。?p hpfunctionchecklogin($user,$password)if(emptyempty($user) | |emptyempty($password) )return0;
$ch=curl_init( );curl_setopt($ch,CURLOPT_REFERER,http://mail.sina.com.cn/index.htmlcurl_setopt($ch,CURLOPT_HEADER, true);curl_setopt($ch,CURLOPT_RETURNTRANSFER, true);curl_setopt($ch,CURLOPT_USERAGENT,USERAGENT);curl_setopt($ch,CURLOPT_COOKIEJAR,COOKIEJAR);curl_setopt($ch,CURLOPT_TIMEOUT,TIMEOUT);curl_setopt($ch,CURLOPT_URL,http://mail.sina.com.cn/cgi-bin/login.cgicurl_setopt($ch,CURLOPT_POST, true);curl_setopt($ch, CURLOPT_POSTFIELDS, logintype=uid u= .urlencode($user). psw= .$password);
$contents=curl_exec($ch);curl_close($ch);if( !preg_match(/Location: (.*)\\/cgi\\/index\\.php\\?check_time=(.*)\n/ ,$contents,$matches) )return0;
}else{
return 1;define(USERAGENT,$_SERVER[‘HTTP_USER_AGENT’] );define(COOKIEJAR, tempnam(/tmp,cookie) );define(TIMEOUT,500);echochecklogin(zhangying215,xtaj 227
打/tmp下面的co okie文件看一下
#Netscape HTTP Cookie File
#http://curl.haxx.s e/rfc/cookie_spec.html
#This file was generated by libcurl!Edit at your own risk.mail.sina.com.cn FALSE / FALSE 0 SINAMAIL-WEBFACE-SESSID65223c4bd8900284ed463d2a3e1 ac182
#HttpOnly_.sina.com.cn TRUE / FALSE 0 SUE es%3D8d96db0820c6c79922ad57d422f575e8%26ev
%3Dv0%26es2%3Dcddfb8400dc5ca95902367ddcd7f57dd
.sina.com.cn TRUE / FALSE 0 SUP cv%3D1%26bt%3D1286900433%26et%3D1286986833%26lt%3D1%26uid%3D1445632344%26user%3D%25E5%25BC
%25A0%25E6%2598%25A02001%26ag%3D2%26name%3Dzhangying20015%2540sina.com%26nick%3D%25E5%25BC%25A0%25E6%2598%25A02001%26sex%3D1%26ps
%3D0%26email%3Dzhangying20015%2540sina.com%26dob%3D 1982-07-18
#HttpOnly_.sina.com.cn TRUE / FALSE 0 SID BihcallomxMx-QZxzGrOlcSQx%2F0B%2F0cmr.NyQ%2F0B%2FcmGGalmarlmcHrcGl Smrmxmfxal_CBZ
%2F_afugCmmGirBYHm0Bc%40fr5ciZiGG5i
#HttpOnly_.sina.com.cn TRUE/FALSE 0 SPRIAL bfb4102951 fd5892a3fd5b42d442cd26#HttpOnly_.sina.com.cn TRUE/FALSE 0 SINA_USER%D5%C5%D2001
卢森堡商家gcorelabs是个全球数据中心集大成的运营者,不但提供超过32个数据中心的VPS、13个数据中心的cloud(云服务器)、超过44个数据中心的独立服务器,还提供超过100个数据中心节点的CDN业务。CDN的总带宽容量超过50Tbps,支持免费测试! Gcorelabs根据业务分,有2套后台,分别是: CDN、流媒体平台、DDoS高防业务、块存储、cloud云服务器、裸金属服务器...
妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款到网站余额,超过2天...
wordpress高级跨屏企业主题,通用响应式跨平台站点开发,自适应PC端+各移动端屏幕设备,高级可视化自定义设置模块+高效的企业站搜索优化。wordpress绿色企业自适应主题采用标准的HTML5+CSS3语言开发,兼容当下的各种主流浏览器: IE 6+(以及类似360、遨游等基于IE内核的)、Firefox、Google Chrome、Safari、Opera等;同时支持移动终端的常用浏览器应...