1、首先说明一下,curl的百科解释是:
PHP[2]支持的由Daniel Stenberg创建的libcurl库允许你与各种的服务器使用各种类型的协议进行连接和通讯。 libcurl目前支持http、https、ftp、gopher、telnet、dict、file和ldap协议。libcurl同时也支持HTTPS认证、HTTP POST、HTTP PUT、 FTP 上传(这个也能通过PHP的FTP扩展完成)、HTTP 基于表单的上传、代理、cookies和用户名+密码的认证。 PHP中使用cURL实现Get和Post请求的方法
2、简单来说,curl就是抓取页面的升级版,即支持GET、POST等浏览器行为,从而可以达到一个模拟浏览器操作的目的。
最简单的一个模型就是如下图所示的模型:
就是初始化,配置,取页面源代码数据,关闭。一个非常简单的例子如下所示:
<?php //1.初始化,创建一个新cURL资源 $ch = curl_init(); //2.设置URL和相应的选项 curl_setopt($ch, CURLOPT_URL, "http://www.baidu.com/"); curl_setopt($ch, CURLOPT_HEADER, 0); //3.抓取URL并把它传递给浏览器 curl_exec($ch); //4.关闭cURL资源,并且释放系统资源 curl_close($ch); ?>
我们可以看到浏览器会输出百度的页面结果。我们继续深入研究如何使用curl来达到一个模拟登陆的过程,也就是模拟post的过程。
3、POST的过程比较复杂一些,但是原理和浏览器提交过程相同,简单来说,就是利用curl直接将用户名和密码(或者其他相应的参数,这个根据post页面具体讨论)提交到post指向的处理页面即可。过程如下图:
当然,我们可以看到过程几乎一样,只是在curl初始化之后,要生成一些列的post参数,然后再提交,等待返回数据。
例子如下:
<?php /** * Curl版本 * 使用方法: * $post_string = "app=request&version=beta"; * request_by_curl(‘http://facebook.cn/restServer.php‘,$post_string); * IT部落格版权所有 http://www.itbuluoge.com */ //设置POST值 $post_string=‘memberName=123&password=456‘; //调用登陆函数 echo request_by_curl(‘http://login.ddd.cn/index.php/action/UserLogin/referer/1‘, $post_string); //登陆函数 function request_by_curl($remote_server, $post_string) { $cookie_jar = tempnam(‘./tmp‘,‘JSESSIONID‘); $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $remote_server); curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_USERAGENT, "Jimmy‘s CURL Example beta"); $data = curl_exec($ch); curl_close($ch); return $data; } ?>
注:例子亲测有效,只是我把我自己测试的真实账号修改了一下。
上面的例子就可以显示,我们可以成功或者失败的返回数据。
但是上面有一个问题,就是失效性,也就是我们仅仅登陆成功了登陆页是没有效果的,服务器不一定保持了我们的登陆状态,所以如果我们直接取其他页面的数据,网站又会给出未登录提示,这里就需要设置一个cookie。
4、cookie设置及登陆
根据图形,我们可以分两步走,第一步模拟登陆并且设置cookie。第二步读取cookie并且加载需要登陆后访问的页面。
下面给出测试成功的例子。
<?php /** * Curl版本 * 使用方法: * $post_string = "app=request&version=beta"; * request_by_curl(‘http://facebook.cn/restServer.php‘,$post_string); * IT部落格版权所有 http://www.itbuluoge.com */ //设置POST值 $post_string=‘memberName=fdsfs&password=ddd‘; //调用登陆函数 request_by_curl(‘http://login.ddd.cn/index.php/action/UserLogin/referer/1‘, $post_string); //返回固定页面数据 echo request_url_data("http://user.ddd.cn/dispatcher.php/module/Personal/"); //登陆函数 function request_by_curl($remote_server, $post_string) { $cookie_jar = tempnam(‘./tmp‘,‘JSESSIONID‘); $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $remote_server); curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_setopt($ch, CURLOPT_USERAGENT, "Jimmy‘s CURL Example beta"); //设置文件读取并提交的cookie路径 curl_setopt($ch, CURLOPT_COOKIEJAR, ‘cookie.txt ‘); //保存 $data = curl_exec($ch); curl_close($ch); return $data; } function request_url_data($url) { //初始化,创建一个新cURL资源 $ch = curl_init(); //读取cookie curl_setopt($ch, CURLOPT_COOKIEFILE, ‘cookie.txt ‘); //设置URL和相应的选项 curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_HEADER, 0); //抓取URL并把它传递给浏览器 $data=curl_exec($ch); //关闭cURL资源,并且释放系统资源 curl_close($ch); } ?>
根据结果,显示成功。这里我的网址和相关参数全部修改了,读者可以根据自己的需要做相应的修改。