CURL抓取页面

cURL的基本原理

curl是利用URL语法在命令行方式下工作的开源文件传输工具,他能够从互联网上获得各种各样的网络资源。简单来说,curl就是抓取页面的升级版。

CURL抓取页面

 

1 2 3 4 5 6 7 8 9 10 11 12 <?php  //1.初始化,创建一个新cURL资源  $ch = curl_init(); //2.设置URL和相应的选项  curl_setopt($ch, CURLOPT_URL, "http://www.baidu.com/");    curl_setopt($ch, CURLOPT_HEADER, 0); //3.抓取URL并把它传递给浏览器  curl_exec($ch); //4.关闭cURL资源,并且释放系统资源  curl_close($ch); ?>

  

cURL爬取页面之爬取网页信息并替换

1 2 3 4 5 6 7 8 <?php $curlobj = curl_init();          // 初始化 curl_setopt($curlobj, CURLOPT_URL, "http://www.baidu.com");       // 设置访问网页的URL curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, true);         // 执行之后不直接打印出来 $output=curl_exec($curlobj);   // 执行 curl_close($curlobj);        // 关闭cURL echo str_replace("百度","php",$output); ?>

  

cURL爬取页面之获取天气

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 <?php header("Content-Type:text/html;   charset=utf-8"); $data 'theCityName=北京'; $curlobj = curl_init(); curl_setopt($curlobj, CURLOPT_URL, "http://www.webxml.com.cn/WebServices/WeatherWebService.asmx/getWeatherbyCityName"); curl_setopt($curlobj, CURLOPT_USERAGENT, "user-agent:Mozilla/5.0 (Windows NT 5.1; rv:24.0) Gecko/20100101 Firefox/24.0"); curl_setopt($curlobj, CURLOPT_HEADER, 0);          //启用时会将头文件的信息作为数据流输出。这里不启用 curl_setopt($curlobj, CURLOPT_RETURNTRANSFER, 1);  //如果成功只将结果返回,不自动输出任何内容。如果失败返回FALSE curl_setopt($curlobj, CURLOPT_POST, 1);            //如果你想PHP去做一个正规的HTTP POST,设置这个选项为一个非零值。这个POST是普通的 application/x-www-from-urlencoded 类型,多数被HTML表单使用。 curl_setopt($curlobj, CURLOPT_POSTFIELDS, $data);  //需要POST的数据 curl_setopt($curlobj, CURLOPT_HTTPHEADER, array("application/x-www-form-urlencoded;                                                       charset=utf-8", "Content-length: ".strlen($data))); $rtn = curl_exec($curlobj); if(!curl_errno($curlobj)){     // $info = curl_getinfo($curlobj);     // print_r($info);     echo $rtn; else {     echo 'Curl error: ' . curl_error($curlobj); } curl_close($curlobj); ?>

 

 

 原贴地址:https://www.cnblogs.com/laomao666/p/10952235.html

上一篇:PHP curl_multi_getcontent函数


下一篇:PHP常用的自定义函数