HTTP协议实现libcurl
1.libcurl简介
libcurl是一个跨平台的网络协议库,支持http, https, ftp, gopher, telnet, dict, file, 和ldap 协议。libcurl同样支持HTTPS证书授权,HTTP POST, HTTP PUT, FTP 上传, HTTP基本表单上传,代理,cookies,和用户认证
libcurl库下载
2.libcurl的使用
初始化libcurl:
curl_global_init()
函数得到 easy interface型指针:
curl_easy_init()
设置传输选项:
curl_easy_setopt()
设置的传输选项,实现回调函数以完成用户特定任务:
curl_easy_setopt()
函数完成传输任务:
curl_easy_perform()
释放内存:
curl_easy_cleanup()
函数简介
1.CURLcode curl_global_init(long flags);
函数只能用一次。(其实在调用curl_global_cleanup 函数后仍然可再用)
如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动调用,所以多线程下最好主动调用该函数以防止在线程中curl_easy_init时多次调用。
注意:虽然libcurl是线程安全的,但curl_global_init是不能保证线程安全的,所以不要在每个线程中都调用curl_global_init,应该将该函数的调用放在主线程中。
写入此函数避免出现上述风险:
curl_global_init(CURL_GLOBAL_ALL);
参数:flags
CURL_GLOBAL_ALL
//初始化所有的可能的调用。CURL_GLOBAL_SSL
//初始化支持 安全套接字层。CURL_GLOBAL_WIN32
//初始化win32套接字库。CURL_GLOBAL_NOTHING
//没有额外的初始化。
CURL类型的指针.
curl_easy_setopt函数部分选项介绍
本节主要介绍curl_easy_setopt中跟http相关的参数。该函数是curl中非常重要的函数,curl所有设置都是在该函数中完成的,该函数的设置选项众多,注意本节的阐述的只是部分常见选项。
1. CURLOPT_URL
设置访问URL
2. CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA
回调函数原型为:size_t function( void *ptr, size_t size, size_t nmemb, void *stream); 函数将在libcurl接收到数据后被调用,因此函数多做数据保存的功能,如处理下载文件。CURLOPT_WRITEDATA 用于表明CURLOPT_WRITEFUNCTION函数中的stream指针的来源。
如果你没有通过CURLOPT_WRITEFUNCTION属性给easy handle设置回调函数,libcurl会提供一个默认的回调函数,它只是简单的将接收到的数据打印到标准输出。你也可以通过 CURLOPT_WRITEDATA属性给默认回调函数传递一个已经打开的文件指针,用于将数据输出到文件里。
3. CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA
回调函数原型为 size_t function( void *ptr, size_t size,size_t nmemb, void *stream); libcurl一旦接收到http 头部数据后将调用该函数。CURLOPT_WRITEDATA 传递指针给libcurl,该指针表明CURLOPT_HEADERFUNCTION 函数的stream指针的来源。
4. CURLOPT_READFUNCTION CURLOPT_READDATA
libCurl需要读取数据传递给远程主机时将调用CURLOPT_READFUNCTION指定的函数,函数原型是:size_t function(void *ptr, size_t size, size_t nmemb,void *stream). CURLOPT_READDATA 表明CURLOPT_READFUNCTION函数原型中的stream指针来源。
5. CURLOPT_NOPROGRESS,CURLOPT_PROGRESSFUNCTION,CURLOPT_PROGRESSDATA
跟数据传输进度相关的参数。CURLOPT_PROGRESSFUNCTION 指定的函数正常情况下每秒被libcurl调用一次,为了使CURLOPT_PROGRESSFUNCTION被调用,CURLOPT_NOPROGRESS必须被设置为false,CURLOPT_PROGRESSDATA指定的参数将作为CURLOPT_PROGRESSFUNCTION指定函数的第一个参数
6. CURLOPT_TIMEOUT,CURLOPT_CONNECTIONTIMEOUT:
CURLOPT_TIMEOUT 由于设置传输时间,CURLOPT_CONNECTIONTIMEOUT 设置连接等待时间
7. CURLOPT_FOLLOWLOCATION
设置重定位URL
我们直接参考该文章代码测试学习一下
参考文章
3.准备libcurl库
先将下载得到的libcurl库拿到Linux系统下,拖拽或FileZilla
1.处理libcurl库
先创建一个文件夹,拷贝到里面解压
tar xvf curl-7.71.1.tar.bz2
使用libcurl库
进入解压后的文件夹后,有各种使用介绍,README,doc下文件,
全都是英文,可以进行阅读,我们要快速开发,也可以借助百度去查看函数的使用,这样更方便,具体参考上文中引用的文章
有能力的话,去看一下INSTALL下的dosc文件夹下的INSTALL.md
我们主要参考Unix 安装
若需交叉编译,请参考
交叉编译
有问题可借助
1.配置configure
./configure --prefix=$PWD/_install
若需指定编译工具即交叉编译
./configure --prefix=$PWD/_install --host= (编译工具)
如
./configure --prefix=$PWD/_install --host= arm-linux-gnueabihf-gcc
默认使用gcc
如要求助:
./configure -help
2.编译 make
make
没有error提示,但依然没有生成install,继续
3.安装
make install
完成,现在我们可以调用lib下面的动态库,静态库去实现线面代码
动态库,静态库的使用参考
动态库,静态库
4. 代码测试
我们首先处理一下C语言不兼容问题
布尔类型,和true和falseC语言不支持
简单测试
#define true 1
#define false 0
typeof unsigned int bool;
#include <stdio.h>
#include <curl/curl.h>
#define true 1
#define false 0
typeof unsigned int bool;
bool getUrl(char *filename)
{
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL) // 返回结果用文件存储
return false;
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Accept: Agent-007");
curl = curl_easy_init(); // 初始化
if (curl)
{
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
res = curl_easy_perform(curl); // 执行
if (res != 0) {
curl_slist_free_all(headers);
curl_easy_cleanup(curl);
}
fclose(fp);
return true;
}
}
bool postUrl(char *filename)
{
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL)
return false;
curl = curl_easy_init();
if (curl)
{
curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86"); // 指定post内容
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi "); // 指定url
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
res = curl_easy_perform(curl);
curl_easy_cleanup(curl);
}
fclose(fp);
return true;
}
int main(void)
{
getUrl("/tmp/get.html");
postUrl("/tmp/post.html");
}
直接是无法使用的
先配置一下环境变量
declare -x LD_LIBRARY_PATH="./curl-7.71.1/_install/lib/"
./out运行 无现象
vi /tmp/get.html
可打开获取的百度网页,当然*面的,全是代码形式,和我们查看网页的代码的内容是一样的
测试回调函数
下面简单测试一下回调函数 (CURLOPT_WRITEFUNCTION)
**回调函数原型为 size_t function( void ptr, size_t size,size_t nmemb, void stream)
#include <stdio.h>
#include <curl/curl.h>
#include<string.h>
#define true 1
#define false 0
typedef unsigned int bool;
size_t testreadData( void *ptr, size_t size, size_t nmemb)
{
char Buf[1024] = {'\0'};
strncpy(Buf,ptr,1024);
printf("============================get data============================");
printf("%s\n",Buf);
}
bool getUrl(char *filename)
{
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL) // 返回结果用文件存储
return false;
struct curl_slist *headers = NULL;
headers = curl_slist_append(headers, "Accept: Agent-007");
curl = curl_easy_init(); // 初始化
if (curl)
{
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, testreadData);
// curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
// curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
res = curl_easy_perform(curl); // 执行
if (res != 0) {
curl_slist_free_all(headers);
curl_easy_cleanup(curl);
}
fclose(fp);
return true;
}
}
bool postUrl(char *filename)
{
CURL *curl;
CURLcode res;
FILE *fp;
if ((fp = fopen(filename, "w")) == NULL)
return false;
curl = curl_easy_init();
if (curl)
{
curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86"); // 指定post内容
//curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi "); // 指定url
curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
res = curl_easy_perform(curl);
curl_easy_cleanup(curl);
}
fclose(fp);
return true;
}
int main(void)
{
getUrl("/tmp/get.html");
postUrl("/tmp/post.html");
}
结果:
也可以设置更大空间,用与读取大多数据
此篇为我后面面部识别内容备忘而做的笔记,所以部分详细部分略过,
详细可参照
libcurl实现
希望可以帮到您
师从上官可编程,陈立臣