python数据处理的一些基本操作(二)

一、csv 文件格式

看下.csv文件的定义:

逗号分隔值(Comma-Separated

Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。

如一下格式:

27,20,14,15,14,12,94,64,37,1015,1013,1009,7,5,2,21,8,35,0.00,,,152.csv

文件可以直接用excel或者类似软件打开,样子都是我们常见的表格形式。

示例一:

python数据处理的一些基本操作(二)

二、excel数据处理

python提供有第三方库来支持对excel的操作,python处理excel文件用的第三方模块库有xlrd、xlwt、xluntils和pyExcelerator,除此之外,python处理excel还可以用win32com和openpyxl模块。下面我们先安装第三方库:

Pip install xlrd

Pip install xlwt

Pip install xluntils

Pip install pyExcelerator

Xlrd只能进行读取excel文件,没法进行写入文件,xlwt可以写入文件,但是不能在已有的excel的文件上进行修改,如果有这个需求,就需要使用xluntils模块了,pyExcelerator模块与xlwt类似,也可以用来生成excel文件。

2.1读取单表文件:

python数据处理的一些基本操作(二)

2.2 读取单表文件复杂例子:

python数据处理的一些基本操作(二)

2.3、写入excel文件

python数据处理的一些基本操作(二)

2.5、Python进行修改excel文件:

python数据处理的一些基本操作(二)

三、Python处理pdf文件

3.1、Python读出pdf文件

python数据处理的一些基本操作(二)

3.2、抓取每个的网页,然后生成pdf文件

python数据处理的一些基本操作(二)

3.3、Html转pdf文件

合并多个pdf文件为一个pdf文件

python数据处理的一些基本操作(二)

四、Python处理图片

图像处理是一门应用非常广的技术,而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL (Python Imaging Library)是 Python 中最常用的图像处理库,如果你是python2.x,可以通过以下地址进行下载:http://www.pythonware.com/products/pil/index.htm,找到相对应的版本进行下载就可以了。

注意:PIL模块在python3.x中已经替换成pillow模块,文档地址:http://pillow.readthedocs.io/en/latest/

引用块内容

直接使用

pip3install pillow

即可安装模块,导入时使用from PIL import Image.

python数据处理的一些基本操作(二)

4.1 Image的三个属性:

format : 识别图像的源格式,如果该文件不是从文件中读取的,则被置为 None 值。

size : 返回的一个元组,有两个元素,其值为象素意义上的宽和高。

mode : RGB(true color image),此外还有,L(luminance),CMTK(pre-press image)。

Image的方法介绍:

show():显示最近加载的图像

open(infilename):  打开文件

save(outfilename):保存文件

crop((left, upper, right, lower)):从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数,各元素为(left, upper, right, lower),坐标系统的原点(0, 0)是左上角。

4.2、抠图

需求,把头像给截图出来:

python数据处理的一些基本操作(二)

4.3、图片拼合

python数据处理的一些基本操作(二)

4.4、缩放:

python数据处理的一些基本操作(二)

4.5、验证码

python数据处理的一些基本操作(二)

上一篇:python将数据带格式输出到excel


下一篇:python操作excel