什么是csv
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)
读csv文件
1、首先导入CSV模板
2、创建一个CSV文件对象
3、打开文件进行读取
# coding:utf-8 import csv f = csv.reader(open('1111.csv','r')) for i in f: print(i) 代码结果: ['测试1', '软件测试工程师'] ['测试2', '软件测试工程师'] ['测试3', '软件测试工程师'] ['测试4', '软件测试工程师'] ['测试5', '软件测试工程师']
写入CSV文件
1、首先导入CSV模块
2、创建一个CSV文件对象
3、进行写入CSV文件
# coding:utf-8 import csv data = [ ("测试1",'软件测试工程师'), ("测试2",'软件测试工程师'), ("测试3",'软件测试工程师'), ("测试4",'软件测试工程师'), ("测试5",'软件测试工程师'), ] f = open('222.csv','w') writer = csv.writer(f) for i in data: writer.writerow(i) f.close()
写入后打开文件发现乱码了
解决方法:
1、导入codecs模块
2、使用cpdecs打开文件
# coding:utf-8 import csv import codecs data = [ ("测试1",'软件测试工程师'), ("测试2",'软件测试工程师'), ("测试3",'软件测试工程师'), ("测试4",'软件测试工程师'), ("测试5",'软件测试工程师'), ] f = codecs.open('222.csv','w','gbk') writer = csv.writer(f) for i in data: writer.writerow(i) f.close()
这个时候发现不会乱码了
编码和解码
CSV文件其他用法
csv.DictReader()用法:
# 将CSV 数据读进列表中(首先查找是否使用给定字段名,如果没有,就是用第一行作为键) # coding:utf-8 import csv data = [ ("测试1",'软件测试工程师1'), ("测试3",'软件测试工程师3'), ("测试4",'软件测试工程师4'), ("测试5",'软件测试工程师5'), ] f1 = open('222.csv','r') reader = csv.DictReader(f1) for i in reader: print(i) f1.close() 代码结果: [('测试1', '测试3'), ('软件测试工程师1', '软件测试工程师3')] [('测试1', '测试4'), ('软件测试工程师1', '软件测试工程师4')] [('测试1', '测试5'), ('软件测试工程师1', '软件测试工程师5')]
csv.DictWriter()用法
# 直接字典字段写入到CSV文件中 # coding:utf-8 import csv data = {'id':'123','name':'anjing','age':'26'} with open('123.csv','w')as f: fieldnames = {'id','name','age'} # 表头 writer = csv.DictWriter(f,fieldnames=fieldnames) writer.writeheader() writer.writerow(data)
结果:
发现上面写入后中间多了一行,如何解决这一行呢?
加入参数“enwline=‘’”
# coding:utf-8 import csv data = {'id':'123','name':'anjing','age':'26'} # 加入参数“enwline=''” with open('123.csv','w',newline='')as f: fieldnames = {'id','name','age'} writer = csv.DictWriter(f,fieldnames=fieldnames) writer.writeheader() writer.writerow(data)
写入多行
# 直接字典字段写入到CSV文件中 # coding:utf-8 import csv data = [{'id':'123','name':'anjing','age':'26'},{'id':'456','name':'anjing','age':'27'}] with open('123.csv','w', newline='')as f: fieldnames = {'id','name','age'} # 表头 writer = csv.DictWriter(f,fieldnames=fieldnames) writer.writeheader() writer.writerows(data) if __name__ == '__main__': pass
写读追加状态
'r':读
'w':写
'a':追加
'r+' == r+w(可读可写,文件若不存在就报错(IOError))
'w+' == w+r(可读可写,文件若不存在就创建)
'a+' ==a+r(可追加可写,文件若不存在就创建)
对应的,如果是二进制文件,就都加一个b就好啦:
'rb' 'wb' 'ab' 'rb+' 'wb+' 'ab+'