文件操作
一般步骤1. 文件打开 2. 文件操作 3. 文件关闭
1. 打开文件
使用open(文件名(绝对路径), 打开模式, 编码)
文件打开的模式有:
r: 只读模式(默认)
w: 只写模式 (不可读,文件不存在就创建,存在则清空)
x: 只写模式 (不可读,文件不存在就创建,存在则报错)
a: 追加模式 (不可读,如果文件不存在就创建,如果存在则在原文件后面追加)
以上都是以字符串方式打开
'+' 表示可以同时读写某个文件
'b' 表示以字节的方式操作 -> 后续socket部分会用到
文件的打开方式有 普通打开方式 和 二进制打开方式
普通打开:python内部将0101自动转换成字符串
二进制打开:'b'模式加str - bytes 转换 + 手动encoding='utf-8'
# 打开一个文件使用open(文件名(绝对路径),打开模式,编码)
# 文件打开默认只读模式('r')
#
f = open('test.log', 'r')
data = f.read()
f.close()
print(data) f = open('test.log', 'r')
data = f.write('ehhh')
f.close()
print(data)
# 在只读状态下写入,报错 Traceback (most recent call last):
# File "D:/NaomiPyer/naomi_01/mod8/file_stuff.py", line 21, in <module>
# data = f.write('ehhh')
# io.UnsupportedOperation: not writable # 只写 - 文件不可读,只写情况下,文件不存在则创建,存在则清空内容写入
f = open('test1.log', 'w')
f.write('ruby')
f.close()
# 执行后自动创建了有'ruby'内容的文件
f = open('test1.log', 'w')
f.write('python')
f.close()
# 修改写入内容再次执行,文件内容更新为新输入的内容
f = open('test1.log', 'w')
f.read()
# 报错, 不可读 => io.UnsupportedOperation: not readable # x 只写 - 不可读,不存在则创建,存在则报错
f = open('test1.log', 'x')
f.write(' ')
f.close()
# 文件已存在,报错 => FileExistsError: [Errno 17] File exists: 'test1.log' # a 追加 - 不可读,不存在则创建,存在则只追加内容
f = open('test.log', 'a')
f.write('java')
f.close()
# 'test.log'文件里面追加了java 内容 # 以上为文件的基本打开方式
# 通常读取到的文件数据,类型是str, 如果要转换为字节,可以用types()
f = open('test.log', 'r')
data = f.read()
a = bytes(data, encoding='utf-8')
print(a)
# 这样文件里的数据就以bytes输出了 => b'zen of pythonjava' # 以字节方式打开
# 1. 只读
f = open('test.log', 'rb')
data = f.read()
print(data)
str_data = str(data, encoding='utf-8')
print(str_data)
# 不需要编码 # 2. 只写
f = open('test.log', 'wb')
f.write(bytes('牛奶', encoding='utf-8'))
f.close()
# 写入的字符串"牛奶"需要用编码变为bytes写入
f = open('test1.log', 'wb')
str_data = '牛奶'
bytes_data = bytes(str_data, encoding='utf-8')
f.write(bytes_data)
f.close()
# 以字节的方式写入
'+'
r+ 读写
# r+
# w, 末尾追加,指针最后
f = open('test1.log', 'r+', encoding='utf-8') # 指针为0, 起始位置
print(f.tell()) data = f.read(3) # read(3) 读取3个字符(中文9个字节)
print(type(data), data)
print(f.tell())
# f.write('草莓')
# f.seek(0)
# data = f.read()
f.read(2)
print(f.tell())
print(type(data), data)
f.close()
# 指针 读取完数据,继续读取的时候从上次停下的位置开始继续读取
# 通过tell() 来获取指针
# 通过seek() 来调整指针 [seek以字节来说]
# 写入的时候,指针会调到最后
w+ 写读
# w+,先清空,写完内容之后才可以读
# 写入完毕,指针到最后
f = open('test1.log', 'w+', encoding='utf-8')
data = f.read()
f.close()
print(data)
# 没有数据,因为写读是先写入再读取,没有写入的内容
f = open('test1.log', 'w+', encoding='utf-8')
f.write('鸡蛋')
data = f.read()
f.close()
print(data)
# 还是没有内容,因为写完之后指针已经到文件末尾
f = open('test1.log', 'w+', encoding='utf-8')
f.write('鸡蛋')
f.seek(0)
data = f.read()
f.close()
print(data)
# 写入数据后,调整指针到起始位置,读到文件内容
x+ 写读
基本和 w+ 一样,不同的是,如果文件已经存在,会报错。
a+ 写读
# a+
# 写时追加,放到最后
f = open('test.log', 'a+', encoding='utf-8')
print(f.tell())
data = f.read()
print(data)
f.seek(0)
data = f.read()
print(data)
f.close()
# 因为a是追加,其实在打开文件的同时,指针已经到了文件末尾
# => 6 空 牛奶
几种读写方式共有的特点
# 从开始向后读
# 写,追加,指针调到最后
f.tell() # 获取指针的位置
f.seek(num) # 调整指针的位置
data = f.read(1) # 读取一个字符(中文3个字节)
print(data)
print(f.tell()) # 向后移了三个字节
f.write('content') # 在尾部追加,并且指针移动到最后
f.close()
在不确定每个读写方式特点的时候,可以通过tell(), seek(), read(), write() 方法来判断
'b' 表示以字节的方式操作
wb w+b
rb r+b
xb x+b
ab a+b
上述是和在底层数据交流的时候,以字节的方式读写,默认以字节方式打开,拿到字节数据后转化为字符串进行操作,写入的时候同样转换为字节写入。
文件的操作:
# close() 关闭一个文件 # fileno() 文件描述符(后续讲) # flush() 文件内部缓冲区
# 写入内容之后,f.flush()可以将内存里写入的东西刷入到硬盘里 # read(1) 读取内容 # readable() 判断是否可读 # readline(1) 仅读取一行内容,再次执行会从第一次指针停下来的位置继续往下读取 # seek() 调整指针 # truncate() 截取, 依赖于指针 f = open("test.log", 'r', encoding='utf-8')
# f.read()
for line in f:
print(line)
# 效果同readline(),且比readline()更好用 # 关闭文件 close()
# 每次文件读写都要close(),比较麻烦,可以通过with语句来自动关闭
with open('test.log', 'r') as f:
f.read()
# 读取数据时,上面代码自动帮助close()文件
# python 2.7 及以后版本,可以同时还打开两个文件
with open('log1', 'r') as obj1, open('log2', 'r') as obj2:
pass
# 以读方式打开源文件,同时打开新文件w,可以一行一行读取然后一行一行写入新文件。大大节省了内存。
with open('源文件', 'r') as obj1, open('新文件', 'w') as obj2:
for line in obj1:
obj2.write(line)
文件关闭后不会保存指针,但是关闭前,文件读到哪儿,指针就指到哪儿。
如果需要记录文件读取的位置,我们可以将tell()指针位置先保存起来,下一次打开的时候seek()一下重新读取