python学习笔记:第8天 文件操作

1. 文件操作介绍

说到操作文件我们肯定会想到流,文件的操作都是通过流来操作的。在python中文件的操作非常简单,并不像Java等其他语言一样有各种各样的流操作,我们直接使用open函数即可打开一个文件,然后进行各种操作,但是根据打开的不同的方式所能够执行的操作也不一样,打开文件的方式有:r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 等等。

下面我们先看一个读取的文件操作:

In [2]: f = open(file='a.txt', mode='r', encoding='utf-8')

In [3]: f.read()
Out[3]: '每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n' In [4]:

使用open函数打开文件,并且返回一个文件对象,open函数常见的几个参数file(要操作的文件名),mode(以什么模式打开)和encoding(指定一种编码来读取文件),根据不同的mode模式,返回的文件会有各种不同的操作。下面我们来看一下文件的几种操作。

2. 文件操作的几种方式

(1)只读操作

只读操作只需指定mode为r即可:

In [5]: f = open(file='a.txt', mode='r', encoding='utf-8')

In [6]: f.read()
Out[6]: '每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n' In [7]: f.readable() # 判断文件是否可读
Out[7]: True In [8]: f.writable() # 判断文件是否可写
Out[8]: False # 此处是以只读模式打开的文件,所以返回False不可写 In [9]: f1 = open(file='单分支结构.eddx', mode='rb') # 使用‘rb’可以打开存储为二进制的数据,图片、视频等 In [10]: f1.read(20)
Out[10]: b'PK\x03\x04\x14\x00\x08\x00\x08\x00mN\xe3H\xa9\x95\xb3\x9eW\x01'

(2)只写操作

mode='w'


In [13]: f = open(file='a.txt', mode='w', encoding='utf-8') In [14]: f.read() # 此时尝试读取文件会报错
---------------------------------------------------------------------------
UnsupportedOperation Traceback (most recent call last)
<ipython-input-14-571e9fb02258> in <module>
----> 1 f.read() UnsupportedOperation: not readable In [15]: f.write('葫芦娃')
Out[15]: 3 In [16]: f.close() In [17]: !cat a.txt # 此时查看文件之前那的内容已经被覆盖了
葫芦娃
In [18]:

使用mode='w'操作文件时首先会在打开文件时先清空文件,然后再根据操作把内容写入文件,只读模式有以下特点:

  • 当文件不存在时,会自动创建文件,然后打开文件进行操作
  • 打开文件时会先清空文件的内容,然后再从头开始写入
  • 文件以只写模式打开,不能够读取

(3)追加操作

mode='a'

In [18]: f = open(file='a.txt', mode='a', encoding='utf-8')

In [19]: f.write('每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n')
Out[19]: 42 In [20]: f.close() In [21]: In [21]: !cat a.txt
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大 In [22]:

追加模式的操作:

  • 打开文件时如果文件不存时会先创建文件
  • 往文件中写入内容时都是在文件末尾写入,不论光标在哪
  • 打开的文件只能写入,不能读取

(4)r+模式

r+模式是加强的读操作,即可以读写:

In [22]: f = open(file='a.txt', mode='r+', encoding='utf-8')

In [23]: f.readable()
Out[23]: True In [24]: f.writable()
Out[24]: True In [25]: f.read()
Out[25]: '葫芦娃每天坚持一点,\n每天努力一点,\n每天多思考一点,\n慢慢你会发现,\n你的进步越来越大\n' In [26]: f.write('\n哈哈哈哈哈哈哈')
Out[26]: 8 In [27]: f.close() In [28]: !cat a.txt # 查看写入的文件并没有异常
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大 哈哈哈哈哈哈哈
In [29]: f = open(file='a.txt', mode='r+', encoding='utf-8') In [30]: f.seek(0, 2) # seek可以调整光标位置
Out[30]: 153 In [31]: f.write('你的进步越来越大')
Out[31]: 8 In [32]: f.read() # 先写后读会读出空字符
Out[32]: '' In [33]:

总结:增强型的读操作对文件可读可写,但是顺序必须是先读取在往里面写入,如果先读再写入再读取的时候可能会读取到空字符串

r+模式深坑请注意: 在r+模式下. 如果读取了内容. 不论读取内容多少. 光标显⽰的是多少. 再写入或者操作⽂件的时候都是在结尾进⾏的操作

(5)w+和a+模式

w+模式和a+模式在实际使用场景较少,这边简单介绍一下:

  • w+:增强型的w模式,可以写和读操作,但是也跟r+一样,如果先读操作再写操作的话会有坑出现,并且每次在打开文件是会先清空文件,因此使用场景较少
  • a+:增强型的a模式,也可以进行读写操作,但是写入时只能往文件的末尾写入,无论光标怎么移动,都只能在文件末尾写入

3. 文件的操作的方法

(1)文件的读取和写入

文件的写入:主要是write方法以及writelines方法

  • write方法:直接写入字符串即可,上面的例子中也有用到
  • writelines方法:传递的参数必须时可迭代的(如列表和元组等)

文件的读取

  • read方法:read方法接收一个int型的参数,表示一次读取几个字符(seek的单位是字节),不提供默认是读取文件所有内容
  • readline方法:读取文件一行,文件很大时这个方法很使用,不会一次读取整个文件
  • readlines方法:读取出整个文件,以每一行分割存放到一个列表里并返回这个列表
In [34]: f = open(file='a.txt', mode='r', encoding='utf-8')
# 葫芦娃每天坚持一点,
# 每天努力一点,
# 每天多思考一点,
# 慢慢你会发现,
# 你的进步越来越大 # 哈哈哈哈哈哈哈你的进步越来越大
In [35]: f.read(10) # 这里时一次读取10个字符
Out[35]: '葫芦娃每天坚持一点,' In [36]: f.readline()
Out[36]: '\n' In [37]: f.readline() # 每次读取一行
Out[37]: '每天努力一点,\n' In [38]: f.readlines() # 返回的是一个列表
Out[38]: ['每天多思考一点,\n', '慢慢你会发现,\n', '你的进步越来越大\n', '\n', '哈哈哈哈哈哈哈你的进步越来越大'] In [39]:

readline(文件句柄)和readlines的区别

  • 文件句柄是一个可迭代对象,在循环遍历时每遍历一次取一行,不会在读取文件时一次性全部读出来
  • readlines返回的结果是一个列表,会一次性把整个文件的内容读取出来并返回一个列表,在处理大文件时会非常消耗资源

也可以使用循环去遍历文件句柄,输出文件中的内容:

In [39]: f.seek(0)
Out[39]: 0 In [40]: for line in f:
...: print(line.strip())
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大 哈哈哈哈哈哈哈你的进步越来越大 In [41]:

(2)文件操作的其他方法

  • close:关闭文件
  • readable:判断文件是否可读
  • seek:移动光标,接收两个数据第一个参数表示偏移到哪个位置(移动的单位是byte. 所以如果是UTF-8的中⽂部分要是3的倍数),第二个参数表示从那个位置开始偏移(0,代表开头,1代表当前位置,2代表结尾)
  • seekable:判断当前文件的光标是否可移动
  • tell:返回当前光标所在的位置
  • truncate:截断数据(谨慎操作),默认截断光标后所有字符
  • writable:判断文件是否可写

(3)打开文件的另一种方式

在打开一个文件后,要记得在文件使用结束狗使用close方法关闭文件句柄,但有时在中间进行大量的操作后可能会忘了关闭,下面介绍的这种方法可以不用自己手动关闭文件了,他会在您操作解说后(代码块的语句执行完毕)自动关闭文件句柄,这种方法就是使用context上下文管理,使用with语句实现:

In [43]: with open('a.txt', mode='r', encoding='utf-8') as f:   # 使用with管理上下文,最后退出时会自己执行close动作
...: for line in f:
...: print(line.strip())
葫芦娃每天坚持一点,
每天努力一点,
每天多思考一点,
慢慢你会发现,
你的进步越来越大 哈哈哈哈哈哈哈你的进步越来越大 In [44]:
上一篇:python学习笔记(22)-os文件操作模块


下一篇:python学习笔记-(七)python基础--集合、文件操作&函数