Python基础（七）-文件操作

2023-09-23 09:10:27

一、文件处理流程

1、打开文件，得到文件句柄赋值给一个变量

2、通过句柄对文件进行操作

3、关闭文件

二、基本操作

f = open('zhuoge.txt') #打开文件

first_line = f.readline()  #读取一行内容

print('first line:',first_line) #读一行

print('我是分隔线'.center(50,'-'))

data = f.read()# 一次性读取剩下的所有内容,文件大时不要用

print(data) #打印读取内容

f.close() #关闭文件

1、文件编码

pycharm打开文件，从硬盘读取二进制数据加载到内存，Python解释器用自身编码方式将这些数据decode成Unicode方式放到内存

Python解释器从内存中读取Unicode代码执行，执行时的代码中函数指定的编码与python解释器再无半点关系

以哪种字符编码格式写入就以哪种编码格式读取否则会出现乱码

如果文件以gbk方式写入，那么读取：

f = open ('zhuoge.tex',encoding='gbk')

f.read()

f.close()

2、文件打开模式：

文件句柄 = open('文件路径', '模式')

打开文件的模式有：

r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】
w，只写模式【不可读；不存在则创建；存在则清空内容】
x，只写模式【不可读；不存在则创建，存在则报错】
a，追加模式【可读；不存在则创建；存在则只追加内容】

"+" 表示可以同时读写某个文件

r+，读写【可读，可写】
w+，写读【可读，可写】
x+ ，写读【可读，可写】
a+，写读【可读，可写】

"b"表示以字节的方式操作

rb 或 r+b
wb 或 w+b
xb 或 w+b
ab 或 a+b

注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

f=open('zhuoge.txt','wb')

f.write('fuck you'.encode(encoding='utf-8'))

f.close()

3、文件内置函数flush

flush原理：

文件操作是通过软件将文件从硬盘读到内存
写入文件的操作也都是存入内存缓冲区buffer（内存速度快于硬盘，如果写入文件的数据都从内存刷到硬盘，内存与硬盘的速度延迟会被无限放大，效率变低，所以要刷到硬盘的数据我们统一往内存的一小块空间即buffer中放，一段时间后操作系统会将buffer中数据一次性刷到硬盘）
flush即，强制将写入的数据刷到硬盘

4、文件内光标移动

f.read(n) 代表读取n个字符，操作的是字符，其他方法操作都是字节

#文件内容

1你好啊

2我好

3他也好

f=open('hello.txt','r+',encoding='utf-8')

print(f.tell())  #以r模式打开 光标在最开头

n=f.read(6)  #读取6个字符

print(n)

print(f.tell())  #此时光标位于6个字符的位置

print(f.read(3))  #在光标之后再读3个字符

f.close()

结果：

0

1你好啊

2

b'1\xe4\xbd\xa0\xe5\xa5\xbd\xe5\x95\x8a\n2'

13

我好

f.readline()

f.readlines() 读出来的是个列表

f.truncate(n) 截取前n个字节内容

 #文件内容

 1你好

 2我好

 3大家好

 f=open('hello.txt','a+')  #以a模式打开，光标在最后

 print(f.tell())     #证明光标当前位置

 print(f.truncate(7))   #但是截取是从文件开头开始

 print(f.tell())   #截取后

 f.close()

 结果：

 28

 7

f.seek()

5、open() 详解

open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)

常用参数 file mode encoding
open() 将会返回一个 file 对象

file：'文件路径'

mode：对文件的操作方式，如下：

r w a 基本模式

t b + U与基本模式结合使用文本模式（默认）、二进制、读写模式、通用换行符

r     以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

rb    以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
r+    打开一个文件用于读写。文件指针将会放在文件的开头。
rb+   以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。

w     打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
wb    以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
w+    打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
wb+   以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。

a     打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
ab    以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。

a+    打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。

ab+   以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

buffering的可取值有0，1，>1三个，0代表buffer关闭（只适用于二进制模式），1代表line buffer（只适用于文本模式），>1表示初始化的buffer大小；

encoding表示的是返回的数据采用何种编码，一般采用utf8或者gbk；

errors的取值一般有strict，ignore，当取strict的时候，字符编码出现问题的时候，会报错，当取ignore的时候，编码出现问题，程序会忽略而过，继续执行下面的程序。

newline可以取的值有None, \n, \r, ”, ‘\r\n'，用于区分换行符，但是这个参数只对文本模式有效；

closefd的取值，是与传入的文件参数有关，默认情况下为True，传入的file参数为文件的文件名，取值为False的时候，file只能是文件描述符，什么是文件描述符，就是一个非负整数，在Unix内核的系统中，打开一个文件，便会返回一个文件描述符。

Python中file()与open()区别

两者都能够打开文件，对文件进行操作，也具有相似的用法和参数，但是，这两种文件打开方式有本质的区别：

file为文件类，用file()来打开文件，相当于这是在构造文件类

open()打开文件，是用python的内建函数来操作，建议使用open

6、使用with进行文件操作

with open() as f: 处理完自动关闭 f.close

with open('hello.txt','r+',encoding='utf-8') as f:

    with open('hello_new','w+',encoding='utf-8') as p:

        for lines in f.readlines():

            p.write(lines)

    print(p.closed)

print(f.closed)

#执行结果

True

True

码农公寓