day12 文件处理1

目录

基本的文件处理

什么是文件

  • 文件是操作系统提供的虚拟的单位,有了文件我们可以读取数据,没有文件的话应该去硬盘上扣动机械手臂然后寻找数据.

如何使用文件

  1. 打开文件()
  2. 读写数据
  3. 保存
  4. 关闭文件

使用Python写一个小程序控制文件

open(打开文件)

  • 格式:open('文件名', mode='模式', encoding='编码格式')
  • 模式默认为r,编码格式默认为读取软件的编码格式
  • 如果在txt中写编码格式则为gbk,在Pycharm或者Python中写则为utf-8, word编码格式不是gbk也不是utf-8,不懂可以参考上一篇文章
fr = open('test1.txt', mode='r', encoding='utf-8')

read:

  • 默认一次性全部读取,里面的参数可以设置从第几个字符开始看,按字符算,其他都是按字节算

  • 读取完了后,再进行读取,则为空

data = fr.read()       # 用data去接收返回值,也就是文本的内容
print(data)            # 输出文本内容

readline:一次性读取一行

  • 一次性读取一行,会读取\n
  • 如果读完所有数据,继续读取为空
print(fr.readline())

del:删除

  • 只是删除了变量名,但是文件对于操作系统来讲,还是打开状态的
del fr

close:关闭

  • 不仅删除了变量名fr,而且也关闭了文件,这个时候文件对于操作系统来说是关闭状态的
fr.close()
  • 打开文件时操作的是硬盘和内存
  • 而Python3只是软件,无法操控硬件,所以也是由操作系统在进行交互
  • 所以当你用del删除变量名时,只是删除了变量名的内存占用,并没有让操作系统关闭文件

write(写入)

  • 会清空当前文件的内容,再写
fw = open('test1.txt', mode='w', encoding='utf-8')
fw.write('12345')

flush 快速刷入硬盘

提高写入优先级,写完write习惯性加一个flush

绝对路径

  • 文件在电脑上的路径
fr = opne(‪'C:\Users\Y\Desktop\123.txt', mode = 'r', encoding = 'utf-8')

相对路径

  • 文件相对于工作文件夹的路径

  • 注意打开的文件夹和运行的py文件需要是同文件夹下的,不然需要修改相对路径的一些信息

文件的三种打开方式

mode = 'r' , 只读, 默认模式

fr = open('test.txt', mode = 'r', encoding = 'utf-8')  # 默认r,和rt相同

mode = 'w' , 只写,会清空之前的内容

fw = open('test.txt', mode = 'w', encoding = 'utf-8') 

mode = 'a' , 追加,在后面追加写入文件

fa = open('test.txt', mode = 'a', encoding = 'utf-8') 

mode = 'rt' , 打开的text文本类型

  • 和r相同
fr = open('test.txt', mode = 'rt', encoding = 'utf-8') 

mode = 'rb' ,打开的bytes类型,(二进制)

frb = open('test.txt', mode = 'rb', encoding = 'utf-8') 

'wt', 'at'和'w', 'a'相同,而'wb', 'ab'用不上,你不会写二进制

在字符串前面加r,告诉接下来的字符串,里面所有特殊字符(如\)都毫无意义
在字符串前面加b,是告诉print字符串里面是二进制数,不要再用终端的编码进行编译了,原生打印就可以了

with open()

  • 比open()好用,会自动关闭,不需要写close
  • 里面的写法和open一样,只是变量名用as写到后面,下面的内容要缩进
with open('test.txt', mode='r', encoding='utf-8') as 变量名:

文件高级应用

  • r+:可读可写,会替换写

  • w+:可读可写,但是会清空写)

  • a+:可读可写,追加写

  • 以上三种方式不推荐使用,可以先读再写,没必要同时

指针

  • 需要有一个文件,并且打开,指针就是光标所处的位置
  • 不推荐使用
with open('test.txt', mode='r+', encoding='utf-8') as fr:
    fr.seek(3)            # 三个字节
    fr.write('123')
    fr.flush()

原文件: 999999

修改后:999123

  • 文件的写没有插入一说,只有替换,覆盖

  • 而电脑word或者txt文本中的可以直接插入其实是

  • 一个中文是3个字节,一个英文是1个字节,一般都是字节,只有read中是字符

seek(a,b)

  • a是指针移动的字节数

  • b如果是0是文件开头,1是指针当前位置,2是末尾,但如果要1或者2,那么只能使用2进制

tell

  • 告诉光标当前的位置

read

  • read中有一个参数,是光标移动的字符个数,只有这次用的是字符

truncate

  • 清空文本,如果有参数,则光标会跳到指定字节数后,然后把后面的文件全部清空,无视之前用seek移动的光标位置

文件的拷贝

  • 修改文件时,为了防止两个应用程序同事修改同一份文件,而导致报错,因为你书写是一个修改的过程,而当第一个程序修改了一个字符后,如果第二个程序也要修改这个字符,那么就会报错
  • 为了避免这种情况,会在修改时新建一个拷贝文件,然后都在拷贝文件中进行修改,最后删掉原有的,把拷贝后的文件改名放进去

文件修改的过程(示例)

# 把文件读出来,替换内容
with open('test.txt', mode='r', encoding='utf-8') as fr:
    data = fr.read()
    data = data.replace('a', 'b')

# 另外用一个文件,写入替换后的内容    
with open('test_swap.txt', mode='w', encoding='utf-8') as fw:
    fw.write(data)


# 用os模块删除test文件,再把test_swap文件改名成test
import os

os.remove('test.txt')
os.rename('test_swap.txt', 'test.txt')
# 简便版
# 把文件读出来,替换内容,再写入一个文件中
with open('test.txt', mode='r', encoding='utf-8') as fr,\
        open('test_swap.txt', mode='w', encoding='utf-8') as fw:
    data = fr.read()
    data = data.replace('a', 'b')
    fw.write(data)


# 用os模块删除test文件,再把test_swap文件改名成test
import os

os.remove('test.txt')
os.rename('test_swap.txt', 'test.txt')

for循环

with open('test.txt', mode='r', encoding='utf-8') as fr:
    # 两种方式结果一样,尽量用第二种,省内存
    for i in fr.read():
        print(i)
    
    for i in fr:  
        print(o)
  • 后续补充
上一篇:day12【Object类、常用API】


下一篇:Java学习总结day12(对象流 & 容器)