任务描述
我们现在生活在信息爆炸的时代,计算机中文本文件可存储的数据量多得难以置信,我们可以把各种信息都存储在文本文件中。每当我们需要利用程序去修改或分析存储在文本文件中的信息时,就必须先正确地读取文件。
要用 Python 程序去修改或分析文本文件中的信息,首先需要将文本文件中的信息读取到内存中。我们既可以将文本文件中的内容一次性读取,也可以按每次一行的方法逐行读取。
本关的目标就是让学习者了解并掌握利用 Python 工具从文件中读取数据的相关知识。
相关知识
读取整个文件
一般我们读取的文件和编写的 Python 文件位于同一目录下,例如在当前目录下我们已经创建了要处理的文件 test.txt ,里面包含的内容为:
Hello,world!
Hello,Python!
Hello,my brothers.
我们运行在同一目录下的 Python 文件 test.py ,代码如下:
with open('test.txt') as file_object:
contents = file_object.read()
print(contents)
程序运行结果:
Hello,world!
Hello,Python!
Hello,my brothers.
test.py 文件中的第一行代码中有函数open()
,用于打开文件,这是我们处理文件的第一步。函数open()
中的参数'test.txt'
就是要打开的文件。函数open()
返回的是打开文件的对象,第一行代码就是把文本文件 test.txt 打开,并将其对象保存在file_object
变量中。
关键字with
的功能是在不再需要访问文件后自动将文件关闭。所以我们在这里只是open()
打开了文件,但是没有加入close()
代码关闭文件,因为 Python 会在处理文件之后自动将文件关闭。
test.py 文件中的第二行代码是使用read()
方法读取文本文件 test.txt 的全部内容,并将内容保存在字符串变量contents
中,然后通过print()
将结果都输出。
如果我们要处理的文本文件和 Python 程序文件不在同一目录下,那么我们就要在open()
函数中传入文本文件的绝对路径。
逐行读取
我们也可以将文本文件中的数据进行逐行读取,我们要处理的文本文件还是上面的 test.txt ,这时我们可以逐行将 test.txt 的内容输出,代码如下:
with open('test.txt') as file_object:
for line in file_object:
print(line)
输出结果:
Hello,world!
Hello,Python!
Hello,my brothers.
我们会发现输出结果中每一行内容后面都多了一个空行,这时因为在文件中每一行的末尾都会有一个换行符,而每条print()
语句也会加上一个换行符,所以每行末尾都有两个换行符,所以输出之后就会多一个空行。
我们可以采取rstrip()
方法消除空行,代码如下:
with open('test.txt') as file_object:
for line in file_object:
print(line.rstrip())
这时输出的结果中就没有多余的空行了:
Hello,world!
Hello,Python!
Hello,my brothers.
创建一个包含文件各行内容的列表
在上文中,函数open()
返回的对象只在with
代码块内可用,但是我们想在with
代码块之外的位置使用,这就需要在with
代码块内创建一个包含文本文件 test.txt 各行内容的列表。例如:
with open('test.txt') as file_object:
lines = file_object.readlines()
上述代码中readlines()
方法就是从文本文件 test.txt 中依次读取每一行,并保存在lines
列表中。
如果您想了解更多有关读取文本文件信息的相关知识,请参考: 【美】Eric Matthes 著《 Python 编程——从入门到实践》第十章 。
编程要求
本关的编程任务是补全 src/Step1/test1.py 文件的代码,实现相应的功能。具体要求如下:
-
补充代码,功能是输出文本文件 test.txt 的前
n
行信息,文本文件 test.txt 和测试代码在同一目录下,n
由输入指定; -
要求:输出的前
n
行信息中间不能有空行。
本关涉及的代码文件 src/Step1/test1.py 的代码框架如下:
#coding=utf-8
#输入n
n = int(input())
with open('src/Step1/test.txt') as file_object:
lines = file_object.readlines()
# 请在此添加代码,实现编程要求
#********** Begin *********#
#********** End **********#
测试说明
本关的测试文件是 src/Step1/test1.py ,测试过程如下:
-
平台自动编译生成 test1.exe ;
-
平台运行 test1.exe ,并以标准输入方式提供测试输入;
-
平台获取 test1.exe 输出,并将其输出与预期输出对比。如果一致则测试通过,否则测试失败。
以下是平台对 src/Step1/test1.py 的样例测试集:
测试输入: 1
预期输出: Hello,world!
测试输入: 2
预期输出: Hello,world!
Hello,Python!
测试输入: 3
预期输出: Hello,world!
Hello,Python!
Hello,my brothers.
开始你的任务吧,祝你成功!
s = input() # 新定义变量
with open('src/Step2/test2.txt','w') as example: # 将文件打开,并命名为example
example.write(s) # 把文件以字符串的形式写入s中
with open('src/Step2/test2.txt') as file_object:
lines = file_object.readlines() # 从文件中读入所有行,以每行为元素形成一个列表
for line in lines: # 遍历lines列表
print(line.rstrip()) # 删除string字符末尾的指定字符,逐行输出lines