当前位置：首页 > news >正文

python基础学习笔记第七章——文件操作

news 2026/3/26 15:32:34

一、文件的编码

1. 编码概念

编码是内容和二进制间相互转换的规则集合，由于计算机仅识别0和1，所以需通过编码将文本转二进制存储，也需编码将二进制转回可识别内容。

不同编码的转换规则不同，使用错误编码读写文件会导致内容乱码。

2. 常见编码

UTF-8：全球通用编码，推荐优先使用
GBK：主要用于中文简体环境
Big5：主要用于中文繁体环境

3. 查看文件编码

Windows系统可通过记事本打开文件，在底部状态栏查看编码格式。

二、文件的基本操作

1. 文件操作核心步骤

打开文件
读写/追加文件
关闭文件

（可仅打开并关闭文件，不执行读写操作）

2. 打开文件：`open()`函数

语法

open(name, mode, encoding)

name：文件路径（字符串，可含绝对/相对路径）
mode：文件打开模式（只读r、写入w、追加a）
encoding：编码格式（关键字参数，推荐UTF-8）

示例

# 以只读模式打开python.txt，编码为UTF-8 f = open('python.txt', 'r', encoding='UTF-8')

注意：f为文件对象，是Python特殊数据类型，后续通过该对象执行文件操作。

3. 常用打开模式

模式	描述
r	只读，文件指针在开头，默认模式；文件不存在则报错
w	只写，文件不存在则创建，文件存在则清空原有内容
a	追加，文件不存在则创建，新内容写在原有内容之后

三、文件的读取

1. 核心读取方法

（1）`read(num)`：读取指定字节数

num：可选，指定读取字节数；不指定则读取全部内容

f = open('python.txt', 'r', encoding='UTF-8') # 读取10个字节 content1 = f.read(10) # 读取剩余全部内容 content2 = f.read() f.close() print(content1, content2)

（2）`readline()`：一次读取一行内容

f = open('python.txt', 'r', encoding='UTF-8') # 读取第一行 line1 = f.readline() # 读取第二行 line2 = f.readline() f.close() print(f'第一行：{line1}') print(f'第二行：{line2}')

（3）`readlines()`：读取全部行，返回列表（每行是一个元素）

f = open('python.txt', 'r', encoding='UTF-8') # 得到列表，元素含换行符\n content = f.readlines() f.close() print(content) # 示例：['hello world\n', 'python\n', 'itheima\n']

（4）for循环读取：逐行读取，高效省内存

# 直接遍历文件对象，每次循环得到一行内容 for line in open('python.txt', 'r', encoding='UTF-8'): print(line)

2. 关闭文件：`close()`

释放文件占用，若不关闭，程序运行时文件会被Python持续占用。

f = open('python.txt', 'r', encoding='UTF-8') content = f.read() # 必须关闭文件 f.close()

3. 自动关闭：`with open`语法

无需手动调用close()，代码块执行完自动关闭文件，推荐使用！

f = open('python.txt', 'r', encoding='UTF-8') content = f.read() # 必须关闭文件 f.close()

4. 读取练习：单词计数

需求：读取word.txt，统计itheima出现的次数

word.txt内容：

itheima itcast python itheima python itcast beijing shanghai itheima shenzhen guangzhou itheima wuhan hangzhou itheima zhengzhou bigdata itheima

实现代码：

# 初始化计数器 count = 0 # 打开文件逐行读取 with open('word.txt', 'r', encoding='UTF-8') as f: for line in f: # 去除行尾换行符，按空格分割成单词列表 strip () 去首尾空白 split () 按符号切分数据 words = line.strip().split() # 遍历单词，统计itheima for word in words: if word == 'itheima': count += 1 print(f'itheima出现的次数：{count}') # 结果：6

四、文件的写入

1. 核心语法

使用w模式打开文件，通过write()写入内容，flush()刷新到硬盘（避免缓冲区积压）。

# 1. 以w模式打开文件（不存在则创建，存在则清空） f = open('python.txt', 'w', encoding='UTF-8') # 2. 写入内容（仅存于缓冲区，未真正写入文件） f.write('hello world\nI love Python') # 3. 刷新缓冲区，内容写入硬盘 f.flush() # 4. 关闭文件（close自带flush功能，可省略flush） f.close()

2. 简化写法（with open）

with open('python.txt', 'w', encoding='UTF-8') as f: f.write('hello world\nI love Python') # 自动close，自带flush，无需手动操作

3. 注意事项

w模式下，文件不存在自动创建，文件存在清空原有内容
写入的内容必须是字符串，数字需先通过str()转换

五、文件的追加

1. 核心语法

使用a模式打开文件，写入方法与w模式一致，新内容追加在文件末尾。

# 以a模式打开文件（不存在则创建，存在则追加） with open('python.txt', 'a', encoding='UTF-8') as f: # 追加内容，\n实现换行 f.write('\n这是追加的内容')

2. 注意事项

a模式下，文件指针默认在文件末尾，始终追加写入
可通过\n实现换行追加，避免内容连在一起
同样支持write()和flush()，close()自带flush功能

六、文件操作综合案例：账单备份与数据过滤

1. 需求

读取bill.txt账单文件
备份文件到bill.txt.bak
过滤掉标记为测试的行，仅保留正式行写入备份文件

2. bill.txt原始内容

name,date,money,type,remarks 周杰轮,2022-01-01,100000,消费,正式 周杰轮,2022-01-02,300000,收入,正式 周杰轮,2022-01-03,100000,消费,测试 林俊节,2022-01-01,300000,收入,正式 林俊节,2022-01-02,100000,消费,测试 林俊节,2022-01-03,100000,消费,正式 林俊节,2022-01-04,100000,消费,测试 林俊节,2022-01-05,500000,收入,正式 张学油,2022-01-01,100000,消费,正式 张学油,2022-01-02,500000,收入,正式 张学油,2022-01-03,900000,收入,测试 王力鸿,2022-01-01,500000,消费,正式 王力鸿,2022-01-02,300000,消费,测试 王力鸿,2022-01-03,950000,收入,正式 刘德滑,2022-01-01,300000,消费,测试 刘德滑,2022-01-02,100000,消费,正式 刘德滑,2022-01-03,300000,消费,正式

3. 实现代码

# 打开原文件（读）和备份文件（写），同时操作 with open('bill.txt', 'r', encoding='UTF-8') as f_read, open('bill.txt.bak', 'w', encoding='UTF-8') as f_write: # 逐行读取原文件 for line in f_read: # 去除行尾换行符，按逗号分割 line_list = line.strip().split(',') # 判断是否为测试行（最后一列是remarks） if line_list[-1] == '测试': # 跳过测试行 continue # 正式行，写入备份文件（保留原换行符） f_write.write(line) print('账单备份并过滤完成，备份文件：bill.txt.bak')