当前位置: 首页 > news >正文

python基础学习笔记第七章——文件操作

一、文件的编码

1. 编码概念

编码是内容和二进制间相互转换的规则集合,由于计算机仅识别0和1,所以需通过编码将文本转二进制存储,也需编码将二进制转回可识别内容。

不同编码的转换规则不同,使用错误编码读写文件会导致内容乱码。

2. 常见编码

  • UTF-8:全球通用编码,推荐优先使用

  • GBK:主要用于中文简体环境

  • Big5:主要用于中文繁体环境

3. 查看文件编码

Windows系统可通过记事本打开文件,在底部状态栏查看编码格式。

二、文件的基本操作

1. 文件操作核心步骤

  1. 打开文件

  2. 读写/追加文件

  3. 关闭文件

(可仅打开并关闭文件,不执行读写操作)

2. 打开文件:open()函数

语法
open(name, mode, encoding)
  • name:文件路径(字符串,可含绝对/相对路径)

  • mode:文件打开模式(只读r、写入w、追加a

  • encoding:编码格式(关键字参数,推荐UTF-8

示例
# 以只读模式打开python.txt,编码为UTF-8 f = open('python.txt', 'r', encoding='UTF-8')

注意f为文件对象,是Python特殊数据类型,后续通过该对象执行文件操作。

3. 常用打开模式

模式

描述

r

只读,文件指针在开头,默认模式;文件不存在则报错

w

只写,文件不存在则创建,文件存在则清空原有内容

a

追加,文件不存在则创建,新内容写在原有内容之后

三、文件的读取

1. 核心读取方法

(1)read(num):读取指定字节数
  • num:可选,指定读取字节数;不指定则读取全部内容

f = open('python.txt', 'r', encoding='UTF-8') # 读取10个字节 content1 = f.read(10) # 读取剩余全部内容 content2 = f.read() f.close() print(content1, content2)
(2)readline():一次读取一行内容
f = open('python.txt', 'r', encoding='UTF-8') # 读取第一行 line1 = f.readline() # 读取第二行 line2 = f.readline() f.close() print(f'第一行:{line1}') print(f'第二行:{line2}')
(3)readlines():读取全部行,返回列表(每行是一个元素)
f = open('python.txt', 'r', encoding='UTF-8') # 得到列表,元素含换行符\n content = f.readlines() f.close() print(content) # 示例:['hello world\n', 'python\n', 'itheima\n']
(4)for循环读取:逐行读取,高效省内存
# 直接遍历文件对象,每次循环得到一行内容 for line in open('python.txt', 'r', encoding='UTF-8'): print(line)

2. 关闭文件:close()

释放文件占用,若不关闭,程序运行时文件会被Python持续占用。

f = open('python.txt', 'r', encoding='UTF-8') content = f.read() # 必须关闭文件 f.close()

3. 自动关闭:with open语法

无需手动调用close(),代码块执行完自动关闭文件,推荐使用!

f = open('python.txt', 'r', encoding='UTF-8') content = f.read() # 必须关闭文件 f.close()

4. 读取练习:单词计数

需求:读取word.txt,统计itheima出现的次数

word.txt内容

itheima itcast python itheima python itcast beijing shanghai itheima shenzhen guangzhou itheima wuhan hangzhou itheima zhengzhou bigdata itheima

实现代码

# 初始化计数器 count = 0 # 打开文件逐行读取 with open('word.txt', 'r', encoding='UTF-8') as f: for line in f: # 去除行尾换行符,按空格分割成单词列表 strip () 去首尾空白 split () 按符号切分数据 words = line.strip().split() # 遍历单词,统计itheima for word in words: if word == 'itheima': count += 1 print(f'itheima出现的次数:{count}') # 结果:6

四、文件的写入

1. 核心语法

使用w模式打开文件,通过write()写入内容,flush()刷新到硬盘(避免缓冲区积压)。

# 1. 以w模式打开文件(不存在则创建,存在则清空) f = open('python.txt', 'w', encoding='UTF-8') # 2. 写入内容(仅存于缓冲区,未真正写入文件) f.write('hello world\nI love Python') # 3. 刷新缓冲区,内容写入硬盘 f.flush() # 4. 关闭文件(close自带flush功能,可省略flush) f.close()

2. 简化写法(with open)

with open('python.txt', 'w', encoding='UTF-8') as f: f.write('hello world\nI love Python') # 自动close,自带flush,无需手动操作

3. 注意事项

  • w模式下,文件不存在自动创建,文件存在清空原有内容

  • 写入的内容必须是字符串,数字需先通过str()转换

五、文件的追加

1. 核心语法

使用a模式打开文件,写入方法与w模式一致,新内容追加在文件末尾。

# 以a模式打开文件(不存在则创建,存在则追加) with open('python.txt', 'a', encoding='UTF-8') as f: # 追加内容,\n实现换行 f.write('\n这是追加的内容')

2. 注意事项

  • a模式下,文件指针默认在文件末尾,始终追加写入

  • 可通过\n实现换行追加,避免内容连在一起

  • 同样支持write()flush()close()自带flush功能

六、文件操作综合案例:账单备份与数据过滤

1. 需求

  • 读取bill.txt账单文件

  • 备份文件到bill.txt.bak

  • 过滤掉标记为测试的行,仅保留正式行写入备份文件

2. bill.txt原始内容

name,date,money,type,remarks 周杰轮,2022-01-01,100000,消费,正式 周杰轮,2022-01-02,300000,收入,正式 周杰轮,2022-01-03,100000,消费,测试 林俊节,2022-01-01,300000,收入,正式 林俊节,2022-01-02,100000,消费,测试 林俊节,2022-01-03,100000,消费,正式 林俊节,2022-01-04,100000,消费,测试 林俊节,2022-01-05,500000,收入,正式 张学油,2022-01-01,100000,消费,正式 张学油,2022-01-02,500000,收入,正式 张学油,2022-01-03,900000,收入,测试 王力鸿,2022-01-01,500000,消费,正式 王力鸿,2022-01-02,300000,消费,测试 王力鸿,2022-01-03,950000,收入,正式 刘德滑,2022-01-01,300000,消费,测试 刘德滑,2022-01-02,100000,消费,正式 刘德滑,2022-01-03,300000,消费,正式

3. 实现代码

# 打开原文件(读)和备份文件(写),同时操作 with open('bill.txt', 'r', encoding='UTF-8') as f_read, open('bill.txt.bak', 'w', encoding='UTF-8') as f_write: # 逐行读取原文件 for line in f_read: # 去除行尾换行符,按逗号分割 line_list = line.strip().split(',') # 判断是否为测试行(最后一列是remarks) if line_list[-1] == '测试': # 跳过测试行 continue # 正式行,写入备份文件(保留原换行符) f_write.write(line) print('账单备份并过滤完成,备份文件:bill.txt.bak')

七、核心知识点总结

  1. 编码优先使用UTF-8,避免文件乱码;

  2. 文件操作三步骤:打开→操作→关闭,推荐with open自动关闭;

  3. 三种核心模式:r(读)、w(写,清空)、a(追加);

  4. 读取方法:read()readline()readlines()、for循环(推荐);

  5. 写入/追加:write()写入内容,flush()刷新硬盘,close()自带flush;

  6. wa模式:文件不存在自动创建,w清空原有内容,a追加末尾。

http://www.jsqmd.com/news/510216/

相关文章:

  • 终极指南:如何用Jekyll Now打造一致的品牌配色方案
  • Dify工作流实战:如何用Qwen-Image插件打造个性化AI绘画工具(附提示词优化技巧)
  • Silero Models深度解析:如何用一行代码实现高质量语音合成与识别
  • 解决scikit-image中SSIM计算报错:win_size和channel_axis参数的正确用法
  • GCC 12+高阶防护配置全解析,深度解读-mllvm + 自定义Pass链如何让IDA Pro 8.3静态分析成功率暴跌至17%
  • GME-Qwen2-VL-2B-Instruct效果体验:AI编程助手如何理解代码截图并给出建议
  • 微信小程序分页优化实战:z-paging下拉刷新+上拉加载的5个性能提升技巧
  • Lychee-Rerank-MM实操手册:A/B测试框架集成与重排序效果归因分析
  • 无人机集群编队避障实战:Stress Matrix在仿射变换控制中的关键作用与避坑指南
  • 别再让ChatGPT瞎写了!8个拿来即用的SCI论文润色提示词(附避坑指南)
  • gazebo 中通过ppo 进行机械臂轨迹规划
  • Qwen2.5-VL-7B-Instruct快速上手:Streamlit轻量界面+对话历史管理教程
  • 文脉定序系统与卷积神经网络结合:多模态信息重排序初探
  • 终极Rails Girls Guides Web性能优化指南:提升Core Web Vitals的7个实用技巧
  • 代码产出“暴涨3倍”后,噩梦开始:凌晨2点线上出Bug,却没一个人能解释
  • Silero-Models与容器编排:构建现代化语音AI服务网格的终极指南
  • 【OpenClaw 全面解析:从零到精通】第008篇:龙虾如何思考——OpenClaw Agent 智能体循环机制深度解析
  • 漫画脸描述生成代码实例:Python调用Ollama接口定制化角色生成流程
  • Qwen3-32B-Chat实战落地:为电商客服系统注入中文语义理解能力的私有化方案
  • Nanbeige 4.1-3B多场景落地:游戏社区、编程教学、创意写作实战
  • 3步安全编辑Windows注册表:PowerToys Registry Preview完全指南
  • DAMOYOLO-S模型导出与部署全流程:从PyTorch到ONNX再到TensorRT加速
  • Visual Studio Build Tools终极指南:从PyQt5安装失败到完美解决的全过程记录
  • FireRed-OCR Studio惊艳效果:化学分子式+反应方程式LaTeX精准输出
  • 如何利用SwinIR实现社会活动污染监测的智能图像分析
  • 圣女司幼幽-造相Z-Turbo部署审计:SELinux/AppArmor安全策略配置最佳实践
  • 2026年实测:Genmini 3.0使用AI联网搜索功能全攻略
  • 【20年身份架构老兵亲授】:MCP+OAuth 2026混合认证落地——4类遗留系统改造清单(含Spring Security 6.4+Keycloak 25适配代码片段)
  • AWS CDK Examples 迁移策略:从传统架构到云原生平台的完整指南
  • 新手必看:PyTorch通用开发镜像手把手教学,从安装到运行