当前位置: 首页 > news >正文

Python 读取 txt 文件的全攻略

Python 读取 txt 文件是最基础的文件操作之一,核心通过内置的open()函数实现,配合不同的读取方法可适配小文件、大文件、按行读取、按字节读取等不同场景。本文从基础到进阶,结合实例讲解所有常用方法。

一、核心基础:open()函数与文件打开模式

1.open()函数的基本参数

python

open(file, mode='r', encoding=None)
参数说明
file文件路径(相对路径:相对于当前 Python 脚本的路径;绝对路径:完整路径)
mode打开模式(默认r,只读模式),常用模式见下表
encoding文件编码格式(推荐显式指定,如utf-8gbk,避免乱码)

2. 常用文件打开模式

模式作用
r只读模式(默认),文件不存在则报错
r+读写模式,文件不存在则报错
rb二进制只读模式(用于非文本文件,如图片、视频,无需指定 encoding)
a追加模式,文件不存在则创建
w写入模式,文件不存在则创建,存在则清空原有内容

3. 关键:使用with语句(推荐)

with语句会自动关闭文件,避免因忘记调用close()导致的资源泄漏,是 Python 读取文件的最佳实践。

python

# 基本结构 with open("test.txt", "r", encoding="utf-8") as f: # 读取文件的操作 content = f.read()

二、常用读取方法(按场景分类)

先准备一个测试文件test.txt,内容如下:

plaintext

Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 1:小文件 → 一次性读取整个文件(read()

适合文件体积小(几 KB~ 几十 KB),需要一次性获取所有内容的场景。

python

# 读取整个文件 with open("test.txt", "r", encoding="utf-8") as f: content = f.read() # 返回字符串,包含所有内容(包括换行符\n) print("文件全部内容:") print(content)

输出结果

plaintext

文件全部内容: Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 2:中等文件 → 读取所有行到列表(readlines()

将文件的每一行作为列表的一个元素,方便后续通过索引、切片处理行数据。

python

with open("test.txt", "r", encoding="utf-8") as f: lines = f.readlines() # 返回列表,每个元素是一行内容(包含换行符\n) print("文件的行列表:", lines) print("第2行内容:", lines[1].strip()) # strip()去掉换行符和首尾空格

输出结果

plaintext

文件的行列表: ['Python读取txt文件\n', '这是第2行内容\n', 'Hello World!\n', '这是最后一行'] 第2行内容: 这是第2行内容

场景 3:任意文件 → 逐行读取(for循环遍历文件对象,推荐)

这是最高效、最内存友好的方式,逐行读取,不一次性加载整个文件,适合所有场景(尤其是大文件)。

python

with open("test.txt", "r", encoding="utf-8") as f: print("逐行读取文件:") for line in f: # 直接遍历文件对象,每次返回一行 print(line.strip()) # strip()去除换行符和多余空格

输出结果

plaintext

逐行读取文件: Python读取txt文件 这是第2行内容 Hello World! 这是最后一行

场景 4:精准控制 → 按字节 / 字符读取(read(n)

read(n)可指定读取的字符数(文本模式)或字节数(二进制模式),适合需要分段读取的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: content1 = f.read(6) # 读取前6个字符 print("前6个字符:", content1) content2 = f.read(3) # 从当前位置继续读取3个字符 print("后续3个字符:", content2)

输出结果

plaintext

前6个字符:Python 后续3个字符:读取t

场景 5:逐行读取(readline()

每次调用readline()读取一行,直到返回空字符串(文件结束),适合需要手动控制读取进度的场景。

python

with open("test.txt", "r", encoding="utf-8") as f: line1 = f.readline() # 读取第一行 line2 = f.readline() # 读取第二行 print("第一行:", line1.strip()) print("第二行:", line2.strip())

输出结果

plaintext

第一行:Python读取txt文件 第二行:这是第2行内容

三、进阶场景处理

1. 处理大文件(GB 级)

大文件的核心是逐行读取(避免一次性加载到内存),使用for循环遍历文件对象即可:

python

# 读取GB级大文件,逐行处理 with open("big_file.txt", "r", encoding="utf-8") as f: for line in f: # 处理每一行(如统计行数、提取关键信息) pass

2. 处理不同编码的 txt 文件

Windows 系统下的 txt 文件常使用gbk/gb2312编码,Linux/Mac 下多为utf-8,若编码不匹配会报UnicodeDecodeError,需显式指定编码:

python

# 读取GBK编码的文件 with open("gbk_file.txt", "r", encoding="gbk") as f: content = f.read() print(content) # 读取带BOM的UTF-8文件(Windows记事本保存的UTF-8文件常带BOM) with open("utf8_bom_file.txt", "r", encoding="utf-8-sig") as f: content = f.read() print(content)

3. 二进制模式读取(rb

用于读取非文本文件(如图片、视频),或需要处理字节数据的场景:

python

with open("test.txt", "rb") as f: content = f.read() # 返回字节串(bytes) print("二进制内容:", content) # 转换为字符串(需指定编码) print("转换为字符串:", content.decode("utf-8"))

四、常见问题与解决方法

问题 1:FileNotFoundError(文件不存在)

  • 解决:检查文件路径是否正确(相对路径是否相对于当前脚本,绝对路径是否完整)。

问题 2:UnicodeDecodeError(编码错误)

  • 解决:显式指定正确的编码(如utf-8gbkutf-8-sig)。

问题 3:读取的内容有多余的换行符 / 空格

  • 解决:使用strip()(去除首尾空格和换行符)、rstrip("\n")(仅去除换行符)。

问题 4:文件权限不足(PermissionError

  • 解决:检查文件的读写权限,确保当前用户有读取权限。

五、总结:方法选择建议

场景推荐方法优点
小文件(<100KB)read()一次性读取简单快捷
中等文件(100KB~1MB)readlines()读取到列表方便后续行处理
大文件(>1MB)for循环遍历文件对象(逐行读取)内存友好、效率高
精准分段读取read(n)灵活控制读取量

核心原则:优先使用with语句,避免资源泄漏;大文件必用逐行读取,避免内存溢出。掌握这些方法,就能处理所有 txt 文件的读取需求。

http://www.jsqmd.com/news/129629/

相关文章:

  • 收藏必备!AI企业应用深度解析:大模型从试点到规模化,如何重塑企业未来
  • 2025年比较好的金属反弹骑马抽最新TOP品牌厂家排行 - 品牌宣传支持者
  • 为什么我越来越警惕“直接用大模型做决策” 一个偏系统工程视角的反思
  • 探索大数据领域 Eureka 的服务限流机制
  • 【Open-AutoGLM 高阶应用秘籍】:如何让AI自主完成复杂电脑任务?
  • 企业建站必看:什么是网站模板?为什么是最佳性价比方案?
  • 敦化市鼻炎调理哪家好?曹丹诊所为您提供专业中医解决方案 - 品牌日记
  • 88%企业选择长期合作黑蚁文创的6大理由
  • 2025年评价好的景区亮化工程/道路景观亮化工程品牌实力榜 - 品牌宣传支持者
  • 从DeepSeek看AI产业跃迁:大模型时代的技术变革与实战应用
  • 【AutoGLM插件应用秘籍】:掌握这7个技巧,轻松驾驭智谱清言AI生态
  • Vibe Coding了一个 X / Twitter 推文收藏网站
  • 职业发展规划:基于行业趋势的个性化成长路径建议
  • 【Open-AutoGLM 2.0核心原理揭秘】:深度解析下一代自动化大模型推理引擎
  • 【稀缺资源】Open-AutoGLM内部架构首曝光:掌握AI协同训练核心逻辑
  • 【Open-AutoGLM本地部署终极指南】:手把手教你从零搭建AI推理环境
  • GESP认证C++编程真题解析 | P10111 [GESP202312 七级] 纸牌游戏
  • 2025初中数学家教五大机构权威评测,目标中考高分的初中数学家教 - 速递信息
  • 开源AI神器Open-AutoGLM发布(AutoGLM技术内幕首次公开)
  • 如何在macOS上高效运行Open-AutoGLM?资深AI工程师的7条实战建议
  • 孩子王闯关港股:背水一战
  • Open-AutoGLM评分全网最高(三大核心指标领先第二名30%)
  • 企业级知识管理平台如何用anything-llm镜像实现?
  • 2025国内最新补血营养剂品牌TOP5评测!中华老字号与现代科技融合,国内优质厂家权威榜单发布 - 全局中转站
  • 智能测试用例生成:是效率革命,还是维护噩梦?
  • Spring 事务失效
  • 亲测!优质服务器数据恢复中心实践分享
  • 2025年质量好的胶木球厂家推荐及选购指南 - 品牌宣传支持者
  • 2025年知名的钢珠轨/反弹钢珠轨厂家最新热销排行 - 品牌宣传支持者
  • 2025年12月欧洲名义雇主eor人力解决方案,全球灵活用工名义雇主eor方案,名义雇主eor公司推荐:行业测评与选择指南 - 品牌鉴赏师