当前位置: 首页 > news >正文

数据处理 常用库

Python 进阶:数据处理 + 常用库(精简实用版)

一、内置标准库(不用安装,直接用)

1. 数据序列化

  • json:读写JSON、字典转字符串、格式化输出
    常用:json.dumps() / json.loads() / json.dump() / json.load()

2. 表格文本处理

  • csv:读写CSV表格,批量导入导出Excel格式数据
  • configparser:读写ini配置文件

3. 时间日期

  • datetime / time:时间获取、格式化、时间戳转换、日期计算
  • calendar:日历、月份星期判断

4. 路径与文件

  • os:创建文件夹、遍历文件、执行系统命令、路径拼接
  • pathlib:现代面向对象路径写法,比os更简洁好用
  • shutil:文件复制、移动、删除、整文件夹拷贝

5. 正则匹配

  • re:正则表达式,匹配、提取、替换、模糊筛选文本

6. 编码与加密

  • base64:Base64编解码
  • hashlib:MD5、SHA加密,常用于密码摘要

二、第三方必备数据处理库(需pip安装)

1. 数据分析核心

  • numpy:数值计算、数组、矩阵运算、高性能数学计算
  • pandas:万能表格处理,Excel/CSV/数据库读写、筛选、分组、聚合、合并透视

2. 可视化绘图

  • matplotlib:基础折线/柱状/饼图,自定义图表
  • seaborn:统计高颜值绘图,热力图、分布图
  • pyecharts:交互式大屏图表,网页可展示

3. Excel/Word/PPT 办公数据处理

  • openpyxl:读写编辑Excel xlsx
  • pandas+openpyxl:批量处理报表最强组合
  • python-docx:操作Word文档
  • python-pptx:操作PPT

4. 数据采集解析

  • requests:网络请求,爬取网页接口数据
  • beautifulsoup4:网页HTML解析取数据
  • lxml:XPath解析,解析速度更快

5. 数据库交互

  • pymysql:操作MySQL
  • sqlite3:内置轻量数据库,无需安装
  • pandas+数据库:一键把Excel数据导入数据库

三、常用场景速配

  1. 普通文本/配置:json + csv + re
  2. 批量Excel报表:pandas + openpyxl
  3. 数值计算、大数据数组:numpy
  4. 画图做报表:matplotlib + pyecharts
  5. 爬取网页拿数据:requests + bs4 + lxml
  6. 时间日期处理:datetime
http://www.jsqmd.com/news/743782/

相关文章:

  • 告别手动画封装!Samacsys Library Loader + Allegro 17.4 实战:5分钟导入一个带3D模型的芯片
  • BetterJoy终极指南:5分钟解锁Switch手柄PC游戏全功能
  • 别再死记硬背了!用这3个真实案例,带你彻底搞懂软件测试的‘边界值分析’
  • 魔兽争霸3终极优化指南:3分钟安装WarcraftHelper插件提升游戏体验
  • 如何快速为数千首离线音乐添加同步歌词:LRCGET批量歌词下载工具完整指南
  • 别再只写CRUD了!用Spring Boot + Redis实战医疗PACS系统中的‘云胶片’与报告管理功能
  • Mac终极NTFS读写解决方案:Free-NTFS-for-Mac免费开源工具完整指南
  • LinkSwift:告别网盘下载烦恼,八大平台一键获取真实链接
  • 三步让Mac音质飞跃:免费开源音频均衡器eqMac完整指南
  • 2026佛山鼎钻不锈钢一站式定制服务产业研究 - 博客万
  • Firecrawl:基于API的网页结构化数据提取工具实战指南
  • 用这块125x85mm的RK3588S小板,我轻松搞定了三屏异显的智能终端原型
  • 初创公司如何借助 Taotoken 低成本快速验证 AI 产品创意
  • 给嵌入式工程师的ISP图像处理入门:从Bayer到YUV,手把手拆解MTK流程
  • PowerBI动态日期筛选:别再手动切片了,用DAX公式实现智能滚动分析(附3个实战案例)
  • 数据中心网络不丢包的秘密:手把手配置华为/新华三交换机的PFC与ECN
  • SoC验证实战:当你的CPU LOG不打印了,别慌!手把手教你定位那些‘挂死’的仿真Case
  • cti-skills:为AI智能体赋能的网络威胁情报技能包实战指南
  • ESP32-C6 RISC-V微控制器实现PSA Level 2安全认证解析
  • 构建虚拟输入层:vJoy内核驱动技术深度解析
  • VS2015+QT5.12.10环境搭建保姆级避坑指南(解决头文件、NMAKE、PDB报错)
  • LRCGET:批量下载同步歌词的高效解决方案
  • 星露谷物语模组加载器SMAPI:新手必看的完整安装与使用指南
  • 魔兽争霸3终极优化指南:5分钟解锁经典游戏全部潜力
  • FDA 2026倒计时18个月!医疗设备厂商紧急启动的C代码合规审计清单(含自动化脚本+Traceability Matrix生成器)
  • 3分钟上手:RePKG - 解锁Wallpaper Engine壁纸资源的终极指南
  • 终极指南:如何安全备份与管理Switch NAND系统
  • AI专著生成神器大揭秘!一键产出20万字专著,配套框架+低查重率搞定
  • XHS-Downloader:基于Python的小红书内容采集与自动化下载解决方案
  • Python处理中文文件报错?UnicodeDecodeError的3个实战解法(附GBK/GB2312编码示例)