当前位置: 首页 > news >正文

Python Pandas学习

一、先搞懂:Pandas 是什么?

Pandas = Python 里的Excel / 数据库表格用来做:

  • 读取 Excel / CSV / 数据库数据
  • 筛选、过滤、查找数据
  • 计算、统计、汇总
  • 清洗、去重、缺失值处理
  • 数据导出

两个核心概念

  1. DataFrame(DF):整张表格(多行多列)
  2. Series:单列数据

二、安装 + 导入

pip install pandas
import pandas as pd

三、最常用 10 个操作(必背)

1. 创建表格

data = { "姓名": ["小明", "小红", "小李"], "年龄": [20, 21, 19], "城市": ["北京", "上海", "广州"] } df = pd.DataFrame(data)

2. 查看数据

df.head() # 前5行 df.head(3) # 前3行 df.info() # 查看列类型、是否为空 df.describe() # 自动统计(均值、最大最小等)

3. 读取文件

# 读取 CSV df = pd.read_csv("数据.csv") # 读取 Excel(需要 pip install openpyxl) df = pd.read_excel("数据.xlsx") # 读取后直接查看 df.head()

4. 选择列

df["姓名"] # 单列 df[["姓名", "年龄"]] # 多列

5. 筛选行(最常用!)

# 年龄大于20 df[df["年龄"] > 20] # 城市等于北京 df[df["城市"] == "北京"] # 多个条件 df[(df["年龄"]>19) & (df["城市"]=="北京")]

6. 新增 / 修改列

df["性别"] = "男" # 新增列,全部赋值男 df["年龄+1"] = df["年龄"] + 1 # 用计算结果生成列

7. 处理缺失值

df.isnull().sum() # 查看每列缺失数量 df.dropna() # 删除有空值的行 df.fillna(0) # 把空值填成0

8. 去重

df.drop_duplicates() # 去重

9. 排序

df.sort_values("年龄", ascending=False) # 降序

10. 保存文件

df.to_csv("新数据.csv", index=False) df.to_excel("新数据.xlsx", index=False)

四、最简单实战案例(复制就能跑)

import pandas as pd # 1. 创建数据 data = { "产品": ["鱼", "贝壳", "虾", "章鱼"], "来源": ["海洋", "海洋", "海洋", "海洋"], "价格": [20, 15, 18, 25] } df = pd.DataFrame(data) # 2. 筛选海洋来源 df_haiyang = df[df["来源"] == "海洋"] # 3. 打印结果 print(df_haiyang)
http://www.jsqmd.com/news/948543/

相关文章:

  • 5分钟解锁QQ音乐加密文件:qmc-decoder音频转换完全指南
  • Anybus B40嵌入式板卡:让I/O模块拥有CC-Link IE、Profinet、EtherNet/IP三头六臂
  • 终极免费方案:解锁Windows远程桌面多用户并发连接的完整指南
  • 从并联电路到创意手工:用LED与晾衣夹制作会发光的电路虫
  • DeepSeek LeetCode 2968. 执行操作使频率分数最大 TypeScript实现
  • 黑水县26年最新专业手表包包回收权威店铺推荐,TOP排行榜 - 莘州文化
  • 数据库---JDBC
  • 从4阶段到3阶段:重新思考ViT的‘起手式’,SHViT的大步长Patchify Stem设计为何能省内存又提速度?
  • 从一次真实的Jenkins未授权访问事件复盘:攻击者视角下的入侵路径与应急响应指南
  • DS4Windows:让你的PlayStation手柄在Windows上完美运行
  • BetterJoy:Switch控制器在PC上的全能映射工具
  • 从静态滑翔机到遥控飞机:DIY改装全流程与核心技术解析
  • HoRain云--Codex 权限设置
  • 智能搜索响应延迟下降68%、长尾查询转化率提升3.2倍,我们用这4个开源+私有化AI工具完成了全栈整合
  • 终极Sunshine游戏串流指南:三分钟实现跨设备畅玩
  • GPT-5.5服务化与具身智能理赔:AI责任锚定落地实践
  • 红原县26年最新专业手表包包回收权威店铺推荐,TOP排行榜 - 莘州文化
  • RV1126调试OV5640摄像头,I2C时好时坏?别急着换硬件,先检查这两个驱动配置
  • 【分享】阿启八字排盘1.2[特殊字符]八字排盘|称骨算命|八字合婚
  • 【Redis】Redis 数据结构与 Spring Boot 集成
  • 从TYPE-A到Micro-USB:不同接口的USB3.0线缆,测试标准到底有啥不同?(附串扰指标对比表)
  • 别再为WebRTC通话卡顿发愁了!手把手教你用Coturn在Ubuntu 22.04上搭建自己的TURN中继服务器
  • 双非本科生也能抓住大模型红利期?收藏这份Agent开发实战指南!
  • Matlab实现口罩配送路径优化:低成本运输方案+可视化结果图+可调参数代码
  • 2026呼和浩特正规金银回收门店精选榜单|黄金铂金彩金白银回收靠谱商家电话汇总 - 余生黄金回收
  • 2026可研报告编制公司实力对比:谁更强?深度评测与选择建议 - 资讯纵览
  • 除了UV,这5个指标更能反映小程序的真实健康度
  • Siri等了15年,终于要像个人了:WWDC 2026五天倒计时全预测
  • 【分享】AutoJs6 自动化脚本编写工具 开源完全免费
  • Arduino入门:Tinkercad仿真实现LED闪烁,掌握嵌入式开发基础