当前位置: 首页 > news >正文

Pandas数据处理(3): 数据分箱与行列名修改

6、数据分箱

import pandas as pd
import numpy as np
df=pd.read_csv("data/employees.csv").head(10)
df
employee_idnamedepartmentpositionsalaryhire_date
0EMP001赵洋产品部数据分析师37652022-02-02
1EMP002周磊运营部数据运营57722021-11-25
2EMP003刘洋产品部需求分析师26082024-09-29
3EMP004吴伟市场部活动执行46992023-12-08
4EMP005张勇人事部培训专员92772023-09-19
5EMP006李敏人事部招聘专员36192021-09-05
6EMP007刘军市场部活动执行30942025-05-05
7EMP008杨静技术部后端开发33982024-07-19
8EMP009王伟产品部产品助理30682023-06-24
9EMP010吴勇市场部市场策划22782023-03-17
#均分成三段
pd.cut(df["salary"],bins=3).value_counts()
salary
(2271.001, 4611.0]    7
(4611.0, 6944.0]      2
(6944.0, 9277.0]      1
Name: count, dtype: int64
#自行定义分段范围
df["收入范围"]=pd.cut(df["salary"],bins=[0,2500,5000,10000],labels=["低","中","高"])
df
employee_idnamedepartmentpositionsalaryhire_date收入范围
0EMP001赵洋产品部数据分析师37652022-02-02
1EMP002周磊运营部数据运营57722021-11-25
2EMP003刘洋产品部需求分析师26082024-09-29
3EMP004吴伟市场部活动执行46992023-12-08
4EMP005张勇人事部培训专员92772023-09-19
5EMP006李敏人事部招聘专员36192021-09-05
6EMP007刘军市场部活动执行30942025-05-05
7EMP008杨静技术部后端开发33982024-07-19
8EMP009王伟产品部产品助理30682023-06-24
9EMP010吴勇市场部市场策划22782023-03-17
#等频率分割
pd.qcut(df["salary"],4).value_counts()
salary
(2277.999, 3074.5]    3
(4465.5, 9277.0]      3
(3074.5, 3508.5]      2
(3508.5, 4465.5]      2
Name: count, dtype: int64
#ser_index函数用于修改index列
df=pd.DataFrame({"name":["A","B","C","D"],"age":[20,30,40,50],"gender":["Female","Male","Female","Female"]
})
df.set_index("name")
# df.reset_index()
df
nameagegender
0A20Female
1B30Male
2C40Female
3D50Female

7、行列名修改

#rename函数用于修改columns和index
df.rename(columns={"name":"姓名"},index={0:4})
姓名agegender
4A20Female
1B30Male
2C40Female
3D50Female
#也可以直接用访问修改
df.index=[10,20,30,40]
df.columns=["姓名","年龄","性别"]
df
姓名年龄性别
10A20Female
20B30Male
30C40Female
40D50Female
********************
http://www.jsqmd.com/news/444578/

相关文章:

  • Pandas数据处理(4):时间数据处理与分组聚合
  • 刚入行 3 个月,我总算搞懂了 Java 集合
  • P4588 [TJOI2018] 数学计算 题解
  • Docker使用方法及注意事项
  • 德系车底盘维修哪家专业?2026年上海浦东5大靠谱店铺推荐,省钱又省心! - 品牌企业推荐师(官方)
  • 除甲醛公司推荐:专业公司服务与技术对比分析 - 品牌企业推荐师(官方)
  • 水利工程设备采购必看!5家优质启闭机、闸门厂家推荐,选购指南一文读懂 - 品牌企业推荐师(官方)
  • 2026年福州代理记账公司哪家好?福州10家财务公司真实测评 - 品牌企业推荐师(官方)
  • 2026年GEO优化服务商排名解读:企业或商户如何选择? - 品牌企业推荐师(官方)
  • 阻燃EPS厂家2026年TOP5:5家实力厂商怎么选?工程采购避坑+价值指南 - 品牌企业推荐师(官方)
  • 张家口注册公司|张家口快速办理营业执照【张家口玉算盘财税服务】 - 品牌企业推荐师(官方)
  • 2026年张家口公司注册、张家口代理记账【张家口玉算盘会计服务有限公司】 - 品牌企业推荐师(官方)
  • 广州地区金蝶云星空最好的服务商有哪家? - 品牌企业推荐师(官方)
  • 明星代言联系哪家好 - 品牌企业推荐师(官方)
  • 2026步入式试验箱优选榜单| 步入式十大精选厂家 - 品牌企业推荐师(官方)
  • 福州睿象科技对接步骤:找对联系方式精准对接,高效启航 - 品牌企业推荐师(官方)
  • 格宾网在高标准农田建设中的技术落地全攻略:高频疑问解答,助力工程高效实施 - 品牌企业推荐师(官方)
  • 张家口注册营业执照首选【玉算盘财税服务】 - 品牌企业推荐师(官方)
  • 2026年性价比高的定制酒生产厂家哪家强? - 品牌企业推荐师(官方)
  • 订婚结婚选哪款钻戒更值?——基于4C标准的五大国产品牌理性解析 - 品牌企业推荐师(官方)
  • 数据解码2026:婚戒定制品牌全景测评,揭秘培育钻石赛道的“价值新标杆” - 品牌企业推荐师(官方)
  • 力扣Hot100---1.两数之和
  • ABC 445 E(利用线性预处理最小质因子快速得到每个数的质因子分布 trick)
  • Git Pre-commit 钩子
  • Java全栈开发面试实战:从基础到高阶的深度探讨
  • 免费在线浏览查看3DTiles,支持修改坐标,微调整保存坐标json,支持cesium地图,高德地图,ArcGIS,天地图等自定义地图
  • Le sens de vivre dans un monde misrable
  • Reversing-x64Elf-100
  • 玩转opencraw
  • 6500亿美元AI资本开支:科技巨头逆势布局的底层逻辑与行业博弈