当前位置: 首页 > news >正文

python学习第十三天(自用)

数据清洗

查看缺失值,若有缺失就是True,isnull()

删除缺失值,索引为4的结果消失了,删除缺失值所在行,dropna

删除缺失值所在列,所在城市这一列直接消失了,dropna

填充缺失值

指定填充值,fillna

用前一行数据填充,ffill

用后一行数据填充‘,bfill

查看重复值,duplicated

指定列查看重复值,duplicated(),subset用来指定列

根据目标列删除重复值,drop_duplicates,默认保留第一个重复值

Keep表示保留哪一个值,first/last/false,第一个/最后一个/全都删了

异常值处理

可以看到单价有-29的,属于异常数据

查看异常值,就是过滤

删除异常值,传入索引以删除目标值,可以看到索引为6的值消失了,drop(.index)

修复异常值,这里取绝对值来修改结果

数据格式处理,看到这里的订单日期与正常格式不同,需要处理格式

这里的replace是整体替换,没办法这样局部替换

因此可以利用series的str方法将这列转为字符串,然后利用字符串的replace方法来替换,会统一的进行替换,发现替换成功

数据排序与分组

排序sort_values,ascending表示升序

多列排序,列表与列表之间一一对应,只有前一个值完全相同才会按照后面的进行排序

数据分组操作

将数据按照不同的特征进行分组,其中想要一次性进行分组操作可以使用agg来进行统一操作,groupby就是将目标内容分组

统计行数,即按目标列统计个数,count

指定目标列,选择没有缺失值的列才能统计正确,随便选哪列都可以,因为是统计数量,只要没有缺失值,那么都是一样的

统计内容和,sum,将相同的内容的目标值进行累加计算

综合运用统计金额数,先添加新的列,然后再统计累加

统计最小值,min

统计最大值,max

统计平均值,mean

综合,agg,将要统计的目标填入agg里,以列表的形式填入,返回的表格将会按照你填的内容进行排版

统计多列的内容,以字典的形式传入

Matplotlib介绍,将我们统计好的数据进行可视化的转化的工具,就是画图工具

绘制折线图,x要和y一一对应

Matplotlib图标详情

上述的名词介绍也就对应了方法

设置画布,figure,一定要在plot之前设置画布,因为plot会默认给你生成画布,你在后面生成则会生成一个新的画布

标题设置,title,也可以设置字体大小

其中要设置中文题目还要配置好项目,否则就是乱码

设置x轴标签,y轴标签

X轴刻度较为稀疏,没办法详细看具体数据,因此可以设置刻度,xtick

也可以隔一个刻度展示一下,因为x是列表,所以可以进行切片操作

设置y的刻度

绘制网格线,grid,也可以自定义表格样式

绘制双折线,就是再创建一个y轴数据,然后再绘制即可

显示图例,就是给线标上名字,让人知道哪条是哪条线,但这样是一一对应显示的,就是第一个创建的对应第一个,修改起来很麻烦

推荐方法,为曲线加上标签label以便于区分,并且legend也无需指定内容,图例可以指定位置,legend具有loc方法可以改变位置

柱状图

创建子图,就是创建两个图,nrows代表行,1就是1行,如果为2,那么就是相当于在中间砍一刀,然后均分。ncols代表列,这里2表示2列,就是竖着切一刀,然后axes接收到的是返回的数组,因此访问不同的图可以利用列表的访问形式来访问

其中bar就是柱状图,pie就是饼状图

Dpi是像素值

子图的设置

添加数据

设置图表属性

http://www.jsqmd.com/news/939025/

相关文章:

  • SAP MM模块实战:手把手教你配置UB STO库存转移(含一步法与两步法选择指南)
  • 性价比高的台球厅装修公司推荐 - 工业品牌热点
  • 岳阳CMA甲醛检测治理公司深度测评:绿居净环保稳居榜首 - 诚信金利回收
  • 从“聊天生成”到“长篇工作台”:六款 AI 写小说工具深度评测
  • 2026年长沙家居建材广场深度解析:一站式购齐的智慧之选 - 2026年企业资讯
  • 【VibeCoding系列教程09】 零代码平台——秒哒
  • 抖音高清素材下载终极指南:免费获取无水印视频、封面和音乐
  • 避坑指南:解决ABAP调用外部Web Service时常见的NIECONN_REFUSED连接错误
  • BetterNCM插件管理器:解锁网易云音乐隐藏功能的钥匙
  • WSL2下Docker调用GPU报错‘file exists’?手把手教你修复nvidia-container-cli的‘legacy’模式问题
  • 如何用Obsidian笔记模板快速搭建个人思考系统:5步告别信息混乱
  • 岳阳母婴除甲醛CMA甲醛检测治理公司2026深度测评:森氧家环保稳居榜首 - 诚信金利回收
  • Quartus II 13.0 保姆级安装与和谐指南(附Cyclone器件库配置)
  • 2026年API中转站选型报告:六大平台压力测试与场景匹配
  • MATLAB R2019b实现的三相并网逆变器PI闭环控制仿真(含SVPWM驱动与参数可调)
  • 3种方法突破平台限制:WorkshopDL一站式跨平台Steam创意工坊下载终极指南
  • 【仅剩87份】Sora 2辅助企业定制方案包(含GDPR合规剪辑日志、发言人声纹隔离策略、离线缓存策略V2.1)
  • Qwen-Image-Edit-Rapid-AIO终极指南:5分钟掌握专业级AI图像编辑的快速方案
  • CSDN AI数字营销会员卡7天深度实测:从选题到变现的全链路实战报告
  • 岳阳母婴除甲醛CMA甲醛检测治理公司深度测评:清醛卫士稳居榜首 - 诚信金利回收
  • 上海母婴除甲醛CMA甲醛检测治理公司深度测评:清醛卫士稳居榜首 - 五金回收
  • 重磅!Qwen3.7-Max官宣免费,每天200次不限身份,AI编程工具开始血拼了
  • 云浮CMA甲醛检测治理公司深度测评:绿居净环保稳居榜首 - 诚信金利回收
  • 工业机器人运动控制工程师晋升CTO都要经历哪些职位和薪资?
  • 从SQL到自然语言分析只差1个API?:揭秘OpenAI Function Calling + DuckDB + Streamlit 实现分钟级AI分析看板的完整链路
  • 上饶CMA甲醛检测治理公司深度测评:绿居净环保稳居榜首 - 五金回收
  • SpringBoot+Vue 在线拍卖系统 | 毕业设计完整源码 | 前后端分离
  • 终极音乐歌词解决方案:告别听歌没歌词的烦恼
  • 2026年AI论文网站实测排行,哪款真正适合写论文?
  • 【电赛保姆级教程】只会红外循迹?小车/无人机自主导航与激光雷达避障硬核避坑指南(附里程计源码)