当前位置: 首页 > news >正文

Pandas 中使用交叉表为分类列生成计数型宽表结构

本文介绍如何利用 pd.crosstab 将长格式的分类评分数据(如 high/medium/low)高效转换为按分组(如店铺)展开的宽表,自动生成对应类别的计数列,并控制类别顺序与轴标签。 本文介绍如何利用 pd.crosstab 将长格式的分类评分数据(如 high/medium/low)高效转换为按分组(如店铺)展开的宽表,自动生成对应类别的计数列,并控制类别顺序与轴标签。在数据分析中,常需将“长格式”(long format)的分组-类别记录(例如每条记录代表某店铺的一次顾客评分)聚合为“宽格式”(wide format)的汇总表——即每个唯一分组(如 Shop)作为一行,每个预定义类别(如 'High'、'Medium'、'Low')作为一列,单元格值为该店铺获得该评分的总次数。这种结构更便于后续统计、可视化或建模。pandas 提供了专为此类任务设计的高效函数:pd.crosstab。它本质是二维频数表生成器,支持索引(行分组)、列变量(类别维度)及可选的值聚合逻辑。为确保输出列严格按指定顺序(如 High → Medium → Low),推荐先将目标列转为有序分类类型(pd.Categorical),再传入 crosstab:import pandas as pd# 原始数据:长格式,含重复店铺IDdata = [['store1', 'High'], ['store1', 'Medium'], ['store2', 'Low'], ['store2', 'Low']]df = pd.DataFrame(data, columns=['Shop', 'Review'])# 步骤1:将 Review 列设为有序分类,明确指定类别顺序df['Review'] = pd.Categorical(df['Review'], categories=['High', 'Medium', 'Low'])# 步骤2:生成交叉表(行=Shop,列=Review)result = pd.crosstab(df['Shop'], df['Review'])print(result)输出:Review High Medium LowShop store1 1 1 0store2 0 0 2默认情况下,crosstab 会为行索引和列名添加轴标签(如 Shop 和 Review)。若需更简洁的表格结构(例如直接用于导出或合并),可链式调用 rename_axis 清除这些标签: 知网AI智能写作 知网AI智能写作,写文档、写报告如此简单

http://www.jsqmd.com/news/664205/

相关文章:

  • CVPR 2024最佳学生论文Mip-Splatting保姆级环境配置(避坑NumPy版本冲突)
  • ARM Watchdog模块寄存器与测试机制解析
  • 【代码健康度红皮书】:用AST+规则引擎实现毫秒级异味拦截,已验证提升CI通过率47%
  • 如何免费绕过iOS 15-16激活锁:applera1n完整指南
  • Layui弹出层layer.tab如何监听标签页切换的具体序号
  • STM32F407的USART DMA+空闲中断接收HC-05数据,这样写代码更稳定(附手机蓝牙助手通信协议解析)
  • 完整解锁ComfyUI-Impact-Pack图像增强功能的终极指南
  • DeepPCB:1500对工业级PCB缺陷检测数据集的完整技术指南
  • 从CNN、RNN到Self-Attention:一个NLP工程师的视角转变与实战选择指南
  • 揭秘奇点大会未公开PPT第47页:LLM代码变更影响域分析模型如何将回滚准确率从61%提升至99.2%
  • 第 14 章 常用模块(下)
  • AI Agent Harness Engineering 如何改变市场营销与内容创作
  • From Now On
  • Cortex-M52处理器指令优化与性能提升指南
  • 别再只会用Pandas的to_csv了!这5个参数(encoding, sep, mode, float_format, columns)才是数据导出的精髓
  • 2026年质量好的型钢通过式抛丸机/钢结构通过式抛丸机实力工厂推荐 - 品牌宣传支持者
  • 用IMX219-83双目相机和Jetson Nano搭建你的第一个视觉SLAM demo
  • 深度学习篇---矩阵的魔法
  • 构建可持续迭代的 Agent:反馈闭环怎么做
  • AI 术语通俗词典:矩阵范数
  • 别再只会用QTcpSocket了!聊聊QAbstractSocket那些被忽略的实用信号与状态管理
  • Layui tab选项卡如何动态根据ID值进行程序化切换
  • UWPHook完整指南:轻松将Windows商店游戏整合到Steam平台
  • 别再为PS2手柄时序头疼了!STM32CubeIDE调试PS2通讯的3个实用技巧与避坑指南
  • Python篇---# -*- coding: utf-8 -*- 声明
  • STM32CubeMX配置CRC避坑指南:Modbus/RTU校验从‘跑不通’到‘一次过’
  • 手把手教你用51单片机驱动DS18B20测温(附完整代码与常见时序问题排查)
  • CSS如何实现根据滚动进度触发的过渡效果_配合JS修改类名触发transition
  • 终极指南:5个核心方案彻底优化AEUX插件连接体验
  • 5G NR时频结构解析:从SCS到无线帧的物理层设计