当前位置: 首页 > news >正文

day10统计师考试(初级)用表格描述数据

用表格描述数据

    • 知识点一、非数值型数据的频数分布表 ★
    • 知识点二、数值型数据的频数分布表★
    • 例题

由于不同类型的数据其特征不同,在利用表格对其进行描述时步骤也不相同,但是无论数据是何种类型,我们都可以使用频数分布表来对其进行描述。

知识点一、非数值型数据的频数分布表 ★

非数值型数据包括分类数据和顺序数据,其本身就是对事物的一种分组。因此,只要先把所有的类别都列出来然后统计出每一类别的数据个数(即频数),进一步就可形成分组列表,即频数分布表。

如将人口按性别分为男、女两组并统计出其各自的频数;按经济类型将企业划分为国有企业、集体企业、私营企业、外商独资企业、中外合资企业等等。

知识点二、数值型数据的频数分布表★

生成数值型数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数。

首先,要对数据进行分组。统计分组有“分”与“合
两重含义,即通过统计分组将不同性质的单位区分开来同时把相同性质的单位合并在一起,从而显示出数据的分布特性。

因此,统计分组的关键一是选择分组变量,二是划分各组界限。 分组数的多少要根据数据本身的特点及数据的多少来确定,一般情况下以能够适当观察数据的分布特征为准。

其次,要确定组距。在组数确定的情况下,组距等于全距(全部数据中的最大值与最小值之差)除以组数。

最后,各组的组距是各组的最大差异,即各组变量值中的最大值(即上限,各组中较大的数值)与最小值(即下限,各组中较小的数值)之差。每一组组距都相等的数列称为等距数列,每一组组距不全相等的数列称为不等距数列或异距数列。各组组中值等于上限与下限之和除以2。

即:
各组组距=上限-下限
各组组中值=(上限+下限)/2

在确定组限时,第一组的下限应小于最小值,最后一组的上限应高于最大值。

在确定组距时,一般应当遵循下列原则:

首先,要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。

如果不能正确反映各部分质的差异,必须重新分组。例如,按学生百分制成绩分组,必须要有60分的组限,否则不能反映是否及格的本质区别。

其次,要能准确、清晰地反映总体单位的分布特征。在确定组距时,当研究的现象变动比较均匀时,可以采用等距分组;

而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组。

最后,统计出各组的频数得出频数分布表。在统计各组频数时,若相邻两组的上下限重叠,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内,即采取上限不在内的原则,以保证一项数据只被分在某一组。

例题

【单选题】当一组数据变动比较均匀时,对其分组宜采用(C)。
A.极大值分组
B.极小值分组
C.等距分组
D.不等距分组

http://www.jsqmd.com/news/657486/

相关文章:

  • 2026年GEO机构综合实力排名:如何找到最适合你的AI搜索优化伙伴?哪家最合适规模化宣传 - 速递信息
  • SpringBoot集成PowerJob实战:从零构建高可靠分布式任务调度平台
  • 2分钟快速解决iPhone USB网络共享问题:Windows用户的完整驱动安装指南
  • 为什么你的Copilot写不出可审计日志?2026奇点大会公布日志生成黄金标准(含ISO/IEC 27001兼容性验证)
  • 用STM32F103C8T6+JDY-32蓝牙做个智能药箱,附完整电路图与代码(避坑DS1302和OLED)
  • DeOldify与ComfyUI工作流结合:可视化节点式图像上色实践
  • 从硬件MMU到软件walk:在xv6内核里“手动”翻译一次虚拟地址(RISC-V Sv39详解)
  • 爆火收藏|大模型入门保姆级指南, 小白程序员必看,零踩坑不焦虑,快速上手不内耗
  • 用Cyclictest给你的树莓派实时内核‘体检’:参数解读、结果分析与性能优化建议
  • 关于缩微组别疯狂电路赛题T2计分规则的建议
  • IP地址访问网站,怎么去除不安全提示?
  • IJPay支付SDK深度集成实战:Java支付网关架构解析
  • windows postgresql 16.9.4 安装教程
  • 一枚线圈的大作用:螺线管如何支撑科研与工业 - 资讯焦点
  • LLM 上下文窗口:扩展与优化 技术指南
  • Attention
  • 从零开始:BepInEx游戏插件框架完全实战指南
  • AI写代码=埋雷?揭秘2024年83%生成代码含安全缺陷的惊人数据及3步加固法
  • 鸿蒙App开发实战:一键拉起高德/百度地图导航(附完整代码与避坑指南)
  • 从VS Code到JetBrains,智能代码生成插件选型对比,12项性能指标实测数据曝光
  • 大模型简明八股——Attention
  • 2998基于单片机的司机乘客酒驾检测系统设计(TLC1543)
  • Noto字体完全指南:如何为全球900+语言消除“豆腐块“显示问题
  • 智能代码生成效率提升300%:从Prompt设计到模型微调的5步实战闭环
  • 深入解析CRC校验:从数学原理到硬件实现
  • 2026届必备的十大降AI率助手推荐榜单
  • 2025届学术党必备的五大AI写作平台实际效果
  • 大模型简明八股——FFN, Residual Addition, LN
  • 知识图谱+LLM:解锁数据价值的黄金组合,企业智能决策的必经之路!
  • OpenVINO模型量化指南:从FP32到INT8的性能提升实测与避坑经验分享