day10统计师考试(初级)用表格描述数据
用表格描述数据
- 知识点一、非数值型数据的频数分布表 ★
- 知识点二、数值型数据的频数分布表★
- 例题
由于不同类型的数据其特征不同,在利用表格对其进行描述时步骤也不相同,但是无论数据是何种类型,我们都可以使用频数分布表来对其进行描述。
知识点一、非数值型数据的频数分布表 ★
非数值型数据包括分类数据和顺序数据,其本身就是对事物的一种分组。因此,只要先把所有的类别都列出来然后统计出每一类别的数据个数(即频数),进一步就可形成分组列表,即频数分布表。
如将人口按性别分为男、女两组并统计出其各自的频数;按经济类型将企业划分为国有企业、集体企业、私营企业、外商独资企业、中外合资企业等等。
知识点二、数值型数据的频数分布表★
生成数值型数据的频数分布表时,首先是将数据进行分组,然后再统计出各组别的数据频数。
首先,要对数据进行分组。统计分组有“分”与“合
两重含义,即通过统计分组将不同性质的单位区分开来同时把相同性质的单位合并在一起,从而显示出数据的分布特性。
因此,统计分组的关键一是选择分组变量,二是划分各组界限。 分组数的多少要根据数据本身的特点及数据的多少来确定,一般情况下以能够适当观察数据的分布特征为准。
其次,要确定组距。在组数确定的情况下,组距等于全距(全部数据中的最大值与最小值之差)除以组数。
最后,各组的组距是各组的最大差异,即各组变量值中的最大值(即上限,各组中较大的数值)与最小值(即下限,各组中较小的数值)之差。每一组组距都相等的数列称为等距数列,每一组组距不全相等的数列称为不等距数列或异距数列。各组组中值等于上限与下限之和除以2。
即:
各组组距=上限-下限
各组组中值=(上限+下限)/2
在确定组限时,第一组的下限应小于最小值,最后一组的上限应高于最大值。
在确定组距时,一般应当遵循下列原则:
首先,要考虑各组的划分是否能区分总体内部各个组成部分的性质差别。
如果不能正确反映各部分质的差异,必须重新分组。例如,按学生百分制成绩分组,必须要有60分的组限,否则不能反映是否及格的本质区别。
其次,要能准确、清晰地反映总体单位的分布特征。在确定组距时,当研究的现象变动比较均匀时,可以采用等距分组;
而当研究的现象变动很不均匀时,例如急剧的增长或急剧的下降,波动的幅度很大时,则一般采用不等距分组。
最后,统计出各组的频数得出频数分布表。在统计各组频数时,若相邻两组的上下限重叠,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内,即采取上限不在内的原则,以保证一项数据只被分在某一组。
例题
【单选题】当一组数据变动比较均匀时,对其分组宜采用(C)。
A.极大值分组
B.极小值分组
C.等距分组
D.不等距分组
