1.统计分组的意义
根据统计研究任务的要求和研究现象总体的内在特点,把现象总体按某一标志划分为若干性质不同但又有联系的几个部分称统计分组。
总体的变异性是统计分组的客观依据。统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更小的总体。
总体经过分组以后,各组内部的差异缩小趋于同质,组与组之间的差异拉以表明现象间质的差别或量的不同。
2.统计分组的种类
①统计分组按其任务和作用不同,分为类型分组、结构分组和分析分组。
②统计分组按分组标志的多少分为简单分组和复合分组。
③统计分组按分组标志的性质分为品质分组和变量分组。
3.分组体系与分组标志的选择
①分组体系
统计分组后所形成的一系列互相联系、互相补充的组的整体称分组体系。分组体系有平行分组体系和复合分组体系两种。
②分组标志的选择
分组标志的选择是统计分组的关键。
正确选择分组标志,必须根据统计研究的任务目的,抓住反映现象本质区别和内在联系的标志作为分组标志。
4.统计分组的方法
(1)品质标志分组方法
品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。
(2)数量标质分组方法
按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。
①单项式分组和组距式分组
离散变量如果变量值的变动幅度小,就可以一个变量值对应一组,称单项式分组。
离散变量如果变量值的变动幅度很,变量值的个数很多,则把整个变量值依次划分为几个区间,各个变量值则按其小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。
连续变量由于不能一一列举其变量值,只能采用组距式的分组方式,且相邻的组限必须重叠。
②等距分组和不等距分组
等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。不等距分组即各组组距不相等的分组。
统计分组时采用等距分组还是不等距分组,取决于研究对象的性质特点。在标志值变动比较均匀的情况下宜采用等距分组。等距分组便于各组单位数和标志值直接比较,也便于计算各项综合指标。在标志值变动很不均匀的情况下宜采用不等距分组。不等距分组有时更能说明现象的本质特征。
③组限和组中值
组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限。上限和下限的差称组距,表示各组标志值变动的范围。
组中值是上下限之间的中点数值,以代表各组标志值的一般水平。
一般情况下,组中值=(上限+下限)÷2
对于第一组是“多少以下”,最后一组“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限—1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。
【】★【】