2016年初级统计师《专业知识》考前必看考点(6)

发布时间:2016-10-17 共1页

1.种类

  ①属性分配数列:

  按品质标志分配而形成的数列叫属性分配数列,简称品质数列,如上例内蒙古自治区人口分布。

  ②变量分配数列

  按数量标志分组而形成的数列叫变量分配数列,简称变量数列。

  1)单项式变量分组数列

  是按每个变量值分别列组而形成的数列。

  2)组距式变量数列

  把各变量值按照一定组距进行分组而形成的数列。如:上例某班学生统计考试成绩表。

  在组距数列中,表示各组界限的变量值称为组限,50—60,60—70等。其中较小的变量值称为下限,50,60等,较大的变量值为上限,60,70等,各组上限与下限之差即为组距,组距=上限-下限,60-50,70-60等,各组上限与下限的中点称为组中值,即组中值=(上限+下限)/2,(50+60)/2=55,(60+70)/2=65,组中值具有一定的假定性,即假定次数在各组内的分布是均匀的,代表了各组内的一般水平。

  a.等距分组

  各组的组距均相等。

  特点:由于各组组距相等,各组次数的分布不受组距大小的影响,它和消除了组距影响,与次数密度的分布是一致的,一般呈正态分布。

  次数密度=次数/组距,其作用主要用于消除各组组距不相等而造成的现象分布的影响。

  b.不等距分组

  各组组距不相等。

  特点:不等距分组各组的次数多少受组距不同的影响,组距大次数可能多,组距小,则次数可能少,

  因此必须消除组距对其分布的影响即需计算次数密度。

  在编制组距式变量数列时,常常会遇到这样的情况,如:学生成绩的分布

  60分以下

  60—70

  70—80等

  又如:学生人数的分布

  30人以下

  30—60

  60人以上等

  这种具有不确定组距的组称为“开口组”,包括上开口和下开口,其组中值如何计算?

  下开口的组中值=上限-1/2邻组组距

  上开口的组中值=下限+下限1/2邻组组距

  2.变量数列的编制

  程序:①原始数据②序列化(编制由小到大简单数列)③求出组距等④分组归类合计(形成次数分布)⑤制成统计表(变量数列)

  a.离散型变量

  由于离散型变量各变量值之间以整数断开,变量值之间有明显的界限,上下限都可以用准确的数值表示,组限非常清楚。

  如:某校按学生人数分组,其组限为:

  100人以下

  101—200

  201—300

  301—400

  401人以上

  b.连续型变量

  由于连续型变量各变量值之间可做无限分割,有小数存在,上下限不能用两个确定的值表示,只能用前一组的上限与本组的下限为同一数值表示。如:上例考试成绩

  统计实际工作中,虽然变量区分连续型变量与离散型变量,但为了计算,绘图等的方便,保证整体单位不出现重复、遗漏。可采用连续型变量的形式代替离散型变量。

  对于连续型变量,在确定组限时,有一原则可循,即“上组限不在内”原则:各组只包括本组下限变量值的单位,不包括本组上限变量值的单位。

  3.编制统计表

  如上例40人考试成绩分为5组,组距为10,组限可以为:

  50—60,60—70,…,90—100

  可以使考试成绩的优、良、中、及、不及格的特征体现出来。

百分百考试网 考试宝典

立即免费试用