在进行组距式分组时,组距两端的数值称为组限(class
boundary)。其中,每组的起点值称为下限。连续型变量中,上一组的上限同时也是下一组的下限。在分组时,凡遇到单位的标志值刚好等于相邻两组上下限数值时,一般把此值归并到作为下限的那一组。
上限
(upper
boundary)
与下限
(lower
boundary)
之间的中点数值称为组中值,
它是各组上下限数值的简单平均,即组中值=(上限+下限)/2。组中值经常被用以代表各组标志值的平均水平。分组中通常把上下两端的组运用开放式的组距,
即第一组用"多少以下",最后一组用"多少以上"表示,这两个组的组中值可参照相邻组的组距来决定,
其公式为
组中值
=
上限
-
相邻组的组距
/
2或下限
+
相邻组的组距
/
2,实务中组距大多相同,所以可以就简参照相邻组的组距来决定.
例如:"30岁以上的人"中,30即为下限,可运用上限公式计算组中值,而"50岁以下的人"中,50即为上限,可运用下限公式计算组中值.
在未明确上、下组限范围的情况下执行“上组限不在内”原则,“上组限不在内”原则是为了解决分组时的“不重”问题而
规定的,即,当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。例如:150这一数据不算在“140~150”这一
组内,而计算在“150~160”这一组。