数值资料描述指标主要分为集中趋势指标和离散程度指标两大类,以下为你详细介绍。
集中趋势指标反映的是一组数据的平均水平或中心位置,常用的有算术均数、几何均数和中位数。算术均数适用于对称分布,特别是正态分布的数据,它是所有观察值的总和除以观察值的个数所得的值,能综合反映数据的平均水平。几何均数常用于等比资料或对数正态分布资料,比如医学上的抗体滴度等数据,计算时是将n个观察值的乘积开n次方,它可以避免个别特大或特小值对平均值的影响。中位数则是将一组观察值按从小到大的顺序排列后,处于中间位置的那个数值,它不受极端值的影响,对于偏态分布资料、分布不明资料或有开口资料(如“>50”等情况),中位数是比较合适的描述指标。
离散程度指标则用于描述数据的变异程度,常见的有全距、四分位数间距、方差、标准差和变异系数。全距是一组数据中最大值与最小值之差,计算简单,但它只考虑了两个极端值,不能反映组内其他数据的变异情况。四分位数间距是上四分位数与下四分位数之差,它和中位数一样,不受极端值的影响,常用于描述偏态分布资料的离散程度。方差是每个观察值与均数之差的平方和的平均值,标准差是方差的算术平方根,它们都反映了数据相对于均数的离散程度,适用于正态分布资料。变异系数是标准差与均数之比,用百分数表示,它消除了单位和均数水平的影响,常用于比较度量单位不同或均数相差悬殊的多组资料的变异程度。
通过综合运用集中趋势指标和离散程度指标,可以更全面、准确地描述数值资料的特征。