矩法正态性检验

正态分布,又称高斯分布,是自然界和社会科学中最常见的概率分布之一。许多统计方法和理论都依赖于数据的正态性假设,因此检验数据是否符合正态分布具有重要的意义。正态性检验是统计学中非常重要的一种检验方法,它用于检测数据是否符合正态分布。矩法正态性检验是一种常用的正态性检验方法。
一、矩法正态性检验原理
矩法正态性检验是利用数学上的矩原理来检验偏度(Skewness)和峰度(Kurtosis)。偏度反映了分布的不对称程度和方向,用偏度系数衡量,样本偏度系数用g1表示,总体偏度系数用γ1表示。峰度反映了与正态曲线相比的冒尖程度和扁平程度,用峰度系数衡量,样本峰度系数用g2表示,总体峰度系数用γ2表示。理论上,总体偏度系数γ1=0为对称,γ1>0为正偏态,γ1<0为负偏态;总体峰度系数γ2=0为正态峰,γ2>0为尖峭峰,γ2<0为平阔峰。只有同时满足对称和正态峰两个条件时,才能认为资料服从正态分布。

偏度系数:描述数据分布不对称的方向及其程度,如图

当偏度系数≈0时,可认为分布是对称的,服从正态分布;

当偏度系数>0时,分布为右偏,即拖尾在右边,峰尖在左边,也称为正偏态;

当偏度系数<0时,分布为左偏,即拖尾在左边,峰尖在右边,也称为负偏态;

峰度系数:描述数据分布形态的陡缓程度,如图:

正态分布峰度=3,大多数软件,例如SPSS,Medcalc,医学统计助手等为了比较方便,所用峰度系数为减去3的算法。

当峰度系数≈0时,可认为分布的峰态合适,服从正态分布(不胖不瘦);

当峰度系数>0时,分布的峰态陡峭(高尖);

当峰度系数<0时,分布的峰态平缓(矮胖);

二、计算公式

偏度系数

峰度系数

其中k 4 是四阶累积量的唯一对称无偏估计,k 2是二阶累积量的无偏估计(等同于样本方差),m 4是样本四阶平均距,m 2是样本二阶平均距。

三、软件计算,以医学统计助手(statsas.com)为例

四、在医学统计中的应用
在医学统计中,矩法正态性检验在很多场景中都发挥着重要作用。例如:

  1. 临床试验数据分析:在临床试验中,分析不同治疗方法对患者疾病的影响,如药物疗效、生存期、病例严重程度等。在进行数据分析前,需要先检验数据是否符合正态分布,以确定是否可以使用基于正态分布的参数统计方法(如t检验、方差分析等)。
  2. 生物标志物研究:在生物标志物的研究中,比较不同组别间生物标志物水平的差异。在进行比较前,可以使用矩法正态性检验来检验生物标志物水平的数据分布是否为正态分布,从而选择合适的统计方法。
  3. 诊断试验评估:在评估诊断试验的准确性时,可能需要比较不同诊断方法的敏感性、特异性等指标。通过矩法正态性检验可以判断这些指标的数据分布是否符合正态分布,以便选择合适的统计方法进行分析。
  4. 疾病流行病学研究:在疾病流行病学研究中需要分析疾病发生率、死亡率等指标与环境、遗传等因素之间的关系。在建立相关模型前可以使用矩法正态性检验来检查这些指标的数据分布,以便采用合适的统计方法。

五、局限性与其他正态性检验方法
尽管矩法正态性检验具有计算简便、直观的优点,但在样本量较小或数据分布具有较大偏离正态分布的情况下,检验结果可能受到较大影响。因此,在实际应用中还可以结合其他正态性检验方法,如Kolmogorov-Smirnov检验、Shapiro-Wilk检验等,以获得更为准确的检验结果。