样本含量的估算方法

样本含量是在进行研究时所需的样本大小或参与者数量。在研究设计中,样本含量的大小直接影响研究的统计功效和可靠性。样本含量的大小取决于多个因素,如研究目的、研究设计、效应或关系的大小和统计分析方法等。确定适当的样本大小可以确保研究的有效性,并最大程度地减少Ⅰ类错误和Ⅱ类错误的概率。

一、两类错误:

1.第一类错误(Ⅰ类错误)也称为α错误,指的是原假设是正确的,但被错误地拒绝了。举例来说,在法庭判案中,如果被告真的是无辜的,但法官错误地判定被告有罪,那么这就是一种第一类错误。置信度为1-α。

2.第二类错误(Ⅱ类错误)也称为β错误,指的是原假设是错误的,但被错误地接受了。举例来说,在法庭判案中,如果被告真的是罪犯,但法官错误地判定被告无罪,那么这就是一种第二类错误。检验效能又称把握度,为1-β。

二、样本含量的估计取决于4个条件:

1.假设检验的Ⅰ类错误概率α,α越小所需样本量越多,或者说置信度越大,置信区间估计的可靠性越好,相应所需样本含量越大。对于相同α,双侧检验比单侧检验所需样本含量多。

2.假设检验的Ⅱ类错误概率β,或检验效能(1-β),β越小或检验效能越大,所需样本含量越多,一般要求检验效能在0.80及以上。

3.处理因素的效应δ,或这说容许误差δ,即预计样本统计量(均值或率)与相应总体参数(μ或π)的最大相差控制在什么范围。δ越大,所需样本含量越小。

4.总体的相关信息,例如均数比较时,总体标准差σ越大,所需样本含量越多,率的比较时,总体率π越接近于0.50,所需样本含量越多。

三、使用软件估算样本含量:

以医学统计助手(statsas.com)为例,可以计算样本含量,方法有单样本均数,单样本率,两样本均数,两样本率。每个功能都可以计算出样本含量,并给出不同α和β的参考结果。

1.单样本均数

2.单样本率

3.两样本均数

4.两样本率