Wilcoxon秩和检验

秩和检验

一、秩和检验的作用

秩和检验主要用于检验两个独立的样本的总体分布是不是相同。跟 t 检验类似,只不过秩和检验对于样本总体的要求不高,t 检验往往要求样本的总体分布符合正态分布。而秩和检验是在总体分布不符合正态或者总体分布不确定时使用的一种非参数性检验。

二、秩和检验的原理

1. 推导过程

首先假设我们这里有需要检验的两个独立样本 来自的总体是不是同一个总体,假设两样本的总体均值均存在,为 。为了检验两个独立样本的总体是否同一个总体。我们有如下假设:

如果原假设成立,那么两样本总和共 n 个样本观察值来同一总体,我们将两样本的观察值按自小到大的次序编号排序列成:

的足标即为 的秩,这里假设来自X,Y样本的观察值个数为 ,且 。设 X 样本的秩和为 , Y 样本的秩和为 。可以利用高斯求和公式求出 的值。

所以的值高度相关,我们只需要检验其中一个值是否符合要求即可,这里我们继续检验。如果两个独立样本来自同一个总体时,X 样本中的元素的秩应当均匀的分布在自然数 那么, 应当满足下式:

为真时, 不会太靠近不等式的两端,因此,如果 的观察值 过分大或者过分小时,我们的都拒绝 。因此在给定显著性水平 下, 的拒绝域为:

故接下来只需要求出拒绝域的临界点 即可。如果知道 的分布那么临界点 是不难求的。即首先计算出 所有可能的取值, 然后用 的所有取值做出 的分布律,在分布律中很容易找出:

这样我们就找到了拒绝域的取值范围。这里只说明了 的假设,单边假设 的方法类似,这里不再介绍。

2. 举例说明

这里我们用一个具体的例子展示如何进行秩和检验,重点介绍 的分布如何求。假设 。那么 的取值一共有 共35种可能。下表是求出的的分布。

1,2,3 6 1,3,6 10 1,6,7 14 2,4,7 13 3,5,6 14
1,2,4 7 1,3,7 11 2,3,4 9 2,5,6 13 3,5,7 15
1,2,5 8 1,4,5 10 2,3,5 10 2,5,7 14 3,6,7 16
1,2,6 9 1,4,6 11 2,3,6 11 2,6,7 15 4,5,6 15
1,2,7 10 1,4,7 12 2,3,7 12 3,4,5 12 4,5,7 16
1,3,4 8 1,5,6 12 2,4,5 11 3,4,6 13 4,6,7 17
1,3,5 9 1,5,7 13 2,4,6 12 3,4,7 14 5,6,7 18

根据上表求出的分布律和分布函数:

6 7 8 9 10 11 12 13 14 15 16 17 18
1/35 1/35 2/35 3/35 4/35 4/35 5/35 4/35 4/35 3/35 2/35 1/35 1/35
1/35 2/35 4/35 7/35 11/35 15/35 20/35 24/35 28/35 31/35 33/35 34/35 1

由上表可知:

所以在此样本下,显著性水平为0.2的检验拒绝域为

参考链接

[1] 概率论与数理统计 第四版 浙大 盛骤编 p208-210

[2] 相同数值时处理方案