第 六 章 卡 方 检 验
作者:赵耐青 授权刊登:医学统计之星
本 节STATA 命 令 摘 要
|
[by 分层变量名:] tab2 变量1 变量2 [, all chi2 exact cell column row ] tabi #11 #12 [...] \ [#21 #22 [...] [\ ...] [, all chi2 exact cell column row] |
· 列 联 表 分 析
STATA 命 令:
[by 分层变量:] tab2 变量1 变量2 [,all chi2 lichi2 exact cell column row]
上 述 命 令 中,变 量 1 为 行 计 数 变 量;变 量2 为 列 计 数 变 量;all 表 示 卡 方(c2 ) 检 验, 似 然 比(likelihood ratio) 检 验 以 及 一 些 统 计 描 述 指 标 和 检 验, 但 不 包 括 Fisher 精 确 检 验; exact 表 示 Fisher 精 确 检 验;chi2 表 示 c2 检 验;lichi2 表 示 likelihood ratio 检 验;cell 表 示 输 出 的 列 联 表 中 显 示 每 个 观 察 计 数 值 占 该 列 联 表 总 观 察 计 数 值 的 比 例;row 表 示 输 出 的 列 联 表 中 显 示 每 个 观 察 计 数 值 占 该 观 察 计 数 值 所 在 行 的 各 观 察 计 数 值 总 数 的 比 例; coloumn 表 示 输 出 的 列 联 表 中 显 示 每 个 观 察 计 数 值 占 该 观 察 计 数 值 所 在 的 列 各 观 察 计 数 值 总 数 的 比 例。
例: 某 地 调 查 肝 癌 病 人 与 健 康 人 饮 用“ 醋 冷 水”( 一 种 以 冷 水 和 醋 为 主 要 成 分 的 饮 料) 的 习 惯。 用 group=1 表 示 肝 癌 组 患 者 和group=2 表 示 健 康 人; 用 custom=1 表 示 经 常 饮 用 醋 冷 水;custom=2 表 示 偶 尔 饮 用 醋 冷 水 和custom=3 表 示 从 不 饮 用 醋 冷 水。 具 体 资 料 为:( 摘 自 医 学 统 计 方 法, 金 丕 焕 主 编,p163)。
|
组 别 |
经 常 |
偶 尔 |
从 不 饮 用 |
合 计 |
|
肝 癌 组 |
26 |
44 |
28 |
98 |
|
健 康 组 |
28 |
49 |
17 |
94 |
|
合 计 |
54 |
93 |
45 |
192 |
显 然 这 是 一 个 病 例 对 照 研 究, 所 以 每 组 人 数 是 人 为 确 定 的, 因 此 只 需 计 算 各 组 "经 常"," 偶 而" 和 "从 不 饮 用" 占 本 组 的 频 数 以 及 检 验 患 肝 癌 是 否 与 饮 水 习 惯 有 关。
tab2 group custom, row chi2
|
-> tabulation of group by custom | custom group | 1 2 3 | Total -----------+--------------------------------------------+---------- 1 | ① 26 44 28 | 98 | ② 26.53 44.90 28.57 | 100.00 -----------+--------------------------------------------+---------- 2 | ③ 28 49 17 | 94 | ④ 29.79 52.13 18.09 | 100.00 -----------+--------------------------------------------+---------- Total | ⑤ 54 93 45 | 192 | ⑥ 28.12 48.44 23.44 | 100.00 Pearson chi2(2) = 2.9497 Pr = 0.229 |
① 该 行 表 示 第 一 组( 肝 癌 组) 的 3 个 观 察 数;② 该 行 表 示 第 一 组 的 各 个 观 察 数 的 占 第 一 组 观 察 总 数 的 百 分 比;③ 该 行 表 示 第 二 组( 健 康 组) 的 3 个 观 察 数;④ 该 行 表 示 第 二 组 的 各 个 观 察 数 的 占 第 二 组 观 察 总 数 的 百 分 比;⑤ 该 行 表 示 关 于 饮 用 醋 冷 水 习 惯 的 三 个 分 类:“ 经 常”, “偶 尔” 和“ 从 不” 的 合 计 数;⑥ 该 行 表 示 上 述 三 个 合 计 数 分 别 占 总 样 本 数 的 百 分 比。
从 上 述 结 果 可 知: 卡 方 值 为2.9497 以 及 自 由 度 为 2,p 为 0.229, 所 以 根 据 当 前 资 料 和 结 果 显 示: 患 肝 癌 病 与 是 否 饮 用 醋 冷 水 无 关。
· 列 联 表 分 析 也 可 以 用 立 即 命 令 执 行:
tabi #11 #12 [...] \ [#21 #22 [...] [\ ...] [, all chi2 exact cell column row]
#11 表 示 列 联 表 中 第 一 行 第 一 列 的 观 察 数;#12 表 示 列 联 表 中 第 一 行 第 二 列 的 观 察 数;\ 表 示 换 一 行;#21 表 示 列 联 表 中 第 二 行 第 一 列 的 观 察 数, 其 它 以 此 类 推。 子 命 令: all chi2 exact cell column row 与 上 述 命 令 完 全 相 同。 以 上 例 的 资 料 为
例: 相 应 的STATA 命 令 为:
tabi 26 44 28 \ 28 49 17, chi2 lichi2
|
| col row | 1 2 3 | Total ----------- +----------------------------------+---------- 1 | 26 44 28 | 98 | 26.53 44.90 28.57 | 100.00 -----------+----------------------------------+---------- 2 | 28 49 17 | 94 | 29.79 52.13 18.09 | 100.00 -----------+----------------------------------+---------- Total | 54 93 45 | 192 | 28.12 48.44 23.44 | 100.00 Pearson chi2(2) = 2.9497 Pr = 0.229 likelihood-ratio chi2(2) = 2.9760 Pr = 0.226 |
两 种 方 法 结 果 对 应 相 同。 另 外 数 学 上 可 以 证 明: 当 大 样 本 是,卡 方 检 验(Pearson chi2 test) 与 似 然 比 检 验(likelihood ratio chi2 test) 趋 向 一 致。
· Fisher 精 确 检 验
例: 用 新 旧 两 种 药 治 疗 某 种 疾 病( 资 料 如 下 表 所 示), 试 问: 两 药 对 该 病 的 治 愈 率 是 否 不 同?( 资 料 摘 自 医 学 卫 生 统 计, 金 丕 焕 主 编,p165)
|
组 别 |
未 治 愈 |
治 愈 |
合 计 |
|
旧 药 |
4(2.2) |
2(3.8) |
6 |
|
新 药 |
0(1.8) |
5(3.2) |
5 |
|
合 计 |
4 |
7 |
11 |
表 中 括 号 中 的 数 为 理 论 数 ( 即:两 种 药 的 疗 效 无 差 异 的 无 效 假 设Ho 成 立 时 的 期 望 频 数)。
由 于 理 论 数 均 小 于 5, 故 必 须 用 Fisher 精 确 检 验 法。 相 应 的STATA 命 令 为:
tabi 4 2\0 5,exact col row
|
| col row | 1 2 | Total ------------+--------------------------+---------- 1 | 4 2 | 6 | 66.67 33.33 | 100.00 | 100.00 28.57 | 54.55 -----------+---------------------------+---------- 2 | 0 5 | 5 | 0.00 100.00 | 100.00 | 0.00 71.43 | 45.45 -----------+----------------------------+---------- Total | 4 7 | 11 | 36.36 63.64 | 100.00 | 100.00 100.00 | 100.00 ① Fisher's exact = 0.061 ② 1-sided Fisher's exact = 0.045 |
① 为 双 侧 Fisher 检 验;② 单 侧 Fisher 检 验
在 Fisher 精 确 检 验 中, 假 定 每 列 和 每 行 的 合 计 数 都 是 常 数 情 况 下, 计 算 相 应 概 率。 在 本 例 中, 单 侧 Fisher 检 验 要 计 算 下 表 的 概 率:
|
|
|
4 |
2 |
6 |
|
0 |
5 |
5 |
|
4 |
7 |
11 |
双 侧 Fisher 检 验 是 考 虑 可 能 新 药 优 于 旧 药, 也 可 能 旧 药 优 于 新 药 的 情 况。 以 新 药 治 愈 人 数 为 例: 观 察 数- 理 论 数=
5-3.2=1.8,因 此 要 考 虑 观 察 数 大 于 理 论 数 的 差 是 考 虑 抽 样 误 差 引 起 的, 所 以 不 仅 要 计 算 所 有 观 察 数- 理 论 数(3.2) 大 于1.8 的 p 值 [1] , 还 要 计 算 所 有 理 论 数(3.2)- 观 察 数 大 于 1.8 的 p 值。即: 计 算 所 有 | 理 论 数- 观 察 数 | >1.8 的 p 值 的 和, 因 此 在 每 列 和 每 行 的 合 计 数 都 是 常 数 情 况 的 假 定 下, 还 有 一 种 情 况 满 足 理 论 数(3.2)- 观 察 数 大 于 1.8 :
|
0 |
6 |
6 |
|
4 |
1 |
5 |
|
4 |
7 |
11 |
|
|
所 以 本 例 Fisher 双 侧 检 验 的 p 值 为 0.04545+0.01515»0.061。
· 由 于 Fisher 检 验 是 在 每 列 和 每 行 的 合 计 数 都 是 常 数 的假 定 下 的 精 确 检 验, 而 对 于 一 般 的 研 究: 如 病 例 对 照( 仅 病 例 组 和 对 照 组 的 人 数 是 常 数, 即:仅 每 行 的 合 计 数 是 常 数), 横 断 面 抽 样 调 查( 样 本 总 数 是 常 数), 所 以 对 于 不 满 足 每 列 和 每 行 的 合 计 数 都 是 常 数 假 定 的 资 料 而 言, Fisher 检 验 也 是 一 种 近 似 检 验。
[1] 本例中只有上述的这张表的情况,所以单侧 Fisher 检验仅计算该表的 p 值:观察数-理论数>1.8的 p值, 类似 t 检验:单侧检验的 p 值为 t分布曲线下大于 t 样本计算值的面积,双侧检验的 p 值为 t 分布曲线下大于 t 样 本计数值的面积和小于 -t 样本计数值的面积之和,而 Fisher 双侧检验:计算 |观察剩-理论数|>1.8 的 p 值的和。 即:在本例中,观察数-理论数=1.8相应 t 检验中的 t 样本计算值。
|
到第七章 |