第二章 描述性统计命令与输出结果说明

作者:赵耐青 授权刊登:医学统计之星

本 节STATA  命 令 摘 要

by   分组变量:]summarize 变 量 名1  变 量 名2      变 量 名m[,detail]

ci 变 量 名1  变 量 名2      变 量 名m  [, level(#) binomial           

                   poisson exposure(varname) by(分组变 )  ]                                                                                           

cii           [, level(#) ]

tab1 变量名 [,generate(变量名)]

·         资 料 特 征 描 述( 均 数, 中 位 数, 离 散 程 度)

 例: 某 地 测 定 克 山 病 患 者 与 克 山 病 健 康 人 的 血 磷 测 定 值 如 下 表( 数 据 摘 自 四 川 医 学 院 主 编 的 卫 生 统 计 学,1978 出 版, p21):

 患 者

2.6

3.24

3.73

3.73

4.32

4.73

5.18

5.58

5.78

6.40

6.53

   

健康人

1.67

1.98

1.98

2.33

2.34

2.50

3.60

3.73

4.14

4.17

4.57

4.82

5.78

并 假 定 这 些 数 据 已 以STATA 格 式 存 入 ex2.dta 文 件 中, 其 中  变 量 x1  为 患 者 的血 磷 测 定 值 数 据, 变 量 x2 为  健 康 人 的血 磷 测 定 值 数 据。 上 述 数 据 也 可 以 用 变 量 x 表 示 血 磷 测 定 值, 分 组 变 量 group=0  表 示 患 者 组 和 group=1 表 示 健 康 组( 如: 患 者 组 中 第 一 个 数 据 为 2.6, 则 x=2.6,group=0; 又 如: 健 康 组 中 第 三 个 数 据 为 1.98, 则 x 为 1.98 以 及 group 为 1), 并 假 定 这 些 数 据 已 以 STATA 格 式 存 入 ex2a.dta 文 件 中。

 计 算  资 料  均 数, 标 准 差 命 令 summarize, 以 述 资 料 为 例:

use ex2,clear

summarize x1  x2

果:

 变量         样本数           标准差       最小值       最大值

Variable |     Obs        Mean      Std. Dev.       Min           Max

---------+-------------------------------------------------------------------

        x1 |      11       4.710909   1.302977        2.6            6.53 

        x2 |      13       3.354615   1.304368        1.67          5.78

 即: 本 例 中 急 性 克 山 病 患 者 组 的 样 本 数 为 11,血 磷 测 定 值 均 数 为 4.711 (mg%),  相 应 的 标 准 差 为 1.303, 最 小 值 为2.6 以 及 最 大 值 为6.53;健 康 组 的 样 本 量 为 13,血 磷 测 定 值 均 数 为3.3546, 相 应 的 标 准 差 为 1.3044, 最 小 值 为1.67 以 及 最 大 值 为5.78。

计 算  资 料  均 数, 标 准 差, 中 位 数, 低 四 分 位 数 和 高 四 分 位 数 的  命 令 summarize 以 及 子 命 令 detail,  仍 以 述 资 料 为 例:

use  ex2,clear

summarize x1 x2,detail

 结 果: 

                              x1

-------------------------------------------------------------

             Percentiles            Smallest( )

 1%          2.6                      2.6

 5%          2.6                      3.24

10%         3.24                    3.73         Obs                  11(样本数)

25%         3.73 (低四分位)  3.73    Sum of Wgt.          11

50%         4.73 (中位数)       (最大值)    Mean           4.710909(均数)

                                            Largest       Std. Dev.      1.302977(标准差)

75%         5.78(高四分位)    5.58

90%          6.4                      5.78          Variance       1.697749 (方差)

95%         6.53                      6.4           Skewness      -.0813446(偏度)

99%         6.53                      6.53           Kurtosis       1.809951 (峰度)

                               x2

-------------------------------------------------------------

                                      

           Percentiles      Smallest

 1%         1.67            1.67

 5%         1.67            1.98

10%         1.98           1.98                 Obs                  13

25%     2.33           2.33        Sum of Wgt.          13

50%      3.6                            Mean           3.354615

                                                      

                                Largest       Std. Dev.      1.304368

75%      4.17           4.17

90%         4.82           4.57      Variance       1.701377

95%         5.78           4. 82     Skewness       .2963943

99%         5.78           5.78      Kurtosis       1.875392

知:summarize 使 detail  和⑥ 差, 标: ①低 (lower quartile) ②中 (Median) ③高 (upper quartile) 料, ± 述, 使   ( - 位,   interquartile range, IQR) 述。 如: [1] x1 Median IQR :  4.73 (3.73-5.78)   x2 Median IQR : 3.6 (2.33-4.17)。⑥ 差;⑦ 度,   小, 好; ⑧峰 度, 显;④ 据;⑤在 据。

  ex2a.dta  件, 计, 令:

use  ex2a,clear

sort group  (   group  )

by group:summarize x

  果:

-> group=        0 

                             x

-------------------------------------------------------------

      Percentiles      Smallest

 1%          2.6             2.6

 5%          2.6             3.24

10%         3.24           3.73       Obs                  11

25%         3.73           3.73       Sum of Wgt.          11

50%         4.73                         Mean           4.710909

                        Largest            Std. Dev.      1.302977

75%         5.78           5.58

90%          6.4            5.78        Variance       1.697749

95%         6.53            6.4        Skewness      -.0813446

99%         6.53            6.53       Kurtosis       1.809951

-> group=        1 

                             x

-------------------------------------------------------------

      Percentiles      Smallest

 1%         1.67            1.67

 5%         1.67            1.98

10%         1.98           1.98         Obs                  13

25%         2.33           2.33        Sum of Wgt.          13

50%          3.6                           Mean           3.354615

                        Largest             Std. Dev.      1.304368

75%         4.17           4.17

90%         4.82           4.57       Variance       1.701377

95%         5.78           4.82       Skewness       .2963943

99%         5.78           5.78        Kurtosis       1.875392

  同。

·          [2]

95%  算:

  态数 据:ci   变量名

    0-1 据:ci   变量名,  binomial

poisson 据: ci  名,poisson

90%  ( )

态数 据:ci   变量名, level(90)

  0-1 据:ci   变量名,  level(90) binomial

poisson 据: ci  名,level(90) poisson

  ex2.dta x1,x2 95 限。

use  ex2.dta,clear

                                                                         

Variable |     Obs         Mean      Std. Err.       [95% Conf. Interval]        

 ---------+----------------------------------------------------------------------        

      x1    |      11     4.710909    .3928624        3.835557    5.586261        

      x2    |      13     3.354615    .3617667        2.566393    4.142837                                                                                     

中:① 数;② 数;③ 误;④ 95% 限, x1 95 [3.8356,5.5863]x2 95 [2.5664,4.1428]

·          数,   [3]

  布, 数, 95 为:

cii         [level(#)]

 例: 90  40 12 则:   95%

 cii  90 40 12                                                           

Variable |     Obs         Mean    Std. Err.          [95% Conf. Interval]        

----------+----------------------------------------------------------------------        

              |      90            40      1.264911        37.48665    42.51335

  90%   [37.48665,    42.51335]

 cii  90 40 12,level(90)                                                       

Variable |     Obs         Mean      Std. Err.         [90% Conf. Interval]        

---------+---------------------------------------------------------------------------

             |      90             40       1.264911        37.89752    42.10248       

·        计 数 资 料 中 频 数 和 比 例

STATA 命 令:

tab1  变 量 名[,g( 新 变 量 名)

 因 为 该 命 令 主 要 适 用 描 述 计 数 资 料( 即: 属 性 资 料), 当 使 用 子 命 令 g( 新 变 量), 则 产 生 属 性 指 示 变 量。 在 回 归 分 析 中 经 常 需 要 这 些 指 示 变 量 作 为 亚 元 变 量 进 行 分 析。

例:50 组, 10  鼠。 后, (mg/g) 示: ( 法, 编,p220) group=12345 5 组。

x:

2.23

1.14

2.63

1

1.35

2.01

1.64

1.13

1.01

1.70

group:

1

1

1

1

1

1

1

1

1

1

x:

5.59

0.96

6.96

1.23

1.61

2.94

1.96

3.68

1.54

2.59

group:

2

2

2

2

2

2

2

2

2

2

x:

4.5

3.92

10.33

8.23

2.07

4.9

6.84

6.42

3.72

6

group:

3

3

3

3

3

3

3

3

3

3

x:

1.35

1.06

0.74

0.96

1.16

2.08

0.69

0.68

0.84

1.34

group:

4

4

4

4

4

4

4

4

4

4

x:

1.4

1.51

2.49

1.74

1.59

1.36

3

4.81

5.21

5.12

group:

5

5

5

5

5

5

5

5

5

5

tab1 group,g(a)