Ph - PowerPoint PPT Presentation

About This Presentation
Title:

Ph

Description:

Title: Data Analysis Using R: Introduction to the R language Author: Dr Tuan V Nguyen Last modified by: TVN Created Date: 1/12/2006 3:47:05 AM Document presentation ... – PowerPoint PPT presentation

Number of Views:96
Avg rating:3.0/5.0
Slides: 53
Provided by: DrTuanV2
Category:
Tags: thong

less

Transcript and Presenter's Notes

Title: Ph


1
Phân tích th?ng kê mô t?
  • Nguy?n Van Tu?n
  • Nguy?n Ðình Nguyên
  • Garvan Institute of Medical Research,
  • Sydney, Australia

2
T?ng quan
  • Ðo lu?ng
  • Qu?n th? và m?u nghiên c?u
  • Tóm t?t s? li?u trung bình, phuong sai, d? l?ch
    chu?n
  • Phân tích bi?u d?
  • Hoán chuy?n d? li?u

3
Thang do lu?ng
  • Nhìn chung, các s? li?u quan sát du?c d?u có th?
    lu?ng hoá b?ng thang t? l? (ratio)
  • Các s? li?u dinh tính thu?ng do lu?ng b?ng các
    kho?ng (interval)
  • ? dây chúng ta s? chú tr?ng hai lo?i s? li?u
    chính là s? li?u phân nhóm so v?i s? li?u phân b?
    liên t?c (ordinal, interval, ratio)

Bi?n
Phân nhóm
Liên t?c
th? t?
Theo kho?ng
t? l?
4
Ðo lu?ng trình t?
  • Trình t? (Ordinal) Designates an ordering
    quasi-ranking
  • Các kho?ng gi?a các v? trí không nh?t thi?t b?ng
    nhau.
  • S?p x?p theo th? t?

Th? nh?t
Th? hai
Th? 3
Th? 4
1 2 3 4 5 6 7 8 gi?
5
Kho?ng và T? l?
  • Kho?ng (interval) S?p x?p thành t?ng kho?ng b?ng
    nhau
  • Kho?ng cách gi?a t?ng do?n luôn b?ng nhau
  • Thí d? Các test IQ thông thu?ng luôn s?p thành
    nh?ng kho?ng b?ng nhau
  • T? l? (ratio) S?p x?p thành nh?ng kho?ng cách
    b?ng nhau theo trình t? bao g?m c? giá tr? 0

6
Th?ng kê U?c lu?ng giá tr? chua bi?t
Qu?n th? M?u
Thông s? U?c s?
Qu?n th?
M?u 3
M?u 1
M?u 2
7
U?c tính trung bình qu?n th?
  • Chi?u cao trung bình c?a qu?n th? 160 cm
  • Ð? l?ch chu?n 5.0 cm

n mean sd 10 161.5 4.5
100 160.4 5.2 1000 160.1 5.0 10000
160.1 5.0
ht1 lt- rnorm(10, mean160, sd5) ht2 lt-
rnorm(100, mean160, sd5) ht3 lt- rnorm(1000,
mean160, sd5) ht4 lt- rnorm(10000, mean160,
sd5)
Nh?n xét C? m?u càng l?n, u?c lu?ng càng chính
xác
8
U?c tính t? l? trong qu?n th?
  • T? l? nam gi?i trong qu?n th? 0.50
  • L?y ra m?t c? m?u n nguòi, m?i l?n l?y ra k
    ngu?i. Ghi nh?n l?i s? nam gi?i trong m?i l?n l?y
  • rbinom(n, k, prob)

T? l? nam gi?i ghi nh?n (p) 0.600 0.507 0.500
males lt- rbinom(10, 10, 0.5) males lt-
rbinom(100, 20, 0.5) males lt- rbinom(1000, 100,
0.5)
Nh?n xét C? m?u càng l?n, u?c lu?ng càng chính
xác
9
Tóm t?t m?t bi?n s? liên t?c
  • Ðo d? t?p trung
  • Trung bình (mean), trung tuy?n (median), trung v?
    (mode)
  • Ðo d? tán x? hay dao d?ng
  • Phuong sai, d? l?ch chu?n, sai s? chu?n
  • Mi?n gi?a hai kho?ng t? phân v? (interquartile
    range)

L?nh trong R Basic length(x), mean(x), median(x),
var(x), sd(x) summary(x) Package Library(pastecs)
Stat.desc(object)
10
Ví d? R
  • set.seed (7438) height lt- rnorm(1000, mean55,
    sd8.2)
  • mean(height)
  • 1 54.8017
  • median(height)
  • 1 54.90927
  • var(height)
  • 1 65.80294
  • sd(height)
  • 1 8.111901
  • summary(height)
  • Min. 1st Qu. Median Mean 3rd Qu. Max.
  • 31.02 49.72 54.91 54.80 60.10 78.91
  • Library(pastecs)
  • stat.desc(height)

11
Tóm t?t b?ng bi?u d? Bi?u d? h?p
boxplot(height)
95 percentile
75 percentile
Median, 50 perc.
25 percentile
5 percentile
12
Bi?u d? chu?i
13
Gi?n d? c?t
14
Vai trò c?a trung bình và d? l?ch chu?n
  • Trong qu?n th? ngu?i Vi?t nam ? tu?i 30 tr? lên,
    cân n?ng trung bình là 55 kg và d? l?ch chu?n là
    8.2 kg.
  • Hai con s? này có nghia là gì?
  • 68 s? ngu?i trong l?a tu?i này s? có cân n?ng
    n?m trong kho?ng t? 55 /- 8.21 46.8 d?n 63.2
    kg
  • 95 s? ngu?i trong l?a tu?i này s? có cân n?ng
    n?m trong kho?ng t? 55 /- 8.21.96 38.9 d?n
    71.1 kg

15
Vai trò c?a trung bình và d? l?ch chu?n
  • Phân b? v? cân n?ng c?a qu?n th? dó có th? bi?u
    di?n b?ng gi?n d? c?t

1.96SD
1SD
16
Tóm t?t s? li?u phân nhóm
  • S? li?u phân nhóm
  • Gi?i tính nam, n?
  • Ch?ng t?c Á, da tr?ng, Phi
  • S? li?u bán d?nh lu?ng
  • M?c d? n?ng c?a b?nh nh?, trung bình, n?ng
  • Các giai do?n ung thu I, II, III, IV
  • S? thích r?t ghét, không thích, bình thu?ng,
    thích, r?t thích

17
Trung bình và phuong sai c?a t? l?
  • Ð?i v?i m?t ngu?i b?nh i, xác su?t cho ngu?i này
    hài lòng v?i cu?c s?ng sau m? là pi. Gi? d?nh
    các b?nh nhân sau m? m?t lo?i b?nh nào dó là d?c
    l?p v?i nhau thì pi p.
  • Phuong sai c?a pi là var(pi) p(1-p)
  • Do dó có m?t m?u n b?nh nhân sau m? m?t lo?i
    b?nh, xác su?t cho b?nh nhân hài lòng v?i cu?c
    s?ng sau m? du?c tính là

Và khi dó phuong sai c?a p_bar là
18
X?p x? phân ph?i chu?n c?a m?t phân ph?i nh? th?c
  • Ð?i v?i m?t ngu?i b?nh i, xác su?t cho ngu?i này
    hài lòng v?i cu?c s?ng sau m? là pi. Gi? d?nh
    các b?nh nhân sau m? m?t lo?i b?nh nào dó là d?c
    l?p v?i nhau thì pi p.
  • Phuong sai c?a pi là var(pi) p(1-p)

Do dó có m?t m?u n b?nh nhân sau m? m?t lo?i
b?nh, xác su?t cho b?nh nhân hài lòng v?i cu?c
s?ng sau m? du?c tính là
Và khi dó phuong sai c?a p_bar là
Và d? l?ch chu?n
19
Ví d?
  • 10 ngu?i m?, 8 ngu?i hài lòng ch?t lu?ng cu?c
    s?ng.
  • T? l? hài lòng p 0.8
  • Phuong sai var(p) 0.8(0.2)/10 0.016
  • Ð? l?ch chu?n c?a p s 0.126
  • 95 CI c?a p 0.8 1.96(0.126) 0.55 d?n 1.00

20
Phân tích mô t? s? li?u bi?n liên t?c
21
Paired t-test
  • Gi? d?nh
  • Bi?n liên t?c
  • Phân ph?i chu?n
  • Hai m?u KHÔNG d?c l?p v?i nhau

22
Paired t-test ví d?
  • V?n d? Ð? xem d? sai l?ch gi?a hai cân. 12 b?nh
    nhi du?c yêu c?u cân làm hai l?n, m?i l?n v?i m?t
    cân khác nhau, và k?t qu? thu du?c nhu sau

Results BN Cân1 Cân2 1 20 22 2 18 19 3 19 17 4
22 18 5 17 21 6 20 23 7 19 19 8 16 20 9 21 22 10 1
7 20 11 23 27 12 18 24
23
Paired t-test
  • Khác bi?t trung bình D x1-x2
  • Phuong sai c?a D
  • T-statistics
  • Tra b?ng T v?i (n-1) b?c t? do
  • T gt2 có ý nghia th?ng kê (p lt0.05)

24
Paired t-test phân tích
BN Cân1 Cân2 Khác bi?t
1 20 22 2
2 18 19 1
3 19 17 -2
4 22 18 -4
5 17 21 4
6 20 23 3
7 19 19 0
8 16 20 4
9 21 22 1
10 17 20 3
11 23 27 4
12 18 24 6
Mean 21.0 19.2 1.83
SD 2.8 2.1 2.82
Mean difference 1.83, SD 2.82 Standard error
(SE) SD/sqrt(n) 2.82/sqrt(12) 0.814 T-test
(1.83 0)/0.814 2.248 P-value 0.0459 K?t
lu?n Có s? khác bi?t có ý nghia th?ng kê v? s?
do khi cân m?t b?nh nhân b?ng hai cân khác nhau.
25
Paired t-test Phân tích b?ng R
  • can1 lt -c(20,18,19,22,17,20,19,16,21,17,23,18)
  • can2 lt -c(22,19,17,18,21,23,19,20,22,20,27,24)
  • t.test(can1, can2, pairedTRUE)

data red and white t -2.2496, df 11,
p-value 0.04592 alternative hypothesis true
difference in means is not equal to 0 95 percent
confidence interval -3.6270234 -0.0396433
sample estimates mean of the differences
-1.833333
26
Two-sample t-test (unpaired t-test)
Khác bi?t trung bình D x y Phuong sai c?a
D
M?u Nhóm 1 Nhóm 2 1 x1 y1 2 x2
y2 3 x3 y3 4 x4 y4 5 x5 y5
n xn yn C? m?u n1 n2 Trung bình x
y SD sx sy
T-statistic
95 Confidence interval
27
M?t ví d? v? so sánh hai nhóm d?c l?p
Chi?u cao trung bình (cm) c?a hai nhóm tr? ? vùng
nông thôn (A) và thành th? (B)
A B 100 122 108 130 119 138 127 142 132
152 135 154 136 176 164 N 8 7 Mean 127.
6 144.9 SD 19.6 17.8
Khác bi?t v? trung bình d 127.6 144.9
-17.3 Phuong sai c?a khác bi?t
T-statistic
95 Kho?ng tin c?y
28
Ví d? th?c hành so sánh hai nhóm
20 tr? nam và n? trong nghiên c?u có tu?i l?n
lu?t là
  • ID Nam Nu
  • 1 3 3
  • 2 7 1
  • 3 1 2
  • 4 9 4
  • 5 3 5
  • 6 4 2
  • 7 1 2
  • 8 2 5
  • 9 6 3
  • 10 7 2

ID Nam Nu 11 5 3 12 8 4 13 5 2 14 9
3 15 4 5 16 6 4 17 4 3 18 3 1 19 9
3 20 5 2
29
Unpaired t-test trong R
  • namlt-c(3,7,1,9,3,4,1,2,6,7,5,8,5,9,4,6,4,3,9,5)
  • nult-c(3,1,2,4,5,2,2,5,3,2,3,4,2,3,5,4,3,1,3,2)
  • t.test(nam, nu)

Welch Two Sample t-test data a and b t
3.3215, df 27.478, p-value 0.002539 alternativ
e hypothesis true difference in means is not
equal to 0 95 percent confidence interval
0.8037895 3.3962105 sample estimates mean of x
mean of y 5.05 2.95
K?t lu?n Có s? khác bi?t có ý nghia th?ng kê c?a
các tr? s? trung bình tu?i c?a hai nhóm gi?i
tính, trong dó nam có tu?i trung bình l?n hon n?
30
Hoán chuy?n s? li?u hi?u ?ng nhân
  • S? li?u du?i dây là lu?ng lysozyme trong d?ch d?
    dày c?a 29 b?nh nhân b? loét d? dày và c?a 30
    ngu?i ch?ng. Li?u có s? khác nhau v? lu?ng
    lysozyme trong d?ch d? dày c?a hai nhóm này
    không?
  • Nhóm b?nh
  • 0.2 0.3 0.4 1.1 2.0 2.1 3.3 3.8
    4.5 4.8 4.9 5.0 5.3 7.5 9.8 10.4 10.9
    11.3 12.4 16.2 17.6 18.9 20.7 24.0 25.4
    40.0 42.2 50.0 60.0
  • Nhóm ch?ng
  • 0.2 0.3 0.4 0.7 1.2 1.5 1.5 1.9 2.0 2.4
    2.5 2.8 3.6 4.8 4.8 5.4 5.7 5.8 7.5 8.7
    8.8 9.1 10.3 15.6 16.1 16.5 16.7 20.0 20.7
    33.0

31
Unpaired t-test , s? d?ng R
  • g1 lt- c( 0.2, 0.3, 0.4, 1.1, 2.0, 2.1, 3.3, 3.8,
  • 4.5, 4.8, 4.9, 5.0, 5.3, 7.5, 9.8, 10.4,
  • 10.9, 11.3, 12.4, 16.2, 17.6, 18.9, 20.7,
  • 24.0, 25.4, 40.0, 42.2, 50.0, 60)
  • g2 lt- c(0.2, 0.3, 0.4, 0.7, 1.2, 1.5, 1.5, 1.9,
    2.0,
  • 2.4, 2.5, 2.8, 3.6, 4.8, 4.8, 5.4, 5.7,
    5.8,
  • 7.5, 8.7, 8.8, 9.1, 10.3, 15.6, 16.1,
    16.5,
  • 16.7, 20.0, 20.7, 33.0)
  • t.test(g1, g2)

data g1 and g2 t 2.0357, df 40.804,
p-value 0.04831 alternative hypothesis true
difference in means is not equal to 0 95 percent
confidence interval 0.05163216 13.20239083
sample estimates mean of x mean of y 14.310345
7.683333
32
Kh?o sát s? li?u
  • P lt-par(mfrowc(1,2))
  • hist(g1)
  • hist(g2)
  • par(p)

Group 1 mean(g1) 14.3 sd(g1) 15.7 Group
2 mean(g2) 7.7 sd(g2) 7.8
33
Normal Q-Q plots
34
Ki?m d?nh Shapiro-Wilk
  • Ð? xem phân ph?i có tuân theo lu?t chu?n hay
    không.
  • Gi? thuy?t là phân ph?i g1, g2 tuân theo lu?t
    chu?n (p gt0.05), n?u k?t qu? thu du?c p lt0.05 ?
    không tuân theo lu?t chu?n.
  • C?n chú ý các test này r?t nh?y nên c?n ph?i xem
    xét các y?u t? khác d? d?c (skewness) và d? nh?n
    (kurtosis) c?a du?ng cong phân ph?i dó.
  • Shapiro.test(g1)
  • Shapiro-Wilk normality test
  • data g1
  • W 0.8036, p-value 9.697e-05
  • shapiro.test(g2)
  • Shapiro-Wilk normality test
  • data g2
  • W 0.8338, p-value 0.0002888

35
Ki?m tra l?i d? skewness (0), kurtosis (1)
library(fBasics)
  • basicStats(g1,ci0.95)
  • g1
  • nobs 29.000000
  • NAs 0.000000
  • Minimum 0.200000
  • Maximum 60.000000
  • 1. Quartile 3.800000
  • 3. Quartile 18.900000
  • Mean 14.310345
  • Median 9.800000
  • Sum 415.000000
  • SE Mean 2.922953
  • LCL Mean 8.322947
  • UCL Mean 20.297742
  • Variance 247.765961
  • Stdev 15.740583
  • Skewness 1.420910
  • Kurtosis 1.104822
  • basicStats(g2,ci0.95)
  • g2
  • nobs 30.000000
  • NAs 0.000000
  • Minimum 0.200000
  • Maximum 33.000000
  • 1. Quartile 1.925000
  • 3. Quartile 10.000000
  • Mean 7.683333
  • Median 5.100000
  • Sum 230.500000
  • SE Mean 1.433179
  • LCL Mean 4.752153
  • UCL Mean 10.614513
  • Variance 61.620057
  • Stdev 7.849844
  • Skewness 1.351903
  • Kurtosis 1.432079

36
Phân tích l?i s? li?u lysozyme hoán chuy?n
log.g1 lt- log(g1) log.g2 lt- log(g2)
37
Ki?m tra l?i d? skewness (0), kurtosis (1)
library(fBasics)
  • basicStats(log.g1,ci0.95)
  • log.g1
  • nobs 29.000000
  • NAs 0.000000
  • Minimum -1.609438
  • Maximum 4.094345
  • 1. Quartile 1.335001
  • 3. Quartile 2.939162
  • Mean 1.921094
  • Median 2.282382
  • Sum 55.711719
  • SE Mean 0.275081
  • LCL Mean 1.357615
  • UCL Mean 2.484572
  • Variance 2.194420
  • Stdev 1.481358
  • Skewness -0.734895
  • Kurtosis -0.136793
  • basicStats(g2,ci0.95)
  • g2
  • nobs 30.000000
  • NAs 0.000000
  • Minimum 0.200000
  • Maximum 33.000000
  • 1. Quartile 1.925000
  • 3. Quartile 10.000000
  • Mean 7.683333
  • Median 5.100000
  • Sum 230.500000
  • SE Mean 1.433179
  • LCL Mean 4.752153
  • UCL Mean 10.614513
  • Variance 61.620057
  • Stdev 7.849844
  • Skewness 1.351903
  • Kurtosis 1.432079

38
Ki?m d?nh Shapiro-Wilk
  • shapiro.test(log.g1)
  • Shapiro-Wilk normality test
  • data log.g1
  • W 0.938, p-value 0.08868
  • shapiro.test(log.g2)
  • Shapiro-Wilk normality test
  • data log.g2
  • W 0.9555, p-value 0.2372

39
Phân tích l?i s? li?u lysozyme
  • t.test(log.g1, log.g2)

data log.g1 and log.g2 t 1.406, df 55.714,
p-value 0.1653 alternative hypothesis true
difference in means is not equal to 0 95 percent
confidence interval -0.2182472 1.2453165
sample estimates mean of x mean of y 1.921094
1.407559
exp(1.921-1.407) 1.67 Tr? s? lysozyme c?a nhóm
b?nh nhân cao hon nhóm ch?ng 1.67 l?n hay 67,
tuy nhiên không có ý nghia th?ng kê
40
Phân tích mô t? s? li?u phân nhóm
41
So sánh hai t? l? - lý thuy?t
Nhóm 1 2 ____________________
________________________ C? m?u n1 n2 S? lu?ng
d? ki?n e1 e2 T? l? xu?t hi?n d? ki?n p1 p2
Khác bi?t D p1 p2 SE c?a D SE
p1(1p1)/n1 p2(1p2)/n21/2 Z D / SE 95 CI
D 1.96(SE) V?i (n1 n2) gt 20, và n?u Z gt 2,
có kh? nang lo?i b? gi? thuy?t
42
Ki?m d?nh s? khác bi?t gi?a 2 t? l?
Vietnam Australia
N 700 1287
Loãng xuong 148 345
T?n su?t 0.211 0.268
Variance (s2) 0.000238 0.000152
  • P1 t? l? nhóm 1
  • P2 t? l? nhóm 2
  • N1 c? m?u nhóm 1
  • N2 c? m?u nhóm 2
  • Dp1-p2
  • Phuong sai c?a d
  • Z-test

d 0.268 0.211 0.057 Phuong sai c?a d
s2 0.000238 0.000152 0.000391 z-test z
0.057 / sqrt(0.00391) 2.87 Có ý nghia th?ng kê
43
Ví d? so sánh hai t? l?
Phân tích Khác bi?t D 0.90 0.36 0.54 SE
(D) 0.9(0.1)/100 0.36(0.64)/1001/2
0.057 Z 0.54 / 0.057 9.54 95 CI 0.54
1.96(0.057) 0.43 to 0.65 K?t lu?n Lo?i b?
gi? thuy?t, có nghia là t? l? t? vong gi?a hai
nhóm phoi nhi?m khác nhau có ý nghia th?ng kê.
T? l? t? vong trong 30 ngày () c?a 100 con chu?t
c?ng cho phoi nhi?m v?i heroin và cocaine là
Nhóm Heroine Cocaine ___________________
_______________________ C? m?u 100 100 S? chu?t
ch?t 90 36 T? l? ch?t 0.90 0.36
44
So sánh hai t? l? s? d?ng R
  • events lt- c(90, 36)
  • total lt- c(100, 100)
  • prop.test(events, total)

2-sample test for equality of proportions with
continuity correction data deaths out of total
X-squared 60.2531, df 1, p-value
8.341e-15 alternative hypothesis two.sided 95
percent confidence interval 0.4190584 0.6609416
sample estimates prop 1 prop 2 0.90 0.36
45
Ki?m d?nh khác bi?t t? l? trên 2 nhóm Chi (Kai)
bình phuong
Lu?ng cà phê tiêu th? 1- 151- 300- Không 1
50 300 900 T?ng __________________________________
______ Tình tr?ng hôn nhân V? ch?ng 652 1537 598 2
42 3029 Ly d? 36 46 38 21 141 Ð?c
thân 218 327 106 67 718 T?ng 906 1910 742 330 3888
652/30290.22 1537/30290.51
598/30290.20 242/30290.08 36/1410.26
46/1410.33 38/1410.27
21/1410.15 218/7180.30 327/7180.46
106/7180.15 67/7180.09 906/38880.23
1910/38880.49 742/3888-.19
330/38880.08
T? l? theo hàng V? ch?ng 0.22 0.51 0.20 0.08 100 L
y d? 0.26 0.33 0.27 0.15 100 Ð?c thân
0.30 0.46 0.15 0.09 100 T?ng 0.23 0.49 0.19 0.08 1
00
46
Ki?m d?nh khác bi?t t? l? trên 2 nhóm Chi (Kai)
bình phuong
Tình tr?ng Lu?ng cà phê tiêu th? hôn
nhân 1- 151- 300- Không 150 300 900 T?ng _______
_________________________________ T?n su?t
quan sát V? ch?ng 652 1537 598 242 3029 Ly
d? 36 46 38 21 141 Ð?c thân 218 327 106 67 718 T?n
g 906 1910 742 330 3888
3029/3888906705.8 3029/388819101488
3029/3888742578.1 3029/3888330257.1 14
1/388890632.9 141/3888191069.3
141/388874226.9
141/388833012.0 718/3888906167.3
718/38881910352.7 718/3888742137.0
718/388833060.9
Tình tr?ng Lu?ng cà phê tiêu th? hôn nhân
1- 151- 300- Không 150 300 900 T?
ng _______________________________________________
T?n su?t k? v?ng V?
ch?ng 705.8 1488 578.1 257.1 3029 Ly
d? 32.9 69.3 26.9 12.0 141 Ð?c thân 167.3 352.7 13
7.0 60.9 718 T?ng 906 1910 742 330 3888
47
Test for Difference Among Proportions
Lu?ng cà phê tiêu th? 1- 151- 300- Không 150 3
00 900 __________________________________________
_____ V? ch?ng 652 1537 598 242 O (quan
sát) (705.8) (1488) (578.1) (257.1) E (k?
v?ng) Ly d? 36 46 38 21 O (32.9) (69.3) (26.9) (
12.0) E Ð?c thân 218 327 106 67 O (167.3) (352.7
) (137.0) (60.9) E
(652-705.8)2 / 705.8 4.11 (1537 1488)2 / 1488
1.61 .
Chisq 51.6 df 3x26 X2 1.63 for a0.05
(O - E)2/E V? ch?ng 4.11 1.61 0.69 0.89 7.30 Ly
d? 0.30 7.82 4.57 6.82 19.51 Ð?c thân
15.30 1.88 7.02 0.60 24.86 T?ng 19.77 11.31 12.28
8.31 51.66
48
So sánh t? l? trên 2 nhóm S? d?ng R (s? li?u
igf)
  • table(sex, ethnicity)
  • ethnicity
  • sex African Asian Caucasian Others
  • Female 4 43 22 0
  • Male 4 17 8 2

females lt- c(4, 43, 22, 0) total lt- c(8, 60, 30,
2) prop.test(females, total) or
chisq.test(sex,ethnicity)
49
So sánh t? l? trên 2 nhóm Phân tích Chi (Kai)
bình phuong
  • 4-sample test for equality of proportions
    without continuity
  • correction
  • data females out of total
  • X-squared 6.2646, df 3, p-value 0.09942
  • alternative hypothesis two.sided
  • sample estimates
  • prop 1 prop 2 prop 3 prop 4
  • 0.5000000 0.7166667 0.7333333 0.0000000
  • Warning message
  • Chi-squared approximation may be incorrect in
    prop.test(females, total)

K?t qu? phân tích s? d?ng Chi-squared v?i m?t
trong các ph?n t? có s? li?u lt 5 s? dua k?t qu?
không chính xác. Khi dó nên dùng Fishers exact
test
50
So sánh t? l? trên 2 nhóm Phân tích dùng
Fishers exact
  • Fisher's Exact Test for Count Data
  • data sex and ethnicity
  • p-value 0.1048
  • alternative hypothesis two.sided

K?t qu? phân tích s? d?ng Chi-squared v?i m?t
trong các ph?n t? có s? li?u lt 5 s? dua k?t qu?
không chính xác. Khi dó nên dùng Fishers exact
test.
51
Tóm t?t
  • Xem xét phân b? c?a s? li?u
  • Bi?n liên t?c
  • Trung bình và phuong sai khác bi?t có tính h?
    th?ng?
  • Phân b? chu?n?
  • Li?u có ph?i hoán chuy?n không?
  • Dùng các phuong pháp th?ng kê thích h?p (t-test)
  • S? li?u phân nhóm
  • Trình bày b?ng t? l?
  • So sánh hai hay nhi?u t? l?
  • Trình bày k?t qu? di kèm v?i kho?ng tin c?y 95
    (và p-values)

52
L?i C?m t?
  • Chúng tôi xin chân thành cám on Công ty Du?c ph?m
    Bridge Healthcare, Australia dã tài tr? cho
    chuy?n di.
Write a Comment
User Comments (0)
About PowerShow.com