Sunday, October 4, 2015

Cỡ mẫu để so sánh 2 số trung bình

Đối với nghiên cứu so sánh hai nhóm độc lập với biến kết quả là biến liên tục, tham số quan tâm là hiệu số của hai số trung bình quần thể μ1 và μ2, tức δ = μ1 – μ2. Giả thuyết đặt ra là:


H0: μ1 = μ2  hay δ = 0
HA: μ1 ≠ μ2  hay δ ≠ 0

Dĩ nhiên, chúng ta không biết μ1 và μ2  , mà chỉ có thể ước tính hai số trung bình m1m2 qua mẫu n1n2 đối tượng. Phương pháp căn bản để kiểm định giả thuyết là t-test.  Gọi m1m2 là số trung bình mẫu của hai nhóm, s1s2 là độ lệch chuẩn, và n1n2 là số đối lượng cho hai nhóm so sánh, kiểm định t được định nghĩa là hiệu số của hai số trung bình chia cho độ lệch chuẩn của hiệu số:

t = (m1 - m2) / SD(m1 - m2)  

Trong đó,
SD(m1 - m2) =sqrt(s12/n1 + s22 / n2)

Giả dụ rằng cỡ mẫu của hai nhóm bằng nhau n1 =  n2  và gọi chung là n = n1 =  n2 . Vấn đề là tìm n sao cho giá trị của t có nghĩa thống kê, tức sao cho trị số P của t thấp hơn α.  Giải phương trình trên, chúng ta có:

n = 2s2(zα + zβ)2 / (m1 - m2)2

Trong đó, s2 = s12 = s22 là phương sai chung của hai nhóm. Nhớ rằng mức độ ảnh hưởng ES là:
ES = (m1 - m2) / SD  

Do đó, công thức trên cũng có thể viết lại đơn giản hơn:

n = 2(zα + zβ)2 / (ES)2


Nếu α = 0.05 và β = 0.20 (tức power bằng 0.8), thì công thức trên còn đơn giản hơn:

n = 16 / (ES)2

Các công thức trên được triển khai trong hàm  n.for.2means trong package epicalc.  

Ví dụ: Để đánh giá hiệu quả của thuốc chống loãng xương, nhà nghiên cứu thiết kế một nghiên cứu lâm sàng gồm 2 nhóm bệnh nhân: Nhóm 1 được điều trị bằng thuốc mới, nhóm 2 là nhóm chứng (placebo). Biến kết quả là mật độ xương hay BMD (tính bằng g/cm2). Qua nghiên cứu sơ khởi, nhà nghiên cứu biết rằng BMD trung bình ở phụ nữ sau mãn kinh là m1 = 0.80 g/cm2 và độ lệch chuẩn là s = 0.12 g/cm2.  Qua y văn, nhà nghiên cứu biết rằng thuốc có thể tăng BMD 5% sau 1 năm điều trị.  Do đó, có thể nói mục tiêu là BMD trung bình của nhóm điều trị là m2 =0.8 x 1.05 = 0.84. Giả dụ rằng độ lệch chuẩn của nhóm 2 cũng là 0.12 g/cm2. Nói cách khác, độ ảnh hưởng ES là: ES = (0.84 – 0.80) / 0.12 = 0.33. Nhà nghiên cứu muốn có power là 80% và sai sót loại I là 5%.

Chúng ta có thể dùng hàm n.for.2means trong epicalc để ước tính cỡ mẫu:


library(epicalc)
n = n.for.2means(mu1=0.80, mu2=0.84, sd1=0.12, sd2=0.12, power=0.9, alpha=0.05, ratio=1)

Trong hàm trên mu1mu2 là chỉ số trung bình của hai nhóm, sd1sd1 là độ lệch chuẩn của hai nhóm, và giả dụ rằng cỡ mẫu nhóm 1 bằng nhóm 2 (ratio = 1). 


Kết quả cho thấy nhà nghiên cứu cần tuyển n = 284 bệnh nhân (142 cho mỗi nhóm) cho công trình nghiên cứu.


No comments:

Post a Comment