Monday, September 22, 2014

Dữ liệu dùng cho phân tích

Trong phân tích dữ liệu, ngoài việc học phương pháp, một điều rất quan trọng là dữ liệu. Tôi đã upload lên trang statistics.vn một số dữ liệu nghiên cứu cần thiết cho thực hành phân tích. Một số dữ liệu có thể ứng dụng ngay là như sau:


obesity data.csv (dữ liệu về béo phì)

does_vn07.csv (dữ liệu về nghiên cứu gãy xương)

fracture.txt (dùng cho logistic regression)

challenger.txt (tai nạn phi thuyền Challenger, minh hoạ logistic regression) 

indian.txt (dữ liệu huyết áp ở người Ấn Độ da đỏ, dùng cho stepwise regression)

rosiglitazone.csv (dùng cho meta-analysis)

Cách đọc:

(a) Nếu là txt file, thì dùng hàm (ví dụ):

dat = read.table("http://statistics.vn/data/fracture.txt", header=T, na.strings=".")

(b) Nếu là csv file, thì dùng hàm (ví dụ):

dat = read.csv("http://statistics.vn/data/does_vn07.txt", header=T, na.strings=".")
1 comment: