Bài Tập Thống Kê Chương 8 - KNGT với hơn 2 mẫu độc lập (K47 2022) - Tài liệu tham khảo | Đại học Hoa Sen
Bài Tập Thống Kê Chương 8 - KNGT với hơn 2 mẫu độc lập (K47 2022) - Tài liệu tham khảo | Đại học Hoa Sen và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả
Preview text:
HP Thống Kê Ứng Dụng Trong Nghiên Cứu Khoa Học Xã Hội (3TC)
SV TLHGD K47 (năm 1), Khoa Tâm Lý học, ĐHSP TP HCM
GV phụ trách: ThS. Lý Minh Tiên
Ngày gửi bài: 22/05/2022
KIẾN THỨC CẦN NHỚ & BÀI TẬP RÈN LUYỆN
KIỂM NGHIỆM GIẢ THUYẾT VỚI K > 2 MẪU ĐỘC LẬP
Tóm tắt kiến thức
Khi kiểm nghiệm sự khác biệt các trung bình dân số (với số mẫu độc lập K > 2), ta
dùng kiểm nghiệm F.
Phương pháp của kiểm nghiệm F gọi là giải tích biến lượn
g (có sách viết “phân
tích phương sai”, từ thường dùng trong thống kê là ANOVA = ANalysis Of VAriance).
ANOVA dùng trong nhiều kiểm nghiệm khác nhau (với các mẫu độc lập hay mẫu
liên hệ, với 1 hay nhiều biến phụ thuộc). Trong bài này chỉ xét trường hợp có nhiều mẫu
độc lập và một biến phụ thuộc (dependent variable), thường gọi One-way ANOVA.
Lưu ý: Kiểm nghiệm F vẫn dùng được trong trường hợp K = 2 mẫu độc lập.
A. CÁC BƯỚC THỰC HIỆN KIỂM NGHIỆM ANOVA
Giả sử có 3 mẫu độc lập với cỡ mẫu là n1, n2, n3 chọn ra từ 3 dân số khác biệt nhau.
Dùng một trắc nghiệm với nhiều câu hỏi (về nhà ở, gia đình, việc làm, sức khỏe, giải trí,
vv..) để đo mức độ hài lòng với cuộc sống của từng người và gọi tổng điểm bài trắc
nghiệm là điểm hài lòng X.
Mục đích kiểm nghiệm: Kiểm chứng có sự chênh lệch thực sự giữa 3 trung bình
điểm hài lòng của 3 dân số hay không?
1. Định nghĩa thông số và viết giả thuyết H0, H1.
* Thông số: Gọi 1, 2, 3 lần lượt là điểm trung bình của 3 dân số về bài trắc nghiệm hài lòng. * Các giả thuyết: Ho : 1 = 2 = 3
H1 : Có ít nhất 2 trung bình dân số không bằng nhau.
2. Lập bảng dữ kiện là điểm số X của 3 mẫu, tính các tổng. Mẫu 1 Mẫu 2 Mẫu 3 X 2 2 2 mẫu1 Xmẫu2 Xmẫu3 X X X X*X X*X X*X X X X X*X X*X X*X X X X X*X X*X X*X X X X X*X X*X X*X X X X X*X X*X X*X X X X*X X*X X X*X . . .
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 8. Kiểm nghiệm ANOVA v
ới K > 2 mẫu độc lập (gửi K47, T5/2022) Trang 1
* Tính tổng điểm Ti = Xi và tổng bình phương (X2)i của mỗi mẫu i.
* Đếm số điểm số (số người ) trong mỗi mẫu i.
* Tính các trung bình 𝑋1 , 𝑋2 , 𝑋3
* Tổng toàn thể: T = Ti
* Tổng số người N = ni
* Tổng bình phương toàn thể: TB
P = (X2)1 + (X2)2 + (X2)3
3. Các bước tính trong ANOVA:
B1. Tính CM (Correct of Mean = số sửa sai trung bình) T 2 CM = N
B2. Tính các tổng bình phương (SS, tức Sums of Square) SStt = X2 - C M (SS toàn thể) SSB = (Ti2 / ni) - CM (SS giữa các nhóm) SSE = SStt - SSB (SS cho sai số) B3. Tính các độ tự do: (df = degree of freedom) * cho tử số : df1 = K - 1 (K là số mẫu)
* cho mẫu số : df2 = N - K
B4. Tính trung bình bình phương (MS = Mean of Square) MSB = SSB / df1 MSE = SSE / df2
B5. Tính biến số kiểm nghiệm F MSB F = MSE
4. Tra bảng các trị số tới hạn của F
* Chọn bảng phân bố F ứng với xác suất . (Có 2 bảng = 0.05 và = 0.01).
* Đọc trị số F trong bảng ứng với mức ý nghĩa và các độ tự do df1, df2.
5. Quyết định :
- Nếu F ≥ F : bác bỏ H0 và chấp nhận H1.
- Ngược lại nếu F < F : chấp nhận H0.
6. Trình bày các kết quả
Bảng giải tích biến lượng như mẫu sau và kết luận:
ANOVA so sánh các trung bình
Gốc biến thiên SS Df MS F
Phần kết luận Giữa các nhóm SSB K –1 MSB MSB/MSE Ghi kết quả so sánh Trong các nhóm SSE N - K MSE (Có khác biệt / (sai số) Không khác biệt ) Toàn thể SSt t
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 8. Kiểm nghiệm ANOVA v
ới K > 2 mẫu độc lập (gửi K47, T5/2022) Trang 2
B. SO SÁNH CÁC CẶP TRUNG BÌNH (KIỂM NGHIỆM SAU ANOVA)
(Lưu ý: Chỉ làm việc này khi kiểm nghiệm F đi đến kết quả bác bỏ giả thuyết H0,
tức giữa các trung bình có sự khác biệt ý nghĩa).
Khi ANOVA cho biết các trung bình dân số có khác biệt ý nghĩa ở xác suất , cần
so sánh từng cặp trung bình để biết rõ hơn sự khác biệt thực sự là do ở các cặp nào. Có
nhiều phương pháp thực hiện, trong khoa học xã hội thường dùng là:
1. Kiểm nghiệm Newman - Keuls. 2. Kiểm nghiệm Scheffé. 3. Kiểm nghiệm Tukey.
Các kiểm nghiệm nói trên thường thấy dùng trong các phần mềm thống kê chuyên
nghiệp như SYSTAT, SPSS for Windows. Ta cũng có thể tính bằng máy tính cầm tay.
Dưới đây trình bày phương pháp Scheffé:
Giả sử chọn (i, j) là một cặp trung bình. Ta tính Fs(ij) là trị số kiểm nghiệm Scheffé
cho cặp ấy theo công thức bên dưới. Lặp lại công thức này cho tất cả các cặp (i,j) có thể
ghép được trong K mẫu đã cho. K
(Lưu ý: Số cặp có thể ghép được là số tổ hợp 2 ! C =
với K = số mẫu độc lập). K ! 2 .(K − 2)!
Gọi i, j là các trung bình dân số từ đó đã chọn ra mẫu i và j.
Giả thuyết: H0 : i - j = 0 H1 : i - j 0 Công thức tính Fs : 2 (X − X ) i j F = S MSE MSE + n n i j X , X i j là 2 trung bình;
ni, nj = cỡ mẫu của mỗi mẫu.
MSE là trị số lấy từ kiểm nghiệm F ở trên.
* Các trị số Fs (ij) được so sánh với F’ = (K - 1). F
- Nếu Fs(ij) ≥ F’ = có sự khác biệt giữa 2 trị số trung bình.
- Nếu Fs(ij) < F’ = không khác biệt ý nghĩa.
* Nếu dùng kiểm nghiệm Tukey, công thức tính là: 𝑀𝑆𝐸 𝐶𝐷 = 𝑞𝑟√ 𝑛 𝑘 Trong đó:
CD là hiệu số tới hạn giữa các trung bình.
qr : biến kiểm nghiệm hàng số student-hóa. (Xem bảng Hàng số student-hóa).
MSE: trung bình bình phương của sai số, đã tính khi làm ANOVA.
nk : số chủ thể của mỗi nhóm (cỡ mỗi nhóm).
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 8. Kiểm nghiệm ANOVA v
ới K > 2 mẫu độc lập (gửi K47, T5/2022) Trang 3
Nếu cỡ các nhóm không bằng nhau và không quá khác biệt, phải sử dụng 𝑁 là
trung bình điều hòa (harmonic mean) theo công thức sau thay cho nk: 𝐾 𝑁 = 1 𝑛 + 1 + . . + 1 1 𝑛2 𝑛𝑘
Trong đó: K là số nhóm và các n1, n2, .. nk là số chủ thể trong nhóm 1, 2, .. k.
C. Bài tập rèn luyện
Bài 1: Dùng kiểm nghiệm F ể
đ so sánh trung bình điểm số 4 nhóm sau. Chọn = 0.05.
Nếu bác bỏ được giả thuyết H0, hãy dùng kiểm nghiệm Scheffé để so sánh trung bình từng
cặp. Điểm của mỗi nhóm ghi theo mỗi hàng dưới đây: Nhóm 1 : 5 7 6 3 9 7 4 2 Nhóm 2 : 9 11 8 7 7 Nhóm 3: 8 6 9 5 7 4 4 Nhóm 4: 1 3 4 5 1 4 Hướng dẫn:
A. Thực hiện kiểm nghiệm F
- Định nghĩa thông số và viết các giả thuyết H0, H1.
- Lập bảng số liệu, tính các tổng và thực hiện các bước trong ANOVA.
- Tra bảng F với = 0.05 và df1, df2
Kết quả được ghi trong bảng dưới để SV tự đối chiếu với bài làm.
Bảng tóm tắt ANOVA so sánh 4 trung bình
Gốc biến thiên SS df MS F Giữa các nhóm 82.222 3 27.407 7.017 Sai số 85.932 22 3.906 Toàn thể 168.154 25
- Kết luận: F
= 7.016 > F0.05 = 3.05. Có sự khác biệt giữa các trung bình.
B. Làm tiếp kiểm nghiệm Scheffé - Số liệu cần dùng: Nhóm 1 Nhóm 2 Nhóm 3 Nhóm 4 Mean = 5.38 8.4 6.14 3 ni = 8 5 7 6 MSE = 3.906 - Tính các Fs (ij
) theo công thức đã dẫn ở trên. Có tất cả 6 cặp.
- So sánh với F’, chỉ khác ở cặp 2 và 4, nghĩa là khác biệt ở trung bình nhóm 2 và 4.
(Nếu dùng Tukey thì có 2 cặp (2,4) và (3,4).
Bài 2. Một nhà nghiên cứu muốn kiểm nghiệm hiệu quả của một loại thuốc mới trên một
số chuột thí nghiệm để tìm hiểu tác dụng của nó về khả năng học chạy của chuột. Cuộc thí
nghiệm gồm 3 nhóm chuột và mỗi nhóm dùng loại thuốc thí nghiệm theo 1 trong 3 liều
lượng khác nhau (0 mg/kg, 10 mg/kg và 20 mg/kg), rồi đo khả năng của chuột học chạy
qua một mê cung. Biến phụ thuộc là số lần sai lầm (chạy sai 1 khúc quanh trong mê cung).
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 8. Kiểm nghiệm ANOVA v
ới K > 2 mẫu độc lập (gửi K47, T5/2022) Trang 4
Dữ kiện thu được (số lần sai) cho mỗi nhóm chuột: Nhóm 1 (0mg/kg) 2 3 1 4 2 T1 = 12 Nhóm 2 (10mg/kg) 1 2 3 1 2 T2 = 9 Nhóm 3 (20mg/kg) 4 4 5 4 4 5 T3 = 26
Hãy dùng ANOVA với = 0.05 để phân tích dữ kiện, nhằm xác định loại thuốc mới này
có ảnh hưởng một cách ý nghĩa đến khả năng học chạy trong mê cung của chuột hay không.
Kết quả (để SV tự đối chiếu):
Bảng tóm tắt ANOVA so sánh 3 trung bình
Gốc biến thiên SS df MS F Giữa các nhóm 19.604 2 9.802 13.653 Sai số 9.333 13 0.718 Toàn thể 28.938 15
- Kết luận: Có sự khác biệt giữa các trung bình. Làm tiếp kiểm nghiệm so sánh các cặp
trung bình → nhóm chuột 3 phạm nhiều lần sai hơn 2 nhóm chuột còn lại. Không có khác
biệt giữa nhóm chuột 1 và 2.
Bài 3. Các cuộc nghiên cứu khả năng đọc được thực hiện để xác định độ rõ ràng của 4 bài
text khác nhau. Các mẫu điểm số được ghi lại ở bên dưới. Hãy kiểm chứng ở mức ý nghĩa
= 0.05 rằng bốn bài text này tạo ra cùng trung bình điểm số khả năng đọc. Text A Text B Text C Text D 50 59 48 60 51 60 51 65 53 58 47 62 58 57 49 68 53 61 50 70 Đáp số:
* Các trung bình của Text A = 53.0, Text B = 59.0, Text C = 49.0, Text D = 65.0.
Bảng tóm tắt ANOVA so sánh 4 trung bình
Gốc biến thiên SS df MS F Giữa các nhóm 735.0 3 245.000 31.111 Sai số 126.0 6 7.875 Toàn thể 861.0 19
* Kiểm nghiệm sau ANOVA: So sánh các cặp trung bình cho thấy:
- Text D khác biệt với cả 3 Text A, Text B, Text C.
- Text A khác với Text B; Text B khác với Text C. Chỉ Text A không khác Text C.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 8. Kiểm nghiệm ANOVA v
ới K > 2 mẫu độc lập (gửi K47, T5/2022) Trang 5