Chương 4. Kiểm định giả thuyết | Đại học Sư Phạm Hà Nội

Chương 4. Kiểm định giả thuyết | Đại học Sư Phạm Hà Nội với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống.

CHƯƠNG 4: KIỂM ĐỊNH
GIẢ THUYẾT THỐNG
Khoa Toán Tin
Trường Đại học phạm Nội
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 1/41
Nội dung của chương
1
Đặt bài toán kiểm định giả thuyết.
2
Bài toán kiểm định giả thuyết cho giá trị trung bình một mẫu.
3
Bài toán kiểm định giả thuyết cho tỉ lệ một mẫu.
4
Bài toán kiểm định giả thuyết cho giá trị trung bình hai mẫu.
5
Bài toán kiểm định giả thuyết cho tỉ lệ hai mẫu.
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 2/41
Mục tiêu của chương
1
Hiểu được cách đặt bài toán các khái niệm: giả thuyết, đối thuyết, sai lầm
loại 1, sai lầm loại 2, mức ý nghĩa, nguyên xây dựng tiêu chuẩn kiểm định.
2
Nhận biết được tình huống
so sánh trung bình một mẫu, hai mẫu;
so sánh tỉ lệ một mẫu, hai mẫu.
3
Sử dụng quy trình 6 bước để giải bài toán kiểm định trung bình, tỉ lệ diễn
giải chính xác kết quả thu được.
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 3/41
4.1Bàitoánkiểmđịnhgiảthuyết
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 4/41
Tình huống thực tế
Một chuỗi cửa hàng phê X sau khi ra mắt sản phẩm đầu tiên rất thành
công với 70% phản hồi tích cực từ tất cả khách hàng. Ông chủ muốn tiếp
tục cho ra mắt công thức pha chế tiếp theo hy vọng cũng nhận được sự
thành công như lần trước.
Ông chủ đã ngầm khẳng định giả thuyếtrằng 70% tất cả khách hàng sẽ yêu
thích sản phẩm mới y tiến hành khảo sát để kiểm chứng.
Ông cho bán miễn phí trên 100 khách hàng bất kỳ ghi nhận được 67
người cho kết quả tích cực. Với kết quả như trên, ông chủ hơi nghi ngờ về
giả thuyết của mình.
Nếu kết quả càng xa con số 70%, sự nghi ngờ của ông chủ càng lớn đến
một ngưỡng nào đó ông chủ sẽ phải bác b giả thuyết của mình. Liệu
cách nào để cụ thể hóa mối tương quan giữa kết quả khảo sát kết luận
của ông chủ về giả thuyết hay không?
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 5/41
Bài toán kiểm định giả thuyết (Hypothesis Testing)
Giả thuyết thống một phát biểu nào đó về tính chất của quần thể.
Bài toán kiểm định giả thuyết thống thường xuất hiện khi ta cần phải đưa
ra kết luận về hai giả thuyết trái ngược nhau thông qua việc khảo sát.
Cụ thể, kiểm định giả thuyết thống một quy trình để xác minh xem
thể chấp nhận giả thuyết thống hay không dựa trên mẫu số liệu quan sát
được từ quần thể.
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 6/41
hình hoá
Với tình huống thực tế trên, ta hai giả thuyết như sau:
- Giả thuyết H
0
: tỉ lệ khách hàng thích sản phẩm mới bằng 70% (đượcgiả
sửđúng)
- Đối thuyết H
1
: tỉ lệ khách hàng thích sản phẩm mới không bằng 70%
(đượcgiảsửsai)
Dựa trên mẫu số liệu thu được, ta cần phải lựa chọn một trong hai quyết
định:
- Bác b giả thuyết để ủng hộ đối thuyết ;H
0
H
1
- Không bác b giả thuyết để ủng hộ đối thuyết . Tức chấp nhậnH
0
H
1
H
0
không ủng hộ .H
1
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 7/41
Miền tiêu chuẩn
Một miền được gọi (hay còn gọi miền bác bỏ) choS miền tiêu chuẩn
bài toán kiểm định giả thuyết với đối thuyết nếu:H
0
H
1
kết quả khảo sát nằm trong miền , ta sẽ bác b để ủng hộ .S H
0
H
1
kết quả khảo sát nằm ngoài miền , ta sẽ chấp nhậnS H
0
không ủng hộ .H
1
dụ, trong tình huống thực tế trên, nếu kết quả khảo sát nằm trong
khoảng 65% đến 75% thì ta bác b , ngược lại ta sẽ chấp nhận .H
0
H
0
Việc xác định miền tiêu chuẩn rất giống với quá trình tìm Khoảngtincậy
thế cũng sẽ tồn tại sự không chắc chắn. Do ta đưa ra quyết định dựa
trên một mẫu số liệu nên thể mắc phải sai lầm.
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 8/41
Hai loại sai lầm
Quy tắc quyết định
Quyết định H
0
đúng đúngH
1
Bác b giả thuyết Quyết định đúngH
0
Sai lầm loại 1
Chấp nhận giả thuyết Quyết định đúngH
0
Sai lầm loại 2
Nhận xét
Nếu ta luôn chấp nhận thì không mắc phải sai lầm loại 1 nhưng sẽ làmH
0
xác suất mắc sai lầm loại 2 đạt cao nhất.
Ngược lại, nếu ta luôn bác b thì không mắc phải sai lầm loại 2 nhưng sẽH
0
làm xác suất mắc sai lầm loại 1 đạt cao nhất.
Như vậy, Khôngthểlàmtriệttiêuđồngthờicảhailoạisailầm!
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 9/41
Nguyên chung để tìm miền tiêu chuẩn
Ta cần tìm miền sao cho xác suất mắc hai loại sai lầm nhỏ nhấtS .
Trong thực tế, người ta thường kiểm soát xác suất xảy ra sai lầm loại 1 theo
ý muốn (thông qua cách thiết kế thí nghiệm, điều chỉnh các thông số,...). Cụ
thể, người ta sẽ khống chế xác suất mắc sai lầm loại 1 không vượt quá
α (0, 1) từ đó sẽ chọn miền tiêu chuẩn sao cho xác suất mắc sai lầmS
loại 2 nhỏ nhất.
Khi đó, được gọi của bài toán kiểm định.α mức ý nghĩa
Ta thường chọn mức ý nghĩa α = 0 5 ., 05 = %
Khoa Toán Tin Trường Đại học phạm Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG 10/41
| 1/40

Preview text:

CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ Khoa Toán Tin
Trường Đại học Sư phạm Hà Nội
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 1 / 41 Nội dung của chương 1
Đặt bài toán kiểm định giả thuyết. 2
Bài toán kiểm định giả thuyết cho giá trị trung bình một mẫu. 3
Bài toán kiểm định giả thuyết cho tỉ lệ một mẫu. 4
Bài toán kiểm định giả thuyết cho giá trị trung bình hai mẫu. 5
Bài toán kiểm định giả thuyết cho tỉ lệ hai mẫu.
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 2 / 41 Mục tiêu của chương 1
Hiểu được cách đặt bài toán và các khái niệm: giả thuyết, đối thuyết, sai lầm
loại 1, sai lầm loại 2, mức ý nghĩa, nguyên lý xây dựng tiêu chuẩn kiểm định. 2
Nhận biết được tình huống
so sánh trung bình một mẫu, hai mẫu;
so sánh tỉ lệ một mẫu, hai mẫu. 3
Sử dụng quy trình 6 bước để giải bài toán kiểm định trung bình, tỉ lệ và diễn
giải chính xác kết quả thu được.
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 3 / 41
4.1Bàitoánkiểmđịnhgiảthuyết
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 4 / 41 Tình huống thực tế
Một chuỗi cửa hàng cà phê X sau khi ra mắt sản phẩm đầu tiên rất thành
công với 70% phản hồi tích cực từ tất cả khách hàng. Ông chủ muốn tiếp
tục cho ra mắt công thức pha chế tiếp theo và hy vọng cũng nhận được sự
thành công như lần trước.
Ông chủ đã ngầm khẳng định giả thuyếtrằng 70% tất cả khách hàng sẽ yêu
thích sản phẩm mới này và tiến hành khảo sát để kiểm chứng.
Ông cho bán miễn phí trên 100 khách hàng bất kỳ và ghi nhận được 67
người cho kết quả tích cực. Với kết quả như trên, ông chủ hơi nghi ngờ về giả thuyết của mình.
Nếu kết quả càng xa con số 70%, sự nghi ngờ của ông chủ càng lớn và đến
một ngưỡng nào đó ông chủ sẽ phải bác bỏ giả thuyết của mình. Liệu có
cách nào để cụ thể hóa mối tương quan giữa kết quả khảo sát và kết luận
của ông chủ về giả thuyết hay không?
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 5 / 41
Bài toán kiểm định giả thuyết (Hypothesis Testing)
Giả thuyết thống kê là một phát biểu nào đó về tính chất của quần thể.
Bài toán kiểm định giả thuyết thống kê thường xuất hiện khi ta cần phải đưa
ra kết luận về hai giả thuyết trái ngược nhau thông qua việc khảo sát.
Cụ thể, kiểm định giả thuyết thống kê là một quy trình để xác minh xem có
thể chấp nhận giả thuyết thống kê hay không dựa trên mẫu số liệu quan sát được từ quần thể.
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 6 / 41 Mô hình hoá
Với tình huống thực tế trên, ta có hai giả thuyết như sau:
- Giả thuyết H0: tỉ lệ khách hàng thích sản phẩm mới bằng 70% (đượcgiả sửlàđúng)
- Đối thuyết H1: tỉ lệ khách hàng thích sản phẩm mới không bằng 70% (đượcgiảsửlàsai)
Dựa trên mẫu số liệu thu được, ta cần phải lựa chọn một trong hai quyết định:
- Bác bỏ giả thuyết H0 để ủng hộ đối thuyết H1;
- Không bác bỏ giả thuyết H0 để ủng hộ đối thuyết H1. Tức là chấp nhận H0 và không ủng hộ H1.
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 7 / 41 Miền tiêu chuẩn
Một miền S được gọi là miền tiêu chuẩn (hay còn gọi là miền bác bỏ) cho
bài toán kiểm định giả thuyết H0 với đối thuyết H1 nếu:
kết quả khảo sát nằm trong miền S, ta sẽ bác bỏ H0 để ủng hộ H1.
kết quả khảo sát nằm ngoài miền S, ta sẽ chấp nhận H0 và không ủng hộ H1.
Ví dụ, trong tình huống thực tế trên, nếu kết quả khảo sát nằm trong
khoảng 65% đến 75% thì ta bác bỏ H0, ngược lại ta sẽ chấp nhận H0.
Việc xác định miền tiêu chuẩn rất giống với quá trình tìm Khoảngtincậy
và vì thế cũng sẽ tồn tại sự không chắc chắn. Do ta đưa ra quyết định dựa
trên một mẫu số liệu nên có thể mắc phải sai lầm.
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 8 / 41 Hai loại sai lầm Quy tắc quyết định Quyết định H0 đúng H1 đúng Bác bỏ giả thuyết H0 Sai lầm loại 1 Quyết định đúng
Chấp nhận giả thuyết H0 Quyết định đúng Sai lầm loại 2 Nhận xét
Nếu ta luôn chấp nhận H0 thì không mắc phải sai lầm loại 1 nhưng sẽ làm
xác suất mắc sai lầm loại 2 đạt cao nhất.
Ngược lại, nếu ta luôn bác bỏ H0 thì không mắc phải sai lầm loại 2 nhưng sẽ
làm xác suất mắc sai lầm loại 1 đạt cao nhất.
Như vậy, Khôngthểlàmtriệttiêuđồngthờicảhailoạisailầm!
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 9 / 41
Nguyên lý chung để tìm miền tiêu chuẩn
Ta cần tìm miền S sao cho xác suất mắc hai loại sai lầm là nhỏ nhất.
Trong thực tế, người ta thường kiểm soát xác suất xảy ra sai lầm loại 1 theo
ý muốn (thông qua cách thiết kế thí nghiệm, điều chỉnh các thông số,...). Cụ
thể, người ta sẽ khống chế xác suất mắc sai lầm loại 1 không vượt quá
α ∈ (0, 1) và từ đó sẽ chọn miền tiêu chuẩn S sao cho xác suất mắc sai lầm loại 2 nhỏ nhất.
Khi đó, α được gọi là mức ý nghĩa của bài toán kiểm định.
Ta thường chọn mức ý nghĩa α = 0, 05 = 5%.
Khoa Toán Tin Trường Đại học Sư phạm Hà Nội CHƯƠNG 4: KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 10 / 41