





Preview text:
Tóm tắt Bài 5.2 •Giới thiệu KIỂM ĐỊNH GIẢ THUYẾT •Khái niệm cơbản
•Kiểmđịnh trung bình một tổng thể
•Kiểmđịnh tỷlệmột tổng thể 01 0 1 Kế hoạch Khái niệm cơbản
•Thu thập thông tin và sử dụng chúng để xác định ý
•Kiểmđịnh giảthuyếtđưa ra quy trình cho việc ra tưởng nào là đúng.
quyếtđịnh trong điều kiện không chắc chắn.
đó sẽ ẫ đến việc ra quyế
•Chúng ta có 2 ý tưởng trái ngược nhau trong đầu –
•Dựa vào việc xác định d n t
định là mang theo ô hay không mang. gọi là các giảthuyết
•Đây là ma trận ra quyết định:
–Ý tưởng 1: giảthuyếtkhông
–Ý tưởng 2: giảthuyếtđối
•Hai ý tưởng này phải hoàn toàn trái ngược nhau. Thực tế xảy ra Chẳng hạn: Mưa Ko mưa –Ý tưởng 1( H ): hôm nay trời mưa Quyết Mang ô 0
–Ý tưởng 2 ( H ): hôm nay trời không mưa định Không mang ô A 3 2 2 3 Về mặt thống kê:
Kiểm định giả thuyết tương tự như phiên tòa (1) Thực tế H đúng H đúng Phiên tòa
Kiểm định giả thuyết 0 A Chấp nhận Quyết H Bị cáo vô tội Giả thuyết H 0 Sai l ầm loại 2 định Chấp nhận 0 H Bị cáo có tội Giả thuyết H A A
Sai lầm loại 1
α= mức ý nghĩa = P(x/s mắc sai lầm loại 1) Thu thập bằng chứng Thu thập thông tin
β= 1 – lực kiểmđịnh = P(x/s mắc sai lầm loại 2)
Thụ lý – tổng hợp bằng
Tóm tắt thông tin – xây
Lực kiểmđịnh=P(x/s bác bỏH khi nó sai) chứng và phán quyết
dựng thống kê và ra quyết định 0 4 5 4 5 1
Kiểm định giả thuyết tương tự như phiên tòa (3)
Kiểm định giả thuyết tương tự như phiên tòa (2)
Nếu chúng ta chỉchắc chắn 95%, có nghĩa là có 5%
mắc sai lầm. Vậy, đó là sai lầm loại nào? Phiên tòa
Kiểm định giả thuyết
Mắc sai lầm loại 1 được coi là nghiêm trọng hơn mắc sai
lầm loại 2. Do vậy, quy tắc thông thường là chọn x/s mắc Bị cáo trắng án Chọn H0
sai lầm loại 1, α,là nhỏ;
Trường hợp lý tưởng là cũng muốn x/s mắc sai lầm loại 2, Bị cáo bị kết tội Chọn HA
β, là nhỏ. Nhưng hai x/s này có quan hệngược chiều;
Do vậy, bài toán kiểmđịnh thường bắtđầu bằng xác định α
Kết tội 1 người vô tội Mắc sai lầm loại 1
bằng 5% (tức là 5% khảnăng chúng ta bác bỏH khi nó 0
đúng), hoặc bằng các giá trịkhác, và không quan tâm đếnβ
Tha bổng 1 người có tội Mắc sai lầm loại 2 “ “ Sau phiên tòa vẫn còn
95% tin tưởng là ra quyết
những nghi ngờ hợp lý” định đúng” 6 7 6 7
Kiểm định giả thuyết tương tự như phiên tòa (4)
Các bước trong kiểm định giả thuyết 1. Phát biểu H0 và HA
•Trong kiểmđịnh giảthuyết, chúng ta cũng đưa ra 2. Tính các thống kê
giảđịnh “vô tội”giống nhưtrong phiên tòa. Có
3. Thiết lập các quy tắc ra quyết định sử dụng
nghĩa là khi kiểmđịnh giảthuyết, chúng ta cũng
hoặc miền bác bỏ, p-value, hoặc KTC.
bắtđầu bằng giảđịnh H đúng. Sau đó, chúng ta 0 4. Đưa ra kết luận.
thu thập thông tin và nếu có đủ bằng chứng chúng ta sẽbác bỏH
.Điều này tương đương với chấp 0 nhận HA 8 9 8 9
Kiểmđịnh µ khi biết Quy tắc kiểm định
•VD1: Một ngân hàng đang đánh giá hiệu quảcủa việc
triển khai tính năng chuyển khoản nhanh 24/7 trên ứng •Giả thuyết không:
dụng ngân hàng số. Ngân hàng kỳvọng rằng, để tính
Luôn luôn để kiểm định cho tổng thể và được
năng này được xem là thành công, sốlượt giao dịch kí hiệu theo chữ Hy Lạp
trung bình mỗi tài khoản sửdụng app phảiđạt ít nhất
Luôn luôn có dấu bằng
170 lượt/6 tháng. Ngân hàng đã chọn ngẫu nhiên một
mẫu gồm 50 tài khoản, và nhận thấy sốgiao dịch trung •Giả thuyết đối:
bình là 178 lượt/6 tháng. Giảsửsốlượt giao dịch của
Cũng viết cho tổng thể
các tài khoản có phân phối xấp xỉchuẩn vớiđộ lệch
Có thể là <, > hoặc ≠
chuẩn là 23. Liệu có kết luậnđược tính năng chuyển
Nhìn giống giả thuyết không nhưng dấu bằng
khoản nhanh 24/7 thực sựhiệu quảkhông? đã được thay thế. 10 11 10 11 2 Áp dụng cho VD 1
Ôn lại: Định lý giới hạn trung tâm (CLT) •Giảthuyếtkhông H0:µ=170
•CLT phát biểu rằng nếu cỡmẫuđủ lớn, trung bình
mẫu có phân phối chuẩn với giá trịtrung bình là µ •Giảthuyếtđối
và độ lệch chuẩn là /n . Do vậy nếu chúng ta H :µ>170
tính thống kê dướiđây thì thống kê này sẽtuân A
theo quy luật phân phối chuẩn hóa XZ N ~ n 0,1 a s . n 13 12 12 13 Áp dụng cho ví dụ 1 Áp dụng cho ví dụ 1 •Chúng ta có σ=23
•Tính tiêu chuẩn kiểmđịnh z. •Tính thống kê
–Ý nghĩa: thống kê z đượcđo lường theo đơn vịchuẩn hóa zcho VD1. z=2.46
cho chúng ta biết trung bình mẫu nằm cách xa trung bình
giảđịnh của tổng thểnhưthếnào. •Công thức: X Zn
•Z sẽtuân theo quy luật phân phối chuẩn hóa Nếu
trên thực tếtrung bình của tổng thểbằng giá trịnêu
trong giảthuyếtkhông 14 15 14 15 Quy tắc ra quyết định Áp dụng cho ví dụ 1
•Có 3 phương pháp: miền bác bỏ, p-value, và khoảng tin cậy Miền bác bỏ:
•Điểm đánh dấu miền bác bỏ 5% là 1.645.
Nếu muốn ĐTC là 95%, có nghĩa là có 5% nguy cơ bác bỏ H khi 0
•Do vậy chúng ta sẽ bác bỏ H nếu tiêu chuẩn kiểm nó đúng. 0
Do vậy, chúng ta vẽ miền 5% trong phân phối chuẩn hóa (việc vẽ định > 1.645.
miền này cần căn cứ vào giả thuyết đối) và miền đó chính là miền bác bỏ. •Trong VD 1 z = 2.46
Bác bỏ H 0 và đưa ra kết luân có lợi cho HA . Nói
một cách khác ‘có đủ bằng chứng thống kê ở mức
ý nghĩa 5% cho giao dịch trung bình của các máy
ATM nhiều hơn 170 lần/tháng. 16 17 16 17 3
P-value (tính thủ công hoặc bằng máy tính) Áp dụng cho VD1
•Đây là xác suất để có được tiêu chuẩn kiểm định Tính P(Z>2.46)
•Vẽ phân phối z – trong VD 1, p-value là P(Z>2.46).
•Giá trị p-value nhỏ là bằng chứng bác bỏ H 0. •Quy tắc:
Nếu p-value < α, => Bác bỏ H 0
Nếu p-value > α, => Không bác bỏ H 0 18 19 18 19
Kiểm định một phía và hai phía
Kiểm định hai phía “≠“
•Kiểm định 1 phía có thể là “<“hoặc “>”
•Miền bác bỏ là Z<-Z α/2, Z>+Zα/2
Miền bác bỏ nằm ở phía trái hoặc phía phải
•P-value bằng P(Z>T.S)+P(Z•Kiểm định 2 phía là “≠”
Miền bác bỏ được chia ra làm 2 phía 20 21 20 21
Kiểmđịnh hai phía: thay đổi VD1
Kiểm định µ khi chưa biết
•VD1: Một ngân hàng đang đánh giá hiệu quảcủa việc
triển khai tính năng chuyển khoản nhanh 24/7 trên ứng
•Thay σbằng svà tính thống kê t.
dụng ngân hàng số. Ngân hàng kỳvọng rằng, để tính
•Quy tắc kiểmđịnh tương tựtrường hợp 1.
năng này được xem là thành công, sốlượt giao dịch Tiêu chuẩn kiểmđịnh
trung bình mỗi tài khoản sửdụng app phảiđạt 170
lượt/6 tháng. Ngân hàng đã chọn ngẫu nhiên một mẫu X
gồm 50 tài khoản, và nhận thấy sốgiao dịch trung bình t s n
là 178 lượt/6 tháng. Giảsửsốlượt giao dịch của các tài
khoản có phân phối xấp xỉchuẩn vớiđộ lệch chuẩn là
ttuân theo quy luậtt-student với bậc tựdo n-1.
23. Liệu có kết luậnđược tính năng chuyển khoản
nhanh 24/7 thực sựhiệu quảkhông? 22 23 22 23 4
Kiểm định tỷ lệ của 1 tổng thê Thực hành với SPSS
Thực hiện tương tựkiểmđịnh trung bình
Luôn sửdụng tiêu chuẩn kiểmđịnh z.
Sửdụng file dữliệugss.sav để kiểmđịnh
Với n đủ lớn, tiêu chuẩn kiểmđịnh là:
giảthuyết những người lao động làm việc nhiều hơn 40h một tuần z𝑝 p p1p n 24 24 25
Kiểm định tỷ lệ của 1 tổng thê (cont.) Ví dụ 2
•Trong một nghiên cứu của công ty AZ, người ta thực
•Miền bác bỏđược xác định nhưsau:
hiện phỏng vấn 758 khách du lịch đến HạLong có H : p ≤p
sửdụng tour du lịch biển xem họcó hài lòng hay 0 0 Kiểmđịnh phía phải: Nếu z > z , bác bỏH 0 .
không. 394 người trong sốđược hỏiđã trảlời là có. H1: p > p0 H ≥
Với mức ý nghĩa 5%, hãy kiểmđịnh xem liệu có 0 : p p 0 Kiểmđịnh phía trái: Nếu z < -z , bác bỏH 0. H
đúng là đa sốnhững ngườiđến HạLong có sửdụng 1 : p < p0 H
tour du lịch biển là hài lòng với tour này hay không? 0 : p = p0
Nếu |z| > z /2, bác bỏ Kiểmđịnh hai phía: H ≠ 0 . H1: p p 0 26 27 5