1
Bài 5.2
KIM ĐỊNH GI THUY T
01
Tóm t t
Gii thi u
Khái nim c nơb
Kimđịnh trung bình mt tng th
Ki mmđịnh tl t tng th
Khái nim cơbn
Ki thuymđịnh gi ếtđưa ra quy trình cho vi c ra
quy iếtđịnh trong đ u kin không chc chn.
Chúng ta có 2 ý tưởng trái ng c nhau trongượ đầu
g thuy ti các gi ế
Ý tưởng 1: githuyếtkhông
Ý tưởng 2: githuyếtđối
Hai ý tưởng này phi hoàn toàn trái ngược nhau.
Chng h n:
Ý tưởng 1(
H
0
): hôm nay tri m aư
Ý tưởng 2 (
H
A
)
: hôm nay tri không m aư
2
Kế hoch
Thu th p thông tin và s nh ý dng chúng để xác đị
tưởng nào là đúng.
Da vào vic xác định d n t đó s đến vic ra quyế
định là mang theo ô hay không mang.
Đây là ma trn ra quyết định:
Thc tế xy ra
Ko mưaM aư
Mang ô
Quyết
định Không mang ô
3
V mt thng kê:
Thc tế
H
A
đúngH
0
đúng

Sai lm loi 2

Chp nhn
H
0
Quyết
định


Sai lm loi 1
Chp nhn
H
A
α= m ĩc ý ngh a = P(x/s mc sai lm loi 1)
β= 1 – l địc kim nh = P(x/s mc sai lm loi 2)
Lc kimđịnh=P(x/s bác b H
0
khi sai)
4
Kim định gi ng t nh thuyết tươ ư phiên tòa (1)
Ki tm định gi thuyếPhiên tòa
Gi thuyết H
0
B cáo vô ti
Gi thuyết H
A
B cáo có ti
Thu thp thông tinThu thp bng chng
Tóm tt thông tin – xây
dng thng kê và ra quyết
định
Th lý – tng hp bng
ch tng và phán quyế
5
0 1
2 3
4 5
2
Kim định gi ng t nh thuyết tươ ư phiên tòa (2)
Ki tm định gi thuyếPhiên tòa
Chn H
0
B cáo trng án
Chn H
A
B cáo b k iết t
Mc sai lm loi 1Kết ti 1 người vô t i
Mc sai lm loi 2Tha b ing 1 người có t
95% tin tưởng là ra quyết
định đúng
Sau phiên tòa vn còn
nhng nghi ng hp lý
6
Kim định gi ng t nh thuyết tươ ư phiên tòa (3)
Nếu chúng ta chchc chn 95%, nghĩa 5%
mc sai lm. Vy, đó sai lm loi nào?
Mc sai lm loi 1 được coi nghiêm trng hơn mc sai
lm loi 2. Do vy, quy tc thông thường chn x/s m c
sai lm loi 1, α, nh ;
Trường hp tưởng cũng mun x/s mc sai lm loi 2,
β, nh. Nhưng hai x/s này quan hngược chiu;
Do vy, bài toán kimđịnh thường btđầu bng xác định α
bng 5% (tc 5% khnăng chúng ta bác b H
0
khi
đúng), ho c b ng c giá trkhác, và không quan tâm đếnβ
7
Kim định gi ng t nh thuyết tươ ư phiên tòa (4)
Trong kimđịnh githuyết, chúng ta cũng đưa ra
giảđnh t ng nhi gi ưtrong phiên tòa.
ngh thuy ngĩa khi kimđịnh gi ết, chúng ta cũ
btđầu bng giảđnh H
0
đ đúng. Sau ó, chúng ta
thu thp thông tin nếu đủ bng chng chúng
ta sbác b H
0
.Điu này tương đương vi ch p
nhn H
A
8
Các bước trong kim tđịnh gi thuyế
1. Phát biu H
0
và H
A
2. Tính các thng kê
3. Thiết lp các quy tc ra quyết d ng định s
hoc min bác b, p-value, hoc KTC.
4. Đưa ra kết lu n.
9
Kimđịnh µ khi bi tế
VD1: Mt ngân hàng đang đánh giá hiu quca vi c
tri ngn khai tính năng chuyn khon nhanh 24/7 trên
d vng ngân hàng s. Ngân hàng k ng rng, để tính
năng này được xem thành công, slượt giao dch
trung bình mi tài khon sdng app phiđạt ít nh t
170 lượt/6 tháng. Ngân hàng đã chn ng u nhiên m t
mu g n thm 50 tài khon, nh y sgiao dch trung
bình 178 lượt/6 tháng. Gis s lượt giao dch c a
các tài kho n phân phi x p xchu n v iđộ lch
chu ế n 23. Li u k t lu nđược tính năng chuy n
kho n nhanh 24/7 th c shi u qukhông?
10
Quy t c ki m định
Gi thuyết không:
Luôn luôn ki ng thđể m định cho t được
kí hi pu theo ch Hy L
Luôn luôn có du b ng
Gi i: thuyết đố
Cũng vi ng thết cho t
Có th là <, > hoc
Nhìn gi thuy u bng gi ết không nh ng dư ng
đã được thay thế.
11
6 7
8 9
10 11
3
Áp dng cho VD 1
Gi thuy ếtkhông
H
0
:µ=170
Gi thuy ếtđối
H
A
:
µ>170
12
Ôn li: Định lý gii hn trung tâm (CLT)
CLT phát biu rng nếu cmuđủ ln, trung bình
mu phân phi chun vi giá trtrung bình µ
độ lch chun . Do v y n ếu chúng ta
tính thng dướiđây thì thng này stuân
theo quy lut phân phi chun hóa
/n
13

~ 0,1 as .
XZ N n
n

Áp dng cho ví d 1
X
Zn
14
Chúng ta σ=23
Tính tiêu chun kimđịnh z.
Ý nghĩa: thng z đượcđo lường theo đơn vchun hóa
cho chúng ta biết trung bình mu nm cách xa trung bình
giảđnh c ng tha t nh th nào.ư ế
Công thc:
Z stuân theo quy lut phân phi chun hóa Nếu
trên thc t a tếtrung bình c ng thbng giá trnêu
trong githuyếtkhông
Áp dng cho ví d 1
15
Tính thng zcho VD1. z=2.46
Quy tc ra quyết định
Có 3 phương pháp: min bác b, p-value, và khong tin c y
Min bác b :
Nếu mun HĐTC là 95%, có nghĩa là có 5% nguy cơ bác b
0
khi
úng. đ
Do vy, chúng ta v min 5% trong phân phi chun hóa (vic v
min này cn căn c vào gi thuyết n n đối) và mi đó chính là mi
bác b.
16
Áp dng cho ví d 1
Đim đánh du min bác b 5% là 1.645.
Do v y chúng ta s bác b H
0
nếu tiêu chun kim
định > 1.645.
Trong VD 1 z = 2.46
Bác b H
0
đưa ra kết luân có li cho H
A
. Nói
mt cách khác đủ bng ch ng thng kê m c
ý nghĩa 5% cho giao dch trung bình ca các máy
ATM nhiu hơn 170 ln/tháng.
17
12 13
14 15
16 17
4
P-value (tính th công hoc bng máy tính)
Đây là xác su t đểđược tiêu chu n ki m định
V phân phi z – trong VD 1, p-value là P(Z>2.46).
Giá tr p-value nh là bng chng bác b H
0
.
Quy tc:
Nếu p-value < α, => Bác b H
0
Nếu p-value > α, => Không bác b H
0
18
Áp dng cho VD1
19
Tính
P(Z>2.46)
Kim định mt phía và hai phía
Ki < hom định 1 phía có th c >
Min bác b n m phía trái hoc phía ph i
Kim định 2 phía là
Min bác b được chia ra làm 2 phía
20
Kim định hai phía
Min bác b là Z<-Z
α/2
, Z>+Z
α/2
P-value bng P(Z>T.S)+P(Z<T.S)
21
Kimđịnh hai phía: thay đổi VD1
VD1: Mt ngân hàng đang đánh giá hiu quca vi c
tri ngn khai tính năng chuyn khon nhanh 24/7 trên
d vng ngân hàng s. Ngân hàng k ng rng, để tính
năng này được xem thành công, slượt giao dch
trung bình mi tài khon sdng app phiđạt 170
lượt/6 tháng. Ngân hàng đã chn ngu nhiên mt mu
gm 50 tài khon, nhn thy sgiao dch trung bình
178 lượt/6 tháng. Gis s lượt giao dch ca các tài
kho n phân phi x p xchu n v iđộ lch chun
23. Liu kết lunđược tính năng chuyn kho n
nhanh 24/7 thc shiu qukhông?
22
Kim định µ khi chưa bi tế
Thay σbng s tính thng .t
Quy tc kimđịnh tương ttrường hp 1.
Tiêu chun kimđịnh
ttuân theo quy lutt-student vi bc tdo n-1.
X
t
s n
23
18 19
20 21
22 23
5
24
Thc hành vi SPSS
S d li ki nh ng file d ugss.sav để mđị
gi thuy ết nhng người lao động làm vi c
nhiu h n 40h mơ t tu n
Kim l cđịnh t a 1 tng thê
Thc hin tương tkimđịnh trung bình
Luôn sdng tiêu chun kimđịnh z.
Vi n đủ ln, tiêu chun kimđịnh là:
z𝑝 p
p
󰇛1p 󰇜
n
Kim l cđịnh t a 1 tng thê (cont.)
Min bác bỏđưc xác định nhưsau:
Nếu z > z
, bác b H
0
.
H
0
: p p
0
H
1
: p > p
0
Ki i:mđịnh phía ph
Nếu z < -z
, bác b H
0
.
H
0
: p p
0
H
1
: p < p
0
Kimđịnh phía trái:
Nếu |z| > z
/2
, bác b
H
0
.
H
0
: p = p
0
H
1
: p p
0
Kimđịnh hai phía:
Ví d 2
Trong mt nghiên cu ca công ty AZ, người ta th c
hin phng vn 758 khách du lch đến HLong
s d ng tour du lch bin xem h hài lòng hay
không. 394 người trong sốđưc h ã triđ li có.
Vi mc ý nghĩa 5%, hãy kimđịnh xem li u
đ úng đa snh ng ngườiđến HLong sd ng
tour du lch bin hài lòng vi tour này hay không?
24 25
26 27

Preview text:

Tóm tắt Bài 5.2 •Giới thiệu KIỂM ĐỊNH GIẢ THUYẾT •Khái niệm cơbản
•Kiểmđịnh trung bình một tổng thể
•Kiểmđịnh tỷlệmột tổng thể 01 0 1 Kế hoạch Khái niệm cơbản
•Thu thập thông tin và sử dụng chúng để xác định ý
•Kiểmđịnh giảthuyếtđưa ra quy trình cho việc ra tưởng nào là đúng.
quyếtđịnh trong điều kiện không chắc chắn.
đó sẽ ẫ đến việc ra quyế
•Chúng ta có 2 ý tưởng trái ngược nhau trong đầu –
•Dựa vào việc xác định d n t
định là mang theo ô hay không mang. gọi là các giảthuyết
•Đây là ma trận ra quyết định:
–Ý tưởng 1: giảthuyếtkhông
–Ý tưởng 2: giảthuyếtđối
•Hai ý tưởng này phải hoàn toàn trái ngược nhau. Thực tế xảy ra Chẳng hạn: Mưa Ko mưa –Ý tưởng 1(   H ): hôm nay trời mưa Quyết Mang ô 0
–Ý tưởng 2 ( H ): hôm nay trời không mưa định   Không mang ô A 3 2 2 3 Về mặt thống kê:
Kiểm định giả thuyết tương tự như phiên tòa (1) Thực tế H đúng H đúng Phiên tòa
Kim định gi thuyết 0 A  Chấp nhận  Quyết H Bị cáo vô tội Giả thuyết H 0 Sai l  ầm loi 2 định Chấp nhận  0 H Bị cáo có tội Giả thuyết H A A
Sai lm loi 1
α= mức ý nghĩa = P(x/s mắc sai lầm loại 1) Thu thập bằng chứng Thu thập thông tin
β= 1 – lực kiểmđịnh = P(x/s mắc sai lầm loại 2)
Thụ lý – tổng hợp bằng
Tóm tắt thông tin – xây
Lực kiểmđịnh=P(x/s bác bỏH khi nó sai) chứng và phán quyết
dựng thống kê và ra quyết định 0 4 5 4 5 1
Kiểm định giả thuyết tương tự như phiên tòa (3)
Kiểm định giả thuyết tương tự như phiên tòa (2)
Nếu chúng ta chỉchắc chắn 95%, có nghĩa là có 5%
mắc sai lầm. Vậy, đó là sai lầm loại nào? Phiên tòa
Kim định gi thuyết
Mắc sai lầm loại 1 được coi là nghiêm trọng hơn mắc sai
lầm loại 2. Do vậy, quy tắc thông thường là chọn x/s mắc Bị cáo trắng án Chọn H0
sai lầm loại 1, α,là nhỏ;
Trường hợp lý tưởng là cũng muốn x/s mắc sai lầm loại 2, Bị cáo bị kết tội Chọn HA
β, là nhỏ. Nhưng hai x/s này có quan hệngược chiều;
Do vậy, bài toán kiểmđịnh thường bắtđầu bằng xác định α
Kết tội 1 người vô tội Mắc sai lầm loại 1
bằng 5% (tức là 5% khảnăng chúng ta bác bỏH khi nó 0
đúng), hoặc bằng các giá trịkhác, và không quan tâm đếnβ
Tha bổng 1 người có tội Mắc sai lầm loại 2 “ “ Sau phiên tòa vẫn còn
95% tin tưởng là ra quyết
những nghi ngờ hợp lý” định đúng” 6 7 6 7
Kiểm định giả thuyết tương tự như phiên tòa (4)
Các bước trong kiểm định giả thuyết 1. Phát biểu H0 và HA
•Trong kiểmđịnh giảthuyết, chúng ta cũng đưa ra 2. Tính các thống kê
giảđịnh “vô tội”giống nhưtrong phiên tòa. Có
3. Thiết lập các quy tắc ra quyết định sử dụng
nghĩa là khi kiểmđịnh giảthuyết, chúng ta cũng
hoặc miền bác bỏ, p-value, hoặc KTC.
bắtđầu bằng giảđịnh H đúng. Sau đó, chúng ta 0 4. Đưa ra kết luận.
thu thập thông tin và nếu có đủ bằng chứng chúng ta sẽbác bỏH
.Điều này tương đương với chấp 0 nhận HA 8 9 8 9
Kiểmđịnh µ khi biết  Quy tắc kiểm định
VD1: Một ngân hàng đang đánh giá hiệu quảcủa việc
triển khai tính năng chuyển khoản nhanh 24/7 trên ứng •Giả thuyết không:
dụng ngân hàng số. Ngân hàng kỳvọng rằng, để tính
Luôn luôn để kiểm định cho tổng thể và được
năng này được xem là thành công, sốlượt giao dịch kí hiệu theo chữ Hy Lạp
trung bình mỗi tài khoản sửdụng app phảiđạt ít nhất
Luôn luôn có dấu bằng
170 lượt/6 tháng. Ngân hàng đã chọn ngẫu nhiên một
mẫu gồm 50 tài khoản, và nhận thấy sốgiao dịch trung •Giả thuyết đối:
bình là 178 lượt/6 tháng. Giảsửsốlượt giao dịch của
Cũng viết cho tổng thể
các tài khoản có phân phối xấp xỉchuẩn vớiđộ lệch
Có thể là <, > hoặc ≠
chuẩn là 23. Liệu có kết luậnđược tính năng chuyển
Nhìn giống giả thuyết không nhưng dấu bằng
khoản nhanh 24/7 thực sựhiệu quảkhông? đã được thay thế. 10 11 10 11 2 Áp dụng cho VD 1
Ôn lại: Định lý giới hạn trung tâm (CLT) •Giảthuyếtkhông H0:µ=170
•CLT phát biểu rằng nếu cỡmẫuđủ lớn, trung bình
mẫu có phân phối chuẩn với giá trịtrung bình là µ •Giảthuyếtđối
và độ lệch chuẩn là  /n . Do vậy nếu chúng ta H :µ>170
tính thống kê dướiđây thì thống kê này sẽtuân A
theo quy luật phân phối chuẩn hóa  XZN  ~ n 0,1 a s .  n 13 12 12 13 Áp dụng cho ví dụ 1 Áp dụng cho ví dụ 1 •Chúng ta có σ=23
•Tính tiêu chuẩn kiểmđịnh z. •Tính thống kê
–Ý nghĩa: thống kê z đượcđo lường theo đơn vịchuẩn hóa zcho VD1. z=2.46
cho chúng ta biết trung bình mẫu nằm cách xa trung bình
giảđịnh của tổng thểnhưthếnào. •Công thức: X   Zn 
•Z sẽtuân theo quy luật phân phối chuẩn hóa Nếu
trên thực tếtrung bình của tổng thểbằng giá trịnêu
trong giảthuyếtkhông 14 15 14 15 Quy tắc ra quyết định Áp dụng cho ví dụ 1
•Có 3 phương pháp: miền bác bỏ, p-value, và khoảng tin cậy Miền bác bỏ:
•Điểm đánh dấu miền bác bỏ 5% là 1.645.
Nếu muốn ĐTC là 95%, có nghĩa là có 5% nguy cơ bác bỏ H khi 0
•Do vậy chúng ta sẽ bác bỏ H nếu tiêu chuẩn kiểm nó đúng. 0
Do vậy, chúng ta vẽ miền 5% trong phân phối chuẩn hóa (việc vẽ định > 1.645.
miền này cần căn cứ vào giả thuyết đối) và miền đó chính là miền bác bỏ. •Trong VD 1 z = 2.46
Bác bỏ H 0 và đưa ra kết luân có lợi cho HA . Nói
một cách khác ‘có đủ bằng chứng thống kê ở mức
ý nghĩa 5% cho giao dịch trung bình của các máy
ATM nhiều hơn 170 lần/tháng. 16 17 16 17 3
P-value (tính thủ công hoặc bằng máy tính) Áp dụng cho VD1
•Đây là xác suất để có được tiêu chuẩn kiểm định  Tính P(Z>2.46)
•Vẽ phân phối z – trong VD 1, p-value là P(Z>2.46).
•Giá trị p-value nhỏ là bằng chứng bác bỏ H 0. •Quy tắc:
Nếu p-value < α, => Bác bỏ H 0
Nếu p-value > α, => Không bác bỏ H 0 18 19 18 19
Kiểm định một phía và hai phía
Kiểm định hai phía “≠“
•Kiểm định 1 phía có thể là “<“hoặc “>”
•Miền bác bỏ là Z<-Z α/2, Z>+Zα/2
Miền bác bỏ nằm ở phía trái hoặc phía phải
•P-value bằng P(Z>T.S)+P(Z•Kiểm định 2 phía là “≠”
Miền bác bỏ được chia ra làm 2 phía 20 21 20 21
Kiểmđịnh hai phía: thay đổi VD1
Kiểm định µ khi chưa biết 
VD1: Một ngân hàng đang đánh giá hiệu quảcủa việc
triển khai tính năng chuyển khoản nhanh 24/7 trên ứng
•Thay σbằng svà tính thống kê t.
dụng ngân hàng số. Ngân hàng kỳvọng rằng, để tính
•Quy tắc kiểmđịnh tương tựtrường hợp 1.
năng này được xem là thành công, sốlượt giao dịch Tiêu chuẩn kiểmđịnh
trung bình mỗi tài khoản sửdụng app phảiđạt 170
lượt/6 tháng. Ngân hàng đã chọn ngẫu nhiên một mẫu X  
gồm 50 tài khoản, và nhận thấy sốgiao dịch trung bình t s n
là 178 lượt/6 tháng. Giảsửsốlượt giao dịch của các tài
khoản có phân phối xấp xỉchuẩn vớiđộ lệch chuẩn là
ttuân theo quy luậtt-student với bậc tựdo n-1.
23. Liệu có kết luậnđược tính năng chuyển khoản
nhanh 24/7 thực sựhiệu quảkhông? 22 23 22 23 4
Kiểm định tỷ lệ của 1 tổng thê Thực hành với SPSS
Thực hiện tương tựkiểmđịnh trung bình
Luôn sửdụng tiêu chuẩn kiểmđịnh z.
Sửdụng file dữliệugss.sav để kiểmđịnh
Với n đủ lớn, tiêu chuẩn kiểmđịnh là:
giảthuyết những người lao động làm việc nhiều hơn 40h một tuần z𝑝  p  p󰇛1p 󰇜 n 24 24 25
Kiểm định tỷ lệ của 1 tổng thê (cont.) Ví dụ 2
•Trong một nghiên cứu của công ty AZ, người ta thực
•Miền bác bỏđược xác định nhưsau:
hiện phỏng vấn 758 khách du lịch đến HạLong có H : p ≤p
sửdụng tour du lịch biển xem họcó hài lòng hay 0 0 Kiểmđịnh phía phải: Nếu z > z , bác bỏH  0 .
không. 394 người trong sốđược hỏiđã trảlời là có. H1: p > p0 H ≥
Với mức ý nghĩa 5%, hãy kiểmđịnh xem liệu có 0 : p p 0 Kiểmđịnh phía trái: Nếu z < -z , bác bỏH  0. H
đúng là đa sốnhững ngườiđến HạLong có sửdụng 1 : p < p0 H
tour du lịch biển là hài lòng với tour này hay không? 0 : p = p0
Nếu |z| > z /2, bác bỏ Kiểmđịnh hai phía: H ≠ 0 . H1: p p 0 26 27 5