Chương 8. Kiểm định giả thiết thống kê - Xác suất thống kê | Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội

Chương 8. Kiểm định giả thiết thống kê - Xác suất thống kê | Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

Thông tin:
28 trang 12 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Chương 8. Kiểm định giả thiết thống kê - Xác suất thống kê | Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội

Chương 8. Kiểm định giả thiết thống kê - Xác suất thống kê | Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

41 21 lượt tải Tải xuống
1
CHƯƠ NG 8. KIỂM ĐỊNH GI THI T TH NG KÊ
8.1. Ki nh gi giá tr trung bình ểm đị thiết v
8.2. Ki nh gi t l ểm đị thiết v
8.3. Ki nh gi ểm đị thiết cho phương sai
8.4. So sánh hai giá tr trung bình
8.5. So sánh hai t l
8.6. So sánh hai phương sai
8.7. Tiêu chu n phù h p
2
8.8. Ki p và so sánh nhi u t l ểm tra tính độc l
8.9. So sánh nhi u giá tr t nhân t trung bình: phân tích phương sai mộ
Bài 8.1. Kiểm định gi thi giá tr trung bình ết v
I. Nguyên lý chung:
Bài toán ki nh gi vào các s u ểm đị thiết thống kê là bài toán: căn cứ li
thng kê c n ph n v m thi ải đưa ra kết lu t gi ết thống kê nào đó mà ta
quan tâm.
Mt gi t th t gi t v thiế ng kê là m thiế phân b xác su t c a tập chính đang
xét. N u phân b xác su g b XÁC SUế ất đó được đặc trưn i các tham s (n T
(t l ), giá tr trung bình hay phương sai, …), thì giả thiết thng kê là gi thiết
v tham s ca phân b đó.
T nay tr hi u m thi t là m đi ta sẽ t gi ế t gi thiết thng kê, m t quy
tc dn ti quyết định ch p nh n hay bá gi i là m c b thiết đã nêu gọ t kim
định (test) thng kê.
Gi thiết đưa ra kiểm định đượ đó là giảc ký hiu H ,
0
thiết mà ta nghi
ng. Đối l p v i gi t H . Ch p nh n H H , thiết H
0
là đối thiế
1
0
nghĩa là bác bỏ
1
ngượ c li, bác b H p nh
0
nghĩa là chấ n H .
1
Câu hỏi đặt ra là: Chúng ta ch p nh n hay bác b m ng t gi thiết b
cách nào? Để nh, các nhà th u nhđưa ra quy tắc kiểm đị ống kê đề t trí vi nhau
nguyên lý sau đây:
“Nế u m t biến c có xác sut rt nh thì trong mt phép th hay mt
vài phép th , bi s không x ến c đó ảy ra”.
Như vậy, chúng ta s bác b H n
0
ếu xu t hi n biến c có xác sut nh,
tính trong điề ếu kin gi thi t H
0
đúng.
Chúng ta s minh h a bi các ví d sau:
Ví d 1. Gieo m ng ti n 100 l n ta th y xu n m p 60 l n. Ta nghi ột đồ t hi t s
ng r ng, xác su t xu t hi n m p l t hi n m t ng t s ớn hơn xác suất xu a.
Gi p là xác su t st xu t hi n m ấp. Khi đó ta có bài toán kiểm định như
sau:
- Gi thiết H
0
: p=1/2
- Đối thi t Hế
1
: p>1/2
2
Ta tính
(60
0
06.0(10
100/5.05.0
5.06.0
100/5.05.0
5.0
100
QPSP
xx
p
028717.0)9.1( Q
Đây là một xác sut nh, mà li xy ra trong m n ki nh. V y ta t l m đị
bác b H , ch p nh n H .
0
1
Ví d 2. M c nghiên c u M cho bi t tr em M n t cu ế độ tuổi đế
trường tiêu th trung bình 19.4 OZ sa 1 ngày (1 OZ=28.35 g).
Trong m t m u ng u nhiên g m 140 tr i ng em ngườ ta tính được lượ
sa chúng ung trung bình m t ngày là 18.5 OZ v ới độ l n là 6.8 ch tiêu chu
OZ. Điều này có cho phép ta k t lu ng s ế ận là lượ a tiêu th ít hơn 19.4 OZ hay
không?
Gii
Gi là lượng s a tiêu th n bài toán trung bình trong 1 ngày. Ta đi đế
kiểm đị ống kê như sau:nh gi thiết th
- Gi thiết H :
0
=19.4
- Đối thi t H : ế
1
<19.4
Gi s H trung bình m u
0
đúng, khi đó xác suất để
5.18X
b ng bao nhiêu?
Do
X
có phân b n (ho p x n) v i k v ng là 19.4 chu c x chu và độ
lch chun là
575.0
140
8.6
n
S
.
Vy
57.15.18
575.0
4.
195.18
ZPZPXP
.
Xác sut này không nh l m.
Vì vậy ta chưa có đủ cơ sở để bác b gi t H . Nói cách khác, thiế
0
s liệu đã có chưa đủ cơ sở để bác b gi thiết H .
0
Trong khi đưa ra quyết định, chúng ta có th phm phi 1 trong 2
loi sai l m sau:
- Sai l i 1: Bác b H m lo
0
trong khi thc ra H
0
đúng
- Sai l m lo p nh n H c ra H i 2: Ch
0
trong khi th
0
sai.
Sai l m lo m c t án nh ại 1, tương tự như sai lầ ủa quan tòa, khi “Kế ầm”
ngườ i vô t i; còn sai lm loi 2 tương tự như sai lầm “Tha bổng” kẻ
ti.
3
Chúng ta mong mun làm c u c 2 lo i sai lc ti ầm trên, nhưng
khi đó chúng ta phả giá đắi tr t v thi gian, tin ca và công sc.
Hơn nữ ại làm tăng sai lầa, khi ta gim sai lm loi này l m loi
kia, và ngược li.
Trong xã hi văn minh, người ta coi k t án nhế ầm người vô t i là
1 sai l m nghiêm tr m tha b ng k có t ọng hơn so với sai l i.
Trong bài toán kiểm định cũng vậy, ta coi sai lm loi 1 là
nghiêm tr m lo sai lọng hơn sai lầ i 2. Cho nên, người ta c định trước m
loi 1. Xác sut m c sai l m lo i là ại 1 được g mức ý nghĩa của tiêu
chun, ký hi u là . Xác su t m c sai l m lo i 2 ký hi u là . Giá tr 1-
được gi là LỰC LƯỢNG ca tiêu chu n. Lực lượng ca tiêu chu n
xác su t bác b H khi H
0 0
sai.
Mc ý n c l c ghĩa ẩn thường đượ ca tiêu chu y là 0.05; 0.02 ho
0.01.
Trong tp các tiêu chu n có cùng m , tiêu chu n nào ức ý nghĩa
có xác sut sai l m lo i 2 nh nh c xem là tiêu chu ất đượ ẩn “tốt nht”.
Các tiêu chu ng ẩn được đưa ra ở chương này đều đã được ch
minh ch t ch v m t toán h c là các tiêu chu n t t nht.
Khi kiểm định thng kê dn ti chp nhn H là m
0
t quyết định
dè d p nh n H nên hi u là vt: Ch
0
, không có nghĩa là H
0
đúng, mà chỉ i
các s u hi bác b H , c n ph i ngh u li ện có, không có đủ cơ sở để
0
iên c
tiếp.
Các bướ ểm địc cn thiết trong vic gii mt bài toán ki nh gi
thiết thống kê như sau:
1.Phát bi u gi thiết H i thi t H
0
và đố ế
1
2.Chn tiêu chun (test) th ng kê.
3.Định rõ mức ý nghĩa
(xác sut mc sai l i 1). m lo
4.Ch in mi n bác b gi th ết H
0
.
5.Tính giá tr c a tiêu chu n th ng kê t m ẫu quan sát được.
6.Kết lun: Bác b hay ch p nh n gi thiết, tùy thu c vào vi c
giá tr c a tiêu chu n bác b gi t hay không. ẩn có rơi vào miề thiế
II. nh gi thi giá tr trung bình: Kiểm đị ết v
Gi s , X ) m u ng c rút t bi n ng u nhiên (X
1 2
, …, X
n
ẫu nhiên đượ ế
chu
n X có EX= , DX= u X không chu n thì n 120).
2
(Nế
3.A.1. Đố ết hai phía: Xét BTKĐGT i thi
Gi thi ết H
0
:
=
0
Đối thiết H
1
:




0
, v i mức ý nghĩa
cho trước.
1.N
ếu phương sai
2
= σ
0
2
t đã biế
Bài toán d ng 1:
Các bướ ến hành như sau:c ti
+ B ước 1:
Gi thiết
00
:
H
4
Đối thiết
+ Bước 2: Xác định hàm tiêu chun
0
0
/
x
n
z
+ Bước 3: Xác định mc ý nghĩa α
Do đố ẩn z nên ta tra α/2 phân vịi thiết 2 phía hàm tiêu chu ca phân
phi chun t c, tra b ng ho c Excel:
z
α/2
=NORMSINV(1- α/2)
α
10%
5%
2%
1%
z
α/2
1.645
1.96
2.326
2.576
+Bướ c 4: Xác đ nh min bác b
S={(X , X }
1 2
, …, X
n
):|z|>z
α/2
+Bước 5: Da vào TB mu
x
để tính
n
x
z
/
0
0
+Bước 6: Nếu
|z|>z
α/2
H . thì ta bác b
0
Nếu |z|<=z
α/2
chp nh n gi thiết H .
0
Bài toán dng 2:
Các bướ ến hành như sau:c ti
+ Bước 1:
Gi thiết
00
:
H
Đối thiết
01
:
H
+ Bướ ác địc 2: X nh hàm tiêu chun
0
/
x
n
z
+ Bước 3: Xác định mc ý nghĩa α
Do đối thiết 1 phía và hàm tiêu chuẩn z nên ta tra α phân vị c a phân ph i
chun, tra b ng ho c Excel:
z
α
=NORMSINV(1-α)
α
5%
2.5%
2%
1%
0.5%
z
α
1.645
1.96
2.054
2.326
2.576
5
+Bướ c 4: Xác đ nh miên bác b
S={(X , X z>z }
1 2
, …, X
n
):
α
+Bước 5: Da vào TB mu
x
tính
n
x
z
/
0
0
+Bước 6: Nếu
z>z
α
thì ta bác b H .
0
N
ếu z<=z
α
chp nh n gi thiết H
0
.
Ví d 2. T p chính X có phân ph n v giá trung bình i chu i tr chưa biết,
0
=5.2, n=25, TB m u
56.27x
. V i m =0.05, hãy ki ức ý nghĩa m
định bài toán sau:
- Gi thiết H :
0
=26
- Đối thi t H : ế
1
26.
Gii
Các bướ ến hành như sau:c ti
+ Bước 1:
Gi thiết
26:
0
H
Đối thiết
+ Bước 2: Xác định hàm tiêu chun
25/2.5
26
x
z
+ Bước 3: Xác định mc ý nghĩa α=0.05
Do đố ẩn z nên ta tra αi thiết 2 phía hàm tiêu chu /2 phân v ca phân
phi chun, tra b ng ho c Excel:
z
α/2
=NORMSINV(1-α/2)=1.96
+Bướ c 4: Xác đ nh miên bác b
S={(X , X ): |z|>1.96}
1 2
, …, X
n
+Bước 5: Da vào mu
6.27x
6.1
5/2.5
266.27
/
0
0
n
x
z
+Bước 6:Vì |z|=1.6 <z =1.96, nên ta ch
0.025
p nhn gi thiết H
0
.
6
Ví d 3. T p chính X có phân ph n v i giá tr g bình i chu trun chưa biết,
0
=5.2, n=25, TB m u
56.27x
. V i m =0.05, hãy ki ức ý nghĩa m
định bài toán sau:
- Gi thiết H :
0
=26
- Đối thi t H : ế
1
> 26.
Gii
Các bướ ến hành như sau:c ti
+ Bước 1:
Gi thiết
26:
0
H
Đối thiết
1
: 26H
+ Bước 2: Xác định hàm tiêu chun
25/2.5
26
x
z
+ Bước 3: Xác định mc ý nghĩa α=0.05
Do đối thiết 1 phía và hàm tiêu chuẩn z nên ta tra α phân vị c a phân ph i
chun, tra b ng ho c Excel:
z
α
=NORMSINV(1- 645 α)=1.
+Bước 4: Xác định miên bác b
S={(X , X ): z>1.645}
1 2
, …, X
n
+Bước 5: Da vào mu
6.27x
6.1
5/2.5
266.27
/
0
0
n
x
z
+Bước 6:Vì z=1.6 <z
0.05
=1.645, nên ta chp nhn gi thiết H .
0
Bài toán dng 3:
Các bướ ến hành như sau:c ti
+ Bước 1:
Gi thiết
00
:
H
Đối thiết
01
:
H
+ Bước 2: Xác định hàm tiêu chun
7
n
x
z
/
0
0
+ Bước 3: Xác định mc ý nghĩa α
Do đối thi t 1 phía và hàm tiêu chuế ẩn z nên ta tra α phân vị ca phân phi
chun, tra b ng ho c Excel:
=NORMSINV(1-α)
+Bướ c 4: Xác đ nh miên bác b
S={(X , X ): z<-z }
1 2
, …, X
n α
+Bước 5: Da vào mu tính
x
n
x
z
/
0
0
+Bước 6: Nếu
z< - z
α
H . thì ta bác b
0
N
ếu z=>- z
α
chp nh n gi thiết H
0
.
Ví d
3. GS X~N( =5.2, n=36, TB m u ,
2
) vi chưa biết,
56.27x
. V i m =0.05, hãy ki nh bài toán sau: ức ý nghĩa ểm đị
- Gi thiết H :
0
=29.64
- Đối thi t H : ế
1
<29.64
Gii
+ Bước 1:
Gi thiết
64.29:
0
H
Đối thiết
64.29:
1
H
+ Bước 2: Xác định hàm tiêu chun
36/2.5
64.29
x
z
+ Bước 3: Xác định mc ý nghĩa α=0.05
Do đối thi t 1 phía hàm tiêu chuế ẩn z nên ta tra α=0.05 phân v c a phân
phi chun, tra b ng ho c Excel:
=NORMSINV(1-0.05)=1.645
+Bướ c 4: Xác đ nh miên bác b
S={(X , X ): z<-1.645}
1 2
, …, X
n
+Bước 5: Da vào mu tính
56.27x
4.2
36/2.5
64.2956.27
/
0
0
n
x
z
8
+Bước 6: Vì z=-2.4 < z =-1.645 nên ta bác b gi t H , ch p nh
α
thiế
0
ận đối
thiết H
1
, nghĩa là chp nhn giá tr TB μ < 29.64.
2.N
ếu
2
chưa biết:
Trong trường hp này ta phi gi ế thi t v tính chun ca biến ngu
nhiên X, c m u nh . hơn 30
Chúng ta có 3 dng ki nh: ểm đị
Dạng 1. Đối thiết 2 phía
Gi thiết
00
:
H
Đối thiết
Hàm tiêu chu n s d ng đây là
.
0
nt
s
x
Vi m c ý ta ph c a phân ph i Student n-1 b c t do: nghĩa α ải tra α/2 phân vị
t
α/2, n-1
.
Nếu tra b ng Excel: t -1).
α/2, n-1
=TINV(α, n
Ví d
4. GS X~N( , TB m u ,
2
) vi chưa biết,
2
chưa biết, n=16
56.27x
, s=5.2 . V i m =0.05, hãy ki nh bài toán sau: ức ý nghĩa ểm đị
- Gi thiết H :
0
=26
- Đối thi t H : ế
1
26
Gii
+ Bước 1:
Gi thiết
26:
0
H
Đối thiết
+ Bước 2: Xác định hàm tiêu chun
16/2.5
26
x
t
+ Bước 3: Xác định mc ý nghĩa α=0.05
Do đố nên ta tra α=0.0i thiết 2 phía hàm tiêu chun t 25 phân v ca
phân ph Student v i 15 b do, tra b ng ho i c t c Excel:
=TINV(0.05,15)=2.13
+Bướ c 4: Xác đ nh miên bác b
S={(X , X ): |t|>2.13}
1 2
, …, X
n
9
+Bước 5: Da vào mu tính
56.27x
2.1
16/2.5
2656.27
/
0
ns
x
t
+Bướ ĩc 6: |t|=1.2 < t
α/2,15
=2.13 nên ta chp nhn gi ế thi t H ngh
0
a
chp nh n giá tr =26. TB μ
Dạng 2. Đối thiết 1 phía l ớn hơn
Gi thiết
00
:
H
Đối thiết
01
:
H
Ví d 5:
GS X~N(
,
2
) vi chưa biết,
2
chưa biết, n=16, TB m u
12.29x
,
s=5.2 . V i m =0.05, hãy ki nh bài toán sau: ức ý nghĩa ểm đị
- Gi thiết H :
0
=26
- Đối thi t H : ế
1
>26
- Gii
+ Bước 1:
- Gi thiết
26:
0
H
- Đối thi t ế
26:
1
H
+ Bước 2: Xác định hàm tiêu chun
16/2.5
26
x
t
+ Bước 3: Xác định mc ý nghĩa α=0.05
Do đối thiết 1 phía và hàm tiêu chuẩn t nên ta tra α=0.05 phân vị ca phân
phi Student vi 15 b do, tra b ng ho c Excel: c t
=TINV(0.10,15)=1.75
+Bướ c 4: Xác đ nh miên bác b
S={(X
1
, X ): t>1.75}
2
, …, X
n
10
+Bước 5: Da vào mu tính
12.29x
4.2
16/2.5
2612.29
/
0
ns
x
t
+Bướ c 6: t=2.4 > t
α,15
=1.75 nên ta bác b gi ế thi t H
0
nghĩa chấp
nhn giá tr TB μ >26.
Dạng 3. Đối thiết 1 phía nh hơn
Gi thiết
00
:
H
Đối thiết
01
:
H
Ví d 6:
GS X~N(
,
2
) vi chưa biết,
2
chưa biết, n=16, TB m u
12.24x
,
s=5.2 . V i m =0.05, hãy ki nh bài toán sau: ức ý nghĩa ểm đị
- Gi thiết H :
0
=26
- Đối thi t H : ế
1
<26
- Gii
+ Bước 1:
- Gi thiết
26:
0
H
- Đối thi t ế
26:
1
H
+ Bước 2: Xác định hàm tiêu chun
16/2.5
26
x
t
+ Bước 3: Xác định mc ý nghĩa α=0.05
Do đối thi t 1 phía và hàm tiêu chuế ẩn t nên ta tra α=0.05 phân vị ca phân
phi Student vi 15 b do, tra b ng ho c Excel: c t
=TINV(0.10,15)=1.75
+Bướ c 4: Xác đ nh miên bác b
S={(X , X ): t<-1.75}
1 2
, …, X
n
11
+Bước 5: Da vào mu tính
12.24x
4.2
16/2.5
2612.29
/
0
ns
x
t
+Bướ c 6: t=2.4 > t
α,15
=1.75 nên ta bác b gi ế thi t H
0
nghĩa chấp
nhn giá tr TB μ >26.
Hàm tiêu chu n s d ng đây là
.
0
nt
s
x
- Xut phát t mẫu đã cho ta tính
x
, s
2
.
0
nt
s
x
- Vi đã cho, tra bảng phân phi Student vi n-1 bc t do ta tìm được
t
α/2,n-1
t h thc
1,2/1 nn
tTP
, trong đó T
n-1
biến ngu
nhiên Student v i n-1 b do. c t
So sánh t và t :
α/2,n-1
- Nếu
1,2/
n
tt
gi thi t H ta bác b ế
0
- Nếu
1,2/
n
tt
p nh n gi thi . ta ch ết H
0
Như vậy min tiêu chun là:
.:),...,,(
1,2/21
0
ns
x
n
tnXXXS
3.A. 2. Đố ột phía: Xét BTKĐGT Hi thuyết m
0
:
=
0
v i thuyới đố ết
H
1
:
>
0
, v i m ức ý nghĩa
cho trước.
1.N
ếu
2
đã biết
Các bướ ến hành như sau:c ti
- Xut phát t mẫu đã cho tính
x
n
x
z
/
0
- Tìm giá tr z( b ng sao cho ) t ( z())=1-.
So sánh u và u( ):
- Nếu
)(
zz
ta bác b H .
0
12
- Nếu
)(
zz
ta chp nh n H .
0
Như vậy min tiêu chun là:
.)(:),...,,(
0
21
znXXXS
x
n
2.N
ếu
2
chưa biết:
Trong trường hp này ta phi gi thiết v tính chun ca biến ngu
nhiên X và n<30.
- Xut phát t mẫu đã cho ta tính
x
, s
2
.
0
nt
s
x
- Vi đã cho, tra bảng phân phi Student vi n-1 bc t do ta tìm được
t
α,n-1
t h thc
1,1 nn
tTP
, trong bi n ng u nhiên đó T
n-1
ế
Student v -1 b do. i n c t
So sánh t và t :
α,n-1
- Nếu
1,
n
tt
ta bác b gi thi t H ế
0
- Nếu
1,
n
tt
ta ch t Hp nh n gi thi ế
0
.
Như vậy min tiêu chun là:
.:),...,,(
1,21
0
n
s
x
n
tnXXXS
Ví d
4. t, t, n=16, X~N( ). TB m u chưa biế chưa biế ,
2
56.27x
,
S =5,2
2 2
. Vi m =0.05, hãy ki nh bài toán sau: ức ý nghĩa ểm đị
- Gi thiết H :
0
=26
- t H 26 Đối thiế
1
: >
3. A. 3. Đố ột phía: Xét BTKĐGT Hi thuyết m
0
:
=
0
v i thuyới đố ết
H
1
:
<
0
, v i m c ý nghĩa
cho trước.
1.N
ếu
2
đã biết
Các bướ ến hành như sau:c ti
- Xut phát t mẫu đã cho tính
x
n
x
z
/
0
- Tìm giá tr z( b ng sao cho ) t ( z())=1-.
So sánh z và z( ):
- Nếu
)(
zz
ta bác b H .
0
- Nếu
)(
zz
ta chp nh n H .
0
13
Như vậy min tiêu chun là:
.)(:),...,,(
0
21
znXXXS
x
n
2.N
ếu
2
chưa biết:
Trong trường hp này ta phi gi ế thi t v tính chun ca biến ngu
nhiên X và c m u n<30.
- Xut phát t mẫu đã cho ta tính
x
, s
2
.
0
nt
s
x
- Vi đã cho, tra bảng phân phi Student vi n-1 bc t do ta tìm được
t
α,n-1
t h thc
1,1 nn
tTP
, trong đó T
n-1
biến ngu nhiên
Student v -1 b do. i n c t
So sánh t và t :
α,n-1
- Nếu
1,
n
tt
ta bác b gi thi t H ế
0
- Nếu
1,
n
tt
ta ch t Hp nh n gi thi ế
0
.
Như vậy min tiêu chun là:
.:),...,,(
1,21
0
n
s
x
n
tnXXXS
Bài t p
Gi s ta có m u ng u nhiên c n=10 v i các giá tr m u:
6.5; 5; 5.5; 8; 6.5; 10; 10; 8; 6.5; 7
Gi thiết m u t bnn chu n. Hãy ki nh gi t v i m ểm đị thiế c ý
nghĩa α=5%:
H
0
: µ = 7;
H
1
: µ > 7.
a) Gi s =2; đã biết phương sai lý thuyết σ
0
b) Gi thiết chưa biết phương sai.
14
Bài 8.2. Kiểm định gi thi t l ết v
Gi s , X ) là m u ng (X
1 2
, …, X
n
ẫu nhiên, trong đó:
Acókhôngkhi
Acókhi
X
i
0
1
, p=P(A)
Như vậy, P(X =1)=P(A)=p, P(X -p=q.
i i
=0)=P(A)=1
Khi đó, nếu đặt
n
i
i
pnBmthìXm
1
),(;
Nếu n l n (n 30), và min(m, n- 5, thì m)
XX
n
i
i
nn
m
1
1
, có phân
phi x p x chu n. lu ận tương tự tương tự trường hp 3.A. Ta nhn
được các mi n tiêu chu ki nh gi thuy t H : p=p v ẩn để ểm đị ế
0 0
ới các đối
thiết pp
0
, p>p , p<p m
0 0
ức ý nghĩa tương ứng như sau:
)2/(;::
)1(
/
0100
00
0
znSppHvàppH
pp
pnm
)(;::
)1(
/
0100
00
0
znSppHvàppH
pp
pnm
)(;::
)1(
/
0100
00
0
znSppHppH
pp
pnm
Ví d: p =45%, n=200, m=80, =5%, xem d
0
đoán có đúng không?
Gii
+ Bước 1:
- Gi thiết H
0
: p=0.45
- Đối thi t H : pế
1
0.45
+ Bước 2: Vì np
0
=90, và n(1-p
0
)=110 nên ta có hàm tiêu chun:
200/55.0*45.0
45.0
/
00
0
p
nqp
pp
z
15
+ Bướ ới α=0.05 và hàm zc 3: v -tiêu chun bước 2, dang BT 1 ta tra
z
α/2
=z
0.025
=1.96.
+ Bước 4:
96.1
)1(
/
00
0
nS
pp
pnm
+ Bước 5:
42.1200
55.045.0
45.0
200
80
x
z
+ Bước 6 : Kim tra ta thy |z|=1.42<z =1.96.
/2
Kết lu t Hn: Ch p nh n gi thiế
0
.
Bài 3. Phương pháp p-giá tr
Các k nh thuật mà ta đã kiểm đị các tiết trước được gọi là phương
pháp ki nh truy n th ng. Trong m c này chúng ta sểm đị trình bày một phương
pháp khác hi c các nhà th ng kê s d ng khá r ng rãi gện đượ ọi là phương pháp
p-giá tr .
Xét bài toán kiểm định:
- Gi thiết H :
0
=
0
- Đối thi t H : ế
1
<
0
Các s u m u cho ta giá tr c a n, li
0
xX
và S. Ta mu n ki nh ểm đị
xem s H hay không? liệu đã cho có cho phép ta bác bỏ
0
Ta lý lun b ng ph n ch ng: Gi s H , ta hãy tính xem xác su
0
là đúng ất để
trung bình mẫu bé hơn hay bằ quan sát đượng giá tr c
0
x
b ng bao nhiêu.
Nếu xác su bác b H , do theo ất này “nhỏ” theo một nghĩa nào đó, ta sẽ
0
nguyên lý xác su t nh , bi n c y ra trong m t phép th . N u xác ế đó rất ít x ế
suất đó khá “lớn” thì ta không có cơ s để bác b H .
0
Giá tr c a xác su t này
0
xXPp
(tính trong điều ki n H
0
đúng), được gi là p-giá tr.
Tương tự, đối vi bài toán ki nh: ểm đị
- Gi thiết H :
0
=
0
- Đối thi t H : ế
1
>
0
Thì p-giá tr là xác sut
0
xXPp
, tính dưới gi thiết H
0
đúng.
Còn vi bài toán ki nh 2 phía: ểm đị
- Gi thiết H :
0
=
0
- Đối thi t H : ế
1

0
Thì p-giá tr ng h p ki nh 2 phía này g -giá tr trong trong trườ ểm đị ấp đôi p
trườ ng h p 1 phía, tc là:
16
0
2 xXPp
n u ế
00
xXPxXP
,
và ngược li:
0
2 xXPp
n u ế
00
xXPxXP
,
p-giá tr ng kê s d ng theo 2 cách. M t s i ch được các nhà th ngườ đơn
thun tính p-giá tr , còn vi bác b gi thi l nhà c có ết H
0
hay không thì để i cho
qun lý t quy ết định l y.
Khi làm như vậy, nhà thng kê có mt s ng d hướ ẫn chung như sau:
- Nếu p>0.05, ta không đủ cơ sở để bác b H .
0
- Nếu 0.01<p<0.05, ta có đủ cơ sở để bác b H .
0
- Nếu p<0.01, ta có m r t m nh, hùng h bác b H . ột cơ sở ồn để
0
Cách th 2 là s d ng p-giá tr k t h p v i m ế ức ý nghĩa đã cho.
Ta tính p-giá tr và so sánh nó v : i
Nếu
05.0p
, ta bác b H .
0
Nếu p> bác b H . Nói cách khác: p-giá tr chính là , ta chưa có cơ sở
0
mức ý nghĩa thấp nht mà ta có th bác b H .
0
Ví d 15. T m p h p chính có trung bình i ta l t t (chưa biết), ngư y
ra m t m ẫu kích thước n=36 và tính được
5040x
và S=780. S
dụng phương pháp p-giá tr, hãy kiểm định:
- Gi thiết H :
0
=4700
- Đối thi t H : ế
1
>4700
Mức ý nghĩa =0.02.
Gii. Ta tính p-giá tr
5040XP
.
Dưới gi thiết H , vì n=36>30,
0
X
là BNN có x i chu i kp x phân ph n v
vọng là 4700 và độ lch chun là:
130
36
780
n
S
Vy
)62.2(1)(1504015040
130
47005040
XPXP
= 1-0.9956=0.0044.
Vy p-giá tr là 0.0044. Giá tr này nh =0.02. V y ta bác b hơn mức ý nghĩa
H
0
và ch p nh n H .
1
Ví d 16. T m p h p chính có trung bình i ta l t t (chưa biết), ngườ y
ra m t m c n=140 ẫu kích thướ và tính được
5.18x
và S=6.8. Vi
mức ý nghĩa ểm đị=0.05, hãy ki nh:
17
- Gi thiết H :
0
=19.4
- Đối thi t H : ế
1
<19.4
Gii. Ta tính p-giá tr
5.18XP
.
Dưới gi thiết H , vì n=140>30,
0
X
là BNN có x i kp x phân ph i chu n v
vng là 19.4 l ch chu n là: và độ
575.0
140
8.6
n
S
Vy
0582.0)57.1()(5.18
575.0
4.
195.18
XP
Vy p-giá tr là 0.0582. Giá tr này l n =0.05. V y ta không hơn mức ý nghĩa
có cơ sở bác b H .
0
Ví d 19. nh sát giao thông cho r ng 80 i lái xe trên Cơ quan cả % s ngườ
đườ ngường là có bng lái. Kim tra ngu nhiên 200 i lái xe, cnh sát giao thông
th liy ch có 150 i có b ng lái xe. S ngườ u này có ch ng t t l người có
bng lái xe thấp hơn 80% hay không?
Dùng phương pháp p-giá tr v i m =2%. ức ý nghĩa
Gii
- Gi thiết H
0
: p=0.8
- Đối thi t Hế
1
: p<0.8
Ta có n=200; m=150; f=150/200=0.75.
Vì np
0
=200x0.6=160>10
n 0>10 (1-p 200x0.2
0
)= =4
Nên f có phân b x p x n v v ng là 0.8 l n là chu i k và độ ch chu
028.0
200
2.08.0
200
)1(
00
x
pp
.
Khi đó p-giá tr là:
03705.0)786.1()(75.0
028.0
8.075.0
fPp
.
Ta nhn th y p-giá tr l n =0.02. V y ta ch p nh n hơn mức ý nghĩa
H
0
. T l i có b ng lái xe th ngườ c tế là 80%.
Bài 4. Kiểm định gi thi ết
v giá tr c a nhi u xác su t
Gi s B , B là h n c c
1 2
, …, B
k
các biế đôi 1 xung khắc và đầy đủ a
không gian m u S c a phép th ng u nhiên E. i xác su Ta quan tâm t ất (chưa
biết) ca các bi n c B nh là: ế
i
, i=1, 2, …, k này. Bài toán kiểm đị
-Gi thiết H : (P(B ), P(B
0 1 2
), …, P(B
k
))=(p
1
, p
2
, …, p
k
).
-Đối thi : (P(Bết H
1 1
), P(B
2
), …, P(B
k
)) (p
1
, p
2
, …, p
k
).
18
Trong đó 0<p
i
<1 và p =1.
1
+p
2
+…+p
k
Tiến hành phép th E n-l p, gi s có n l n x y ra bi n c B ần độc l
i
ế
i
(i=1, 2,
…, k), n
1
+n
2
+…+n
k
=n.
Ta biu di n k b ng t n s ết qu i b sau:
Biến c
B
1
B
2
B
k
Tng
Tn s quan sát
n
1
n
2
n
k
n
Các s
ki
npn
ii
,...,2,1,
n s lý thuy u gi được gi là t ết. Nế
thiết H t s
0
g thì theo luđún ln
i
n
và n x p x nhau.
i
Ta s bác b gi t H khi các t n s n s lý thuy thiế
0
quan sát “khác xa” các t ết
theo 1 nghĩa nào đó. t đư Kho ếng cách gia các tn s quan sát và lý thuy c
đo bở ống kê “Khi ình phương”:i tiêu chun th -b
k
i
n
nn
i
ii
T
1
)(
2
Ta s bác b H khi T l n m n bác b H s có d ng:
0
ột cách có ý nghĩa. Mi
0
={T>c}, ng s ph thu c m đây, c là một h c đã chọn.
Người ta chứng minh đượ đúng và nếc rng nếu gi thiết H
0
u các tn s
thuyết
kin
i
,...,2,1,5
thì T s i x i có phân ph p x phân ph
2
vi k-1 b do. Tra b ng phân phc t i
2
vi k-1 b do ta s tìm c t
được
)(
2
1
k
tha mãn:
)}({
2
1k
TP
.
Như vậy
)(
2
1
k
c
là phân v i m c a phân phc
2
vi
k-1 b do. c t
Ví d: Gieo 1 con xúc x n. S l n xu n các m c cho b ng c 600 l t hi ặt đượ i b
sau:
1
2
3
4
5
6
Tng
106
92
97
105
88
112
600
19
Có th coi con xúc x ng chắc đó là cân đối, đồ ất được không? Mc ý nghĩa là
0.05.
Gii
Tn s lý thuy ết:
1
2
3
4
5
6
Tng
100
100
100
100
100
100
600
Tính tiêu chun th ống kê “Khi-bình phương”:
22.4
100
)100112(
100
)10088(
100
)100105(
100
)10097(
100
)10092(
100
)100106(
222
222
T
Tra bng phân ph i
0705.
11)05.0()(
2
16
2
1
k
c
So sánh: T=4.22<11.0705
Bài 8.5. Kiểm định gi thi ết v phương sai
20
Gi s ng ng u nhiên có phân b chu n X là đại lượ
N(
,
2
). Tp h p chính p t các gi có th c a X. Xét m đây là tậ t c tr t
m
u ng u nhiên c sai m u S là m ng n. Như ta đã biết, phương
2
ột ước lượ
không ch c p h p chính.
ệch cho phương sai
2
a t
Bây gi ta xét bài toán ki nh gi ểm đị thiết:
Trường hp 1:
-
Gi thiết H :
0
2
=
0
2
-
Đối thi t H : ế
1
2
<
0
2
Tính
2
2
0
( 1)
2
n S
,
2
i Khi bình có phân ph phương với
n-1 b do. D a vào m , ta tra b ng giá tr c t ức ý nghĩa
)1(
2
1
n
c
.
So sánh T vi
)1(
2
1
n
c
, n u: ế
-
)1(
2
1
n
cT
: Bác b H .
0
-
2 2
1
(1 )
n
c
: Chp nh n H
0.
Trường hp 2:
-
Gi thiết H :
0
2
=
0
2
-
Đối thi t H : ế
1
2
>
0
2
Tính
2
0
2
)1(
Sn
T
, T có phân ph i Khi i n-1 bình phương v
bc t do. D a vào m , ta tra b ng giá tr ức ý nghĩa
)(
2
1
n
c
.
So sánh T vi
)(
2
1
n
c
, n u: ế
-
)(
2
1
n
cT
: Bác b H .
0
21
-
)(
2
1
n
cT
: Chp nh n H
0.
Trường hp 3:
-
Gi thiết H :
0
2
=
0
2
-
Đối thi t H : ế
1
2

0
2
Tính
2
0
2
)1(
Sn
T
, T có phân ph i Khi i n-1 bình phương v
bc t do. D a vào m , ta tra b ng giá tr ức ý nghĩa
)2/(
)2/1(
2
12
2
11
n
n
c
c
.
So sánh T vi
)2/(
)2/1(
2
12
2
11
n
n
c
c
, n u: ế
-
)2/1(
2
11
n
cT
hoc
)2/(
2
12
n
cT
: Bác b
H
0
.
-
)2/()2/1(
2
12
2
11
nn
cTc
: Chp
nhn H
0.
22
Ví d:
-
Gi thiết H :
0
2
=0.2
2
-
Đối thi t H : ế
1
2
>0.2
2
S=0.3, n=12, =0.2, =5%.
0
Tính
)
05.0(67514.1975.24
2
11
2.0
3.0)112()1(
2
2
2
0
2
xSn
T
Vy, ta bác b gi thi t H , ế
0
chp nh t H . ận đối thiế
1
Bài 8.6. So sánh hai giá tr trung bình
Gi s ta hai m u ng u nhiên
)...,,,(
1
21 n
XXX
rút ra t bi n ng ế u
nhiên XF
1
(x),
)...,,,(
2
21 n
YYY
rút ra t bi n ng u nhiên Y (y) ế F
2
i toán đặt ra là: ki m tra xem hai m u trên có ph ải được rút ra t
mt phân phi hay không, t c là:
)()()()(
2121
xFxFhayxFxF
.
Trong m ục này ta xét bài toán đơn giản hơn là so sánh hai giá trị
EX và EY.
Ký hiu
DYDX
EYEX
2
2
2
121
,,,
Gi thiết H : t H :
0
1
=
2
, đối thiế
1
1

2.
1.Nếu
2
2
2
1
,
t đã biế
Trong trường hp này ta cn phi gi thiết ho c X Y phân
phi chu n ho c m u n , n
1 2
đủ ln (n 30, n 30). lu
1
2
ận tương tự ta
được các min tiêu chun mức ý nghĩa tương ứng như sau:
2/211210
2
2
2
1
2
1
||;::
zzSHvàH
nn
yx
2/211210
2
2
2
1
2
1
;::
zzSHvàH
nn
yx
23
2/211210
2
2
2
1
2
1
;::
zzSHvàH
nn
yx
Ví d 1. GS t hai t p h p chính có phân b chu n X và Y ta l y hai m u
độ c lp v i c m ng n =40 n =50. Trung bình mẫu tương
1 2
u tính
được là
140,130 yx
.
GS E(X)=
μ
1
(chưa biết)
, biết V(X)=σ
1
2
=80.
GS E(Y)=
μ
2
(chưa biết)
, biết V(Y)=σ
2
2
=100.
Vi m nh bài toán : ức ý nghĩa α=1%, kiểm đị
- t H Gi thiế
0
: μ
1
2
- t H Đối thiế
1
: μ
1
≠μ
2
Gii
Ta có
5
50
100
40
80
140130
T
Với α=1%, ta có u
α/2
=2.576.
Vì |T|=5>2.576, nên ta b gi thi . ác b ết H
0
Ví d 2. V i m nh gi t sau : ức ý nghĩa α=5% hãy kiểm đị thiế
a) - t H Gi thiế
0
: μ
1
=μ
2
- Đối thi t Hế
1
: μ
1
>μ
2
Vi s liệu như sau :
256;105;
98;105;32;50
2
2
2
121
yxnn
b) - t H Gi thiế
0
: μ
1
2
- Đối thi t Hế
1
: μ
1
2
Vi s liệu như sau :
64
;36;25;20;35;25
2
2
2
121
yxnn
Gii
a)
203.2
32
256
50
105
98
105
T
Do T=2.203>u
α
=1.645, nên ta bác b gi thi t H . ế
0
b)
24
77.2
35
64
25
36
2520
T
Do T=-2.77<-z
α
=-1.645, nên ta bác b gi . thiết H
0
2. N u ế
2
2
2
1
,
chưa biết nhưng mẫu l n (n >30, n
1 2
>30), trong trường hp
này ta v n v n d ng test th ống như trong phần 1. trong đó các phương sai
chưa biết
2
2
2
1
,
c thay b u: trong T đượ ởi các phương sai m
2
2
2
1
,SS
. Như vậ ống kê đượ đây là: y test th c dùng
2
2
2
1
2
1
n
S
n
S
yx
T
Khi n , n nh gi i h n trung tâm, T có phân b x p x phân b
1 2
>30 thì theo đị
chun t c cho dù X và Y không có phân b chu n.
Ví d 3. Người ta ti n hành m t cu c nghiên c u v ế điểm trung bình c a các v n
động viên th d ục năm 1970 và năm 1995. Một m u g ồm 35 VĐV của năm 1970
có s điểm trung bình là 267 v l ch tiêu chu n là 27. M u g m 40 với độ t m n
độ điểng viên của năm 1995 có số m trung bình là 255 v lới độ ch tiêu chun là
30. Ki nh xem s khác nhau hay không gi a hai th h v ng viên ểm đị ế ận độ
của năm 1970 và 1995? Mức ý nghĩa α=5%.
Gii
Bài toán ki nh là: ểm đị
- t H Gi thiế
0
: μ
1
=μ
2
- t H Đối thiế
1
: μ
1
≠μ
2
Ta có
823.1
40
2
30
35
2
27
255267
T
Do T=1.823<z =1.96, nên ta ch p nh n H . V kh nh
α/2
0
ậy không có cơ sở để ẳng đị
có s khác nhau gi a hai th h v ng viên. ế ận độ
3.Nếu
2
2
2
1
,
t m u nh <30, n <30) chưa biế (n
1 2
Trong trường h p này ta ph thi t i gi ế
25
).
,();,(
2
2
2
1
NYNX
Các bước làm như sau:
- Xut phát t hai mẫu đã cho ta tính
22
,,,
yx
ssyx
.
- Tính
21
21
2
21
2
)1
2
(
2
)1
1
(
.
nn
nn
nn
y
sn
x
sn
yx
t
- Vi đã cho, tra bả ối Student tìm đưng phân ph c
)2/(
2
21
nn
t
hoc
)(
2
21
nn
t
. Các mi n tiêu chu ẩn như sau:
)2/(;::
2211210
21
nn
ttSHvàH
)(;::
2211210
21
nn
ttSHvàH
)(;::
2211210
21
nn
ttSHvàH
d M ng v i 2 5. Cơ quan hàng không vụ tr (NASA) đã ký hợp đồ
công ty A và B s n xu pin dùng cho v tinh vi n thông. t th
Da trên k t qu c a các pin th nghi m, NASA s quy nh ch n công ế ết đị
ty nào làm nhà cung c p pin cho v tinh vi s n thông. Công ty A đã n
xut th đưc 10 chi c, có tuế i th l ch tiêu trung bình là 4.8 năm và độ
chuẩn 1.1 năm. Công ty B sản xu t th được 12 chi c, v i tu i th trung ế
bình 4.3 năm và độ ẩn là 0.9 năm. lch tiêu chu
GS r ng tu i th c a pin do A B cung c p phân b chu n
phương sai như nhau. V i m nh xem s ức ý nghĩa α=1%, kiểm đị
khác nhau v i th trung bình c i pin hay không? tu a 2 lo
Gii
Bài toán ki nh là: ểm đị
- t H Gi thiế
0
: μ
1
=μ
2
26
- t H Đối thiế
1
: μ
1
≠μ
2
Các s liệu đã cho như sau:
Công ty A:
1.1;8.4;
10
11
sxn
.
Công ty B:
9.0;3.4;
12
22
syn
.
Phương sai chung của ước lưng là:
99.0
20
8.19
21210
)9.0)(112()1.1)(110(
2
22
s
.
Vy
174.1
426
.0
5.0
)(99.0
3.48.4
12
1
10
1
T
Tra b ng phân ph i Student 1-0.005 phân v v i 20 b c t do ta được
2.845.
Do |T|<2.845, nên ta không đủ cơ sở bác b H .
0
4.Khong tin c y cho hi u s : μ
1
-μ
2
Khi bài toán kiểm định dn ti bác b H , ta d
0
n ti bài toán tìm khong tin cy
cho hiu s . μ
1
-μ
2
Trong trường h p
2
2
2
1
,
ng BNN đã biết, có th chứng minh được r
2
2
2
1
2
1
21
)(
nn
yx
T
Có phân b n t ng tin c u s chu ắc N(0, 1). Khi đó, khoả y γ cho hiệ μ
1
-μ
2
là:
2
2
2
1
2
1
2/
nn
uyx
Trong trườ ng h p
2
2
2
1
,
u l n chưa biết nhưng mẫ
(n
1
, n >30) ta thay
2
2
2
2
1
,
bi
2
2
2
1
, SS
và nh c kho ng tin c y x p x ận đượ γ:
2
2
2
1
2
1
2/
n
S
n
S
uyx
Và không cn gi thi t 2 t p chính có phân b n. ế chu
5.Phương pháp so sánh từng cp:
27
Gi s p g ng ng u nhiên (nói chung ph (X, Y) là mt c ồm hai đại lượ thuc
nhau), v . ới E(X)=μ
1
, E(Y)=μ
2
Chúng ta cn so sánh . μ
1
và μ
2
Xét D=X -Y, khi đó ta đưa BT so sánh về ểm đị BT ki nh v giá tr TB.
Bài 8.7. So sánh hai t l
Xét hai tp h p chính I và II và m i cá th c ột đặc tính A nào đó mà mỗ a hai
tập chính đó thể có hay không. Ta mun so sánh t l cá th có đặc tính A ca
tp chính I vi t l cá th c tính A c p chính II. có đặ a t
Gi s u ng u nhiên ta có hai m
)...,,,(
1
21 n
XXX
trong đó
1
1
1111
,1)0(,)1(
n
i
iii
XmpqXPpXP
Và m u
)...,,,(
2
21 n
YYY
trong đó
2
1
2222
,1)0(,)1(
n
j
jjj
YmpqYPpYP
Gi thiết H : p t H : p
0 1
=p
2
i thiđố ế
1 1
p
2
, p , p
1
>p
2 1
<p
2
Vì EX , EY , DX ), DY ) nên so sánh hai xác su t p , p
i
=p
1 j
=p
2 i
=p
1
(1-p
1 j
=p
2
(1-p
2
1 2
chính là so sánh hai giá tr trung bình v t. Nới phương sai chưa biế ếu H
0
đúng thì
DX
i
=DY
j
=
2
. Khi đó
).()(
21
11
2
nn
YXD
Ướ
c lư ng ca
2
)1.(
21
21
21
21
nn
mm
nn
mm
ĐK áp dụng: m 10 và n - m 10.
1
+m
2
1
+n
2 1
-m
2
Vi n , n l n ta x p x phân ph
1 2
đủ i
)( YXV
YX
T
b xi phân phi p x
chun N(0, 1).
T đó ta nhận được các tiêu chun mc tương ứng như sau:
.
21
21
21
2121
21
21
2
2
1
1
.
nn
nn
nn
mmnn
nn
mm
n
m
n
m
u
28
Nếu H
0
: p
1
=p
2
, H
1
: p
1
p
2
thì S=|u| u( /2)
Nếu H
0
: p
1
=p
2
, H
1
: p
1
>p
2
thì S=uu()
Nếu H
0
: p
1
=p
2
, H
1
: p
1
<p
2
thì S=u-u()
Ví d 15. Công ty Coca- i ti n s n ph m. V i công th cola đang n/c cả ế ức khi
cho 500 ngư thì 120 người ưai dùng th thích. Vi công thc mi khi cho
1000 ngườ ời ưa thích. i khác dùng th thì có 300 ngư
Vi m =2%, ki nh xem công th c mức ý nghĩa ểm đị ới đưa vào có làm tăng t
l người ưa thích hay không?
Gii
H
0
: p
1
=p
2
, H
1
: p
1
>p
2
.4.2
5001000
50001000
5001000
1203005001000
5001000
120300
500
120
1000
300
21
21
21
2121
21
21
2
2
1
1
..
.
x
nn
nn
nn
mmnn
nn
mm
n
m
n
m
u
u
=u
0.02
=2.054
Do u>u =2.054, nên ta bác b H .
0
Gi s X và Y là 2 BNN có phân b n, chu
),(~
2
11
NX
,
),(~
2
22
NY
,
Chúng ta cn so sánh d p c a X và Y. μ
1
μ
2
a trên 2 mẫu quan sát đc l
| 1/28

Preview text:

CHƯƠNG 8. KIỂM ĐỊNH GI THIT THNG KÊ
8.1. Kiểm định giả thiết về giá trị trung bình
8.2. Kiểm định giả thiết về tỷ lệ
8.3. Kiểm định giả thiết cho phương sa i
8.4. So sánh hai giá trị trung bìn h 8.5. So sánh hai tỷ lệ
8.6. So sánh hai phương sai 2  8.7. Tiêu chuẩn phù hợp
8.8. Kiểm tra tính độc lập và so sánh nhiều tỷ lệ
8.9. So sánh nhiều giá trị trung bình: phân tích phương sai một nhân tố
Bài 8.1. Kiểm định gi thiết v giá tr trung bình I. Nguyên lý chung:
Bài toán kiểm định giả thiết thống kê là bài toán: căn cứ vào các số liệu
thống kê cần phải đưa ra kết luận về một giả thiết thống kê nào đó mà ta quan tâm.
Một giả thiết thống kê là một giả thiết về phân bố xác suất của tập chính đang
xét. Nếu phân bố xác suất đó được đặc trưng bởi các tham số (như XÁC SUẤT
(tỷ lệ), giá trị trung bình hay phương sai, …), thì giả thiết thống kê là giả thiết
về tham số của phân bố đó.
Từ nay trở đi ta sẽ hiểu một giả thiết là một giả thiết thống kê, một quy
tắc dẫn tới quyết định chấp nhận hay bác bỏ giả thiết đã nêu gọi là một kiểm định (test) thống kê.
Giả thiết đưa ra kiểm định được ký hiệu H0, đó là giả thiết mà ta nghi
ngờ. Đối lập với giả thiết H0 là đối thiết H1. Chấp nhận H0 nghĩa là bác bỏ H1,
ngược lại, bác bỏ H0 nghĩa là chấp nhận H1.
Câu hỏi đặt ra là: Chúng ta chấp nhận hay bác bỏ một giả thiết bằng
cách nào? Để đưa ra quy tắc kiểm định, các nhà thống kê đều nhất trí với nhau nguyên lý sau đây:
“Nếu mt biến c có xác sut rt nh thì trong mt phép th hay mt
vài phép th, biến c đó s không xảy ra”.
Như vậy, chúng ta sẽ bác bỏ H0 nếu xuất hiện biến cố có xác suất nhỏ,
tính trong điều kiện giả th ế i t H0 đúng.
Chúng ta sẽ minh họa bởi các ví dụ sau:
Ví dụ 1. Gieo một đồng tiền 100 lần ta thấy xuất hiện mặt sấp 60 lần. Ta nghi
ngờ rằng, xác suất xuất hiện mặt sấp lớn hơn xác suất xuất hiện mặt ngửa.
Gọi p là xác suất xuất hiện mặt sấp. Khi đó ta có bài toán kiểm định như sau: - Giả thiết H0: p=1/2 - Đối thiết H1: p>1/2 1 Ta tính   P S  6  p     P    100  0 5 . 0 6 . 0 5 . 0 (10( 6. 0 0 Q 5 . 0 x 5 . 0 /100 5 . 0 x 5 . 0 /100 0    Q ) 9 . 1 (  0 . 0 28717
Đây là một xác suất nhỏ, mà lại xảy ra trong một lần kiểm định. Vậy ta
bác bỏ H0, chấp nhận H1.
Ví dụ 2. Một cuộc nghiên cứu ở Mỹ cho biết trẻ em Mỹ ở độ tuổi đến
trường tiêu thụ trung bình 19.4 OZ sữa 1 ngày (1 OZ=28.35 g).
Trong một mẫu ngẫu nhiên gồm 140 trẻ em người ta tính được lượng
sữa chúng uống trung bình một ngày là 18.5 OZ với độ lệch tiêu chuẩn là 6.8
OZ. Điều này có cho phép ta kết luận là lượng sữa tiêu thụ ít hơn 19.4 OZ hay không? Giải
Gọi  là lượng sữa tiêu thụ trung bình trong 1 ngày. Ta đi đến bài toán
kiểm định giả thiết thống kê như sau: - Giả thiết H0: =19.4
- Đối thiết H1: <19.4
Giả sử H0 đúng, khi đó xác suất để trung bình mẫu X  18 5 . bằng bao nhiêu?
Do X có phân bố chuẩn (hoặc xấp xỉ chuẩn) với kỳ vọng là 19.4 và độ S 8 . 6   5 . 0 75 lệch chuẩn là n 140 . Vậy  P X  18  5 .   18 5 . 1  9 4 . P Z    P Z   5 . 1 7 5 . 0 75 .
Xác suất này không nhỏ lắm.
Vì vậy ta chưa có đủ cơ sở để bác bỏ giả thiết H0. Nói cách khác,
số liệu đã có chưa đủ cơ sở để bác bỏ giả thiết H0.
Trong khi đưa ra quyết định, chúng ta có thể phạm phải 1 trong 2 loại sai lầm sau:
- Sai lm loi 1: Bác b H0 trong khi thc ra H0 đúng
- Sai lầm loại 2: Chấp nhận H0 trong khi thực ra H0 sai.
Sai lầm loại 1, tương tự như sai lầm của quan tòa, khi “Kết án nhầm” người vô ộ
t i; còn sai lầm loại 2 tương tự như sai lầm “Tha bổng” kẻ có tội. 2
Chúng ta mong muốn làm cực tiểu cả 2 loại sai lầm trên, nhưng
khi đó chúng ta phải trả giá đắt về thời gian, tiền của và công sức.
Hơn nữa, khi ta giảm sai lầm loại này lại làm tăng sai lầm loại kia, và ngược lại.
Trong xã hội văn minh, người ta coi kết án nhầm người vô tội là
1 sai lầm nghiêm trọng hơn so với sai lầm tha bổng kẻ có tội.
Trong bài toán kiểm định cũng vậy, ta coi sai lầm loại 1 là
nghiêm trọng hơn sai lầm loại 2. Cho nên, người ta cố định trước sai lầm
loại 1. Xác suất mắc sai lầm loại 1 được gọi là mức ý nghĩa của tiêu
chuẩn, ký hiệu là . Xác suất mắc sai lầm loại 2 ký hiệu là . Giá trị 1-
được gọi là LỰC LƯỢNG của tiêu chuẩn. Lực lượng của tiêu chuẩn là
xác suất bác bỏ H0 khi H0 sai .
Mức ý nghĩa  của tiêu chuẩn thường được lấy là 0.05; 0.02 hoặc 0.01.
Trong tập các tiêu chuẩn có cùng mức ý nghĩa , tiêu chuẩn nào
có xác suất sai lầm loại 2 nhỏ nhất được xem là tiêu chuẩn “tốt nhất” .
Các tiêu chuẩn được đưa ra ở chương này đều đã được chứng
minh chặt chẽ về mặt toán học là các tiêu chuẩn tốt nhất.
Khi kiểm định thống kê dẫn tới chấp nhận H0 là một quyết định
dè dặt: Chấp nhận H0, không có nghĩa là H0 đúng, mà chỉ nên hiểu là với
các số liệu hiện có, không có đủ cơ sở để bác bỏ H0, cần phải nghiên cứu tiếp.
Các bước cần thiết trong việc giải một bài toán kiểm định giả thiết thống kê như sau:
1.Phát biu gi thiết H0 và đối thiết H1
2.Ch
n tiêu chun (test) thng kê.
3
.Định rõ mức ý nghĩa  (xác sut mc sai lm loi 1).
4.Ch
n min bác b gi t i h ết H0.
5.Tính giá tr ca tiêu chun thng kê t mẫu quan sát được.
6.K
ết lun: Bác b hay chp nhn gi thiết, tùy thuc vào vic
giá tr ca tiêu chuẩn có rơi vào miền bác b gi thiết hay không.
II. Kiểm định gi thiết v giá tr trung bình:
Giả sử (X1, X2, …, Xn) là mẫu ngẫu nhiên được rút từ biến ngẫu nhiên
chuẩn X có EX=, DX=2 (Nếu X không chuẩn thì n120). 3.A.1. Đối th ế
i t hai phía: Xét BTKĐGT
Gi thiết H0 : =0
Đối thiết H1: 
 0, vi mức ý nghĩa  cho trước.
1.Nếu phương sai 2 = σ 2
0 đã biết Bài toán dạng 1:
Các bước tiến hành như sau: + Bước 1: H :   Giả thiết 0 0 3 H   Đối thiết :  1 0
+ Bước 2: Xác định hàm tiêu chuẩn x 0  z   n 0 /
+ Bước 3: Xác định mức ý nghĩa α
Do đối thiết 2 phía và hàm tiêu chuẩn z nên ta tra α/2 phân vị của phân
phối chuẩn tắc, tra bảng hoặc Excel: zα/2 =NORMSINV(1-α/2) α 10% 5% 2% 1% zα/2 1.645 1.96 2.326 2.576
+Bước 4: Xác định miền bác bỏ
S={(X1, X2, …, Xn):|z|>zα/2} x x z 0  để tín h +Bướ  c 5: Dựa vào TB mẫu / n 0
+Bước 6: Nếu |z|>zα/2 thì ta bác bỏ H0.
Nếu |z|<=zα/2 chấp nhận giả thiết H0.
Bài toán dng 2:
Các bước tiến hành như sau: + Bước 1: H :   Giả thiết 0 0 H   Đối thiết :  1 0
+ Bước 2: Xác định hàm tiêu chuẩn x z   0/ n
+ Bước 3: Xác định mức ý nghĩa α
Do đối thiết 1 phía và hàm tiêu chuẩn z nên ta tra α phân vị của phân phối
chuẩn, tra bảng hoặc Excel: zα =NORMSINV(1-α) α 5% 2.5% 2% 1% 0.5% zα 1.645 1.96 2.054 2.326 2.576 4
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): z>zα} x0  x z tính  / n
+Bước 5: Dựa vào TB mẫu 0
+Bước 6: Nếu z>zα thì ta bác bỏ H0.
Nếu z<=zα chấp nhận giả thiết H0.
Ví dụ 2. Tập chính X có phân phối chuẩn với giá trị trung bình  chưa biết, 0 x  27 5 . 6 =5.2, n=25, TB mẫu
. Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =26
- Đối thiết H1: ≠26. Giải
Các bước tiến hành như sau: + Bước 1: H :  26 Giả thiết 0   Đối thiết H : 26 1
+ Bước 2: Xác định hàm tiêu chuẩn 26  x z 5.2 / 25
+ Bước 3: Xác định mức ý nghĩa α=0.05
Do đối thiết 2 phía và hàm tiêu chuẩn z nên ta tra α/2 phân vị của phân
phối chuẩn, tra bảng hoặc Excel: zα/2 =NORMSINV(1-α/2)=1.96
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): |z|>1.96} x  27 6 . và +Bước 5: Dựa vào mẫu x0 27 6 . 2  6 z    6 . 1  / 2 . 5 / 5 0 n +Bước 6:Vì |z|=1.6 5
Ví dụ 3. Tập chính X có phân phối chuẩn với giá trị tru g
n bình  chưa biết, 0 x  27 5 . 6 =5.2, n=25, TB mẫu
. Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =26
- Đối thiết H1:  > 26. Giải
Các bước tiến hành như sau: + Bước 1: H :  26 Giả thiết 0   Đối thiết H : 26 1
+ Bước 2: Xác định hàm tiêu chuẩn 26  x z 5.2 / 25
+ Bước 3: Xác định mức ý nghĩa α=0.05
Do đối thiết 1 phía và hàm tiêu chuẩn z nên ta tra α phân vị của phân phối
chuẩn, tra bảng hoặc Excel: zα =NORMSINV(1-α)=1.645
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): z>1.645} x  27 6 . và +Bước 5: Dựa vào mẫu x0 27 6 . 2  6 z    6 . 1  / 2 . 5 / 5 0 n +Bước 6:Vì z=1.6
Bài toán dng 3:
Các bước tiến hành như sau: + Bước 1: H :   Giả thiết 0 0
Đối thiết H :    1 0
+ Bước 2: Xác định hàm tiêu chuẩn 6 x  z 0  0/ n
+ Bước 3: Xác định mức ý nghĩa α
Do đối thiết 1 phía và hàm tiêu chuẩn z nên ta tra α phân vị của phân phối
chuẩn, tra bảng hoặc Excel: =NORMSINV(1-α)
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): z<-zα} x0  x z
+Bước 5: Dựa vào mẫu tính  / n 0
+Bước 6: Nếu z< - zα thì ta bác bỏ H0.
Nếu z=>- zα chấp nhận giả thiết H0.
Ví dụ 3. GS X~N(,2) với  chưa biết, =5.2, n=36, TB mẫu x  27 5
. 6 . Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =29.64
- Đối thiết H1: <29.64 Giải + Bước 1: H :  29 6 . 4 Giả thiết 0
Đối thiết H :  29 6 . 4 1
+ Bước 2: Xác định hàm tiêu chuẩn 2 . 9 64  x z 5 2 . / 36
+ Bước 3: Xác định mức ý nghĩa α=0.05
Do đối thiết 1 phía và hàm tiêu chuẩn z nên ta tra α=0.05 phân vị của phân
phối chuẩn, tra bảng hoặc Excel: =NORMSINV(1-0.05)=1.645
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): z<-1.645} x  27 5 . 6 và +Bước 5: Dựa vào mẫu tính x0 27 5 . 629 6 . 4 z     4 . 2  / n 2 . 5 / 36 0 7
+Bước 6: Vì z=-2.4 < zα=-1.645 nên ta bác bỏ giả thiết H0, chấp nhận đối
thiết H1, nghĩa là chấp nhận giá trị TB μ < 29.64.
2.Nếu 2 chưa biết:
Trong trường hợp này ta phải giả th ế
i t về tính chuẩn của biến ngẫu
nhiên X, cỡ mẫu nhỏ hơn 30.
Chúng ta có 3 dạng kiểm định:
Dạng 1. Đối thiết 2 phía H :   Giả thiết 0 0 H   Đối thiết :  1 0 x 0 t n.
Hàm tiêu chuẩn sử dụng ở đây là s
Với mức ý nghĩa α ta phải tra α/2 phân vị của phân phối Student n-1 bậc tự do: tα/2, n-1.
Nếu tra bằng Excel: tα/2, n-1=TINV(α, n-1).
Ví dụ 4. GS X~N(,2) với  chưa biết, 2 chưa biết, n=16, TB mẫu x  27 5
. 6 , s=5.2 . Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =26 - Đối thiết H1: ≠26 Giải + Bước 1: H :  26 Giả thiết 0
Đối thiết H :  26 1
+ Bước 2: Xác định hàm tiêu chuẩn 26  x t 5 2 . / 16
+ Bước 3: Xác định mức ý nghĩa α=0.05
Do đối thiết 2 phía và hàm tiêu chuẩn t nên ta tra α=0.025 phân vị của phân phối S
tudent với 15 bậc tự do, tra bảng hoặc Excel: =TINV(0.05,15)=2.13
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): |t|>2.13} 8 x  27 5 . 6 và +Bước 5: Dựa vào mẫu tính x 0 27 5 . 6 2  6 t    . 1 2 s / n 5 2 . / 16
+Bước 6: Vì |t|=1.2 < tα/2,15=2.13 nên ta chấp nhận giả th ế i t H0 nghĩa là
chấp nhận giá trị TB μ =26.
Dạng 2. Đối thiết 1 phía lớn hơn H :   Giả thiết 0 0
Đối thiết H :    1 0 Ví dụ 5:
GS X~N(,2) với  chưa biết, 2 chưa biết, n=16, TB mẫu x  29 1 . 2 ,
s=5.2 . Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =26
- Đối thiết H1: >26 - Giải + Bước 1: H   - Giả thiết 0 : 26
- Đối thiết H :  26 1
+ Bước 2: Xác định hàm tiêu chuẩn 26  x t . 5 2/ 16
+ Bước 3: Xác định mức ý nghĩa α=0.05
Do đối thiết 1 phía và hàm tiêu chuẩn t nên ta tra α=0.05 phân vị của phân
phối Student với 15 bậc tự do, tra bảng hoặc Excel: =TINV(0.10,15)=1.75
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): t>1.75} 9 x  29 1 . 2 và +Bước 5: Dựa vào mẫu tính x 0 29 1 . 226 t    . 2 4 s / n 5.2 / 16
+Bước 6: Vì t=2.4 > tα,15=1.75 nên ta bác bỏ giả th ế i t H0 nghĩa là chấp
nhận giá trị TB μ >26.
Dạng 3. Đối thiết 1 phía nhỏ hơn H :   Giả thiết 0 0
Đối thiết H :   1 0 Ví dụ 6:
GS X~N(,2) với  chưa biết, 2 chưa biết, n=16, TB mẫu x  24 1 . 2 ,
s=5.2 . Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =26
- Đối thiết H1: <26 - Giải + Bước 1: H   - Giả thiết 0 : 26
- Đối thiết H :   26 1
+ Bước 2: Xác định hàm tiêu chuẩn 26  x t . 5 2/ 16
+ Bước 3: Xác định mức ý nghĩa α=0.05
Do đối thiết 1 phía và hàm tiêu chuẩn t nên ta tra α=0.05 phân vị của phân
phối Student với 15 bậc tự do, tra bảng hoặc Excel: =TINV(0.10,15)=1.75
+Bước 4: Xác định miên bác bỏ
S={(X1, X2, …, Xn): t<-1.75} 10 x  24 1 . 2 và +Bước 5: Dựa vào mẫu tính x 0 29 1 . 226 t    . 2 4 s / n 5.2 / 16
+Bước 6: Vì t=2.4 > tα,15=1.75 nên ta bác bỏ giả th ế i t H0 nghĩa là chấp
nhận giá trị TB μ >26. x 0
Hàm tiêu chuẩn sử dụng ở đây là t n. s x 0
- Xuất phát từ mẫu đã cho ta tính x , s2 và t n. s
- Với  đã cho, tra bảng phân phối Student với n-1 bậc tự do ta tìm được t P T  α/2,n-1 từ hệ thức  t n1 / 2,n     1
, trong đó Tn-1 là biến ngẫu
nhiên Student với n-1 bậc tự do. So sánh t và tα/2,n-1:
- Nếu t t / 2,n 1
 ta bác bỏ giả thiết H0
- Nếu t t / 2,
ta chấp nhận giả thiết H0 . n 1 
Như vậy miền tiêu chuẩn là:  x 0  S X X X n  (  , ,..., ) : t n sn  . 1 2 / 2, 1  
3.A. 2. Đối thuyết một phía: Xét BTKĐGT H0 : =0 với đối thuyết
H1: >0, vi mức ý nghĩa   cho trước.
1.Nếu 2 đã biết
Các bước tiến hành như sau: x  z 0 
- Xuất phát từ mẫu đã cho tính x và  / n
- Tìm giá trị z() từ bảng sao cho ( z())=1-. So sánh u và u():
- Nếu z z ( )ta bác bỏ H0. 11
- Nếu z z ( )ta chấp nhận H0.
Như vậy miền tiêu chuẩn là: 
S  ( X , X ,..., Xn ) : x 0  n z( 1 2  ) .
2.Nếu 2 chưa biết:
Trong trường hợp này ta phải giả thiết về tính chuẩn của biến ngẫu nhiên X và n<30. x 0
- Xuất phát từ mẫu đã cho ta tính t n. x , s2 và s
- Với  đã cho, tra bảng phân phối Student với n-1 bậc tự do ta tìm được t P Tt  α,n-1 từ hệ thức
n1 ,n   1
, trong đó Tn-1 là biến ngẫu nhiên Student với - n 1 bậc tự do. So sánh t và tα,n-1:
- Nếu t t ,n 1
 ta bác bỏ giả thiết H0
- Nếu t t ,
ta chấp nhận giả thiết H n 1  0.
Như vậy miền tiêu chuẩn là: 
S  (X , X ,.. , X ) : x 0 n  1 2 t n s , n  . 1
Ví dụ 4.  chưa biết,  chưa biết, n=16, X~N(,2). TB mẫu x  27 5 . 6 ,
S2=5,22 . Với mức ý nghĩa =0.05, hãy kiểm định bài toán sau: - Giả thiết H0: =26
- Đối thiết H1:  > 26
3. A. 3. Đối thuyết một phía: Xét BTKĐGT H0 : =0 với đối thuyết
H1: <0, vi mc ý nghĩa   cho trước.
1.Nếu 2 đã biết
Các bước tiến hành như sau: x  z 0 
- Xuất phát từ mẫu đã cho tính x và  / n
- Tìm giá trị z() từ bảng sao cho ( z())=1-. So sánh z và z():
- Nếu z  z( ) ta bác bỏ H0 .
- Nếu z  z( ) ta chấp nhận H0 . 12
Như vậy miền tiêu chuẩn là: 
S  ( X , X ,..., X ) : x 0 n   ( z  1 2 n   ) .
2.Nếu 2 chưa biết:
Trong trường hợp này ta phải giả th ế
i t về tính chuẩn của biến ngẫu
nhiên X và cỡ mẫu n<30. x 0
- Xuất phát từ mẫu đã cho ta tính t n. x , s2 và s
- Với  đã cho, tra bảng phân phối Student với n-1 bậc tự do ta tìm được t P Tt  α,n-1 từ hệ thức  , trong đó T n1 ,n    1 n-1 là biến ngẫu nhiên Student với - n 1 bậc tự do. So sánh t và tα,n-1:
- Nếu t  t ,
ta bác bỏ giả thiết H0 n 1 
- Nếu t  t ,n 1
 ta chấp nhận giả thiết H0 .
Như vậy miền tiêu chuẩn là: 
S  ( X , X ,.. , X ) : x 0 n   1 2 t n s ,  n 1   . Bài tập
Giả sử ta có mẫu ngẫu nhiên cỡ n=10 với các giá trị mẫu:
6.5; 5; 5.5; 8; 6.5; 10; 10; 8; 6.5; 7
Giả thiết mẫu từ bnn chuẩn. Hãy kiểm định giả thiết với mức ý nghĩa α=5%: H0: µ = 7; H1: µ > 7.
a) Giả sử đã biết phương sai lý thuyết σ0=2;
b) Giả thiết chưa biết phương sai. 13
Bài 8.2. Kiểm định gi thiết v t l
Giả sử (X1, X2, …, Xn) là mẫu ngẫu nhiên, trong đó: 1 khi có A X  , p=P(A) i  0 khikhôngcó A
Như vậy, P(Xi=1)=P(A)=p, P(Xi=0)=P(A)=1-p=q. n
m   X ; thì m B(n, p) Khi đó, nếu đặt i i1 n m  1  
Nếu n lớn (n30), và min(m, n-m)5, thì X X n n i , có phân i1
phối xấp xỉ chuẩn. Lý luận tương tự tương tự trường hợp 3.A. Ta nhận
được các miền tiêu chuẩn để kiểm định giả thuyết H0 : p=p0 với các đối thiết pp0, p>p0, p
H : p p và H : p p ; m n p 0 S n z  0 0 1 0  / ( / 2 p 1 (  p ) ) 0 0 
H : p p và H : p p ; m n p0 S n z  0 0 1 0  / ( p 1 (  p ) ) 0 0 
H : p p và H : p p ; m n p 0 S n  z  0 0 1 0  / ( ) p 1 (  p )  0 0
Ví d: p0=45%, n=200, m=80, =5%, xem dự đoán có đúng không? Giải + Bước 1: - Giả thiết H0: p=0.45 - Đối thiết H1: p0.45
+ Bước 2: Vì np0=90, và n(1-p0)=110 nên ta có hàm tiêu chuẩn:   p p0  p 4 . 0 5 z   p0q0 /n 4 . 0 5 5 . 0 * 5/ 200 14
+ Bước 3: với α=0.05 và hàm z-tiêu chuẩn ở bước 2, dang BT 1 ta tra zα/2=z0.025=1.96. + Bước 4:
S   m/ n 0p n  . 1 9 p 1 (  p )  6 0 0 + Bước 5: 80 4 . 0 5 200 z   200   4 . 1 2 4 . 0 5x 5 . 0 5
+ Bước 6 : Kiểm tra ta thấy |z|=1.42Kết luận: Chấp nhận giả thiết H0.
Bài 3. Phương pháp p-giá tr
Các kỹ thuật mà ta đã kiểm định ở các tiết trước được gọi là phương
pháp kiểm định truyền thống. Trong mục này chúng ta sẽ trình bày một phương
pháp khác hiện được các nhà thống kê sử dụng khá rộng rãi gọi là phương pháp p-giá trị.
Xét bài toán kiểm định: - Giả thiết H0: =0
- Đối thiết H1: <0
Các số liệu mẫu cho ta giá trị của n, X  0
x và S. Ta muốn kiểm định
xem số liệu đã cho có cho phép ta bác bỏ H0 hay không?
Ta lý luận bằng phản chứng: Giả sử H0 là đúng, ta hãy tính xem xác suất để
trung bình mẫu bé hơn hay bằng giá trị quan sát được x0 bằng bao nhiêu.
Nếu xác suất này “nhỏ” theo một nghĩa nào đó, ta sẽ bác bỏ H0, do theo
nguyên lý xác suất nhỏ, biến cố đó rất ít xảy ra trong một phép thử. Nếu xác
suất đó khá “lớn” thì ta không có cơ sở để bác bỏ H0. p   P X  0 x
Giá trị của xác suất này
(tính trong điều kiện H0
đúng), được gọi là p-giá trị.
Tương tự, đối với bài toán kiểm định: - Giả thiết H0: =0
- Đối thiết H1: >0
p PX  0 x
Thì p-giá trị là xác suất
, tính dưới giả thiết H0 đúng.
Còn với bài toán kiểm định 2 phía: - Giả thiết H0: =0
- Đối thiết H1: 0
Thì p-giá trị trong trường hợp kiểm định 2 phía này gấp đôi p-giá trị trong
trường hợp 1 phía, tức là: 15
p  2PX x PX    0
x PX 0 x  0 nếu , và ngược lại:
p  2PX x PX    0
x PX 0 x  0 nếu ,
p-giá trị được các nhà thống kê sử dụng theo 2 cách. Một số người chỉ đơn
thuần tính p-giá trị, còn việc có bác bỏ giả thiết H0 hay không thì để lại cho n hà
quản lý tự quyết định lấy.
Khi làm như vậy, nhà thống kê có một số hướng dẫn chung như sau:
- Nếu p>0.05, ta không đủ cơ sở để bác bỏ H0.
- Nếu 0.01

- Nếu p<0.01, ta có một cơ sở rất mạnh, hùng hồn để bác bỏ H0.
Cách thứ 2 là sử dụng p-giá trị kết hợp với mức ý nghĩa  đã cho.
Ta tính p-giá trị và so sánh nó với :
Nếu p  0.05 , ta bác bỏ H0.
Nếu p>, ta chưa có cơ sở bác bỏ H0. Nói cách khác: p-giá trị chính là
mức ý nghĩa thấp nhất mà ta có thể bác bỏ H0.
Ví dụ 15. Từ một tập hợp chính có trung bình  (chưa biết), người ta lấy
ra một mẫu kích thước n=36 và tính được x  5040và S=780. Sử
dụng phương pháp p-giá trị, hãy kiểm định: - Giả thiết H0: =4700
- Đối thiết H1: >4700 Mức ý nghĩa =0.02.  P X  504  Giải. Ta tính p-giá trị 0 . Dưới giả thiết H X 0, vì n=36>30,
là BNN có xấp xỉ phân phối chuẩn với kỳ
vọng là 4700 và độ lệch chuẩn là: S 780  130 n 36 Vậy  P X  504  0  1  P X  504 
0  1 (50404700) 1 ( 6 . 2 ) 2 130 = 1-0.9956=0.0044.
Vậy p-giá trị là 0.0044. Giá trị này nhỏ hơn mức ý nghĩa =0.02. Vậy ta bác bỏ H0 và chấp nhận H1.
Ví dụ 16. Từ một tập hợp chính có trung bình  (chưa biết), người ta lấy
ra một mẫu kích thước n=140 và tính được x  18 5 . và S=6.8. Với
mức ý nghĩa =0.05, hãy kiểm định: 16 - Giả thiết H0: =19.4
- Đối thiết H1: <19.4 PX 18  Giải. Ta tính p-giá trị 5 . . Dưới giả thiết H X 0, vì n=140>30,
là BNN có xấp xỉ phân phối chuẩn với kỳ
vọng là 19.4 và độ lệch chuẩn là: S 6.8   5 . 0 75 n 140  P X  18  1 . 8 5 1  . 9 4 Vậy 5 .  ( )  (   5 . 1 ) 7  0 . 0 582 . 0 575
Vậy p-giá trị là 0.0582. Giá trị này lớn hơn mức ý nghĩa =0.05. Vậy ta không có cơ sở bác bỏ H0.
Ví dụ 19. Cơ quan cảnh sát giao thông cho rằng 80% số người lái xe trên
đường là có bằng lái. Kiểm tra ngẫu nhiên 200 người lái xe, cảnh sát giao thông
thấy chỉ có 150 người có bằng lái xe. Số liệu này có chứng tỏ tỷ lệ người có
bằng lái xe thấp hơn 80% hay không?
Dùng phương pháp p-giá trị với mức ý nghĩa =2%. Giải - Giả thiết H0: p=0.8 - Đối thiết H1: p<0.8
Ta có n=200; m=150; f=150/200=0.75. Vì np0=200x0.6=160>10 n(1-p0)=200x0.2=40>10
Nên f có phân bố xấp xỉ chuẩn với kỳ vọng là 0.8 và độ lệch chuẩn là p 1 (  p ) 0 0 8 . 0 x 2 . 0   0 . 0 28 200 200 . Khi đó p-giá trị là: p   P f  0 7 . 
5  ( .075 .08 )  (1 7 . 8 ) 6  . 0 03705 028 . 0 .
Ta nhận thấy p-giá trị lớn hơn mức ý nghĩa =0.02. Vậy ta chấp nhận
H0. Tỷ lệ người có bằng lái xe thực tế là 80%.
Bài 4. Kiểm định gi thiết
v
giá tr ca nhiu xác sut
Giả sử B1, B2, …, Bk là họ các biến cố đôi 1 xung khắc và đầy đủ của
không gian mẫu S của phép thử ngẫu nhiên E. Ta quan tâm tới xác suất (chưa
biết) của các biến cố Bi, i=1, 2, …, k này. Bài toán kiểm định là:
-Giả thiết H0: (P(B1), P(B2), …, P(Bk))=(p1, p2, …, pk).
-Đối thiết H1: (P(B1), P(B2), …, P(Bk))(p1, p2, …, pk). 17
Trong đó 0Tiến hành phép thử E n-lần độc lập, giả sử có ni lần xảy ra biến cố Bi (i=1, 2, …, k), n1+n2+…+nk=n.
Ta biểu diễn kết quả bởi bảng tần số sau: Biến cố B1 B2 … Bk Tổng Tần số quan sát n1 n2 … nk n   ,  ,1 ,2.. , Các số n np i k i i
được gọi là tần số lý thuyết. Nếu giả  n
thiết H0 đúng thì theo luật số lớn
i và ni xấp xỉ nhau.
Ta sẽ bác bỏ giả thiết H0 khi các tần số quan sát “khác xa” các tần số lý thuyết
theo 1 nghĩa nào đó. Khoảng cách giữa các tần số quan sát và lý thuyết được
đo bởi tiêu chuẩn thống kê “Khi-bình phương”:  k 2
T   (n n ) i iini 1
Ta sẽ bác bỏ H0 khi T lớn một cách có ý nghĩa. Miền bác bỏ H0 sẽ có dạng:
={T>c}, ở đây, c là một hằng số phụ thuộc mức  đã chọn.
Người ta chứng minh được rằng nếu giả thiết H0 đúng và nếu các tần số lý  thuyết n  , 5 i  , 1 , 2 . ., k i
thì T sẽ có phân phối xấp xỉ phân phối 2  2 
với k-1 bậc tự do. Tra bảng phân phối
với k-1 bậc tự do ta sẽ tìm 2 k ( ) được 1 thỏa mãn: { P T   2  ( )}  k 1 . 2 c   2  k ( ) Như vậy 1
là phân vị mức  của phân phối với k-1 bậc tự do.
Ví dụ: Gieo 1 con xúc xắc 600 lần. Số lần xuất hiện các mặt được cho bởi bảng sau: 1 2 3 4 5 6 Tổng 106 92 97 105 88 112 600 18
Có thể coi con xúc xắc đó là cân đối, đồng chất được không? Mức ý nghĩa là 0.05. Giải Tần số lý thuyết: 1 2 3 4 5 6 Tổng 100 100 100 100 100 100 600
Tính tiêu chuẩn thống kê “Khi-bình phương”: 1 ( 06 1  00)2 (92 1  00)2 (97 1  00)2 T     100 100 100 1 ( 05 1  00)2 (88 1  00)2 1 ( 12 1  00)2    2 . 4 2 100 100 100 Tra bảng phân phối 2 c   () 2   0 . 0 ( ) 5 11 070 . 5 k 1  6 1  So sánh: T=4.22<11.0705
Bài 8.5. Kiểm định gi thiết v phương sai 19
Giả sử X là đại lượng ngẫu nhiên có phân bố chuẩn
N(, 2). Tập hợp chính ở đây là tập tất cả các giả trị có thể của X. Xét một
mẫu ngẫu nhiên cỡ n. Như ta đã biết, phương sai mẫu S2 là một ước lượng
không chệch cho phương sai 2 của tập hợp chính.
Bây giờ ta xét bài toán kiểm định giả thiết:
Trường hp 1: - Giả thiết H 2 0: 2=0 - Đối thiết H 2 1: 2<0 2 2 (n 1)S    2  Tính 2  ,
có phân phối Khi – bình phương với 0
n-1 bậc tự do. Dựa vào mức ý nghĩa , ta tra bảng giá trị 2 c  n 1 ( ) 1 . 2 c  n 1 ( ) So sánh T với 1 , nếu: 2
T c  n 1 (  ) - 1 : Bác bỏ H0. 2 2
  c   (1) - n 1  : Chấp nhận H0.
Trường hp 2: - Giả thiết H 2 0: 2=0 - Đối thiết H 2 1: 2>0 2 (n ) 1 S T   Tính 2  0
, T có phân phối Khi – bình phương với n-1
bậc tự do. Dựa vào mức ý nghĩa , ta tra bảng giá trị 2 c    () n 1 . 2 c    n () So sánh T với 1 , nếu: 2 T c    n 1  ( ) - : Bác bỏ H0. 20 2
T c  n () - 1 : Chấp nhận H0.
Trường hp 3: - Giả thiết H 2 0: 2=0 - Đối thiết H 2 1: 20 2 (n ) 1 S T   Tính 2  ố – bình phương vớ 0 , T có phân ph i Khi i n-1
bậc tự do. Dựa vào mức ý nghĩa , ta tra bảng giá trị 2 c    n 1 (  / 2) 1 1 2 c   . n  ( / 2) 2 1 2 c  n 1 (   / 2) 1 1  So sánh T với 2 c   , nếu: n   2 1 ( / 2) 2 2
- T c    T c   ( n  / n  1 1 1 ( / ) 2 hoặc ) 2 2 1 : Bác bỏ H0. 2 c   1 (  / ) 2 2
T c   ( / ) 2 - 1 n 1  2 n 1  : Chấp nhận H0. 21 Ví dụ: - Giả thiết H0: 2=0.22
- Đối thiết H1: 2>0.22
S=0.3, n=12, 0=0.2, =5%. Tính (n ) 1 2 S 1 ( 2 ) 1 x 3 . 0 2 T       2 2 2 . 4 75 19 6 . 7514 2 11 ( 0 . 0 ) 5  2 . 0 0
Vậy, ta bác bỏ giả thiết H0, chấp nhận đối thiết H1.
Bài 8.6. So sánh hai giá tr trung bình
Giả sử ta có hai mẫu ngẫu nhiên ( 1
X , X2 ,.. , Xn ) rút ra từ biến ngẫu 1 nhiên XF (Y ,Y ,.. , 1(x), Y ) 1 2
rút ra từ biến ngẫu nhiên YF2(y) 2 n
Bài toán đặt ra là: kiểm tra xem hai mẫu trên có phải được rút ra từ
một phân phối hay không, tức là:
F (x)  F ( ) x hay F ( ) x F ( ) 1 2 1 2 x .
Trong mục này ta xét bài toán đơn giản hơn là so sánh hai giá trị EX và EY. Ký hiệu   ,  2 ,  2 ,  EX EY DX DY 1 2 1 2
Giả thiết H0: 1=2, đối thiết H1: 12. 2 2  , 1.Nếu 1 2 đã biết
Trong trường hợp này ta cần phải giả thiết hoặc X và Y có phân
phối chuẩn hoặc mẫu n1, n2 đủ lớn (n130, n230). Lý luận tương tự ta
được các miền tiêu chuẩn mức ý nghĩa  tương ứng như sau:  x y 
H :   và H :   ; S  | z | 0 1 2 1 1 2    z 2 2  / 2     1  2 n n   1 2   x y 
H :   và H :   ; S  0 1 2 1 1 2 z   z 2 2  / 2   1    2 n n   1 2  22  x y 
H :   và H :   ; S  0 1 2 1 1 2 z   z 2 2  / 2   1 2 n n   1 2 
Ví dụ 1. GS từ hai tập hợp chính có phân bố chuẩn X và Y ta lấy hai mẫu
độc lập với cỡ mẫu tương ứng là n1=40 và n2=50. Trung bình mẫu tính x 13 , 0 y 140 được là . GS E(X)=μ 2
1(chưa biết) , biết V(X)=σ1 =80. GS E(Y)=μ 2
2(chưa biết) , biết V(Y)=σ2 =100.
Với mức ý nghĩa α=1%, kiểm định bài toán : - Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1≠μ2 Giải Ta có 130 1  40 T   5  80 100  40 50
Với α=1%, ta có uα/2=2.576.
Vì |T|=5>2.576, nên ta bác bỏ giả thiết H0.
Ví dụ 2. Với mức ý nghĩa α=5% hãy kiểm định giả thiết sau :
a) - Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1>μ2 Với số liệu như sau : n n x y      1 5 ; 0 2 3 ; 2 ; 105 9 ; 8 21 ; 105 22 256
b) - Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1<μ2 Với số liệu như sau : n 2 ; 5 n 3 ; 5 x 2 ; 0 y 2 ; 5 2  3 ; 6 2  64 1 2 1 2 Giải a) 105 9  8 T   . 2 203 105 256  50 32
Do T=2.203>uα=1.645, nên ta bác bỏ giả thiết H0. b) 23 20 2  5 T    7 . 2 7 36 64  25 35
Do T=-2.77<-zα=-1.645, nên ta bác bỏ giả thiết H0. 2 2  , 2. Nếu 1
2 chưa biết nhưng mẫu lớn (n1>30, n2>30), trong trường hợp
này ta vẫn vận dụng test thống kê như trong phần 1. trong đó các phương sai 2 2  , chưa biết 1
2 trong T được thay bởi các phương sai mẫu: 2 2 S ,
1 S 2 . Như vậy test thống kê được dùng ở đây là: xy T  2 2 1 S S2  1 n n2
Khi n1, n2>30 thì theo định lý giới hạn trung tâm, T có phân bố xấp xỉ phân bố
chuẩn tắc cho dù X và Y không có phân bố chuẩn.
Ví dụ 3. Người ta tiến hành một cuộc nghiên cứu về điểm trung bình của các vận
động viên thể dục năm 1970 và năm 1995. Một mẫu gồm 35 VĐV của năm 1970
có số điểm trung bình là 267 với độ lệch tiêu chuẩn là 27. Một mẫu gồm 40 vận
động viên của năm 1995 có số điểm trung bình là 255 với độ lệch tiêu chuẩn là
30. Kiểm định xem có sự khác nhau hay không giữa hai thế hệ vận động viên
của năm 1970 và 1995? Mức ý nghĩa α=5%. Giải
Bài toán kiểm định là: - Giả thiết H0 : μ1=μ2
- Đối thiết H1 : μ1≠μ2 267 255 T  1.823 2 2 Ta có 27 30  35 40
Do T=1.823có sự khác nhau giữa hai thế hệ vận động viên. 2 2  , 3.Nếu 1
2 chưa biết mẫu nhỏ (n1<30, n2<30)
Trong trường hợp này ta phải giả thiết 24 X N ( , 2
 ); Y N( , 2  ). 1 2 Các bước làm như sau: 2 2
x, y, s , s x y
- Xuất phát từ hai mẫu đã cho ta tính . - Tính x y t  2 2 (n 1  ) s ( x 2 n 1  ) 1 sy 1 n n2 . n n 2 1 2 1 n 2 n
- Với  đã cho, tra bảng phân phối Student tìm được t ( / ) 2 n n 2 1 2 hoặc t ( ) n n 2
. Các miền tiêu chuẩn như sau: 1 2
H :   và H :   ; S t t  0 1 2 1 1 2
n n  ( / 2 ) 2 1 2
H :   và H :   ; S t t  0 1 2 1 1 2
n n  (2 ) 1 2
H :   và H :   ; S t  t  0 1 2 1 1 2  n n  ( 2 ) 1 2
Ví dụ 5. Cơ quan hàng không vụ trụ Mỹ (NASA) đã ký hợp đồng với 2
công ty A và B sản xuất thử pin dùng cho vệ tinh viễn thông.
Dựa trên kết quả của các pin thử nghiệm, NASA sẽ quyết định chọn công
ty nào làm nhà cung cấp pin cho vệ tinh viễn thông. Công ty A đã sản
xuất thử được 10 chiếc, có tuổi thọ trung bình là 4.8 năm và độ lệch tiêu
chuẩn là 1.1 năm. Công ty B sản xuất thử được 12 chiếc, với tuổi thọ trung
bình 4.3 năm và độ lệch tiêu chuẩn là 0.9 năm.
GS rng tui th ca pin do A và B cung cp có phân b chun và
phương sai như nhau. Với mức ý nghĩa α=1%, kiểm định xem có sự
khác nhau về tuổi thọ trung bình của 2 loại pin hay không? Giải
Bài toán kiểm định là: - Giả thiết H0 : μ1=μ2 25
- Đối thiết H1 : μ1≠μ2
Các số liệu đã cho như sau: n x s  Công ty A: 1 ; 0 ; 8 . 4 1 . 1 1 1 . n 1 ; 2 y  ; 3 . 4 s  9 . 0 Công ty B: 2 2 .
Phương sai chung của ước lượng là: 2 1 ( 0 ) 1 ( . 1 ) 1 2 1 ( 2 ) 1 ( 9 . 0 )2 19 8 . s    0 9 . 9 10122 20 . 4 8 . 4.3 0.5 T    1 . 1 74 1 1 0 4 . 26 Vậy 0 9 . 9(  ) 10 12
Tra bảng phân phối Student 1-0.005 phân vị với 20 bậc tự do ta được 2.845.
Do |T|<2.845, nên ta không đủ cơ sở bác bỏ H0.
4.Khoảng tin cậy cho hiệu số μ1-μ2:
Khi bài toán kiểm định dẫn tới bác bỏ H0, ta dẫn tới bài toán tìm khoảng tin cậy cho hiệu số μ1-μ2. Trong trường hợp 2 2  , 1
2 đã biết, có thể chứng minh được rằng BNN xy( 1  2) T  2 2 1  2  1 n n2
Có phân bố chuẩn tắc N(0, 1). Khi đó, khoảng tin cậy γ cho hiệu số μ1-μ2 là: 2 2   1 2
x y u   / 2 1 n n2 Trong trường hợp 2 2  , 1
2 chưa biết nhưng mẫu lớn (n 2 2 2 1, n2>30) ta thay  ,  S , 1 2 bởi 2
1 S2 và nhận được khoảng tin cậy xấp xỉ γ: 2 2 1 S S2
x y u   / 2 1 n n2
Và không cần giả thiết 2 tập chính có phân bố chuẩn.
5.Phương pháp so sánh từng cặp: 26
Giả sử (X, Y) là một cặp gồm hai đại lượng ngẫu nhiên (nói chung phụ thuộc
nhau), với E(X)=μ1, E(Y)=μ2.
Chúng ta cần so sánh μ1 và μ2.
Xét D=X-Y, khi đó ta đưa BT so sánh về BT kiểm định về giá trị TB.
Bài 8.7. So sánh hai t l
Xét hai tập hợp chính I và II và một đặc tính A nào đó mà mỗi cá thể của hai
tập chính đó thể có hay không. Ta muốn so sánh tỷ lệ cá thể có đặc tính A của
tập chính I với tỷ lệ cá thể có đặc tính A của tập chính II.
Giả sử ta có hai mẫu ngẫu nhiên ( X , X ,.. , X ) 1 2 trong đó 1 n 1 n P(X  )
1  p , P(X  )
0  q  1 p ,m X i 1 i 1 1 1  i i1 Và mẫu (Y , 1 Y , 2 .. , Yn ) trong đó 2 n2 P(Y  )
1  p , P(Y  )
0  q 1 p ,m Y j 2 j 2 2 2  j j 1
Giả thiết H0: p1=p2 đối thiết H1: p1p2, p1>p2, p1Vì EXi=p1, EYj=p2, DXi=p1(1-p1), DYj=p2(1-p2) nên so sánh hai xác suất p1, p2
chính là so sánh hai giá trị trung bình với phương sai chưa biết. Nếu H0 đúng thì DXi=DYj=2. Khi đó 2 1 1
D(X Y )   (  ). 1 n 2 n Ước lượng của 2 1 m  2 m . 1 ( 1 m  2 m  )   1 n 2 n 1 n 2 n
ĐK áp dụng: m1+m2 10 và n1+n2- m1-m210. X Y T
Với n1, n2 đủ lớn ta xấp xỉ phân phối bởi phân phối xấp xỉ V ( X Y  ) chuẩn N(0, 1).
Từ đó ta nhận được các tiêu chuẩn mức  tương ứng như sau: 1 m 2 m  1 n 2 n u  . 1 m  2 m 1 n  2 n  1 m  2 m 1 n  2 . n 1 n  2 n 1 n n2 1 n 2 n 27
Nếu H0: p1=p2, H1: p1p2 thì S=|u|u(/2)
Nếu H0: p1=p2, H1: p1>p2 thì S=uu()
Nếu H0: p1=p2, H1: p1Ví dụ 15. Công ty Coca-cola đang n/c cải tiến sản phẩm. Với công thức cũ khi
cho 500 người dùng thử thì có 120 người ưa thích. Với công thức mới khi cho
1000 người khác dùng thử thì có 300 ng ời ư ưa thích.
Với mức ý nghĩa =2%, kiểm định xem công thức mới đưa vào có làm tăng tỷ
lệ người ưa thích hay không? Giải H0: p1=p2, H1: p1>p2 1 m 2  m 1 n 2 u n 1
m m2 n1n 2 1 m m 2 1 n  2 . n 1 n  2 n 1 n  2 n 1 n 2 n 300 120  1000 500   . 2 . 4 300 1  20 1000500300120 10005000 . . 1000500 1000500 1000x500 u=u0.02=2.054
Do u>u=2.054, nên ta bác bỏ H0. 2 X N  
Giả sử X và Y là 2 BNN có phân bố chuẩn, ~ ( 1, 1 ) , Y ~ N ( , 2  ) 2 2 ,
Chúng ta cần so sánh μ1 và μ2 dựa trên 2 mẫu quan sát độc lập của X và Y. 28