3
N I DUNG
I. Ph ân t thng kê
Bảng tn s phân phi dưới đây ghi li quãng đường bay ca các nhân viên
Brumley Statistical Consulting Inc. khi đi công tác trong quý gn đây (Đơn v tính: nghìn
mile).
a. ? bao nhiêu nhân viên đi công tác trong quý
b. Tr s gia ca t đu tiên là bao nhiêu?
c. . V biu đ tn s phân phi
d. Trong đa giác tn s, to đ ca đim đu tiên là bao nhiêu?
e. V đa giác tn s.
f. Nhn xét v quãng đưng bay da vào hai biu đ trên.
Li gii
a. bao nhiêu nhân viên đi công tác trong quý?
Có 50 ngưi đi công tác trong quý
b. bao nhiêu? Tr s gia ca t đu tiên là
Tr s gia ca t đu tiên là:
0 + 3
2
= 1.5 (nghìn mile)
c. V biu đ tn s phân phi.
Quãng đưng bay
(nghìn mile)
S nhân viên
(người)
T 0 đến dưới 3
5
T 3 đến dưới 6
12
T đến dưới 6 9
23
T 9 đến dưới 12
8
T 12 đến dưi 15
2
Tng
50
4
d. Trong đa giác tn s, to đ ca đim đu tiên là bao nhiêu?
Trong đa giác tn s, ta đ ca đim đu tiên có:
- Hoành đ (quãng đưng bay) là tr s gia ca t đu tiên: 𝑥= 1.5
- Tung đ (s nhân viên): 𝑦= 5
e. V đa giác tn s.
Quãng đưng bay (nghìn mile)
Tr s gia
S nhân viên (ngưi)
T 0 đến dưới 3
T 3 đến dưới 6
T 6 đến dưới 9
T 9 đến dưới 12
T 12 đến dưi 15
Tng
1.5
4.5
7.5
10.5
13.5
5
12
23
8
2
50
f. Nhn xét v quãng đường bay da vào hai biu đ trên.
5
Khi đi công tác trong quý gn đây, trong 50 nhân viên Brumley Statistical
Consulting Inc. Có gn mt na s nhân viên bay được quãng đưng nm trong khong
6,000 đến 9,000 mile . 5 nhân viên bay quãng đường ít hơn 3,000 miless và 2 nhân
viên bay quãng đưng nhiu hơn 12,000 miles.
Dưới đây là d liu v thời gian đi làm t nhà đến công ty ca 25 nhân viên (Đơn
v tính: phút)
a. Khi xây dng bng tn s phân phi, nên la chn s t là bao nhiêu?
b. Nên la chn khong cách t bng bao nhiêu?
c. ? Giới hn dưi ca t đu tiên có giá tr bng bao nhiêu
d. . y dng bng tn s phân phi
e. Nhn xét v hình dáng phân phi ca dãy s.
Li gii
a. Khi xây dng bng tn s phân phi, nên la chn s t là bao nhiêu?
Ta có s quan sát n = 25, áp dng quy tc 2 2
k
> 𝑛, ta có:
k
>25
< 25 và S t k = 5 (vì 16 2
5
= 32 25> )
b. Nên la chn khong cách t bng bao nhiêu?
h =
xmax xmin
k
=
48 16
5
=
32
5
= 6.4 7
c. Giới hn dưi ca t đu tiên có giá tr bng bao nhiêu?
Đáp án: 15
d. Bng tn s phân phi
Thời gian đi làm ca nhân viên (đơn v: phút)
Tn s
T đến 15 22
3
T đến 22 29
8
T đến 29 36
7
T đến 36 43
5
T đến 43 50
2
28
25
48
37
41
19
32
26
16
23
23
29
36
31
26
21
32
25
31
43
35
42
38
33
28
6
e. Nhn xét v hình dáng phân phi ca dãy s
Da trên đ th, ta có th rút ra mt s nhn xét sau:
- . Hình dng phân phi: Đ th cho thy mt phân phi lch trái Điu này có nghĩa là
phn lớn nhân viên có thời gian đi làm tương đi ngn (dưi 30 phút), và ch có mt s
ít nhân viên có thi gian đi làm dài hơn.
- Giá tr trung bình: Giá tr trung bình ca thời gian đi làm có th ước tính nm khong
t 2 đến phút, da vào v trí đnh ca đ th.2 29
II. Mc đ hin tưng kinh tế xã hi-
Trudy Green là nhân viên ca True-Green Lawn Company, chu trách nhim giới
thiu dch v chăm sóc c qua đin thoi. D liu dưới đây là s cuc hn mà cô y đã
thc hin trong 25 giqua. Tính trung bình và trung v v s cuc hn mà cô y đã thc
hin mi gi. Viết mt báo cáo tóm tt nhng kết qu thu đưc t phân tích trên.
Li gii
(1) trung bình Tính
S ông th t , ta có: dng c c ính trung bình
9
5
2
6
5
6
4
4
7
2
3
6
3
4
4
7
8
4
4
5
5
4
8
3
3
7
x =
x
n
=
105
25
= 4.2
(2) Tính trung v
Ta có bng sp xếp
2
2
3
3
3
3
4
4
4
4
4
4
4
5
5
5
5
6
6
6
7
7
8
8
9
Vì s đơn v l = 25, là s nên ta có:
V trí trung v =
n+1
2
= 13 Me = 4
(3) Viết báo cáo tóm tt kết qu trên
Tng s cuc hn: 105 cuc hn
Trung bình mi gi Trudy Green 4.2 thc hin cuc gi
Gn đây, Bidwell Electronics Inc. đã kho sát mt mu gm các nhân viên v
quãng đường h đi làm hàng ngày. Tính trung bình và đ lch chun da vào thông tin
trong bng dưi đây.
Quãng đưng (mile)
Tn s
M
T 0 đến dưới 5
4
2.5
T 5 đến dưới 10
15
7.5
T 10 đến dưi 15
27
12.5
T 15 đến dưi 20
18
17.5
T 20 đến dưi 25
6
22.5
Li gii
Quãng đưng
Tn s
M
fM
T 0 đến dưi 5
4
2.5
10
T 5 đến dưi 10
15
7.5
112.5
T i 15 10 đến dư
27
12.5
337.5
T i 20 15 đến dư
18
17.5
315
T 20 d i 25 ến dư
6
22.5
135
Tng
70
910
8
S dng công thc tính trung bình (3 11), ta có:
x =
fM
n
=
910
70
= 13
Vy trung bình mt nhân viên đi làm là 13 miles.
Quãng đường
Tn s
M
fM
M - 𝑥
(
𝑀 𝑥
)
2
𝑓
(
𝑀 𝑥
)
2
T 0 đến dưới 5
4
2.5
10
-10.5
110.25
441
T 5 đến dưới 10
15
7.5
112.5
-5.5
30.25
453.75
T 10 đến dưi 15
27
12.5
337.5
-0.5
0.25
6.75
T 15 đến dưi 20
18
17.5
315
4.5
20.25
364.5
T 20 dến dưi 25
6
22.5
135
9.5
90.25
541.5
Tng
70
910
-2.5
251.25
1807.5
S dng công thc đ lch chun (3-12), ta có:
s =
f
(
M x
)
2
n 1
=
1807.5
70
1
= 5.12
3. i 31 trang 122
Sau đây là s v trm xe hơi trong 1 tun mt thành ph lớn. Hãy xác đnh h s
Skewness bng hai phương pháp.
3
12
13
7
8
3
8
Li gii
n = 7
- trung bình: Giá tr
x =
x
n
=
54
7
= 7.71
- M 8 Trung v: e =
- Đ lch chun ca mu:
s =
(
x x
)
2
n 1
= 3.9
T đó, ta có:
- H s Skewness ca Pearson
sk
=
3
(
x Me
)
s
=
3
(
7.71 8
)
3.9
= 0.22
9
- Excel: H s Skewness t phn mm
III. Điu tra chn mu
1. i 31 trang 274
Công ty Power + Inc. sn xut pin AA dùng cho điu khin ô tô đ chơi t xa. Tui
th trung bình ca loi pin này tuân theo quy lut phân phi chun với giá tr trung bình
là 35.0 . givà đ lch chun là 5 5 giờ. Đ kim tra cht lượng sn phm, Power + Inc.
đã ly mu 25 pin.
a. Hãy cho biết hình dng phân phi ca các trung bình mu.
b. Tính sai s trung bình chn mu.
c. Tính t l các mu có tui th trung bình ca pin t 36 gitrlên.
d. 4.5 Tính t l các mu có tui th trung bình ca pin t 3 gitrlên.
e. .5 Tính t l các mu có tui th trung bình ca pin t 34 đến 36 giờ.
f. Tính xác sut đ sai s chn mu lớn hơn 1 giờ.
Li gii
Tóm t t
n = 25
μ = 35
σ = 5.5
a. Hãy cho biết hình dng phân phi ca các trung bình mu.
tui th trung bình ca loi pin này tuân theo quy lut phân phi chun nên các trung
bình mu (x) cũng được phân phi chun.
b. Tính sai s trung bình chn mu.
S ông th sai s ình ch , ta có: dng c c trung b n mu
σ
x
=
σ
n
=
5.5
25
=
5.5
5
= 1.1
c. Tính t l các mu có tui th trung bình ca pin t 36 gitr lên.
10
S ông th t gi z, ta có: dng c c ính á tr
z =
x μ
σ/
n
=
36 35
1.1
= 0.91
Da vào bng Xác sut phân phi ch n hou á c, xác sut a giá tr à z < 0.91 l 0.3186
T l l các mu có tui th trung bình ca pin t 36 gitrlên à:
p = 0. 0. = 0.5000 3186 1814
d. 4.5 Tính t l các mu có tui th trung bình ca pin t 3 gitrlên.
S ông th t gi z, ta có: dng c c ính á tr
z =
x μ
σ/
n
=
34.5 35
1.1
= 0.45
Da vào bng Xác sut phân phi ch n hou á c, xác sut a giá tr à z < 0.45 l 0.1736
T 34.5 l l các mu có tui th trung bình ca pin t gitrlên à:
p = 0. + 0. = 0.5000 1736 6736
e. .5 Tính t l các mu có tui th trung bình ca pin t 34 đến 36 giờ.
T l các mu có tui th trung bình ca pin t đến 36 gi34.5 là:
p = 0. + 0. = 0.3186 1736 4922
f. Tính xác sut đ sai s chn mu ln hơn 1 giờ.
S t tu ình c nh h ai s chn mu lớn hơn 1 gi ương ng vi i th trung b a pin ơn 34
gi ho l . c ớn hơn 36 gi
S ông th t gi z, ta có: dng c c ính á tr
z
1
=
x
1
μ
σ/
n
=
36 35
1.1
= 0.91
z
2
=
x
2
μ
σ/
n
=
34 35
1.1
= 0.91
Như ph ta có: T l n (c) l các mu có tui th trung bình ca pin t 36 gitrlên à:
p = 0.
1
1814
Tương t l các mu có tui th trung bình ca pin t gitr, ta có: T 34 xung là:
p = 0.
2
1814
X l ác sut đ sai s chn mu lớn hơn 1 gi à:
p + p = 0. + 0. = 0.
1 2
1814 1814 3628
IV. Ước lượng
1. i 57 trang 309
Áp sut trong khoang máy bay nh hưởng đến s thoi mái ca khách hàng Mc .
11
áp sut cao hơn làm cho không khí trong khoang máy bay càng gn với môi trường t
nhiên và khách hàng thoi mái hơn. Mt nhóm khách hàng ca hàng không đã ghi li
mc áp sut trong 30 chuyến bay được chn ngu nhiên và thy rng áp sut trong
khoang máy bay tương đương đ cao trung bình 8000 feet với đ lch chun là 300
feet.
a. Với đ tin cy 99%, mc áp sut trung bình chung tương đương với đ cao trong
khong giá tr nào?
b. Đ xác đnh mc áp sut trung bình chung tương đương với đ cao nào, cn thu
thp thông tin bao nhiêu chuyến bay với phm vi sai s là 25 feet và đ tin cy là 95%?
Li gii
Tóm tt đ bài
n = 30
X = 8000
σ = 300
a. Với đ tin cy 99%, m c áp su t trung bình chung tương đương với đ cao trong
Đ tin cy = 99% = 1- α
.01 α = 1% = 0
t bng phân phi chun Z
α/2
2.576
S d ng công thc khong tin cy
7858.9 < < 8141.1 M
Vy mc áp sut trung bình tương đương đ cao trong khong (7858.9,8141.1)
b. Đ xác đnh mc áp sut trung bình chung tương đương vi đ cao nào, cn thu
thp thông tin bao nhiêu chuy n bay v i ph m vi sai s là 25 et ế fe và đ tin cy là
95%?
Phm vi sai s chn mu là Với đ tin cy 95% nên t bng phân phi có ε = 25. Z
α/2
=
1.960 và đ lch chun Thay s vào công thc s = 300.
n 553.1
Vy đ xác đnh mc áp sut trung bình chung tương đương với đ cao nào với phm
vi sai s là 25 feet và đ tin cy là 95%, cn thu thp thông tin khong chuyến 554
bay.
12
2. i 14 trang 294
The Buf New York, Area Chamber of Commerce falo, mun ước lượng thời gian
trung bình di chuyn đến nhà máy ca nhng nhân viên đang làm vic trung tâm thành
ph. D : liu sau là thời gian đi làm (phút) ca 15 nhân viên
14
24
24
19
24
7
31
20
26
23
23
28
16
15
21
Xác đnh khong tin cy 98% v thời gian trung bình di chuyn đến nhà máy ca
nhân viên. G ? ii thích kết qu
Li gii
Gi n cđnh tng th có phân phi chun và chưa biết đ lch chu a tng th.
Giá tr trung bình c a mu
x =
x
n
=
14 + 24 + + 15 21+
15
=
315
15
= 21
Đ l a mch chun c u
s =
Σ
(
x x
)
2
n 1
=
(
14 21
)
2
+
(
24 21
)
2
+ +
(
21 21
)
2
14
6.094
Với b do y 98%c t n 1 = 14 và đ tin c , tra bng Phân ph có i Student ta :
t = 2.624
S ông th kho cho giá tr c khi ch : dng c c ng tin cy trung bình a tng th ưa biết σ
x ± t
s
n
= 21 ± (2.624)
6.094
15
= 21 ± 4.129
Vy kh có giá tr năng đ thời gian trung bình di chuyn đến nhà máy ca nhân viên
trong khong t 16.871 phút đến 25.129 út l 98%. ph à
V. Kim đnh
1. i 48 trang 345
Chủ shu ca mun nghiên cu thói quen mua sm ca khách Westfield Mall
hàng. T , .heo nghiên cu trước đó mt người mua sm thông thường dành 0 75 giti
trung tâm thương mi với đ lch chun là 0 n đây trung tâm thương mi , .10 gi. G ,
mthêm 1 s nhà hàng với mc đích gi chân khách lâu hơn h shu trung tâm . C
thương mi đã thuê Công ty tư vn Brunner and Swanson đánh giá tác đng ca các nhà
13
hàng. Mt mu gm 45 khách hàng được hi cho thy thời gian trung bình trung tâm
thương mi ca h là 0.80 gi.
a. Với mc ý nghĩa thời gian trung bình ca khách hàng ti trung tâm thương 0.10,
mi có thay đi không?
b. Gi s thời gian mua sm thc s ca khách hàng tăng t 0.75 lên 0. . Hãy 79 gi
tính xác sut mc sai lm loi II.
c. Khi Brunner and Swanson (bbáo cáo kết qu phn ), ch s hu Westfield
Mall nhn thy xác sut mc sai lm loi II là quá lớn àm thế nào đ gim xác sut. L
này?
Li gii
a. Với mc ý nghĩa 0.10, thời gian trung bình ca khách hàng ti trung tâm thương
mi có thay đi không?
S dng quy trình kim đnh 6 bước:
ớc 1: Nêu gi thuyết không và gi thuyết đi.
Với bài này, ta có gi thuyết là Trung bình tng th là 0.75 giờ” và gi thuyết không
đi là Trung bình tng th khác 0.75 giờ”. Đây là kim đnh 2 phía vì gi thuyết đi
không nêu lên chiu hưng.
H
0
: µ=0.75
H
1
: µ0.75
ớc 2: Chọn mc ý nghĩa.
Quyết đnh s dng mc ý nghĩa α = 0.1.
ớc 3: Chọn tiêu chun kim đnh.
S dng tiêu chun kim đnh z vì đã biết đ lch chun ca tng th. Ta có:
z =
x μ
σ
n
ớc 4: Xác đnh quy tc ra quyết đnh.
S dng bng phân phi chun hóa, với mc ý nghĩa α = 0.1 và kim đnh 2 phía, ta có
giá tr tới hn z
α/2
= 1.645
Quy tc ra quyết đnh: Bác b gi thuyết không nếu giá tr tiêu chun kim đnh:
|z| > z hay |z| > 1.645.
α/2
14
ớc 5: Ra quyết đnh.
z =
x
c
μ
1
σ
n
=
0.8 0.75
0.1
45
= 3.354
ớc 6: Nêu kết lun
|z| > 1.645 (3.35 > 1.645) nên gi thuyết b bác b.không
Vy thời gian tr ng bình ca khách ti trung tâm thương mi thay đi.u s
b. Gi s thời gian mua sm thc s ca khách hàng tăng t 0.75 lên 0. . Hãy 79 gi
tính xác sut mc sai lm loi II.
Cần xác đnh xác sut đ trung bình mu nm trong khong t 0 đến 0. . Sau đó, .79 80
ly 0.5 ( toàn b din tích bên phi ca giá tr trung bình 0.79) tr đi giá tr xác sut
va tính được ta có kết qu xác sut mc sai lm loi II.
z =
x
c
μ
1
σ
n
=
0.8 0.79
0.1
45
= 0.67
Xác sut mc sai lm loi II là: β 0.2486 =
c. Khi Brunner and Swanson (b Westfield báo cáo kết qu phn ), ch shu
Mall nhn thy xác sut mc sai lm loi II là quá lớn àm thế nào đ gim xác . L
sut này?
Đ gim xác sut loi II, ta nên gim giá tr trung bình ca mu.
VI. Hi quy tương quan
1. Bài 12 trang 396
Hi Sinh viên ti Đi hc iddle Carolina mun chng minh mi liên h gia s M
lượng bia mà mt sinh viên ung và nng đ cn trong máu ca h t mu (BAC). M
ngu nhiên gm 18 sinh viên được ch đnh ung mt s lượng ngu nhiên lon bia 12
ounce. , 30 phút sau khi h ung hết s bia đưc ch đnh mt thành viên ca văn phòng
cnh sát trưng đa phương đã đo nng đ cn trong máu ca h hông tin t mu như . T
sau:
Sinh viên
S lon bia
BAC
Sinh viên
S lon bia
BAC
Charles
6
0.10
Jalme
3
0.07
Ellis
7
0.09
Shannon
3
0.05
Harriet
7
0.09
Nellie
7
0.08
15
Marlene
4
0.10
Jeanne
1
0,04
Tara
5
0.10
Michele
4
0.07
Kerry
3
0.07
Seth
2
0.06
Vera
3
0.10
Gilberto
7
0.12
Pat
6
0.12
Lillian
2
0.05
Marjorie
6
0.09
Becky
1
0.02
a. Xây dng biu đ phân tán cho lon bia đã ung và BAC hn xét v mc s . N
đ cht ch ca mi liên h i liên h thun hay nghch? M ?
b. Xác . đnh h s tương quan
c. Với mc ý nghĩa có mi liên h thun trong tng th gia s lon bia được 0.01,
ung và BAC không? Xác đnh giá tr p-value.
Li gii
a. . NXây dng biu đ phân tán cho s lon bia đã ung và BAC hn xét v mc đ
cht ch ca mi liên h i liên h thun hay nghch? M ?
Tương quan thun và cht ch gia s lon bia đã ung và BAC
b. Xác . đnh h s tương quan
STT
S lon
bia (x)
BAC (y)
( )
𝑥 𝑥
2
( )
𝑦 𝑦
2
( )
𝑥 𝑥
( )
𝑦 𝑦
( )
𝑥 𝑥 𝑦 𝑦
)(
1
6
0.1
2.97
0.00044568
1.722
0.021
0.036
2
7
0.09
7.41
0.00012346
2.722
0.011
0.030
3
7
0.09
7.41
0.00012346
2.722
0.011
0.030
4
4
0.1
0.08
0.00044568
-0.278
0.021
-0.006
16
5
5
0.1
0.52
0.00044568
0.722
0.021
0.015
6
3
0.07
1.63
0.00007901
-1.278
-0.009
0.011
7
3
0.1
1.63
0.00044568
-1.278
0.021
-0.027
8
6
0.12
2.97
0.00169012
1.722
0.041
0.071
9
6
0.09
2.97
0.00012346
1.722
0.011
0.019
10
3
0.07
1.63
0.00007901
-1.278
-0.009
0.011
11
3
0.05
1.63
0.00083457
-1.278
-0.029
0.037
12
7
0.08
7.41
0.00000124
2.722
0.001
0.003
13
1
0.04
10.74
0.00151235
-3.278
-0.039
0.127
14
4
0.07
0.08
0.00007901
-0.278
-0.009
0.002
15
2
0.06
5.19
0.00035679
-2.278
-0.019
0.043
16
7
0.12
7.41
0.00169012
2.722
0.041
0.112
17
2
0.05
5.19
0.00083457
-2.278
-0.029
0.066
18
1
0.02
10.74
0.00346790
-3.278
-0.059
0.193
Tng
77
1.42
77.61
0.0128
0.776
x =
77
18
= 4.28
y =
1.42
18
= 0.08
s
x
=
77.61
18
1
= 2.14
s
y
=
0.0128
17
= 0.027
r =
( )
x x
)(
y y
( )
n 1 s
x
s
y
=
0.776
( )(
18 1 2.
)(
14 0.027
)
= 0.8
c. Với mc ý nghĩa có mi liên h thun trong tng th gia s lon bia được 0.01,
ung và BAC không? Xác đnh giá tr p-value.
H 0
0
: p
H
1
: p > 0
Loi b nếu t > 2.583 với df = 16
t =
r
n 2
1 r
2
=
0.8
18 2
1 0.8
2
= 5.33 > 2.583
Loi b H
0
và có mi liên h thun gia s lon bia đưc ung và BAC.
17
ANOVA
df
SS
MS
F
Significanc
e F
Regression
1
0.007750004
0.00775
24.66302
0.00014
Residual
16
0.005027774
0.000314
Total
17
0.012777778
Coefficient
s
Standard
Error
t Stat
P-value
Lower 95%
Upper 95%
Lower
95.0%
Upper
95.0%
Intercept
0.036142
0.009568126
3.777305
0.00165
0.015858
0.056425
0.015858
0.056425
X Variable 1
0.009993
0.002012176
4.966187
0.00014
0.005727
0.014258
0.005727
0.014258
2. i 24 trang 482
Mt nhà nghiên cu th trường đang nghiên cu v các dch v thuê bao trc tuyến.
y đc bit quan tâm đến nhng biến liên quan đến s lượng đăng ký cho mt dch
v trc tuyến c th hông tin mô t v dch v đăng ký trc tuyến với các biến có . T 25
ký hiu như sau:
Sub = S (nghìn) lượng đăng ký
Web page hits = S t (nghìn) lư truy cp trung bình hng tháng
Adv Price N = gân sách qung cáo ca dch v (trăm $)
Price ng tháng = Phí đăng ký trung bình h ($)
Service
Sub
Web page
hits
Adv
Price
1
37.95
588.9
13.2
35.1
2
37.66
585.3
13.2
34.7
3
37.55
566.3
19.8
34.8
23
38.83
629.6
22.0
35.3
24
38.33
680.0
24.2
34.7
25
40.24
651.2
33.0
35.8
a. Xây . dng phương trình hi quy
b. Tiến hành kim đnh ý nghĩa ca mô hình. S dng mc ý nghĩa 0,05.
c. Tiến hành kim đnh ý nghĩa ca tng h s hi quy riêng phn. S dng mc ý
nghĩa cn loi b biến nào không0.05. ?
d. Xác đnh phn dư và v đ th da trên các giá tr ưc lưng. Nhn xét ?
e. Xây dng đ th phn dư. Gi thiết các phn dư tuân theo quy lut phân phi
18
chun có đưc tha mãn không?
Li gii
a. Xây dng phương trình hi quy.
Biến ph thuc ( lượng đăng kýy): S (nghìn)
c biến đc lp:
- : S t (nghìn) x
1
lư truy cp trung bình hng tháng
- ) x
2
: Ngân sách qung cáo ca dch v (trăm đô la
- ($) x
3
: Phí đăng ký trung bình hng tháng
Phương trình hi quy có dng:
Dùng Excel chy bng Regression tìm b
0
, b , b , b
1 2 3
, được kết qu như sau:
b = 5.7328
0
b = 0.0075
1
b = 0.0509
2
b = 1.0974
3
b. Tiến hành kim đnh ý nghĩa ca mô hình. S dng mc ý nghĩa 0.05.
ớc 1: Xét cp gi thuyết.
H
0
: β
1
= β
2
= β
3
= 0 (mô hình không có ý nghĩa)
H
1
: β
1
0; β
2
0; β
3
0 (mô hình có ý nghĩa)
ớc 2: So sánh Sig với α.
Điu kin bác b: Sig < α
19
Trong đó: Sig = 0.00000002; α = 0.05
Sig < α
c b H
0
, chp nhn H
1
Mô hình có ý nghĩa vi mc ý nghĩa 0.05.
c. Tiến hành kim đnh ý nghĩa ca tng h s hi quy riêng phn. S dng mc
ý nghĩa 0.05. cn loi b biến nào không?
(1) Kim đnh β
1
ớc 1: Xét cp gi thuyết.
H
0
: β
1
= 0 (h s không có ý nghĩa)
H
1
: β
1
0 ( h s có ý nghĩa)
ớc 2: Tính tiêu chun kim đnh.
𝑇
qs
= t = 4.1575
1
ớc 3: Điu kin bác b H
0
.
𝑇
𝑞𝑠
> 𝑡
𝛼
2
(
𝑛𝑘 −1
)
Mà n = 25; k = 3 n - k - 1 = 21
α = 0.05
|𝑇
𝑞𝑠
| > 𝑡
0.05
2
(
21
)
4.1575 > 2.080
c b H
0
, chp nhn H
1
β
1
có ý nghĩa.
(2) Kim đnh β
2
ớc 1: Xét cp gi thuyết.
H
0
: β
2
= 0 (h s không có ý nghĩa)
H
1
: β
2
0 (h s có ý nghĩa)
ớc 2: Tính tiêu chun kim đnh.
𝑇
qs
= t = 3.5987
2
ớc 3: Điu kin bác b H
0
|
𝑇
𝑞𝑠
|
> 𝑡
𝛼
2
(
𝑛𝑘 −1
)
Mà n = 25; k = 3 n - k - 1 = 21
α = 0.05
20
|
𝑇
𝑞𝑠
|
> 𝑡
0.05
2
(
21
)
3.5987 > 2.080
c b H
0
, chp nhn H
1
β
2
có ý nghĩa.
(3) Kim đnh β
3
ớc 1: Xét cp gi thuyết.
H
0
: β
3
= 0 (h s không có ý nghĩa)
H
1
: β
3
0 (h s có ý nghĩa)
ớc 2: Tính tiêu chun kim đnh.
𝑇
qs
= t 4.4786
3
=
ớc 3: Điu kin bác b H
0
|
𝑇
𝑞𝑠
|
> 𝑡
𝛼
2
(
𝑛𝑘 −1
)
Mà n = 25; k = 3 n - k - 1 = 21
α = 0.05
|
𝑇
𝑞𝑠
|
> 𝑡
0.05
2
(
21
)
4.4786 > 2.080
c b H
0
, chp nhn H
1
β
3
có ý nghĩa.
Tt c h s hi quy riêng tng phn đu có ý nghĩa, không loi b biến nào.
d. Xác đnh phn dư và v đ th da trên các giá tr ưc lượng. Nhn xét?
S d tính ph ng công thc n dư:
Phn dư = S lưng đăng ký thc tế S lượng đăng ký ưc lượng-
S lượng đăng ký thc tế được ly t bng (ct Sub), S lưng đăng ký ước
lượng được tính bng cách thay giá tr các biến x t bng s liu vào phương
1
, x , x
2 3
trình hi quy.
T đó, ta có Bng 5: Phn dư ca phương trình hi quy.
21
Bng 5: Phn dư ca phương trình hi quy (đơn v: nghìn)
T bng s liu trên, ta v được Biu đ 3: S lượng đăng ký dch v ước lượng
(đơn v: nghìn)
Biu đ 3: S lưng đăng ký dch v ưc lưng (đơn v: nghìn)
22
e. Xây dng đ th phn dư. Gi thiết các phn dư tuân theo quy lut phân phi
chun có đưc tha mãn không?
T s liu ca , ta xây dng được Bảng 4: Phn dư ca phương trình hi quy
Biu đ 4: Histogram ca phn dư.
Biu đ 4: Histogram ca phn dư
T đ th trên, ta thy biu đ đang lch phi, nghĩa là các phn dư đang phân
phi lch sang phi. Do đó, gi thiết các phn dư tuân theo quy lut phân phi chun
không được tha mãn.
VII. Chỉ s
1. i 12 trang 510
Bạn đang làm vic cho ăn phòng hát trin kinh tế ca tiu bang. Văn phòng V P
mun xây dng mt ch s kinh tế đ đánh giá hot đng kinh tế trong quá kh và d
đoán các xu hưng kinh tế trong tương lai ca tiu bang. Bạn cho rng có mt s yếu t
chính nên vào : s được đưa ch s, gm lượng doanh nghip mới thành lp trong năm,
s doanh nghip kinh doanh tht bi, thuế thu nhp ca tiu bang s lượng sinh viên đi ,
hc nhp hc và thuế thương v ca tiu bang. Đây là d liu ca năm 2000 và 2018.
2000
2018
S doanh nghip mi
1,088
1,162

Preview text:

NỘI DUNG I. Phân tổ thống kê 1. Bài 17 trang 3 7
Bảng tần số phân phối dưới đây ghi lại quãng đường bay của các nhân viên ở
Brumley Statistical Consulting Inc. khi đi công tác trong quý gần đây (Đơn vị tính: nghìn mile). Quãng đường bay Số nhân viên (nghìn mile) (người) Từ 0 đến dưới 3 5 Từ 3 đến dưới 6 12 Từ 6 đến dưới 9 23 Từ 9 đến dưới 12 8 Từ 12 đến dưới 15 2 Tổng 50
a. Có bao nhiêu nhân viên đi công tác trong quý?
b. Trị số giữa của tổ đầu tiên là bao nhiêu?
c. Vẽ biểu đồ tần số phân phối.
d. Trong đa giác tần số, toạ độ của điểm đầu tiên là bao nhiêu ? e. Vẽ đa giác tần số.
f. Nhận xét về quãng đường bay dựa vào hai biểu đồ trên. Lời giải
a. Có bao nhiêu nhân viên đi công tác trong quý?
Có 50 người đi công tác trong quý
b. Trị số giữa của tổ đầu tiên là bao nhiêu?
Trị số giữa của tổ đầu tiên là: 0 + 3 = 1.5 (nghìn mile) 2
c. Vẽ biểu đồ tần số phân phối. 3
d. Trong đa giác tần số, toạ độ của điểm đầu tiên là bao nhiêu?
Trong đa giác tần số, tọa độ của điểm đầu tiên có:
- Hoành độ (quãng đường bay) là trị số giữa của tổ đầu tiên: 𝑥 = 1.5
- Tung độ (số nhân viên): 𝑦 = 5 e. Vẽ đa giác tần số.
Quãng đường bay (nghìn mile) Trị số giữa Số nhân viên (người) Từ 0 đến dưới 3 1.5 5 Từ 3 đến dưới 6 4.5 12 Từ 6 đến dưới 9 7.5 23 Từ 9 đến dưới 12 10.5 8 Từ 12 đến dưới 15 13.5 2 Tổng 50
f. Nhận xét về quãng đường bay dựa vào hai biểu đồ trên. 4
Khi đi công tác trong quý gần đây, trong 50 nhân viên ở Brumley Statistical
Consulting Inc. Có gần một nửa số nhân viên bay được quãng đường nằm trong khoảng
6,000 đến 9,000 miles. Có 5 nhân viên bay quãng đường ít hơn 3,000 miles và 2 nhân
viên bay quãng đường nhiều hơn 12,000 miles. 2. Bài 29 trang 44
Dưới đây là dữ liệu về thời gian đi làm từ nhà đến công ty của 25 nhân viên (Đơn vị tính: phút) 28 25 48 37 41 19 32 26 16 23 23 29 36 31 26 21 32 25 31 43 35 42 38 33 28
a. Khi xây dựng bảng tần số phân phối, nên lựa chọn số tổ là bao nhiêu?
b. Nên lựa chọn khoảng cách tổ bằng bao nhiêu?
c. Giới hạn dưới của tổ đầu tiên có giá trị bằng bao nhiêu?
d. Xây dựng bảng tần số phân phối.
e. Nhận xét về hình dáng phân phối của dãy số. Lời giải
a. Khi xây dựng bảng tần số phân phối, nên lựa chọn số tổ là bao nhiêu?
Ta có số quan sát n = 25, áp dụng quy tắc 2k > 𝑛, ta có: 2k>25
⇒ Số tổ k = 5 (vì 16 < 25 và 25 = 32 > 25)
b. Nên lựa chọn khoảng cách tổ bằng bao nhiêu? xmax − xmin 48 − 16 32 h = = = = 6.4 ≈ 7 k 5 5
c. Giới hạn dưới của tổ đầu tiên có giá trị bằng bao nhiêu? Đáp án: 15
d. Bảng tần số phân phối
Thời gian đi làm của nhân viên (đơn vị: phút) Tần số Từ 15 đến 22 3 Từ 22 đến 29 8 Từ 29 đến 36 7 Từ 36 đến 43 5 Từ 43 đến 50 2 5
e. Nhận xét về hình dáng phân phối của dãy số
Dựa trên đồ thị, ta có thể rút ra một số nhận xét sau:
- Hình dạng phân phối: Đồ thị cho thấy một phân phối lệch trái. Điều này có nghĩa là
phần lớn nhân viên có thời gian đi làm tương đối ngắn (dưới 30 phút), và chỉ có một số
ít nhân viên có thời gian đi làm dài hơn.
- Giá trị trung bình: Giá trị trung bình của thời gian đi làm có thể ước tính nằm ở khoảng
từ 22 đến 29 phút, dựa vào vị trí đỉnh của đồ thị.
II. Mức độ hiện tượng kinh tế - xã hội 1. Bài 68 trang 89
Trudy Green là nhân viên của True-Green Lawn Company, chịu trách nhiệm giới
thiệu dịch vụ chăm sóc cỏ qua điện thoại. Dữ liệu dưới đây là số cuộc hẹn mà cô ấy đã
thực hiện trong 25 giờ qua. Tính trung bình và trung vị về số cuộc hẹn mà cô ấy đã thực
hiện mỗi giờ. Viết một báo cáo tóm tắt những kết quả thu được từ phân tích trên. 9 5 2 6 5 6 4 4 7 2 3 6 3 4 4 7 8 4 4 5 5 4 8 3 3 Lời giải (1) Tính trung bình
Sử dụng công thức tính trung bìn , h ta có: 6 ∑ x 105 x = = = 4.2 n 25 (2) Tính trung vị Ta có bảng sắp xếp 2 2 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 6 6 6 7 7 8 8 9
Vì số đơn vị = 25, là số lẻ nên ta có:
Vị trí trung vị = n+1 = 13 ⇒ Me = 4 2
(3) Viết báo cáo tóm tắt kết quả trên
Tổng số cuộc hẹn: 105 cuộc hẹn
Trung bình mỗi giờ Trudy Green thực hiện 4.2 cuộc gọi 2. Bài 85 trang 9 2
Gần đây, Bidwell Electronics Inc. đã khảo sát một mẫu gồm các nhân viên về
quãng đường họ đi làm hàng ngày. Tính trung bình và độ lệch chuẩn dựa vào thông tin trong bảng dưới đây. Quãng đường (mile) Tần số M Từ 0 đến dưới 5 4 2.5 Từ 5 đến dưới 10 15 7.5 Từ 10 đến dưới 15 27 12.5 Từ 15 đến dưới 20 18 17.5 Từ 20 đến dưới 25 6 22.5 Lời giải Quãng đường Tần số M fM Từ 0 đến dưới 5 4 2.5 10 Từ 5 đến dưới 1 0 15 7.5 112.5 Từ 10 đến dưới 15 27 12.5 337.5 Từ 15 đến dưới 20 18 17.5 315 Từ 20 dến dưới 25 6 22.5 135 Tổng 70 910 7
Sử dụng công thức tính trung bình (3 – 11), ta có: ∑ fM 910 x = = = 13 n 70
Vậy trung bình một nhân viên đi làm là 13 miles. Quãng đường Tần số M fM M - 𝑥 (𝑀 − 𝑥 )2 𝑓(𝑀 − 𝑥 )2 Từ 0 đến dưới 5 4 2.5 10 -10.5 110.25 441 Từ 5 đến dưới 10 15 7.5 112.5 -5.5 30.25 453.75 Từ 10 đến dưới 15 27 12.5 337.5 -0.5 0.25 6.75 Từ 15 đến dưới 20 18 17.5 315 4.5 20.25 364.5 Từ 20 dến dưới 25 6 22.5 135 9.5 90.25 541.5 Tổng 70 910 -2.5 251.25 1807.5
Sử dụng công thức độ lệch chuẩn (3-12), ta có: ∑ f(M − x)2 1807.5 s = √ = √ = 5.12 n − 1 70 − 1 3. Bài 31 trang 122
Sau đây là số vụ trộm xe hơi trong 1 tuần ở một thành phố lớn. Hãy xác định hệ số
Skewness bằng hai phương pháp. 3 12 13 7 8 3 8 Lời giải n = 7 - Giá trị trung bình: ∑ x 54 x = = = 7.71 n 7 - Trung vị: Me = 8
- Độ lệch chuẩn của mẫu: ∑ ( x − x)2 s = √ = 3.9 n − 1 Từ đó, ta có:
- Hệ số Skewness của Pearson 3( x − Me) 3(7.71 − 8) sk = = = − 0.22 s 3.9 8
- Hệ số Skewness từ phần mềm E xcel: III. Điều tra chọn mẫu 1. Bài 31 trang 274
Công ty Power + Inc. sản xuất pin AA dùng cho điều khiển ô tô đồ chơi từ xa. Tuổi
thọ trung bình của loại pin này tuân theo quy luật phân phối chuẩn với giá trị trung bình
là 35.0 giờ và độ lệch chuẩn là 5.5 giờ. Để kiểm tra chất lượng sản phẩm, Power + Inc. đã lấy mẫu 25 pin.
a. Hãy cho biết hình dạng phân phối của các trung bình mẫu.
b. Tính sai số trung bình chọn mẫu.
c. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên.
d. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 giờ trở lên.
e. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 đến 36 giờ.
f. Tính xác suất để sai số chọn mẫu lớn hơn 1 giờ. Lời giải Tóm tắt n = 25 μ = 35 σ = 5.5
a. Hãy cho biết hình dạng phân phối của các trung bình mẫu.
Vì tuổi thọ trung bình của loại pin này tuân theo quy luật phân phối chuẩn nên các trung
bình mẫu (x ) cũng được phân phối chuẩn.
b. Tính sai số trung bình chọn mẫu.
Sử dụng công thức sai số trung bình chọn mẫu, ta có: σ 5.5 5.5 σx = = = = 1.1 √n √25 5
c. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên. 9
Sử dụng công thức tính giá trị z, ta có: x − μ 36 − 35 z = = = 0.91 σ/√n 1.1
Dựa vào bảng “Xác suất phân phối chuẩn hoá”, xác suất của giá trị z < 0.91 là 0.3186
⇒ Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên là:
p = 0.5000 − 0.3186 = 0.1814
d. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 giờ trở lên.
Sử dụng công thức tính giá trị z, ta có: x − μ 34.5 − 35 z = = = −0.45 σ/√n 1.1
Dựa vào bảng “Xác suất phân phối chuẩn hoá”, xác suất của giá trị z < 0.45 là 0.1736
⇒ Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 giờ trở lên là: p = 0.5000 + 0.1736 = 0.6736
e. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 đến 36 giờ.
Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 đến 36 giờ là: p = 0.3186 + 0.1736 = 0.4922
f. Tính xác suất để sai số chọn mẫu lớn hơn 1 giờ.
Sai số chọn mẫu lớn hơn 1 giờ tương ứng vớ ituổi thọ trung bình của pin nhỏ hơn 34 giờ h oặc lớn hơn 36 giờ.
Sử dụng công thức tính giá trị z, ta có: x 36 − 35 z 1 − μ 1 = = = 0.91 σ/√n 1.1 x 34 − 35 z 2 − μ 2 = = = −0.91 σ/√n 1.1
Như phần (c) ta có: Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên là: p1 = 0.1814
Tương tự, ta có: Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34 giờ trở xuống là: p2 = 0.1814
⇒ Xác suất để sai số chọn mẫu lớn hơn 1 giờ là:
p1 + p2 = 0.1814 + 0.1814 = 0.3628 IV. Ước lượng 1. Bài 57 trang 309
Áp suất trong khoang máy bay ảnh hưởng đến sự thoải mái của khách hàng. Mức 10
áp suất cao hơn làm cho không khí trong khoang máy bay càng gần với môi trường tự
nhiên và khách hàng thoải mái hơn. Một nhóm khách hàng của hàng không đã ghi lại
mức áp suất trong 30 chuyến bay được chọn ngẫu nhiên và thấy rằng áp suất trong
khoang máy bay tương đương ở độ cao trung bình 8000 feet với độ lệch chuẩn là 300 feet.
a. Với độ tin cậy 99%, mức áp suất trung bình chung tương đương với độ cao trong khoảng giá trị nào?
b. Để xác định mức áp suất trung bình chung tương đương với độ cao nào, cần thu
thập thông tin ở bao nhiêu chuyến bay với phạm vi sai số là 25 feet và độ tin cậy là 95%? Lời giải Tóm tắt đề bài n = 30 X = 8000 σ = 300
a. Với độ tin cậy 99%, mức áp suất trung bình chung tương đương với độ cao trong khoảng giá trị nào Độ tin cậy = 99% = 1- α ⇒ α = 1% = 0.01
Có từ bảng phân phối chuẩn Zα/2 ≈ 2.576
Sử dụng công thức khoảng tin cậy ⇒ 7858.9 < M < 8141.1
Vậy mức áp suất trung bình tương đương độ cao trong khoảng (7858.9,8141.1)
b. Để xác định mức áp suất trung bình chung tương đương với độ cao nào, cần thu
thập thông tin ở bao nhiêu chuyến bay với phạm vi sai số là 25 feet và độ tin cậy là 95%?
Phạm vi sai số chọn mẫu là ε = 25. Với độ tin cậy 95% nên từ bảng phân phối có Zα/2 =
1.960 và độ lệch chuẩn s = 300. Thay số vào công thức n ≈ 553.1
Vậy để xác định mức áp suất trung bình chung tương đương với độ cao nào với phạm
vi sai số là 25 feet và độ tin cậy là 95%, cần thu thập thông tin ở khoảng 554 chuyến bay. 11 2. Bài 14 trang 294
The Buffalo, New York, Area Chamber of Commerce muốn ước lượng thời gian
trung bình di chuyển đến nhà máy của những nhân viên đang làm việc ở trung tâm thành
phố. Dữ liệu sau là thời gian đi làm (phút) của 15 nhân viên: 14 24 24 19 24 7 31 20 26 23 23 28 16 15 21
Xác định khoảng tin cậy 98% về thời gian trung bình di chuyển đến nhà máy của
nhân viên. Giải thích kết qu ? ả Lời giải
Giả định tổng thể có phân phối chuẩn và chưa biết độ lệch chuẩn của tổng thể.
Giá trị trung bình của mẫu ∑ x 14 + 24 + ⋯ + 15 + 21 315 x = = = = 21 n 15 15
Độ lệch chuẩn của mẫu Σ(x − x)2
(14 − 21)2 + (24 − 21)2 + ⋯ + (21 − 21)2 s = √ = √ ≈ 6.094 n − 1 14
Với bậc tự do n – 1 = 14 và độ tin cậy 98%, tra bảng “Phân phối Student” ta c ó: t = 2.624
Sử dụng công thức khoảng tin cậy cho giá trị trung bìn
h của tổng thể khi chưa biết σ: s 6.094 x ± t = 21 ± (2.624) = 21 ± 4.129 √n √15
Vậy khả năng để thời gian trung bình di chuyển đến nhà máy của nhân viên có giá trị
trong khoảng từ 16.871 phút đến 25.129 phút là 98%. V. Kiểm định 1. Bài 48 trang 345
Chủ sở hữu của Westfield Mal muốn nghiên cứu thói quen mua sắm của khách
hàng. Theo nghiên cứu trước đó, một người mua sắm thông thường dành 0.75 giờ tại
trung tâm thương mại, với độ lệch chuẩn là 0.10 giờ. Gần đây, trung tâm thương mại
mở thêm 1 số nhà hàng với mục đích giữ chân khách lâu hơn. Chủ sở hữu trung tâm
thương mại đã thuê Công ty tư vấn Brunner and Swanson đánh giá tác động của các nhà 12
hàng. Một mẫu gồm 45 khách hàng được hỏi cho thấy thời gian trung bình ở trung tâm
thương mại của họ là 0.80 giờ.
a. Với mức ý nghĩa 0.10, thời gian trung bình của khách hàng tại trung tâm thương mại có thay đổi không?
b. Giả sử thời gian mua sắm thực sự của khách hàng tăng từ 0.75 lên 0.79 giờ. Hãy
tính xác suất mắc sai lầm loại II.
c. Khi Brunner and Swanson báo cáo kết quả ở phần (b), chủ sở hữu Westfield
Mal nhận thấy xác suất mắc sai lầm loại II là quá lớn. Làm thế nào để giảm xác suất này? Lời giải
a. Với mức ý nghĩa 0.10, thời gian trung bình của khách hàng tại trung tâm thương mại có thay đổi không?
Sử dụng quy trình kiểm định 6 bước:
Bước 1: Nêu giả thuyết không và giả thuyết đối.
Với bài này, ta có giả thuyết không là “Trung bình tổng thể là 0.75 giờ” và giả thuyết
đối là “Trung bình tổng thể khác 0.75 giờ”. Đây là kiểm định 2 phía vì giả thuyết đối
không nêu lên chiều hướng. H0: µ=0.75 H1: µ≠0.75
Bước 2: Chọn mức ý nghĩa.
Quyết định sử dụng mức ý nghĩa α = 0.1.
Bước 3: Chọn tiêu chuẩn kiểm định.
Sử dụng tiêu chuẩn kiểm định z vì đã biết độ lệch chuẩn của tổng thể. Ta có: x − μ z = σ √n
Bước 4: Xác định quy tắc ra quyết định.
Sử dụng bảng phân phối chuẩn hóa, với mức ý nghĩa α = 0.1 và kiểm định 2 phía, ta có
giá trị tới hạn zα/2 = 1.645
⇒ Quy tắc ra quyết định: Bác bỏ giả thuyết không nếu giá trị tiêu chuẩn kiểm định:
|z| > zα/2 hay |z| > 1.645. 13
Bước 5: Ra quyết định. x 0.8 − 0.75 z = c − μ1 σ = = 3.354 0.1 √n √45 Bước 6: Nêu kết luận
Vì |z| > 1.645 (3.35 > 1.645) nên giả thuyết không bị bác bỏ.
Vậy thời gian trung bình của khách tại trung tâm thương mại sẽ thay đổi.
b. Giả sử thời gian mua sắm thực sự của khách hàng tăng từ 0.75 lên 0.79 giờ. Hãy
tính xác suất mắc sai lầm loại II.
Cần xác định xác suất để trung bình mẫu nằm trong khoảng từ 0.79 đến 0.80. Sau đó,
lấy 0.5 ( toàn bộ diện tích ở bên phải của giá trị trung bình 0.79) trừ đi giá trị xác suất
vừa tính được ta có kết quả xác suất mắc sai lầm loại II. x 0.8 − 0.79 z = c − μ1 σ = 0.1 = 0.67 √n √45
⟹ Xác suất mắc sai lầm loại II là: β = 0.2486
c. Khi Brunner and Swanson báo cáo kết quả ở phần (b), chủ sở hữu Westfield
Mal nhận thấy xác suất mắc sai lầm loại II là quá lớn. Làm thế nào để giảm xác suất này?
Để giảm xác suất loại II, ta nên giảm giá trị trung bình của mẫu. VI. Hồi quy tương quan 1. Bài 12 trang 39 6
Hội Sinh viên tại Đại học Middle Carolina muốn chứng minh mối liên hệ giữa số
lượng bia mà một sinh viên uống và nồng độ cồn trong máu của họ (BAC). Một mẫu
ngẫu nhiên gồm 18 sinh viên được chỉ định uống một số lượng ngẫu nhiên lon bia 12
ounce. 30 phút sau khi họ uống hết số bia được chỉ định, một thành viên của văn phòng
cảnh sát trưởng địa phương đã đo nồng độ cồn trong máu của họ. Thông tin từ mẫu như sau: Sinh viên Số lon bia BAC Sinh viên Số lon bia BAC Charles 6 0.10 Jalme 3 0.07 El is 7 0.09 Shannon 3 0.05 Harriet 7 0.09 Nel ie 7 0.08 14 Marlene 4 0.10 Jeanne 1 0,04 Tara 5 0.10 Michele 4 0.07 Kerry 3 0.07 Seth 2 0.06 Vera 3 0.10 Gilberto 7 0.12 Pat 6 0.12 Lil ian 2 0.05 Marjorie 6 0.09 Becky 1 0.02
a. Xây dựng biểu đồ phân tán cho số lon bia đã uống và BAC. Nhận xét về mức
độ chặt chẽ của mối liên hệ? Mối liên hệ thuận hay nghịch?
b. Xác định hệ số tương quan.
c. Với mức ý nghĩa 0.01, có mối liên hệ thuận trong tổng thể giữa số lon bia được
uống và BAC không? Xác định giá trị p-value. Lời giải
a. Xây dựng biểu đồ phân tán cho số lon bia đã uống và BAC. Nhận xét về mức độ
chặt chẽ của mối liên hệ? Mối liên hệ thuận hay nghịch?
⇒ Tương quan thuận và chặt chẽ giữa số lon bia đã uống và BAC
b. Xác định hệ số tương quan. Số lon
STT bia (x) BAC (y) (𝑥 − 𝑥)2
(𝑦 − 𝑦)2 (𝑥 − 𝑥) (𝑦 − 𝑦) (𝑥 − 𝑥)(𝑦 − 𝑦) 1 6 0.1 2.97 0.00044568 1.722 0.021 0.036 2 7 0.09 7.41 0.00012346 2.722 0.011 0.030 3 7 0.09 7.41 0.00012346 2.722 0.011 0.030 4 4 0.1 0.08 0.00044568 -0.278 0.021 -0.006 15 5 5 0.1 0.52 0.00044568 0.722 0.021 0.015 6 3 0.07 1.63 0.00007901 -1.278 -0.009 0.011 7 3 0.1 1.63 0.00044568 -1.278 0.021 -0.027 8 6 0.12 2.97 0.00169012 1.722 0.041 0.071 9 6 0.09 2.97 0.00012346 1.722 0.011 0.019 10 3 0.07 1.63 0.00007901 -1.278 -0.009 0.011 11 3 0.05 1.63 0.00083457 -1.278 -0.029 0.037 12 7 0.08 7.41 0.00000124 2.722 0.001 0.003 13 1 0.04
10.74 0.00151235 -3.278 -0.039 0.127 14 4 0.07 0.08 0.00007901 -0.278 -0.009 0.002 15 2 0.06 5.19 0.00035679 -2.278 -0.019 0.043 16 7 0.12 7.41 0.00169012 2.722 0.041 0.112 17 2 0.05 5.19 0.00083457 -2.278 -0.029 0.066 18 1 0.02
10.74 0.00346790 -3.278 -0.059 0.193 Tổng 77 1.42 77.61 0.0128 0.776 77 x = = 4.28 18 1.42 y = = 0.08 18 77.61 sx = √ = 2.14 18 − 1 0.0128 sy = √ = 0.027 17 ∑ ( x − x)(y − y) 0.776 r = = = 0.8 (n − 1)sxsy (18 − 1)(2.14)(0.027)
c. Với mức ý nghĩa 0.01, có mối liên hệ thuận trong tổng thể giữa số lon bia được
uống và BAC không? Xác định giá trị p-value. H0: p ≤ 0 H1: p > 0
Loại bỏ nếu t > 2.583 với df = 16 r√n − 2 0.8√18 − 2 t = = = 5.33 > 2.583 √1 − r2 √1 − 0.82
⇒ Loại bỏ H0 và có mối liên hệ thuận giữa số lon bia được uống và BAC. 16 ANOVA Significanc df SS MS F e F Regression 1
0.0077500040.00775 24.66302 0.00014 Residual 16 0.0050277740.000314 Total 17 0.012777778 Coefficient Standard Lower Upper s Error t Stat
P-value Lower 95%Upper 95% 95.0% 95.0% Intercept
0.036142 0.0095681263.777305 0.00165 0.015858 0.056425 0.015858 0.056425
X Variable 1 0.009993 0.0020121764.966187 0.00014 0.005727 0.014258 0.005727 0.014258 2. Bài 24 trang 482
Một nhà nghiên cứu thị trường đang nghiên cứu về các dịch vụ thuê bao trực tuyến.
Cô ấy đặc biệt quan tâm đến những biến liên quan đến số lượng đăng ký cho một dịch
vụ trực tuyến cụ thể. Thông tin mô tả về 25 dịch vụ đăng ký trực tuyến với các biến có ký hiệu như sau: Sub
= Số lượng đăng ký (nghìn)
Web page hits = Số lượt truy cập trung bình hằng tháng (nghìn) Adv Price
= Ngân sách quảng cáo của dịch vụ (trăm $) Price
= Ph íđăng ký trung bình hằng tháng ($) Web page Service Sub Adv Price hits 1 37.95 588.9 13.2 35.1 2 37.66 585.3 13.2 34.7 3 37.55 566.3 19.8 34.8 … … … … … 23 38.83 629.6 22.0 35.3 24 38.33 680.0 24.2 34.7 25 40.24 651.2 33.0 35.8
a. Xây dựng phương trình hồi quy.
b. Tiến hành kiểm định ý nghĩa của mô hình. Sử dụng mức ý nghĩa 0,05.
c. Tiến hành kiểm định ý nghĩa của từng hệ số hồi quy riêng phần. Sử dụng mức ý
nghĩa 0.05. Có cần loại bỏ biến nào không?
d. Xác định phần dư và vẽ đồ thị dựa trên các giá trị ước lượng. Nhận xét?
e. Xây dựng đồ thị phần dư. Giả thiết các phần dư tuân theo quy luật phân phối 17
chuẩn có được thỏa mãn không? Lời giải
a. Xây dựng phương trình hồi quy.
• Biến phụ thuộc (y): Số lượng đăng ký (nghìn) • Các biến độc lập:
- x1: Số lượt truy cập trung bình hằng tháng (nghìn)
- x2: Ngân sách quảng cáo của dịch vụ (trăm đô la)
- x3: Phí đăng ký trung bình hằng tháng ($)
⇒ Phương trình hồi quy có dạng:
Dùng Excel chạy bảng Regression tìm b0, b1, b2, b3, được kết quả như sau: b0 = 5.7328 b1 = 0.0075 b2 = 0.0509 b3 = 1.0974 ⇒
b. Tiến hành kiểm định ý nghĩa của mô hình. Sử dụng mức ý nghĩa 0.05.
Bước 1: Xét cặp giả thuyết.
H0: β1 = β2 = β3 = 0 (mô hình không có ý nghĩa)
H1: β1 ≠ 0; β2 ≠ 0; β3 ≠ 0 (mô hình có ý nghĩa)
Bước 2: So sánh Sig với α.
Điều kiện bác bỏ: Sig < α 18
Trong đó: Sig = 0.00000002; α = 0.05 ⇒ Sig < α
⇒ Bác bỏ H0 , chấp nhận H1
⇒ Mô hình có ý nghĩa với mức ý nghĩa 0.05.
c. Tiến hành kiểm định ý nghĩa của từng hệ số hồi quy riêng phần. Sử dụng mức
ý nghĩa 0.05. Có cần loại bỏ biến nào không? (1) Kiểm định β1
Bước 1: Xét cặp giả thuyết.
H0: β1 = 0 (hệ số không có ý nghĩa)
H1: β1 ≠ 0 ( hệ số có ý nghĩa)
Bước 2: Tính tiêu chuẩn kiểm định. 𝑇qs = t1 = 4.1575
Bước 3: Điều kiện bác bỏ H0. ⌊𝑇 (𝑛−𝑘−1) 𝑞𝑠⌋ > 𝑡𝛼 2
Mà n = 25; k = 3 ⇒ n - k - 1 = 21 α = 0.05 ⇒ |𝑇 (21) 𝑞𝑠| > 𝑡0.05 2 ⇒ 4.1575 > 2.080
⇒ Bác bỏ H0, chấp nhận H1 ⇒ β1 có ý nghĩa. (2) Kiểm định β2
Bước 1: Xét cặp giả thuyết.
H0: β2 = 0 (hệ số không có ý nghĩa)
H1: β2 ≠ 0 (hệ số có ý nghĩa)
Bước 2: Tính tiêu chuẩn kiểm định. 𝑇qs = t2 = 3.5987
Bước 3: Điều kiện bác bỏ H0 |𝑇 (𝑛−𝑘−1) 𝑞𝑠| > 𝑡𝛼 2
Mà n = 25; k = 3 ⇒ n - k - 1 = 21 α = 0.05 19 ⇒ |𝑇 (21) 𝑞𝑠| > 𝑡0.05 2 ⇒ 3.5987 > 2.080
⇒ Bác bỏ H0, chấp nhận H1 ⇒ β2 có ý nghĩa. (3) Kiểm định β3
Bước 1: Xét cặp giả thuyết.
H0: β3 = 0 (hệ số không có ý nghĩa)
H1: β3 ≠ 0 (hệ số có ý nghĩa)
Bước 2: Tính tiêu chuẩn kiểm định. 𝑇qs = t3 = 4.4786
Bước 3: Điều kiện bác bỏ H0 |𝑇 (𝑛−𝑘−1) 𝑞𝑠| > 𝑡𝛼 2
Mà n = 25; k = 3 ⇒ n - k - 1 = 21 α = 0.05 ⇒ |𝑇 (21) 𝑞𝑠| > 𝑡0.05 2 ⇒ 4.4786 > 2.080
⇒ Bác bỏ H0, chấp nhận H1 ⇒ β3 có ý nghĩa.
⇒ Tất cả hệ số hồi quy riêng từng phần đều có ý nghĩa, không loại bỏ biến nào.
d. Xác định phần dư và vẽ đồ thị dựa trên các giá trị ước lượng. Nhận xét?
Sử dụng công thức tính phần dư:
Phần dư = Số lượng đăng ký thực tế - Số lượng đăng ký ước lượng
Số lượng đăng ký thực tế được lấy từ bảng (cột Sub), Số lượng đăng ký ước
lượng được tính bằng cách thay giá trị các biến x1, x2, x3 từ bảng số liệu vào phương trình hồi quy.
Từ đó, ta có Bảng 5: Phần dư của phương trình hồi quy. 20
Bảng 5: Phần dư của phương trình hồi quy (đơn vị: nghìn)
Từ bảng số liệu trên, ta vẽ được Biểu đồ 3: Số lượng đăng ký dịch vụ ước lượng (đơn vị: nghìn)
Biểu đồ 3: Số lượng đăng ký dịch vụ ước lượng (đơn vị: nghìn) 21
e. Xây dựng đồ thị phần dư. Giả thiết các phần dư tuân theo quy luật phân phối
chuẩn có được thỏa mãn không?
Từ số liệu của Bảng 4: Phần dư của phương trình hồi quy, ta xây dựng được
Biểu đồ 4: Histogram của phần dư.
Biểu đồ 4: Histogram của phần dư
Từ đồ thị trên, ta thấy biểu đồ đang lệch phải, nghĩa là các phần dư đang phân
phối lệch sang phải. Do đó, giả thiết các phần dư tuân theo quy luật phân phối chuẩn không được thỏa mãn. VII. Chỉ số 1. Bài 12 trang 510
Bạn đang làm việc cho Văn phòng Phát triển kinh tế của tiểu bang. Văn phòng
muốn xây dựng một chỉ số kinh tế để đánh giá hoạt động kinh tế trong quá khứ và dự
đoán các xu hướng kinh tế trong tương lai của tiểu bang. Bạn cho rằng có một số yếu tố
chính nên được đưa vào chỉ số, gồm: số lượng doanh nghiệp mới thành lập trong năm,
số doanh nghiệp kinh doanh thất bại, thuế thu nhập của tiểu bang, số lượng sinh viên đại
học nhập học và thuế thương vụ của tiểu bang. Đây là dữ liệu của năm 2000 và 2018. 2000 2018 Số doanh nghiệp mới 1,088 1,162 22