Bài giải tham khảo cho bài tập ôn tập thi học kỳ 2 - Công nghệ thông tin | Đạo học Hoa Sen

Bài giải tham khảo cho bài tập ôn tập thi học kỳ 2 - Công nghệ thông tin | Đạo học Hoa Sen được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem

1
BÀI GIẢI THAM KHẢO cho
BÀI TẬP ÔN THI MÔN TKUD HK 23.2A
BÀI TẬP LUYỆN TẬP
1. Khảo sát chi tiêu (triệu đồng / tháng) của một số sinh viên trường đại học B, người ta ghi
được bảng số liệu sau: BÀI NÀY DỄ NÊN SV TỰ GIẢI
2,5 2,8 3 3,5 3,6 3,5 4 4,2 4,8 3,6
4 4,5 4,4 3,5 3,8 4 4,5 5 5,2 3,8
a) Hãy ước lượng chi tiêu trung bình của sinh viên trường B với độ tin cậy 95%, biết chi tiêu có
phân phối chuẩn.
b) Ở mức ý nghĩa 1% có thể nói rằng: “Trung bình mỗi sinh viên trường B chi tiêu 4 triệu đồng /
tháng” được hay không?
2. Điều tra doanh thu bán gạo (triệu đồng/ngày) của một số đại lý tại TpHCM, người ta
ghi được bảng số liệu sau đây: (100 đại lý → n = 100)
Doanh thu
(Trị số giữa)
38 – 40
39
40 – 42
41
42 – 44
43
44 – 46
45
46 – 48
47
48 – 50
49
Số đại lý 9 12 16 18 25 20
a) Những đại lý có doanh thu trên 46tr đồng/ngày là đại lý có doanh thu cao. Hãy ước
lượng tỷ lệ đại lý có doanh thu cao ở TpHCM với độ tin cậy 95%.
Gọi P là tỉ lệ đại lý có doanh thu cao ở TpHCM. Khoảng ước lượng của P là:
P P
(
ε;P
+ ε
)
, trong đó:
P
=


=0,45
Độ tin cậy 95% → 1 α=0,95φ󰇡Z
󰇢=
,
=0,475Z
=1,96 (Tra bảng Laplace)
Độ chính xác ε=Z
.
(
)
=1,96.
,(,)

0,0975
Vậy khoảng ước lượng của tỉ lệ đại lý có doanh thu cao ở TpHCM là:
P P
(
0,45 ± 0,0975
) (
0,3525;0,5475
)
2
b) Hãy ước lượng doanh thu trung bình của các đại lý bán gạo tại TpHCM với độ tin cậy
97%.
Gọi là doanh thu trung bình của các đại lý bán gạo tại TpHCM. Khoảng ước lượng của là:
μ X
(
ε;X
+ ε
)
Bấm máy tính theo bảng tần số của trị số giữa (ở trên) ta được:
X
=44,96 S3,178
Độ tin cậy 97% → 1 α=0,97φ󰇡Z
󰇢=
,
=0,485Z
=2,17 (Tra bảng Laplace)
Độ chính xác ε=Z
.
=2,17.
,

0,69
Vậy khoảng ước lượng của doanh thu trung bình là:
μ
(
44,96 ± 0,69 μ
)
(
44,27;45,65
)
c) Muốn sai số khi ước lượng doanh thu trung bình của các đại lý đó không vượt quá
400.000 đồng/ ngày và độ tin cậy 98% thì cần khảo sát thêm bao nhiêu đại lý nữa?
Độ tin cậy 98% → 1 α=0,98φ󰇡Z
󰇢=
,
=0,49Z
=2,33 (Tra bảng Laplace)
Sai số không vượt quá 400.000 đồng/ngày triệu đồng/ngày ε=0,4
n
󰆒
=
.
=
,
.,
,
342,689 chọn n’ = 343
Vậy cần khảo sát thêm 343 – 100 = 243 đại lý nữa.
d) Ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày được không?
Ta kiểm tra giả thuyết
H
:μ=45,5
H :μ45,5
X
=44,96 S3,178
Giá trị kiểm định
Z=

n=
,,
,
100−1,699
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ󰇡Z
󰇢=

=
,
=0,475
𝑍
=1,96
|
Z
|
<Z
nên ta chấp nhận H
Vậy ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày.
e) Có ý kiến cho rằng “ số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý Một nửa
nghĩa 1%”, hãy nhận xét về ý kiến này.
Gọi P là tỷ lệ đại lý bán gạo tại TpHCM có doanh thu cao
3
→ Ta kiểm tra giả thuyết
H
:P=0,5
H :P0,5
n=100 ; P
=0,45 (câu a)
Giá trị kiểm định
Z=

(
)
n=
, ,
,(,)
100=−1
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ󰇡Z
󰇢=

=
,
=0,495
𝑍
=2,58
|
Z
|
<Z
nên ta chấp nhận H
Vậy ta chấp nhận ý kiến “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý
nghĩa 1%”.
3. Khảo sát thu nhập (triệu đồng/tháng) của một số công nhân (CN) nam, nữ nhà máy X,
người ta thu được kết quả sau:
Thu nhập
(Trị số giữa)
5 – 7
6
7 – 9
8
9 – 11
10
11 – 13
12
13 – 15
14
15
𝟏𝟔
Số CN nữ 10 14 18 26 20 12
Số CN nam 6 14 24 28 16 8
a) Hãy ước lượng thu nhập trung bình của công nhân nhà máy X với độ tin cậy 95%.
Ta có bảng tần số (số CN cả nữ và nam trong mỗi tổ) theo trị số giữa như sau:
Thu nhập
(Trị số giữa)
6 8 10 12 14
16
Số CN 16 28 42 54 36 20
Cỡ mẫu n = n + n = n + n = 100 + 96 = 196
1 2 nữ nam
Gọi là thu nhập trung bình của công nhân nhà máy X. Khoảng ước lượng của là:
μ X
(
ε;X
+ ε
)
Từ số liệu trên, ta tính được: X
11,286 S2,825
Độ tin cậy 95% → 1 α=0,95φ󰇡Z
󰇢=
,
=0,475Z
=1,96 (Tra bảng Laplace)
Độ chính xác: ε=Z
.
=1,96.
,

0,396
Vậy khoảng ước lượng của là:
μ
(
11,286 ± 0,396
)
μ
(
10,89; 11,682
)
4
b) Những công nhân có thu nhập trên 13tr đồng/tháng là thu nhập cao. Hãy ước lượng tỷ
lệ công nhân có thu nhập cao của nhà máy X với độ tin cậy 97%.
Gọi P là tỷ lệ công nhân có thu nhập cao của nhà máy X. Khoảng ước lượng của P là:
P P
(
ε;P
+ ε
)
, trong đó:
P
=
20 + 16 + 12 + 8
196
=
56
196
0,286
Độ tin cậy 97% → 1 α=0,97φ󰇡Z
󰇢=
,
=0,485Z
=2,17 (Tra bảng Laplace)
Độ chính xác ε=Z
.
(
)
=2,17.
,(,)

0,07
Vậy khoảng ước lượng của P là:
P
(
0,286 ± 0,07 P
) (
0,216;0,356
)
c) Ở mức ý nghĩa 2%, hãy so sánh tỷ lệ công nhân có thu nhập cao của nữ và nam. (trên
13tr đồng/tháng, 100 CN nữ → & 96 CN nam → 𝐧
𝟏
=𝟏𝟎𝟎 𝐧
𝟐
=𝟗𝟔)
Gọi P
là tỷ lệ công nhân có thu nhập cao của nữ
Gọi P
là tỷ lệ công nhân có thu nhập cao của nam
→ Ta kiểm định giả thuyết
H
:P
=P
H :P
P
(Nếu chấp nhận thì tỷ lệ CN thu nhập cao của nữ và nam như nhau. Nếu bác bỏ 𝐇
𝟎
𝐇
𝟎
thì tỷ lệ CN có thu nhập cao của nữ và nam có chênh lệch nhau.)
P
=


=0,32 P
=


=0,25
P
=
n
P
+ n
P
n + n
=
100.0,32 + 96.0,25
100 + 96
=
56
196
0,286
Giá trị kiểm định
Z=


󰇡
󰇢
=
,,
,(,)󰇡


󰇢
1,084
Từ mức ý nghĩa 0,02, tra bảng hàm số Laplace → φ󰇡Z
󰇢=

=
,
=0,49 𝑍
=2,33
|
Z
|
<Z
nên ta chấp nhận H
Vậy ở mức ý nghĩa 2%, tỷ lệ công nhân có thu nhập cao của nữ và nam là như nhau.
d) Ở mức ý nghĩa 1%, có thể nói rằng thu nhập trung bình của công nhân nam nhà máy
X là 12tr đồng/tháng được không? (n = 96)
Ta kiểm tra giả thuyết
H
:μ = 12

H :μ 12

X
11,208 S2,651 [có thể ký hiệu hoặc để phân biệt giá trị trung bình và độ
nam
2
lệch chuẩn cho mẫu gồm cả nữ lẫn nam] 𝑛ℎư 𝑘ý ℎ𝑖ệ𝑢 ở 𝑐â𝑢 𝑒 𝑏ê𝑛 𝑑ướ𝑖
Giá trị kiểm định
Z=

n=
,
,
96−2,927
5
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ󰇡Z
󰇢=

=
,
=0,495
𝑍
=2,58
|
Z
|
>Z
nên ta bác bỏ . H
Vậy ở mức ý nghĩa 1%, không thể nói rằng thu nhập trung bình của công nhân nam nhà máy X
là 12tr đồng/tháng.
e) Ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà
máy X là như nhau hay không? ( 𝐧
𝟏
=𝟏𝟎𝟎, 𝐧
𝟐
=𝟗𝟔)
Gọi là thu nhập trung bình của công nhân nữ μ
Gọi là thu nhập trung bình của công nhân nam μ
→ Ta cần kiểm định giả thuyết
H
:μ
=μ
H :μ μ
(Nếu chấp nhận thì thu nhập trung bình của CN nữ nam nhà máy X như nhau. 𝐇
𝟎
Nếu bác bỏ thì thu nhập trung bình của CN nữ và nam nhà máy X có chênh lệch nhau.) 𝐇
𝟎
Từ bảng số liệu ban đầu, ta tính được:
X
=11,36 ; S
2,993 ; X
=11,208 ; S
2,651
Giá trị kiểm định
Z=

=
,,
,

,

0,377
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ󰇡Z
󰇢=

=
,
=0,475
𝑍
=1,96
|
Z
|
<Z
nên ta chấp nhận H
Vậy ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà máy
X là như nhau.
6
4. Khảo sát tuổi thọ của một loại sản phẩm do 3 nhà máy A, B, C sản xuất (đơn vị tính:
năm), người ta ghi được số liệu sau đây:
Nhà máy A Nhà máy B Nhà máy C
3
4
6
3.5
3
6.5
4
4.5
5
4
3.5
4.5
4.5
5
5.5
5
5.5
6.5
5.5
6
5
5.5
6
6
6
5
4
6.2
4
4.5
Giả sử tuổi thọ của sản phẩm do ba nhà máy sản xuất có phân phối chuẩn với phương
sai bằng nhau. Ở mức ý nghĩa 5%, hãy kiểm định ý kiến cho rằng có sự khác biệt về
tuổi thọ trung bình của sản phẩm do ba nhà máy A, B, C sản xuất.
Để giải bài này, các bạn xem lại VD trong giáo trình (phần Phân tích phương sai - ANOVA)
mà GV đã hướng dẫn cách tính cụ thể trong buổi học tuần 15. Làm tuần tự các bước như lời
giải trong giáo trình và dò kết quả chạy ANOVA trong Excel dưới đây:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
Nhà máy A 10
47.2
4.72
1.184
Nhà máy B 10
46.5
4.65
1.058333333
Nhà máy C 10
53.5
5.35
0.780555556
ANOVA
Source of Variation SS df MS F P-value F crit
Between Groups 2.972666667
2
1.486333333
1.475079027
0.246617
3.354131
Within Groups 27.206
27
1.00762963
Total 30.17866667
29
Tương ứng các giá trị tính ra ở phần ANOVA trong bảng trên với các ký hiệu ở hình dưới đây:
7
5. Công ty bất động sản muốn dự báo giá bán ngôi nhà dựa vào diện tích của ngôi nhà tại
khu vực A. Dữ liệu thu được của 7 ngôi nhà như sau: (n = 7)
Giá bán (Y - tỷ đồng/căn) 2.3 1.8 5 4.2 2.7 3.6 3.3
Diện tích (X - m
2
) 135 70 350 215 150 280 200
a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘
=𝟏,𝟎𝟔𝟑 𝟎,𝟎𝟏𝟏+ 𝐗
Ý nghĩa: , trong điều kiện các yếu tố khác không thay đổi, nếu diện tích ngôi nhà b =0,011
tăng thì giá bán nhà trung bình tăng 0,011 tỷ đồng/căn (hay 11 triệu đồng/căn). 1m
Hệ số tương quan → Hệ số xác định r 0,933

R
0,8699
Giải thích: Hệ số xác định (SV tự xem lại slide bài giảng để phát biểu) 𝐑
𝟐
b) Với mức ý nghĩa 1%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết
H
:R
=0
H :R 0
(Nếu chấp nhận thì hình hồi quy hai biến không phù hợp. Nếu bác bỏ thì 𝐇
𝟎
𝐇
𝟎
hình hồi quy hai biến phù hợp)
Hệ số tương quan → Hệ số xác định r 0,933

R
0,8699
Vì k = 2
→ Giá trị kiểm định F=
()
( )()
=
()

=
,()
,
33,432
Mức ý nghĩa , tra bảng Fisher:
α=0,01 F
(
1;n 2
)
=F
,
(
1;5
)
=16,258
8
nên ta bác bỏ
F>F 1;5
,
( )
H
Vậy với mức ý nghĩa 1%, mô hình hồi quy hai biến phù hợp.
c) Với mức ý nghĩa 5%, diện tích có thực sự là yếu tố tác động đến giá nhà hay
không? Phần giải dưới đây là để tham khảo, SV hoàn toàn có đưa bài toán về Kiểm
định mô hình để thay thế
Từ phương trình quy hồi mẫu: 𝐘
=𝟏,𝟎𝟔𝟑 + 𝟎,𝟎𝟏𝟏𝐗
→ Ta được bảng giá trị sau
𝐗
𝐢
135 70 350 215 150 280 200
𝐘
𝐢
2,3 1,8 5 4,2 2,7 3,6 3,3
𝐘
𝐢
2,548 1,833 4,913 3,428 2,713 4,143 3,263
SSE= Y
Y
=0,962533
s
=


=
,

0,439
S
93,764 se b
(
)
=
.

=
,
,. 
0,001911
Lập giả thuyết
H
:β
=0
H :β 0
(Nếu chấp nhận thì diện tích không thực sự là yếu tố tác động đến giá nhà. Nếu bác bỏ 𝐇
𝟎
𝐇
𝟎
thì diện tích là yếu tố tác động đến giá nhà)
Giá trị kiểm định
t=

(
)
=
,
,
5,756
Tra bảng Student: t
󰇡;
󰇢
=t
(
;,
)
=2,571
nên ta bác bỏ
|
t
|
>t
(
;,
)
H
Vậy với mức ý nghĩa 5%, diện tích thực sự là yếu tố tác động đến giá nhà
9
6. Khảo sát về số km đã đi (km) và số tiền phải trả (nghìn đồng) khi sử dụng xe grab, ta
có bảng số liệu sau:
Số km (X) 1 2 3 5 7 8 9 10
Số tiền phải trả (Y) 10 13 18 28 36 39 41 47
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.996640573
R Square 0.993292432
Adjusted R Square
0.992174504
Standard Error 1.231223082
Observations 8
ANOVA
df SS MS F
Significance
F
Regression 1
1346.904538 1346.9045
888.512044
9.45454E-08
Residual 6
9.095461659 1.5159103
Total 7
1356
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept 5.901408451
0.888808985 6.6396814
0.00056327
3.726571212
8.076245689
X 4.106416275
0.137762594 29.807919
9.4545E-08
3.769323351
4.4435092
a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘
=𝟓,𝟗𝟎𝟏 + 𝟒,𝟏𝟎𝟔𝐗
Ý nghĩa: , trong điều kiện các yếu tố khác không thay đổi, nếu đường đi tăng 1km b =4,106
thì số tiền phải trả khi sử dụng xe grab tăng trung bình 4,106 nghìn đồng.
Giải thích hệ số xác định R
= R Square = 0.993292432 (?)
b) Với mức ý nghĩa 5%, mô hình hồi quy hai biến có phù hợp hay không? (n = 8)
Lập giả thuyết
H
:R
=0
H :R 0
(Nếu chấp nhận thì mô hình hồi quy hai biến không phù hợp. Nếu bác bỏ thì mô 𝐇
𝟎
𝐇
𝟎
hình hồi quy hai biến phù hợp)
10
Theo đề ta có: Hệ số tương quan , hệ số xác định r 0,997

R
0,993
Từ bảng kết quả hồi quy, ta có giá trị kiểm định F888,512
Mức ý nghĩa , tra bảng Fisher:
α=0,05 F
(
1;n 2
)
=F
,
(
1;6
)
=5,987
nên ta bác bỏ
F>F 1;6
,
( )
H
Vậy với mức ý nghĩa 5%, mô hình hồi quy hai biến phù hợp.
c) Hãy dự báo số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%.
Từ phương trình quy hồi mẫu → Y
=5,901 + 4,106.12=55,173 (nghìn đồng)
Tra bảng Student: t
󰇡;
󰇢
=t
(
;,
)
=3,707
𝐬
𝐞
𝟏,𝟐𝟑𝟏 với (s
là Standard Error)
X
=5,625 ; S
11,411
Nếu đề không cho Standard Error mà cho (vị trí giao giữa hàng Residual SS Residual = SSE
và cột SS trong bảng ANOVA của kết quả hồi quy ở trên) thì ta có thể tính Se như sau:
s
=


=
,

1,23122
Theo công thức: seY
=s
.
+
(

)
( )

=1,231.
+
(
,
)
(

)
.,
0,98
Vậy số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%:
󰇡𝑌
𝑡
(
;,
)
.𝑠𝑒𝑌
;𝑌
+ 𝑡
(
;,
)
.𝑠𝑒𝑌
󰇢
=
(
55,173 3,707.0,98;55,173 + 3,707.0,98
)
(
51,54;58,806
)
| 1/10

Preview text:

BÀI GIẢI THAM KHẢO cho
BÀI TẬP ÔN THI MÔN TKUD HK 23.2A
BÀI TẬP LUYỆN TẬP
1. Khảo sát chi tiêu (triệu đồng / tháng) của một số sinh viên trường đại học B, người ta ghi
được bảng số liệu sau: BÀI NÀY DỄ NÊN SV TỰ GIẢI 2,5 2,8 3 3,5 3,6 3,5 4 4,2 4,8 3,6 4 4,5 4,4 3,5 3,8 4 4,5 5 5,2 3,8
a) Hãy ước lượng chi tiêu trung bình của sinh viên trường B với độ tin cậy 95%, biết chi tiêu có phân phối chuẩn.
b) Ở mức ý nghĩa 1% có thể nói rằng: “Trung bình mỗi sinh viên trường B chi tiêu 4 triệu đồng /
tháng” được hay không?
2. Điều tra doanh thu bán gạo (triệu đồng/ngày) của một số đại lý tại TpHCM, người ta
ghi được bảng số liệu sau đây: (100 đại lý → n = 100) Doanh thu 38 – 40 40 – 42 42 – 44 44 – 46 46 – 48 48 – 50 (Trị số giữa) 39 41 43 45 47 49 Số đại lý 9 12 16 18 25 20
a) Những đại lý có doanh thu trên 46tr đồng/ngày là đại lý có doanh thu cao. Hãy ước
lượng tỷ lệ đại lý có doanh thu cao ở TpHCM với độ tin cậy 95%.
Gọi P là tỉ lệ đại lý có doanh thu cao ở TpHCM. Khoảng ước lượng của P là:
P ∈ (P − ε; P + ε), trong đó:
P =  = 0,45 
Độ tin cậy 95% → 1 − α = 0,95 → φ 󰇡Z󰇢 = , = 0,475 → Z = 1,96 (Tra bảng Laplace)   
Độ chính xác ε = Z. () = 1,96. ,(,) ≈ 0,0975   
Vậy khoảng ước lượng của tỉ lệ đại lý có doanh thu cao ở TpHCM là:
P ∈ (0,45 ± 0,0975) → P ∈ (0,3525; 0,5475) 1
b) Hãy ước lượng doanh thu trung bình của các đại lý bán gạo tại TpHCM với độ tin cậy 97%.
Gọi  là doanh thu trung bình của các đại lý bán gạo tại TpHCM. Khoảng ước lượng của  là:
μ ∈ (X − ε; X + ε)
Bấm máy tính theo bảng tần số của trị số giữa (ở trên) ta được: X = 44,96 S ≈ 3,178
Độ tin cậy 97% → 1 − α = 0,97 → φ 󰇡Z󰇢 = , = 0,485 → Z = 2,17 (Tra bảng Laplace)   
Độ chính xác ε = Z.  = 2,17. , ≈ 0,69  √ √
Vậy khoảng ước lượng của doanh thu trung bình là:
μ ∈ (44,96 ± 0,69)  μ ∈ (44,27; 45,65)
c) Muốn sai số khi ước lượng doanh thu trung bình của các đại lý đó không vượt quá
400.000 đồng/ ngày và độ tin cậy 98% thì cần khảo sát thêm bao nhiêu đại lý nữa?
Độ tin cậy 98% → 1 − α = 0,98 → φ 󰇡Z󰇢 = , = 0,49 → Z = 2,33 (Tra bảng Laplace)   
Sai số không vượt quá 400.000 đồng/ngày → ε = 0,4 triệu đồng/ngày . n󰆒 = 
= ,., ≈ 342,689  ,  chọn n’ = 343
Vậy cần khảo sát thêm 343 – 100 = 243 đại lý nữa.
d) Ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày được không?
Ta kiểm tra giả thuyết H: μ = 45,5 H : μ ≠ 45,5 X = 44,96 S ≈ 3,178
Giá trị kiểm định Z = √n = ,, √100 ≈ −1,699  ,
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ 󰇡Z󰇢 =  = , = 0,475    → 𝑍 = 1,96 
Vì |Z| < Z nên ta chấp nhận H  
Vậy ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày.
e) Có ý kiến cho rằng “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý
nghĩa 1%”, hãy nhận xét về ý kiến này.
Gọi P là tỷ lệ đại lý bán gạo tại TpHCM có doanh thu cao 2
→ Ta kiểm tra giả thuyết H: P = 0,5 H : P ≠ 0,5
n = 100 ; P = 0,45 (câu a)
Giá trị kiểm định Z =   √100 = −1
() √n = , , ,(,)
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ 󰇡Z󰇢 =  = , = 0,495    →𝑍 = 2,58 
Vì |Z| < Z nên ta chấp nhận H  
Vậy ta chấp nhận ý kiến “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý nghĩa 1%”.
3. Khảo sát thu nhập (triệu đồng/tháng) của một số công nhân (CN) nam, nữ nhà máy X,
người ta thu được kết quả sau: Thu nhập 5 – 7 7 – 9 9 – 11 11 – 13 13 – 15 15 (Trị số giữa) 6 8 10 12 14 𝟏𝟔 Số CN nữ 10 14 18 26 20 12 Số CN nam 6 14 24 28 16 8
a) Hãy ước lượng thu nhập trung bình của công nhân nhà máy X với độ tin cậy 95%.
Ta có bảng tần số (số CN cả nữ và nam trong mỗi tổ) theo trị số giữa như sau: Thu nhập 6 8 10 12 14 16 (Trị số giữa) Số CN 16 28 42 54 36 20
Cỡ mẫu n = n1 + n2 = nnữ + nnam = 100 + 96 = 196
Gọi  là thu nhập trung bình của công nhân nhà máy X. Khoảng ước lượng của  là:
μ ∈ (X − ε; X + ε)
Từ số liệu trên, ta tính được: X ≈ 11,286 S ≈ 2,825
Độ tin cậy 95% → 1 − α = 0,95 → φ 󰇡Z󰇢 = , = 0,475 → Z = 1,96 (Tra bảng Laplace)   
Độ chính xác: ε = Z.  = 1,96. , ≈ 0,396  √ √
Vậy khoảng ước lượng của  là: μ ∈ (11,286 ± 0,396)  μ ∈ (10,89; 11,682) 3
b) Những công nhân có thu nhập trên 13tr đồng/tháng là thu nhập cao. Hãy ước lượng tỷ
lệ công nhân có thu nhập cao của nhà máy X với độ tin cậy 97%.
Gọi P là tỷ lệ công nhân có thu nhập cao của nhà máy X. Khoảng ước lượng của P là:
P ∈ (P − ε; P + ε), trong đó: 20 + 16 + 12 + 8 56 P = 196 = 196 ≈ 0,286
Độ tin cậy 97% → 1 − α = 0,97 → φ 󰇡Z󰇢 = , = 0,485 → Z = 2,17 (Tra bảng Laplace)   
Độ chính xác ε = Z. () = 2,17. ,(,) ≈ 0,07   
Vậy khoảng ước lượng của P là: P ∈ (0,286 ± 0,07) → P ∈ (0,216; 0,356)
c) Ở mức ý nghĩa 2%, hãy so sánh tỷ lệ công nhân có thu nhập cao của nữ và nam. (trên
13tr đồng/tháng, 100 CN nữ → 𝐧 & 96 CN nam → 𝟏 = 𝟏𝟎𝟎 𝐧𝟐 = 𝟗𝟔)
Gọi P là tỷ lệ công nhân có thu nhập cao của nữ
Gọi P là tỷ lệ công nhân có thu nhập cao của nam
→ Ta kiểm định giả thuyết H: P = P H:P ≠ P
(Nếu chấp nhận 𝐇 thì tỷ lệ CN có thu nhập cao của nữ và nam là như nhau. Nếu bác bỏ 𝟎
𝐇𝟎 thì tỷ lệ CN có thu nhập cao của nữ và nam có chênh lệch nhau.)
P =  = 0,32 P = 0,25    =   n 100.0,32 + 96.0,25 56 P P  + nP  = n =  + n 100 + 96 = 196 ≈ 0,286  Giá trị kiểm định Z =   = ,, ≈ 1,084  
󰇡    󰇢 ,(,)󰇡     󰇢
Từ mức ý nghĩa 0,02, tra bảng hàm số Laplace → φ 󰇡Z󰇢 =  = , = 0,49→ 𝑍 = 2,33    
Vì |Z| < Z nên ta chấp nhận H  
Vậy ở mức ý nghĩa 2%, tỷ lệ công nhân có thu nhập cao của nữ và nam là như nhau.
d) Ở mức ý nghĩa 1%, có thể nói rằng thu nhập trung bình của công nhân nam nhà máy
X là 12tr đồng/tháng được không? (n = 96)
Ta kiểm tra giả thuyết H: μ = 12 H : μ ≠ 12
X ≈ 11,208 S ≈ 2,651 [có thể ký hiệu nam hoặc 2 để phân biệt giá trị trung bình và độ
lệch chuẩn cho mẫu gồm cả nữ lẫn nam]
𝑛ℎư 𝑘ý ℎ𝑖ệ𝑢 ở 𝑐â𝑢 𝑒 𝑏ê𝑛 𝑑ướ𝑖
Giá trị kiểm định Z = √n = , √96 ≈ −2,927  , 4
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ 󰇡Z󰇢 =  = , = 0,495    → 𝑍 = 2,58 
Vì |Z| > Z nên ta bác bỏ H .  
Vậy ở mức ý nghĩa 1%, không thể nói rằng thu nhập trung bình của công nhân nam nhà máy X là 12tr đồng/tháng.
e) Ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà
máy X là như nhau hay không? (𝐧
𝟏 = 𝟏𝟎𝟎, 𝐧𝟐 = 𝟗𝟔)
Gọi μ là thu nhập trung bình của công nhân nữ 
Gọi μ là thu nhập trung bình của công nhân nam 
→ Ta cần kiểm định giả thuyết H: μ = μ H:μ ≠ μ
(Nếu chấp nhận 𝐇 thì thu nhập trung bình của CN nữ và nam nhà máy X là như nhau. 𝟎
Nếu bác bỏ 𝐇 thì thu nhập trung bình của CN nữ và nam nhà máy X có chênh lệch nhau.) 𝟎
Từ bảng số liệu ban đầu, ta tính được:
X = 11,36 ; S ≈ 2,993 ; X = 11,208 ; S ≈ 2,651
Giá trị kiểm định Z =  = ,, ≈ 0,377    ,    ,   
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ 󰇡Z󰇢 =  = , = 0,475    →𝑍 = 1,96 
Vì |Z| < Z nên ta chấp nhận H  
Vậy ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà máy X là như nhau. 5
4. Khảo sát tuổi thọ của một loại sản phẩm do 3 nhà máy A, B, C sản xuất (đơn vị tính:
năm), người ta ghi được số liệu sau đây: Nhà máy A Nhà máy B Nhà máy C 3 4 6 3.5 3 6.5 4 4.5 5 4 3.5 4.5 4.5 5 5.5 5 5.5 6.5 5.5 6 5 5.5 6 6 6 5 4 6.2 4 4.5
Giả sử tuổi thọ của sản phẩm do ba nhà máy sản xuất có phân phối chuẩn với phương
sai bằng nhau. Ở mức ý nghĩa 5%, hãy kiểm định ý kiến cho rằng có sự khác biệt về
tuổi thọ trung bình của sản phẩm do ba nhà máy A, B, C sản xuất.
Để giải bài này, các bạn xem lại VD trong giáo trình (phần Phân tích phương sai - ANOVA)
mà GV đã hướng dẫn cách tính cụ thể trong buổi học tuần 15. Làm tuần tự các bước như lời
giải trong giáo trình và dò kết quả chạy ANOVA trong Excel dưới đây: Anova: Single Factor SUMMARY Groups Count Sum Average Variance Nhà máy A 10 47.2 4.72 1.184 Nhà máy B 10 46.5 4.65 1.058333333 Nhà máy C 10 53.5 5.35 0.780555556 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 2.972666667
2 1.486333333 1.475079027 0.246617 3.354131 Within Groups 27.206 27 1.00762963 Total 30.17866667 29
Tương ứng các giá trị tính ra ở phần ANOVA trong bảng trên với các ký hiệu ở hình dưới đây: 6
5. Công ty bất động sản muốn dự báo giá bán ngôi nhà dựa vào diện tích của ngôi nhà tại
khu vực A. Dữ liệu thu được của 7 ngôi nhà như sau: (n = 7)
Giá bán (Y - tỷ đồng/căn) 2.3 1.8 5 4.2 2.7 3.6 3.3 Diện tích (X - m2) 135 70 350 215 150 280 200
a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘 = 𝟏, 𝟎𝟔𝟑 + 𝟎, 𝟎𝟏𝟏𝐗
Ý nghĩa: b = 0,011, trong điều kiện các yếu tố khác không thay đổi, nếu diện tích ngôi nhà
tăng 1m thì giá bán nhà trung bình tăng 0,011 tỷ đồng/căn (hay 11 triệu đồng/căn).
Hệ số tương quan r ≈ 0,933 → Hệ số xác định R ≈ 0,8699
Giải thích: Hệ số xác định 𝐑𝟐 (SV tự xem lại slide bài giảng để phát biểu)
b) Với mức ý nghĩa 1%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết H: R = 0 H  : R ≠ 0
(Nếu chấp nhận 𝐇 thì mô hình hồi quy hai biến không phù hợp. Nếu bác bỏ thì mô 𝟎 𝐇𝟎
hình hồi quy hai biến phù hợp)
Hệ số tương quan r ≈ 0,933 → Hệ số xác định R ≈ 0,8699
Vì k = 2 → Giá trị kiểm định F = () = () = ,() ≈ 33,432 ()()  ,
Mức ý nghĩa α = 0,01, tra bảng Fisher: F
(1; n − 2) = F,(1; 5) = 16,258 7
Vì F > F,(1; 5) nên ta bác bỏ H 
Vậy với mức ý nghĩa 1%, mô hình hồi quy hai biến phù hợp.
c) Với mức ý nghĩa 5%, diện tích có thực sự là yếu tố tác động đến giá nhà hay
không? Phần giải dưới đây là để tham khảo, SV hoàn toàn có đưa bài toán về Kiểm
định mô hình để thay thế
Từ phương trình quy hồi mẫu: 𝐘 = 𝟏, 𝟎𝟔𝟑 + 𝟎, 𝟎𝟏𝟏𝐗
→ Ta được bảng giá trị sau 𝐗𝐢 135 70 350 215 150 280 200 𝐘𝐢 2,3 1,8 5 4,2 2,7 3,6 3,3 𝐘𝐢 2,548 1,833 4,913 3,428 2,713 4,143 3,263 → SSE = ∑ 
 Y − Y = 0,962533 → s =  = , ≈ 0,439  
S ≈ 93,764 se(b) =  = , ≈ 0,001911 .√ ,.√
Lập giả thuyết H: β = 0 H : β ≠ 0
(Nếu chấp nhận 𝐇 thì diện tích không thực sự là yếu tố tác động đến giá nhà. Nếu bác bỏ 𝟎
𝐇𝟎 thì diện tích là yếu tố tác động đến giá nhà)
Giá trị kiểm định t =  = , ≈ 5,756 () ,
Tra bảng Student: t󰇡; = t(;,) = 2,571 󰇢 Vì |t| > t nên ta bác bỏ (;,) H
Vậy với mức ý nghĩa 5%, diện tích thực sự là yếu tố tác động đến giá nhà 8
6. Khảo sát về số km đã đi (km) và số tiền phải trả (nghìn đồng) khi sử dụng xe grab, ta
có bảng số liệu sau: Số km (X) 1 2 3 5 7 8 9 10 Số tiền phải trả (Y) 10 13 18 28 36 39 41 47 SUMMARY OUTPUT Regression Statistics Multiple R 0.996640573 R Square 0.993292432 Adjusted R Square 0.992174504 Standard Error 1.231223082 Observations 8 ANOVA Significance df SS MS F F Regression 1
1346.904538 1346.9045 888.512044 9.45454E-08 Residual 6 9.095461659 1.5159103 Total 7 1356 Standard Coefficients Error t Stat P-value Lower 95% Upper 95% Intercept 5.901408451
0.888808985 6.6396814 0.00056327 3.726571212 8.076245689 X 4.106416275
0.137762594 29.807919 9.4545E-08 3.769323351 4.4435092
a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘 = 𝟓, 𝟗𝟎𝟏 + 𝟒, 𝟏𝟎𝟔𝐗
Ý nghĩa: b = 4,106, trong điều kiện các yếu tố khác không thay đổi, nếu đường đi tăng 1km
thì số tiền phải trả khi sử dụng xe grab tăng trung bình 4,106 nghìn đồng.
Giải thích hệ số xác định R = R Square = 0.993292432 (?)
b) Với mức ý nghĩa 5%, mô hình hồi quy hai biến có phù hợp hay không? (n = 8)
Lập giả thuyết H: R = 0 H  : R ≠ 0
(Nếu chấp nhận 𝐇 thì mô hình hồi quy hai biến không phù hợp. Nếu bác bỏ thì mô 𝟎 𝐇𝟎
hình hồi quy hai biến phù hợp) 9
Theo đề ta có: Hệ số tương quan r ≈ 0,997, hệ số xác định R ≈ 0,993
Từ bảng kết quả hồi quy, ta có giá trị kiểm định F ≈ 888,512
Mức ý nghĩa α = 0,05, tra bảng Fisher: F
(1; n − 2) = F,(1; 6) = 5,987
Vì F > F,(1; 6) nên ta bác bỏ H 
Vậy với mức ý nghĩa 5%, mô hình hồi quy hai biến phù hợp.
c) Hãy dự báo số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%.
Từ phương trình quy hồi mẫu → Y = 5,901 + 4,106.12 = 55,173 (nghìn đồng)
Tra bảng Student: t󰇡; = t(;,) = 3,707 󰇢
𝐬𝐞 ≈ 𝟏, 𝟐𝟑𝟏 với (s là Standard Error)
X = 5,625 ; S  ≈ 11,411
Nếu đề không cho Standard Error mà cho SS Residual = SSE (vị trí giao giữa hàng Residual
và cột SS trong bảng ANOVA của kết quả hồi quy ở trên) thì ta có thể tính Se như sau:
→ s =  = , ≈ 1,23122  
Theo công thức: seY = s.  + ()
+ (,) ≈ 0,98 
() = 1,231.    ().,
Vậy số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%:
󰇡𝑌 − 𝑡(;,).𝑠𝑒𝑌; 𝑌 + 𝑡(;,).𝑠𝑒𝑌󰇢
= (55,173 − 3,707.0,98; 55,173 + 3,707.0,98) ≈ (51,54; 58,806) 10