










Preview text:
lOMoAR cPSD| 58968769
BÀI GIẢI THAM KHẢO cho
BÀI TẬP ÔN THI MÔN TKUD HK 24.2A BÀI TẬP ÔN TẬP
1. Khảo sát chi tiêu (triệu đồng / tháng) của một số sinh viên trường đại học B, người ta
ghi được bảng số liệu sau: BÀI NÀY DỄ NÊN SV TỰ GIẢI 2,5 2,8 3 3,5 3,6 3,5 4 4,2 4,8 3,6 4 4,5 4,4 3,5 3,8 4 4,5 5 5,2 3,8
a) Hãy ước lượng chi tiêu trung bình của sinh viên trường B với độ tin cậy 95%, biết chi tiêu có phân phối chuẩn.
b) Ở mức ý nghĩa 1% có thể nói rằng: “Trung bình mỗi sinh viên trường B chi tiêu 4 triệu đồng /
tháng” được hay không?
2. Điều tra doanh thu bán gạo (triệu đồng/ngày) của một số đại lý tại TpHCM, người ta
ghi được bảng số liệu sau đây: (100 đại lý → n = 100) Doanh thu 38 – 40 40 – 42 42 – 44 44 – 46
46 – 48 48 – 50 (Trị số giữa) 39 41 43 45 47 49 Số đại lý 9 12 16 18 25 20
a) Những đại lý có doanh thu trên 46tr đồng/ngày là đại lý có doanh thu cao. Hãy ước
lượng tỷ lệ đại lý có doanh thu cao ở TpHCM với độ tin cậy 95%.
Gọi P là tỉ lệ đại lý có doanh thu cao ở TpHCM. Khoảng ước lượng của P là:
P ∈ (̅P − ε; ̅P + ε), trong đó: ̅P Độ tin cậy 95% →
→ Z = 1,96 (Tra bảng Laplace) Độ chính xác
Vậy khoảng ước lượng của tỉ lệ đại lý có doanh thu cao ở TpHCM là: 1 lOMoAR cPSD| 58968769
P ∈ (0,45 ± 0,0975) → P ∈ (0,3525; 0,5475)
b) Hãy ước lượng doanh thu trung bình của các đại lý bán gạo tại TpHCM với độ tin cậy 97%.
Gọi là doanh thu trung bình của các đại lý bán gạo tại TpHCM. Khoảng ước lượng của là: μ ∈ (̅X − ε;̅X + ε)
Bấm máy tính theo bảng tần số của trị số giữa (ở trên) ta được: ̅X = 44,96 S ≈ 3,178 Độ
tin cậy 97% → 1 − α = 0,97 → φ (Z ) =
0,97 = 0,485 → Z = 2,17 (Tra bảng Laplace) 2 Độ chính xác
Vậy khoảng ước lượng của doanh thu trung bình là:
μ ∈ (44,96 ± 0,69) μ ∈ (44,27;45,65) c)
Muốn sai số khi ước lượng doanh thu trung bình của các đại lý đó không vượt
quá 400.000 đồng/ ngày và độ tin cậy 98% thì cần khảo sát thêm bao nhiêu đại lý nữa?
Độ tin cậy 98% → 1 − α = 0,98 → φ (Z ) = 0,98 = 0,49 → Z = 2,33 (Tra bảng Laplace) 2
Sai số không vượt quá 400.000 đồng/ngày → ε = 0,4 triệu đồng/ngày Z2α.S2 2 2 n′ chọn n’ = 343
Vậy cần khảo sát thêm 343 – 100 = 243 đại lý nữa. d)
Ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo
tại TpHCM là 45,5tr đồng/ngày được không?
Ta kiểm tra giả thuyết {H0: μ = 45,5 H1:μ ≠ 45,5 ̅X = 44,96 S ≈ 3,178 Giá trị kiểm định Z
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ (Z ) == 1 −0,05 = 0,475 2 → 𝑍𝛼 = 1,96 2 2 lOMoAR cPSD| 58968769
Vì |Z| < Z nên ta chấp nhận H0
Vậy ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại TpHCM là 45,5tr đồng/ngày.
e) Có ý kiến cho rằng “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý
nghĩa 1%”, hãy nhận xét về ý kiến này.
Gọi P là tỷ lệ đại lý bán gạo tại TpHCM có doanh thu cao
→ Ta kiểm tra giả thuyết {H0: P = 0,5 H1:P ≠ 0,5
n = 100 ; ̅P = 0,45 (câu a) Giá trị kiểm định Z
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ (Z ) == 1 −0,01 = 0,495 2 →𝑍𝛼 = 2,58 2
Vì |Z| < Z nên ta chấp nhận H0
Vậy ta chấp nhận ý kiến “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý nghĩa 1%”.
3. Khảo sát thu nhập (triệu đồng/tháng) của một số công nhân (CN) nam, nữ nhà máy X,
người ta thu được kết quả sau: ≥ 15 Thu nhập 5 – 7 7 – 9 9 – 11 11 – 13 13 – 15 (Trị số giữa) 6 8 10 12 14 𝟏𝟔 Số CN nữ 10 14 18 26 20 12 Số CN nam 6 14 24 28 16 8
a) Hãy ước lượng thu nhập trung bình của công nhân nhà máy X với độ tin cậy 95%.
Ta có bảng tần số (số CN cả nữ và nam trong mỗi tổ) theo trị số giữa như sau: Thu nhập 6 8 10 12 14 16 (Trị số giữa) Số CN 16 28 42 54 36 20
Cỡ mẫu n = n1 + n2 = nnữ + nnam = 100 + 96 = 196 3 lOMoAR cPSD| 58968769
Gọi là thu nhập trung bình của công nhân nhà máy X. Khoảng ước lượng của là: μ ∈ (̅X − ε; ̅X + ε)
Từ số liệu trên, ta tính được: ̅X ≈ 11,286 S ≈ 2,825 Độ tin cậy 95% →
→ Z = 1,96 (Tra bảng Laplace) Độ chính xác: 2
Vậy khoảng ước lượng của là: μ ∈ (11,286 ± 0,396) μ ∈ (10,89;11,682)
b) Những công nhân có thu nhập trên 13tr đồng/tháng là thu nhập cao. Hãy ước lượng tỷ
lệ công nhân có thu nhập cao của nhà máy X với độ tin cậy 97%.
Gọi P là tỷ lệ công nhân có thu nhập cao của nhà máy X. Khoảng ước lượng của P là:
P ∈ (̅P − ε; ̅P + ε), trong đó: ̅P Độ tin cậy 97% →
→ Z = 2,17 (Tra bảng Laplace) Độ chính xác
Vậy khoảng ước lượng của P là: P ∈ (0,286 ± 0,07) → P ∈ (0,216; 0,356)
c) Ở mức ý nghĩa 2%, hãy so sánh tỷ lệ công nhân có thu nhập cao của nữ và nam. (trên
13tr đồng/tháng, 100 CN nữ → 𝐧𝟏 = 𝟏𝟎𝟎 & 96 CN nam → 𝐧𝟐 = 𝟗𝟔)
Gọi P1 là tỷ lệ công nhân có thu nhập cao của nữ
Gọi P2 là tỷ lệ công nhân có thu nhập cao của nam
→ Ta kiểm định giả thuyết {H0: P1 = P2 H1: P1 ≠ P2
(Nếu chấp nhận 𝐇𝟎 thì tỷ lệ CN có thu nhập cao của nữ và nam là như nhau. Nếu bác bỏ
𝐇𝟎 thì tỷ lệ CN có thu nhập cao của nữ và nam có chênh lệch nhau.)
P̂0 = 1P̅1 + n2P̅2 = 100.0,32 + 96.0,25 = 56 ≈ 0,286 n n1 + n2 100 + 96 196 Giá trị kiểm định Z 4 lOMoAR cPSD| 58968769
Từ mức ý nghĩa 0,02, tra bảng hàm số Laplace → → 𝑍𝛼 = 2,33 2
Vì |Z| < Z nên ta chấp nhận H0
Vậy ở mức ý nghĩa 2%, tỷ lệ công nhân có thu nhập cao của nữ và nam là như nhau.
d) Ở mức ý nghĩa 1%, có thể nói rằng thu nhập trung bình của công nhân nam nhà máy
X là 12tr đồng/tháng được không? (n = 96)
Ta kiểm tra giả thuyết {H0: μ𝑛𝑎𝑚 = 12 H1:μ𝑛𝑎𝑚 ≠ 12
̅X ≈ 11,208 S ≈ 2,651 [có thể ký hiệu nam hoặc 2 để phân biệt giá trị trung bình và độ
lệch chuẩn cho mẫu gồm cả nữ lẫn nam] 𝑛ℎư 𝑘ý ℎ𝑖ệ𝑢 ở 𝑐â𝑢 𝑒 𝑏ê𝑛 𝑑ướ𝑖 Giá trị kiểm định Z
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ (Z ) == 1 −0,01 = 0,495 2 → 𝑍𝛼 = 2,58 2
Vì |Z| > Z nên ta bác bỏ H0.
Vậy ở mức ý nghĩa 1%, không thể nói rằng thu nhập trung bình của công nhân nam nhà máy X là 12tr đồng/tháng.
e) Ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà
máy X là như nhau hay không? (𝐧𝟏 = 𝟏𝟎𝟎, 𝐧𝟐 = 𝟗𝟔)
Gọi μ1 là thu nhập trung bình của công nhân nữ
Gọi μ2 là thu nhập trung bình của công nhân nam
→ Ta cần kiểm định giả thuyết {H0: μ1 = μ2 H1: μ1 ≠ μ2
(Nếu chấp nhận 𝐇𝟎 thì thu nhập trung bình của CN nữ và nam nhà máy X là như nhau.
Nếu bác bỏ 𝐇𝟎 thì thu nhập trung bình của CN nữ và nam nhà máy X có chênh lệch nhau.)
Từ bảng số liệu ban đầu, ta tính được:
̅X1 = 11,36 ; S1 ≈ 2,993 ; ̅X2 = 11,208 ; S2 ≈ 2,651 5 lOMoAR cPSD| 58968769 Giá trị kiểm định Z
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ (Z ) == 1 −0,05 = 0,475 2 →𝑍𝛼 = 1,96 2
Vì |Z| < Z nên ta chấp nhận H0
Vậy ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà máy X là như nhau.
4. Khảo sát tuổi thọ của một loại sản phẩm do 3 nhà máy A, B, C sản xuất (đơn vị tính: năm),
người ta ghi được số liệu sau đây: Nhà máy A Nhà máy B Nhà máy C 3 4 6 3.5 3 6.5 4 4.5 5 4 3.5 4.5 4.5 5 5.5 5 5.5 6.5 5.5 6 5 5.5 6 6 6 5 4 6.2 4 4.5
Giả sử tuổi thọ của sản phẩm do ba nhà máy sản xuất có phân phối chuẩn với phương
sai bằng nhau. Ở mức ý nghĩa 5%, hãy kiểm định ý kiến cho rằng có sự khác biệt về
tuổi thọ trung bình của sản phẩm do ba nhà máy A, B, C sản xuất.
Để giải bài này, các bạn xem lại VD trong giáo trình (phần Phân tích phương sai - ANOVA) hoặc
trong slide bài giảng ANOVA. Làm tuần tự các bước như lời giải trong giáo trình (hoặc slides) và
dò kết quả chạy ANOVA từ phần mềm Excel dưới đây: 6 lOMoAR cPSD| 58968769 Anova: Single Factor SUMMARY Groups Count Sum Average Variance Nhà máy A 10 47.2 4.72 1.184 Nhà máy B 10 46.5 4.65 1.058333333 Nhà máy C 10 53.5 5.35 0.780555556 ANOVA
Source of Variation SS df MS F P-value F crit Between Groups 2.972666667
2 1.486333333 1.475079027 0.246617 3.354131 Within Groups 27.206 27 1.00762963 Total 30.17866667 29
Tương ứng các giá trị tính ra ở phần ANOVA trong bảng trên với các ký hiệu ở hình dưới đây:
5. Công ty bất động sản muốn dự báo giá bán ngôi nhà dựa vào diện tích của ngôi nhà tại
khu vực A. Dữ liệu thu được của 7 ngôi nhà như sau: (n = 7)
Giá bán (Y - tỷ đồng/căn) 2.3 1.8 5 4.2 2.7 3.6 3.3 Diện tích (X - m2) 135 70 350 215 150 280 200
a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định. 7 lOMoAR cPSD| 58968769
Phương trình quy hồi tuyến tính mẫu: 𝐘̂ = 𝟏,𝟎𝟔𝟑 + 𝟎, 𝟎𝟏𝟏𝐗
Ý nghĩa: b1 = 0,011, trong điều kiện các yếu tố khác không thay đổi, nếu diện tích ngôi nhà
tăng 1m2 thì giá bán nhà trung bình tăng 0,011 tỷ đồng/căn (hay 11 triệu đồng/căn). Hệ số
tương quan rxy ≈ 0,933 → Hệ số xác định R2 ≈ 0,8699
Giải thích: Hệ số xác định 𝐑𝟐 (SV tự xem lại slide bài giảng để phát biểu)
b) Với mức ý nghĩa 1%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết {HH01:: RR22 =≠ 00
(Nếu chấp nhận 𝐇𝟎 thì mô hình hồi quy hai biến không phù hợp. Nếu bác bỏ 𝐇𝟎 thì mô hình
hồi quy hai biến phù hợp)
Hệ số tương quan rxy ≈ 0,933 → Hệ số xác định R2 ≈ 0,8699 2 2
Vì k = 2 → Giá trị kiểm định F 1−
Mức ý nghĩa α = 0,01, tra bảng Fisher: Fα(1;n − 2) = F0,01(1;5) = 16,258
Vì F > F0,01(1;5) nên ta bác bỏ H0
Vậy với mức ý nghĩa 1%, mô hình hồi quy hai biến phù hợp.
c) Với mức ý nghĩa 5%, diện tích có thực sự là yếu tố tác động đến giá nhà hay không?
Phần giải dưới đây là để tham khảo, SV hoàn toàn có đưa bài toán về Kiểm định mô
hình để thay thế
Từ phương trình quy hồi mẫu: 𝐘̂ = 𝟏,𝟎𝟔𝟑 + 𝟎, 𝟎𝟏𝟏𝐗
→ Ta được bảng giá trị sau 𝐗𝐢 135 70 350 215 150 280 200 𝐘̂𝐢 2,3 1,8 5 4,2 2,7 3,6 3,3 𝐘̂ 𝐢 2,548 1,833 4,913 3,428 2,713 4,143 3,263
→ SSE = ∑i(Yi − Yi)2 = 0,962533 → se 8 lOMoAR cPSD| 58968769 SX ≈ 93,764 se(b1) s X
Lập giả thuyết {H0: β1 = 0 H1: β1 ≠ 0
(Nếu chấp nhận 𝐇𝟎 thì diện tích không thực sự là yếu tố tác động đến giá nhà. Nếu bác bỏ
𝐇𝟎 thì diện tích là yếu tố tác động đến giá nhà) Giá trị kiểm định t se(b1) 0,001911 Tra bảng Student: t
Vì |t| > t(5;0,025) nên ta bác bỏ H0
Vậy với mức ý nghĩa 5%, diện tích thực sự là yếu tố tác động đến giá nhà
6. Khảo sát về số km đã đi (km) và số tiền phải trả (nghìn đồng) khi sử dụng xe grab, ta có
bảng số liệu sau: Số km (X) 1 2 3 5 7 8 9 10 Số tiền phải trả (Y) 10 13 18 28 36 39 41 47 SUMMARY OUTPUT Regression Statistics Multiple R 0.996640573 R Square 0.993292432 Adjusted R Square 0.992174504 Standard Error 1.231223082 Observations 8 ANOVA Significance F SS df MS F Regression 1
1346.904538 1346.9045 888.512044 9.45454E-08 9 lOMoAR cPSD| 58968769 Residual 6 9.095461659 1.5159103 Total 7 1356 Standard Coefficients Error t Stat P-value Lower 95% Upper 95% Intercept
5.901408451 0.888808985 6.6396814 0.00056327 3.726571212 8.076245689 X
4.106416275 0.137762594 29.807919 9.4545E-08 3.769323351 4.4435092
a) Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘̂ = 𝟓,𝟗𝟎𝟏 + 𝟒, 𝟏𝟎𝟔𝐗
Ý nghĩa: b1 = 4,106, trong điều kiện các yếu tố khác không thay đổi, nếu đường đi tăng 1km thì
số tiền phải trả khi sử dụng xe grab tăng trung bình 4,106 nghìn đồng.
Giải thích hệ số xác định R2 = R Square = 0.993292432 (?)
b) Với mức ý nghĩa 5%, mô hình hồi quy hai biến có phù hợp hay không? (n = 8)
Lập giả thuyết {HH01:: RR22 =≠ 00
(Nếu chấp nhận 𝐇𝟎 thì mô hình hồi quy hai biến không phù hợp. Nếu bác bỏ 𝐇𝟎 thì mô hình
hồi quy hai biến phù hợp) Cách 1:
Theo đề ta có: Hệ số tương quan rxy ≈ 0,997, hệ số xác định R2 ≈ 0,993
Từ bảng kết quả hồi quy, ta có giá trị kiểm định F ≈ 888,512
Mức ý nghĩa α = 0,05, tra bảng Fisher: Fα(1;n − 2) = F0,05(1;6) = 5,987
Vì F > F0,05(1;6) nên ta bác bỏ H0 Cách 2:
Theo bảng kết quả hồi quy đề cho, ta có Pvalue(F), tức chính là Significance F, bằng 9.45454E-
08, hay có thể viết là Pvalue(F) = 9,455x10-8 < (=0,05) nên ta bác bỏ H0
KL: Vậy với mức ý nghĩa 5%, mô hình hồi quy hai biến phù hợp.
c) Hãy dự báo số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%.
Từ phương trình quy hồi mẫu → Y0 = 5,901 + 4,106.12 = 55,173 (nghìn đồng) 10 lOMoAR cPSD| 58968769
Tra bảng Student: t(n−k;α) = t(6;0,005) = 3,707 2
𝐬𝐞 ≈ 𝟏, 𝟐𝟑𝟏 với (se là Standard Error) ̅X
Nếu đề không cho Standard Error mà cho SS Residual = SSE (vị trí giao giữa hàng Residual và
cột SS trong bảng ANOVA của kết quả hồi quy ở trên) thì ta có thể tính Se như sau: → se Theo công thức: se
Vậy số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%:
(𝑌̂ 0 − 𝑡(5;0,025) .𝑠𝑒(𝑌̂ 𝑜); 𝑌̂ 0 + 𝑡(5;0,025) .𝑠𝑒(𝑌̂ 𝑜))
= (55,173− 3,707.0,98; 55,173 + 3,707.0,98) ≈ (51,54; 58,806) 11