Bài giải: Thống kê ứng dụng - Tài liệu tham khảo | Đại học Hoa Sen

Bài giải: Thống kê ứng dụng - Tài liệu tham khảo | Đại học Hoa Sen và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả

Trường:

Đại học Hoa Sen 4.8 K tài liệu

Thông tin:
10 trang 1 tháng trước

Bình luận

Vui lòng đăng nhập hoặc đăng ký để gửi bình luận.

Bài giải: Thống kê ứng dụng - Tài liệu tham khảo | Đại học Hoa Sen

Bài giải: Thống kê ứng dụng - Tài liệu tham khảo | Đại học Hoa Sen và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả

40 20 lượt tải Tải xuống
BÀI GIẢI THAM KHẢO cho
BÀI TẬP ÔN THI MÔN TK
BÀI TẬP LUYỆN TẬP
Khảo sát chi tiêu (triệu đồng / tháng) của một số sinh viên trường đại học B, người ta ghi
được bảng số liệu sau: DỄ NÊN SV TỰ GIẢI
a) Hãy ước lượng chi tiêu trung bình của sinh viên trường B với độ tin cậy 95%, biết chi tiêu
phân phối chuẩn.
b) Ở mức ý nghĩa 1% có thể nói rằng: “Trung bình mỗi sinh viên trường B chi tiêu 4 triệu đồng /
tháng” được hay không?
. Điều tra doanh thu bán gạo (triệu đồng/ngày) của một số đại lý tại TpHCM, người ta
ghi được bảng số liệu sau đây: (100 đại lý → n
(Trị số giữa)
Số đại lý
Những đại lý có doanh thu trên 46tr đồng/ngày là đại lý có doanh thu cao. Hãy ước
lượng tỷ lệ đại lý có doanh thu cao ở TpHCM với độ tin cậy 95%.
Gọi P là tỉ lệ đại lý có doanh thu cao ở TpHCM. Khoảng ước lượng của P là:
P P
(
ε;P
+ ε
)
, trong đó:
P
=
25+20
100
= 0,45
Độ tin cậy 95% → 1 α = 0, φ(Z95
α
2
) =
0,95
2
= 0, Z475
α
2
= 1,96 (Tra bảng Laplace)
Độ chính xác ε = Z
α
2
.
P
(1−P
)
n
= 1,96.
0,45(1−0,45)
100
0,0975
Vậy khoảng ước lượng của tỉ lệ đại lý có doanh thu cao ở TpHCM là:
P 0, P 0, ;0,
(
45 ± 0,0975
) (
3525 5475
)
b) Hãy ước lượng doanh thu trung bình của các đại lý bán gạo tại TpHCM với độ tin cậy
Gọi là doanh thu trung bình của các đại lý bán gạo tại TpHCM. Khoảng ước lượng của
μ X
(
ε;X
+ ε
)
Bấm máy tính theo bảng tần số của trị số giữa (ở trên) ta đượ
X
= 44 96 178, S 3,
Độ tin cậy 97% → 1 α = 0, φ(Z97
α
2
) =
0,97
2
= 0, Z485
α
2
= 2,17 (Tra bảng Laplace)
Độ chính xác ε = Z
α
2
.
S
n
= 2,17.
3,178
100
0,69
Vậy khoảng ước lượng của doanh thu
μ
(
44 96, ± 0, μ 69
)
(
44 27 45 65, ; ,
)
c) Muốn sai số khi ước lượng doanh thu trung bình của các đại lý đó không vượt quá
400.000 đồng/ ngày và độ tin cậy 98% thì cần khảo sát thêm bao nhiêu đại lý nữa?
Độ tin cậy 98% → 1 α = 0, φ(Z98
α
2
) =
0,98
2
= 0, Z49
α
2
= 2,33 (Tra bảng Laplace)
Sai số không vượt qu triệu đồng/ngàyđồng/ngày ε = 0,4
n
=
Z
α
2
2
.S
2
ε
2
=
2,33
2
.3,178
2
0,4
2
342,689 chọn n’ = 343
Vậy cần khảo sát thêm 343 – 100 = 243 đại lý nữa
Ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày được không?
Ta kiểm tra giả thuyết
{
H
0
:μ = ,545
H :μ ,5
1
45
X
= 44 96 178, S 3,
Giá trị kiểm định Z =
X
−μ
0
S
n =
44 45,96− ,5
3,
178
100 699 −1,
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ(Z
α
2
) =
1−α
2
=
1−0,05
2
= 0,475
𝑍
𝛼
2
= 1,96
|
Z
|
< Z
α
2
nên ta chấp nhận H
0
Vậy ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày
e) Có ý kiến cho rằng “ số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý Một nửa
nghĩa 1%”, hãy nhận xét về ý kiến này.
Gọi P là tỷ lệ đại lý bán gạo tại TpHCM có doanh thu cao
→ Ta kiểm tra giả thuyết
{
H
0
:P = 0,5
H :P 0,5
1
n = 100 ; P
= 0,45
Giá trị kiểm định Z =
P
−P
0
P (1−P
0 0
)
n =
0,
45−0,5
0,5(1−0,5)
100 = −1
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ(Z
α
2
) =
1−α
2
=
1−0,01
2
= 0,495
𝑍
𝛼
2
= 2,58
|
Z
|
< Z
α
2
nên ta chấp nhận H
0
Vậy ta chấp nhận ý kiến “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý
nghĩa 1%”
. Khảo sát thu nhập (triệu đồng/tháng) của một số công nhân (CN) nam, nữ nhà máy X,
người ta thu được kết quả sau:
𝟏𝟔
Hãy ước lượng thu nhập trung bình của công nhân nhà máy X với độ tin cậy 95%.
Ta có bảng tần số (số CN nữ và nam trong mỗi tổ) theo trị số giữa như sau:cả
16
ỡ mẫu n = n
nữ
Gọi thu nhập trung bình của công nhân nhà máy X. Khoảng ước lượng của
μ X
(
ε;X
+ ε
)
Từ số liệu trên, ta tính được: X
11 286 825, S 2,
Độ tin cậy 95% → 1 α = 0, φ(Z95
α
2
) =
0,95
2
= 0, Z475
α
2
= 1,96 (Tra bảng Laplace)
Độ chính xác ε = Z
α
2
.
S
n
= 1,96.
2,825
196
0,396
Vậy khoảng ước lượn của
μ
(
11 286, ± 0,396
)
μ
(
10 89 11 682, ; ,
)
Những công nhân có thu nhập trên 13tr đồng/tháng là thu nhập cao. Hãy ước lượng tỷ
lệ công nhân có thu nhập cao của nhà máy X với độ tin cậy 97%.
Gọi P là tỷ lệ công nhân có thu nhập cao của nhà máy X. Khoảng ước lượng của P là:
P P
(
ε;P
+ ε
)
, trong đó:
P
=
20 16 12+ + + 8
196
=
56
196
0,286
Độ tin cậy 9 % → 1 α = 0, φ(Z97
α
2
) =
0,97
2
= 0, Z485
α
2
= 2,17 (Tra bảng Laplace)
Độ chính xác ε = Z
α
2
.
P
(1−P
)
n
= 2,17.
0,286(1−0,286)
196
0,07
Vậy khoảng ước của P là:
lượng P 0, 0, ;0,
(
286 ± 0, P 07
) (
216 356
)
Ở mức ý nghĩa 2%, hãy so sánh tỷ lệ công nhân có thu nhập cao của nữ và nam.
13tr đồng/tháng 100 CN nữ 𝐧 𝟏𝟎𝟎
𝟏
= 𝐧
𝟐
= 𝟗𝟔
Gọi
P
1
là tỷ lệ công nhân có thu nhập cao của nữ
Gọi
P
2
là tỷ lệ công nhân có thu nhập cao của nam
→ Ta kiểm định giả thuyết
{
H
0
:P
1
= P
2
H :P
1 1
P
2
(Nếu chấp nhận thì tỷ lệ CN có thu nhập cao của nữ và nam là như nhau. Nếu bác bỏ 𝐇
𝟎
𝐇
𝟎
thì tỷ lệ CN có thu nhập cao của nữ và nam có chênh lệch nhau
P
1
=
20+12
100
= 0, P32
2
=
16+8
96
= 0,25
P
0
=
n
1
P
1
+ n
2
P
2
n + n
1 2
=
100 32 96 25.0, + .0,
100
+ 96
=
56
196
0,286
Giá trị kiểm định
Z =
P
1
−P
2
P
0
(1−P
0
)(
1
n
1
+
1
n
2
)
=
0, −0,32 25
√0, (1−0,286 286)(
1
100
+
1
96
)
1,084
Từ mức ý nghĩa 0,02, tra bảng hàm số Laplace → φ(Z
α
2
) =
1−α
2
=
1−0,02
2
= 0,49 𝑍
𝛼
2
= 2,33
|
Z
|
< Z
α
2
nên ta chấp nhận H
0
Vậy mức ý nghĩa 2%, tỷ lệ công nhân có thu nhập cao của nữ và nam là như
Ở mức ý nghĩa 1%, có thể nói rằng thu nhập trung bình của công nhân nam nhà máy
X là 12tr đồng/tháng được không?
Ta kiểm tra giả thuyết
{
H
0
:μ
𝑛𝑎𝑚
= 12
H :μ
1 𝑛𝑎𝑚
12
X
11 208 651, S 2,
để trung bình và đ
𝑛ℎư 𝑘ý ℎ𝑖ệ𝑢 ở 𝑐â𝑢 𝑒 𝑏ê𝑛 𝑑ướ𝑖
Giá trị kiểm định Z =
X
−μ
0
S
n =
11 208 12,
2,
651
96 927 −2,
Từ mức ý nghĩa , tra bảng hàm số Laplace → φ (Z
α
2
) =
1−α
2
=
1−0,01
2
= 0,495
𝑍
𝛼
2
= 2,58
|
Z
|
> Z
α
2
bác bỏ H
0
Vậy ở mức ý nghĩa 1%, không thể nói rằng thu nhập trung bình của công nhân nam nhà máy X
là 12tr đồng/tháng
Ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà
máy X là như nhau hay không? 𝐧 𝟏𝟎𝟎
𝟏
= 𝐧
𝟐
= 𝟗𝟔
Gọi là thu nhập trung bình của công nhân nữμ
1
Gọi là thu nhập trung bình của công nhân namμ
2
→ Ta cần kiểm định giả thuyết
{
H
0
:μ
1
= μ
2
H :μ μ
1 1 2
(Nếu chấp nhận thu nhập trung bình của CN nữ nam nhà máy X như nhau𝐇
𝟎
Nếu bác bỏ thì thu nhập trung bình của CN nữ và nam nhà máy X có chênh lệch nhau𝐇
𝟎
Từ bảng số liệu ban đầu, ta tính được:
X
1
= 11 36 993, ; S
1
2, X
2
= 11 208 651, ; S
2
2,
Giá trị kiểm định
Z =
X
1
−X
2
S
1
2
n
1
+
S
2
2
n
2
=
11 36 11 208, ,
2,993
2
100
+
2,651
2
96
0,377
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ(Z
α
2
) =
1−α
2
=
1−0,05
2
= 0,475
𝑍
𝛼
2
= 1,96
|
Z
|
< Z
α
2
nên ta chấp nhận H
0
Vậy ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà máy
X là như nhau
Khảo sát tuổi thọ của một loại sản phẩm do 3 nhà máy A, B, C sản xuất (đơn vị
năm), người ta ghi được số liệu sau đây:
Giả sử tuổi thọ của sản phẩm do ba nhà máy sản xuất có phân phối chuẩn với phương
sai bằng nhau. Ở mức ý nghĩa 5%, hãy kiểm định ý kiến cho rằng có sự khác biệt về
tuổi thọ trung bình của sản phẩm do ba nhà máy A, B, C sản xuất.
Để giải bài này, các bạn xem lại VD trong giáo trình (phần Phân tích phương sai
mà GV đã hướng dẫn cách tính cụ thể trong buổi học tuần 1 . Làm tuần tự các bước như lời
giải trong giáo trình và dò kết quả chạy ANOVA trong Excel dưới đây:
Anova: Single Factor
SUMMARY
Groups
Count
Sum
Average
Variance
Nhà máy A
10
47.2
4.72
1.184
Nhà máy B
10
46.5
4.65
1.058333333
Nhà máy C
10
53.5
5.35
0.780555556
ANOVA
Source of Variaon
SS
df
MS
F
P-value
F crit
Between Groups
2.972666667
2
1.486333333
1.475079027
0.246617
3.354131
Within Groups
27.206
27
1.00762963
Total
30.17866667
29
Tương ứng các giá trị tính ra ở phần ANOVA trong bảng trên với các ký hiệu ở hình dưới đây:
Công ty bất động sản muốn dự báo giá bán ngôi nhà dựa vào diện tích của ngôi nhà tại
khu vực A. Dữ liệu thu được của 7 ngôi nhà như sau:
tỷ đồng/căn)
Diện tích (X
Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘
= 𝟏, 𝟎,𝟎𝟔𝟑 + 𝟎𝟏𝟏𝐗
Ý nghĩa: điều kiện các yếu tố khác không thay đổi, nếu diện tích ngôi nhà b = 0,
1
011
tăng tăng 0,011 tỷ đồng/căn ( 11 triệu đồng/căn)1m
2
Hệ số tương quan → Hệ số xác định r 0,
xy
933 R 0,
2
8699
Giải thích: Hệ số xác định 𝐑
𝟐
(SV tự xem lại slide bài giảng để phát biểu
Với mức ý nghĩa 1%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết
{
H
0
:R
2
= 0
H :R 0
1
2
(Nếu chấp nhận thì hình hồi quy hai biến không phù hợp. Nếu bác bỏ 𝐇
𝟎
𝐇
𝟎
hình hồi quy hai biến phù hợp)
Hệ số tương quan → Hệ số xác định r 0,
xy
933 R 0,
2
8699
→ Giá trị kiểm định F =
R
2
(n−k)
(1−R )(k−1)
2
=
R
2
(n−2)
1−R
2
=
0,8699(7−2)
1−0,8699
33,432
Mức ý nghĩa , tra bảng Fisher:
α = 0,01 F
α
(
1;n 2
)
= F
0,01
(
1;5
)
= 16 258,
F > F 1;5
0,01
( )
nên ta bác bỏ H
0
Vậy với mức ý nghĩa 1%, mô hình hồi quy hai biến phù hợp
Với mức ý nghĩa 5%, diện tích có thực sự là yếu tố tác động đến giá nhà hay
Phần giải dưới đây là để tham khảo, SV hoàn toàn có đưa bài toán về Kiểm
định mô hình như câu b để thay thế
Từ phương trình quy hồi mẫu: 𝐘
= 𝟏,𝟎𝟔𝟑 + 𝟎,𝟎𝟏𝟏𝐗
→ Ta được bảng giá trị sau
𝐗
𝐢
𝐘
𝐢
𝐘
𝐢
SSE =
(Y
i
Y
i
)
2
= 0,962533
i
s
e
=
SSE
n−k
=
0,962533
7−2
0,439
S
X
93 764, se b
(
1
)
=
s
e
S
X
.
n−1
=
0,439
93, .764
7−1
0,001911
Lập giả thuyết
{
H
0
:β
1
= 0
H :β 0
1 1
(Nếu chấp nhận thì diện tích không thực sự là yếu tố tác động đến giá nhà. Nếu bác bỏ 𝐇
𝟎
𝐇
𝟎
thì diện tích là yếu tố tác động đến giá nhà)
Giá trị kiểm định
t =
b
1
se
(
b
1
)
=
0,011
0,001911
5,756
Tra bảng Student: t
(n−k;
α
2
)
= t
(
5;0,025
)
= 2,571
|
t
|
> t
(
5;0,025
)
nên ta bác bỏ H
0
Vậy với mức ý nghĩa 5%, diện tích thực sự là yếu tố tác động đến giá nhà
Khảo sát về số km đã đi (km) và số tiền phải trả (nghìn đồng) khi sử dụng xe
có bảng số liệu sau:
Số km (
Số tiền phải trả
SUMMARY OUTPUT
Regression Stascs
Mulple R
0.996640573
R Square
0.993292432
Adjusted R Square
0.992174504
Standard Error
1.231223082
Observaons
8
ANOVA
df
SS
MS
F
Signicance
F
Regression
1
1346.904538
1346.9045
888.512044
9.45454E-08
Residual
6
9.095461659
1.5159103
Total
7
1356
Coecients
Standard
Error
t Stat
P-value
Lower 95%
Upper 95%
Intercept
5.901408451
0.888808985
6.6396814
0.00056327
3.726571212
8.076245689
X
4.106416275
0.137762594
29.807919
9.4545E-08
3.769323351
4.4435092
Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘
= 𝟓,𝟗𝟎𝟏 + 𝟒,𝟏𝟎𝟔𝐗
Ý nghĩa: điều kiện các yếu tố khác không thay đổi, nếu đường đi tăng 1kmb = 4,
1
106
số tiền phải trả khi sử dụng xe grab tăng đồng
Giải thích hệ số xác định R
2
giải thích như trong lide bài giảng
Với mức ý nghĩa 5%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết
{
H
0
:R
2
= 0
H :R 0
1
2
iải nghĩa cặp giả thuyết trên Nếu chấp nhận 𝐇
𝟎
thì mô hình hồi quy tuyến tính
biến không phù hợp. Nếu bác bỏ 𝐇
𝟎
thì mô hình hồi quy tuyến tính hai biến phù hợp
Theo đề ta có: Hệ số tương quan , hệ số xác định r 0,
xy
997 R 0,
2
993
Từ bảng kết quả hồi quy, ta có giá trị kiểm định F 888 512,
Mức ý nghĩa , tra bảng Fisher:
α = 0,05 F
α
(
1;n 2
)
= F
0,05
(
1;6
)
= 5,
987
F > F 1;6
0,05
( )
nên ta bác bỏ H
0
α nên ta bác bỏ H
0
Vậy với mức ý nghĩa %, mô hình hồi quy hai biến phù hợp
Hãy dự báo số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%.
Từ phương trình quy hồi mẫu → Y
0
= 5, + 4,901 106 12 55173. = , (nghìn đồng)
Tra bảng Student: t
(n−k;
α
2
)
= t
(
6;0,005
)
= 3,707
𝐬 𝟏,
𝐞
𝟐𝟑𝟏 với (s
e
X
= 5,625 ; S
X
2
11 411, hai giá trị này chúng ta vào mục thống 2 biến sau khi nhập
liệu để lấy, đối với máy tính asio 570 hoặc inacal thì lấy Độ lệch chuẩn hiệu chỉnh
để bình phương lên để có phương sai mẫu hiệu chỉnhtức S
X
2
Nếu đề (vị trí giao giữa hàng Residual
và cột SS trong bảng ANOVA của kết quả hồi quy ở trên) thì ta có thể tính Se như sau
s
e
=
SSE
n−k
=
0,909546
8−2
1,23122
Theo công thức: se(Y
0
) = s
e
.
1
n
+
(
X
−X
0
)
2
( )
n−1 S
X
2
= 1,231.
1
8
+
(
5,
625 12
)
2
( )
8−1 . ,11 411
0,98
Vậy số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%
(𝑌
0
t
(n−k;
α
2
)
.𝑠𝑒(𝑌
𝑜
);𝑌
0
+ t
(n−k;
α
2
)
.𝑠𝑒(𝑌
𝑜
))
=
(
55 173, 3,707.0,98 55 173; , + 3,707.0,98 51 54 58 806
)
(
, ; ,
)
| 1/10

Preview text:

BÀI GIẢI THAM KHẢO cho
BÀI TẬP ÔN THI MÔN TK
BÀI TẬP LUYỆN TẬP
Khảo sát chi tiêu (triệu đồng / tháng) của một số sinh viên trường đại học B, người ta ghi
được bảng số liệu sau:
DỄ NÊN SV TỰ GIẢI
a) Hãy ước lượng chi tiêu trung bình của sinh viên trường B với độ tin cậy 95%, biết chi tiêu có phân phối chuẩn.
b) Ở mức ý nghĩa 1% có thể nói rằng: “Trung bình mỗi sinh viên trường B chi tiêu 4 triệu đồng /
tháng” được hay không?
. Điều tra doanh thu bán gạo (triệu đồng/ngày) của một số đại lý tại TpHCM, người ta
ghi được bảng số liệu sau đây: (100 đại lý → n (Trị số giữa) Số đại lý
Những đại lý có doanh thu trên 46tr đồng/ngày là đại lý có doanh thu cao. Hãy ước
lượng tỷ lệ đại lý có doanh thu cao ở TpHCM với độ tin cậy 95%.
Gọi P là tỉ lệ đại lý có doanh thu cao ở TpHCM. Khoảng ước lượng của P là:
P ∈ (P − ε; P + ε), trong đó: P = 25+20 = 0,45 100
Độ tin cậy 95% → 1 − α = 0,95 → φ (Zα ) = 0,95 = 0,475 → Zα = 1,96 (Tra bảng Laplace) 2 2 2
Độ chính xác ε = Zα. √P(1−P) = 1,96. √0,45(1−0,45) ≈ 0,0975 2 n 100
Vậy khoảng ước lượng của tỉ lệ đại lý có doanh thu cao ở TpHCM là:
P ∈ (0,45 ± 0,0975) → P ∈ (0,352 ; 5 0,5475)
b) Hãy ước lượng doanh thu trung bình của các đại lý bán gạo tại TpHCM với độ tin cậy
Gọi  là doanh thu trung bình của các đại lý bán gạo tại TpHCM. Khoảng ước lượng của 
μ ∈ (X − ε; X + ε)
Bấm máy tính theo bảng tần số của trị số giữa (ở trên) ta đượ X = 44,96 S ≈ 3,178
Độ tin cậy 97% → 1 − α = 0,97 → φ (Zα ) = 0,97 = 0,485 → Zα = 2,17 (Tra bảng Laplace) 2 2 2
Độ chính xác ε = Zα. S = 2,17. 3,178 ≈ 0,69 2 √n √100
Vậy khoảng ước lượng của doanh thu
μ ∈ (44,96 ± 0,69)  μ ∈ (44,27; 45,65)
c) Muốn sai số khi ước lượng doanh thu trung bình của các đại lý đó không vượt quá
400.000 đồng/ ngày và độ tin cậy 98% thì cần khảo sát thêm bao nhiêu đại lý nữa?
Độ tin cậy 98% → 1 − α = 0,98 → φ (Zα ) = 0,98 = 0,49 → Zα = 2,33 (Tra bảng Laplace) 2 2 2 Sai số không vượt qu
đồng/ngày → ε = 0,4 triệu đồng/ngày Z2α.S2
n′ = 2 = 2,332.3,1782 ≈ 342,689  chọn n’ = 343 ε2 0,42
Vậy cần khảo sát thêm 343 – 100 = 243 đại lý nữa
Ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại
TpHCM là 45,5tr đồng/ngày được không? 45
Ta kiểm tra giả thuyết {H0: μ = ,5 H1:μ ≠ 45,5 X = 44,96 S ≈ 3,178
Giá trị kiểm định Z = X−μ0 √n = 44,96−45,5 √100 ≈ −1,699 S 3,178
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ (Zα) = 1−α = 1−0,05 = 0,475 2 2 2 → 𝑍𝛼 = 1,96 2
|Z| < Zα nên ta chấp nhận H0 2
Vậy ở mức ý nghĩa 5%, có thể cho rằng doanh thu trung bình của các đại lý bán gạo tại TpHCM là 45,5tr đồng/ngày
e) Có ý kiến cho rằng “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý
nghĩa 1%”, hãy nhận xét về ý kiến này.
Gọi P là tỷ lệ đại lý bán gạo tại TpHCM có doanh thu cao
→ Ta kiểm tra giả thuyết {H0: P = 0,5 H1:P ≠ 0,5 n = 100 ; P = 0,45
Giá trị kiểm định Z = P−P0 √n = 0,45−0,5 √100 = −1 √P0(1−P0) √0,5(1−0,5)
Từ mức ý nghĩa 0,01, tra bảng hàm số Laplace → φ (Zα) = 1−α = 1−0,01 = 0,495 2 2 2 →𝑍𝛼 = 2,58 2
|Z| < Zα nên ta chấp nhận H0 2
Vậy ta chấp nhận ý kiến “Một nửa số đại lý bán gạo tại TpHCM có doanh thu cao, ở mức ý nghĩa 1%”
. Khảo sát thu nhập (triệu đồng/tháng) của một số công nhân (CN) nam, nữ nhà máy X,
người ta thu được kết quả sau: Thu nhập (Trị số giữa) 𝟏𝟔 Số CN nữ Số CN nam
Hãy ước lượng thu nhập trung bình của công nhân nhà máy X với độ tin cậy 95%.
Ta có bảng tần số (số CN cả nữ và nam
trong mỗi tổ) theo trị số giữa như sau: Thu nhập 16 (Trị số giữa) Số CN ỡ mẫu n = n nữ Gọi 
thu nhập trung bình của công nhân nhà máy X. Khoảng ước lượng của 
μ ∈ (X − ε; X + ε)
Từ số liệu trên, ta tính được: X ≈ 11,286 S ≈ 2,825
Độ tin cậy 95% → 1 − α = 0,95 → φ (Zα ) = 0,95 = 0,475 → Zα = 1,96 (Tra bảng Laplace) 2 2 2
Độ chính xác ε = Zα. S = 1,96. 2,825 ≈ 0,396 2 √n √196
Vậy khoảng ước lượn của 
μ ∈ (11,286 ± 0,396)  μ ∈ (10,89; 11,682)
Những công nhân có thu nhập trên 13tr đồng/tháng là thu nhập cao. Hãy ước lượng tỷ
lệ công nhân có thu nhập cao của nhà máy X với độ tin cậy 97%.
Gọi P là tỷ lệ công nhân có thu nhập cao của nhà máy X. Khoảng ước lượng của P là:
P ∈ (P − ε; P + ε), trong đó: 20 + 16 + 12 + 8 56 P = 196 = 196 ≈ 0,286
Độ tin cậy 9 % → 1 − α = 0,97 → φ (Zα) = 0,97 = 0,485 → Zα = 2,17 (Tra bảng Laplace) 2 2 2
Độ chính xác ε = Zα . √P(1−P) = 2,17. √0,286(1−0,286) ≈ 0,07 2 n 196
Vậy khoảng ước lượng của P là: P ∈ (0,286 ± 0,07) → P ∈ (0,21 ; 6 0,356)
Ở mức ý nghĩa 2%, hãy so sánh tỷ lệ công nhân có thu nhập cao của nữ và nam.
13tr đồng/tháng 100 CN nữ → 𝐧𝟏 = 𝟏𝟎𝟎 𝐧𝟐 = 𝟗𝟔
Gọi P1 là tỷ lệ công nhân có thu nhập cao của nữ
Gọi P2 là tỷ lệ công nhân có thu nhập cao của nam
→ Ta kiểm định giả thuyết {H0: P1 = P2 H1:P1 ≠ P2
(Nếu chấp nhận 𝐇 thì tỷ lệ CN có thu nhập cao của nữ và nam là như nhau. Nếu bác bỏ 𝟎
𝐇𝟎 thì tỷ lệ CN có thu nhập cao của nữ và nam có chênh lệch nhau P 
1 = 20+12 = 0,32 P = 16+8 = 0,25 100 2 96 n 100.0,32 + 96.0,25 56 P 1P1  + n2P2 0 = n = 1 + n2 100 + 96 = 196 ≈ 0,286 −P 32 25 Giá trị kiểm định Z = P1 2 = 0, −0, ≈ 1,084 √P0
(1−P0)( 1n + 1 ) √0,28 (61−0,286)( 1 1 n2 100+ 196)
Từ mức ý nghĩa 0,02, tra bảng hàm số Laplace → φ (Zα) = 1−α = 1−0,02 = 0,49→ 𝑍𝛼 = 2,33 2 2 2 2
|Z| < Zα nên ta chấp nhận H0 2
Vậy ở mức ý nghĩa 2%, tỷ lệ công nhân có thu nhập cao của nữ và nam là như
Ở mức ý nghĩa 1%, có thể nói rằng thu nhập trung bình của công nhân nam nhà máy
X là 12tr đồng/tháng được không?
Ta kiểm tra giả thuyết {H0: μ𝑛𝑎𝑚 = 12 H1:μ𝑛𝑎𝑚 ≠ 12 X ≈ 11,208 S ≈ 2,651 để
ị trung bình và độ ả ữ ẫ
𝑛ℎư 𝑘ý ℎ𝑖ệ𝑢 ở 𝑐â𝑢 𝑒 𝑏ê𝑛 𝑑ướ𝑖
Giá trị kiểm định Z = X−μ0 √n = 11,208−12 ≈ −2, S √96 927 2,651 Từ mức ý nghĩa
, tra bảng hàm số Laplace → φ (Zα) = 1−α = 1−0,01 = 0,495 2 2 2 → 𝑍𝛼 = 2,58 2 |Z| > Zα bác bỏ H0 2
Vậy ở mức ý nghĩa 1%, không thể nói rằng thu nhập trung bình của công nhân nam nhà máy X là 12tr đồng/tháng
Ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà
máy X là như nhau hay không? 𝐧𝟏 = 𝟏𝟎𝟎 𝐧𝟐 = 𝟗𝟔
Gọi μ là thu nhập trung bình của công nhân nữ 1
Gọi μ là thu nhập trung bình của công nhân nam 2
→ Ta cần kiểm định giả thuyết {H0: μ1 = μ2 H1:μ1 ≠ μ2
(Nếu chấp nhận 𝐇
thu nhập trung bình của CN nữ và nam nhà máy X là như nhau 𝟎
Nếu bác bỏ 𝐇 thì thu nhập trung bình của CN nữ và nam nhà máy X có chênh lệch nhau 𝟎
Từ bảng số liệu ban đầu, ta tính được:
X1 = 11,36 ; S1 ≈ 2,993 X2 = 11,208 ; S2 ≈ 2,651 , − ,
Giá trị kiểm định Z = X1−X2 = 11 36 11 208 ≈ 0,377 2 2 √S1 √2,9932 n +S2 100 +2,6512 96 1 n2
Từ mức ý nghĩa 0,05, tra bảng hàm số Laplace → φ (Zα) = 1−α = 1−0,05 = 0,475 2 2 2 →𝑍𝛼 = 1,96 2
|Z| < Zα nên ta chấp nhận H0 2
Vậy ở mức ý nghĩa 5%, có thể nói rằng thu nhập trung bình của công nhân nữ và nam nhà máy X là như nhau
Khảo sát tuổi thọ của một loại sản phẩm do 3 nhà máy A, B, C sản xuất (đơn vị
năm), người ta ghi được số liệu sau đây:
Giả sử tuổi thọ của sản phẩm do ba nhà máy sản xuất có phân phối chuẩn với phương
sai bằng nhau. Ở mức ý nghĩa 5%, hãy kiểm định ý kiến cho rằng có sự khác biệt về
tuổi thọ trung bình của sản phẩm do ba nhà máy A, B, C sản xuất.
Để giải bài này, các bạn xem lại VD trong giáo trình (phần Phân tích phương sai
mà GV đã hướng dẫn cách tính cụ thể trong buổi học tuần 1 . Làm tuần tự các bước như lời
giải trong giáo trình và dò kết quả chạy ANOVA trong Excel dưới đây: Anova: Single Factor SUMMARY Groups Count Sum Average Variance Nhà máy A 10 47.2 4.72 1.184 Nhà máy B 10 46.5 4.65 1.058333333 Nhà máy C 10 53.5 5.35 0.780555556 ANOVA
Source of Varia on SS df MS F P-value F crit Between Groups 2.972666667
2 1.486333333 1.475079027 0.246617 3.354131 Within Groups 27.206 27 1.00762963 Total 30.17866667 29
Tương ứng các giá trị tính ra ở phần ANOVA trong bảng trên với các ký hiệu ở hình dưới đây:
Công ty bất động sản muốn dự báo giá bán ngôi nhà dựa vào diện tích của ngôi nhà tại
khu vực A. Dữ liệu thu được của 7 ngôi nhà như sau: tỷ đồng/căn) Diện tích (X
Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘 = 𝟏, 𝟎𝟔𝟑 + 𝟎, 𝟎𝟏𝟏𝐗 Ý nghĩa: b1 = 0,011
điều kiện các yếu tố khác không thay đổi, nếu diện tích ngôi nhà tăng 1m2
tăng 0,011 tỷ đồng/căn ( 11 triệu đồng/căn) Hệ số tương quan r 2
xy ≈ 0,933 → Hệ số xác định R ≈ 0,8699
Giải thích: Hệ số xác định 𝐑𝟐 (SV tự xem lại slide bài giảng để phát biểu
Với mức ý nghĩa 1%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết {H0: R2 = 0 H 2 1: R ≠ 0
(Nếu chấp nhận 𝐇 thì mô hình hồi quy hai biến không phù hợp. Nếu bác bỏ 𝟎 𝐇𝟎
hình hồi quy hai biến phù hợp) Hệ số tương quan r 2
xy ≈ 0,933 → Hệ số xác định R ≈ 0,8699
→ Giá trị kiểm định F = R2(n−k) = R2(n−2) = 0,8699(7−2) ≈ 33,432 (1−R2)(k−1) 1−R2 1−0,8699
Mức ý nghĩa α = 0,0 , tra bảng Fisher: 1
Fα(1;n − 2) = F0,01(1; 5) = 16,258
F > F0,01(1; 5) nên ta bác bỏ H0
Vậy với mức ý nghĩa 1%, mô hình hồi quy hai biến phù hợp
Với mức ý nghĩa 5%, diện tích có thực sự là yếu tố tác động đến giá nhà hay
Phần giải dưới đây là để tham khảo, SV hoàn toàn có đưa bài toán về Kiểm
định mô hình như câu b để thay thế
Từ phương trình quy hồi mẫu: 𝐘 = 𝟏, 𝟎𝟔𝟑 + 𝟎, 𝟎𝟏𝟏𝐗
→ Ta được bảng giá trị sau 𝐗𝐢 𝐘𝐢 𝐘𝐢
→ SSE = ∑i(Yi − Yi)2 = 0,962533 → se = √SSE = √0,962533 ≈ 0,439 n−k 7−2 SX ≈ 93,764 se(b1) = se = 0,439 ≈ 0,001911 SX.√n−1 93,76 . 4 √7−1
Lập giả thuyết {H0: β1 = 0 H1:β1 ≠ 0
(Nếu chấp nhận 𝐇 thì diện tích không thực sự là yếu tố tác động đến giá nhà. Nếu bác bỏ 𝟎
𝐇𝟎 thì diện tích là yếu tố tác động đến giá nhà)
Giá trị kiểm định t = b1 = 0,011 ≈ 5,756 se(b1) 0,001911
Tra bảng Student: t(n−k;α = t(5;0,025) = 2,571 2)
|t| > t(5;0,025) nên ta bác bỏ H0
Vậy với mức ý nghĩa 5%, diện tích thực sự là yếu tố tác động đến giá nhà
Khảo sát về số km đã đi (km) và số tiền phải trả (nghìn đồng) khi sử dụng xe
có bảng số liệu sau: Số km ( Số tiền phải trả SUMMARY OUTPUT Regression Sta s cs Mul ple R 0.996640573 R Square 0.993292432 Adjusted R Square 0.992174504 Standard Error 1.231223082 Observa ons 8 ANOVA Signi cance df SS MS F F Regression 1
1346.904538 1346.9045 888.512044 9.45454E-08 Residual 6 9.095461659 1.5159103 Total 7 1356 Standard Coe cients Error t Stat P-value Lower 95% Upper 95% Intercept 5.901408451
0.888808985 6.6396814 0.00056327 3.726571212 8.076245689 X 4.106416275
0.137762594 29.807919 9.4545E-08 3.769323351 4.4435092
Hãy viết phương trình hồi quy tuyến tính mẫu của Y theo X, nêu ý nghĩa của hệ số
góc và hệ số xác định.
Phương trình quy hồi tuyến tính mẫu: 𝐘 = 𝟓, 𝟗𝟎𝟏 + 𝟒, 𝟏𝟎𝟔𝐗 Ý nghĩa: b1 = 4,106
điều kiện các yếu tố khác không thay đổi, nếu đường đi tăng 1km
số tiền phải trả khi sử dụng xe grab tăng đồng
Giải thích hệ số xác định R2
giải thích như trong lide bài giảng
Với mức ý nghĩa 5%, mô hình hồi quy hai biến có phù hợp hay không?
Lập giả thuyết {H0: R2 = 0 H 2 1: R ≠ 0
iải nghĩa cặp giả thuyết trên Nếu chấp nhận 𝐇𝟎 thì mô hình hồi quy tuyến tính
biến không phù hợp. Nếu bác bỏ 𝐇𝟎 thì mô hình hồi quy tuyến tính hai biến phù hợp
Theo đề ta có: Hệ số tương quan r 2
xy ≈ 0,99 , hệ số xác định 7 R ≈ 0,993
Từ bảng kết quả hồi quy, ta có giá trị kiểm định F ≈ 888,512
Mức ý nghĩa α = 0,0 , tra bảng Fisher: 5
Fα(1;n − 2) = F0,05(1; 6) = 5,987
F > F0,05(1; 6) nên ta bác bỏ H0 α nên ta bác bỏ H0
Vậy với mức ý nghĩa %, mô hình hồi quy hai biến phù hợp
Hãy dự báo số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99%.
Từ phương trình quy hồi mẫu → Y0 = 5,901 + 4,106.12 = 55,173 (nghìn đồng)
Tra bảng Student: t(n−k;α = t(6;0,005) = 3,707 2)
𝐬𝐞 ≈ 𝟏, 𝟐𝟑𝟏 với (se
X = 5,625 ; S2 X ≈ 11,411 hai giá trị này chúng ta vào mục
thống kê 2 biến sau khi nhập liệu
để lấy, đối với máy tính asio 570 hoặc inacal thì lấy Độ lệch chuẩn hiệu chỉnh
để bình phương lên tức
để có phương sai mẫu hiệu chỉnh SX2 Nếu đề
(vị trí giao giữa hàng Residual
và cột SS trong bảng ANOVA của kết quả hồi quy ở trên) thì ta có thể tính Se như sau
→ se = √SSE = √0,909546 ≈ 1,23122 n−k 8−2 Theo công thức: se(Y − )2 0) = se. √1 + (X−X0)2 + (5,625 12 ≈ 0,98 n (n−1)S2 = 1,231. √1 X 8 (8−1).1 ,1411
Vậy số tiền trung bình phải trả cho xe grab nếu đi 12 km với độ tin cậy 99% (𝑌0 − t . 𝑠𝑒(𝑌 . 𝑠𝑒(𝑌 (n−k;α 𝑜); 𝑌0 + t 𝑜)) 2) (n−k;α2)
= (55,173 − 3,707.0,98; 55,173 + 3,707.0,98) ≈ (51,54; 58,806)