Bài tập phần thống kê
Bài 1: Có mẫu gồm 100 sinh viên trong 1 trường đại học có điểm môn toán được thống kê như
sau:
x
i
0
1
2
3
4
5
6
7
8
9
10
ni
2
1
1
2
10
14
25
20
14
8
3
a) Tính các đặc trưng số: trung bình, phương sai và độ lệch điều chỉnh của mẫu trên.
b) Ước lượng điểm trung bình môn Tn của các sinh viên ở trường đại học này với độ tin cậy
99%.
c) Các sinh viên có điểm môn Toán từ 8 điểm trở lên được xem là sinh viên khá Toán. Hãy ước
lượng tỷ lệ sinh viên khá Toán với độ tin cậy 98%.
d) Với mẫu trên, nếu muốn ước lượng điểm trung bình môn Toán có độ chính xác 0,4 điểm thì
độ tin cậy đạt được bao nhiêu phần trăm?
e) Với mẫu trên, nếu muốn ước lượng tỷ lệ các sinh viên khá Tn có độ chính xác 5% thì độ tin
cậy đạt được bao nhiêu phần trăm?
f) Nếu muốn ước lượng điểm trung bình môn Tn có độ chính xác 0,3 điểm và độ tin cậy 94%
thì cần khảo sát thêm bao nhiêu sinh viên nữa?
g) Nếu muốn ước lượng các sinh viên khá Toán có độ chính xác 5% và độ tin cậy 94% thì cần
khảo sát thêm bao nhiêu sinh viên nữa?
h) Ước lượng điểm trung bình môn Tn của các sinh viên khá Toán với độ tin cậy 95%, giả sử
điểm môn Tn của các sinh viên khá Toán có phân phối chuẩn.
i) Ước lượng phương sai điểm môn Tn của các sinh viên khá Toán với độ tin cậy 96%, giả sử
điểm môn Tn của các sinh viên khá Toán có phân phối chuẩn.
j) Theo thống kê tổng thể năm học trước đây của trường này, người ta thấy điểm số trung bình
môn toán của các sinh viên là 6,6 điểm. Hãy so sánh điểm số trung bình môn Toán của các
sinh viên ở 2 năm học, với mức ý nghĩa 3%.
k) Ban giám hiệu trường này cho rằng tỷ lệ sinh viên khá Toán của trường trong năm nay là
35%. Hãy cho nhận xét về đánh giá của ban giám hiệu, với mức ý nghĩa 6%. Tính p – value
tương ứng.
l) Kiểm định xem điểm môn Toán của sinh viên trường này có phân phối chuẩn hay không, với
mức ý nghĩa 5%.
Bài 2: Tuổi thọ của các bóng đèn do 1 nhà máy sản xuất là ĐLNN có phân phối chuẩn với tuổi
thọ trung bình là 1800 giờ và độ lệch chuẩn là 130 giờ. Chọn 1 mẫu gồm 100 bóng đèn để kiểm
tra. Tính xác suất để tuổi thọ trung bình 1 bóng đèn của mẫu thuộc khoảng (1774; 1813) giờ.
Bài 3: Xem tổng thể là tập hợp gồm 4 công ty du lịch A, B, C, D với lợi nhuận (tỷ đồng/năm)
lần lượt là 25, 27, 28, 30. Lấy mẫu ngẫu nhiên kích thước n = 2 từ tổng thể này theo phép chọn
không lặp. Lập bảng phân phối xác suất của trung bình mẫu ngẫu nhiên, từ đó tính phương sai
của trung bình mẫu ngẫu nhiên.
Bài 4: Khảo sát về thu nhập của 1 số người làm việc ở 1 công ty, ta có số liệu cho ở bảng sau:
Thu nhập (triệu đồng/tháng)
4 – 6
6 – 8
12 – 16
16 – 20
Số người
11
17
10
8
a) Những người có mức thu nhập từ 10 triệu đồng/tháng trở lên là những người có thu nhập
cao. Hãy ước lượng tỷ lệ những người có thu nhập cao của công ty này với độ tin cậy 97%.
b) Nếu muốn ước lượng thu nhập trung bình của 1 người ở công ty này với độ chính xác
= 0,57 triệu đồng/tháng thì độ tin cậy đạt được bao nhiêu phần trăm?
Bài 5: Theo dõi số lượng bán được về mặt hàng A trong 1 số ngày ở 1 siêu thị , ta có số liệu cho
dưới dạng khoảng [a
i
, b
i
) ở bảng sau:
Lượng hàng bán được x
i
(kg/ngày)
190-
210
210-
220
220-
230
230-
240
240-
250
250-
260
260-
280
Số ngày (n
i
)
5
12
25
30
23
16
9
a) Những ngày bán được từ 240 kg trở lên là những ngày có doanh thu khá. Hãy ước lượng
số ngày có doanh thu khá của siêu thị này trong năm tới (365 ngày) với độ tin cậy 98%.
b) Giả sử sau đó siêu thị áp dụng 1 chiến dịch quảng cáo làm cho doanh số bán trung bình
của mặt hàng A là 3,36 triệu đồng/ngày. Với mức ý nghĩa 5%, hãy kết luận xem chiến dịch
quảng cáo có tác dụng làm tăng doanh số trung bình của mặt hàng A lên hay không? Biết giá
bán 1 kg hàng A là 12000 đồng.
Bài 6:
a) Trong 1 đợt kiểm tra, người ta lấy ngẫu nhiên 100 sản phẩm để khảo sát về trọng lượng,
kết quả cho ở bảng sau (x
i
là trọng lượng, n
i
là số sản phẩm):
x
i
(g)
200-250
250-300
300-350
350-400
400-450
450-500
500-600
n
i
5
10
18
30
17
12
8
Giả sử sau đợt kiểm tra, người ta áp dụng 1 cải tiến làm cho trọng lượng trung bình của sản
phẩm là 440 g. Với mức ý nghĩa = 3%, hãy cho biết biện pháp cải tiến có làm cho trọng lượng
trung bình của sản phẩm tăng lên hay không?
b) Giả sử trong kho có rất nhiều sản phẩm của công ty A và 2000 sản phẩm của công ty B.
Lấy ngẫu nhiên 200 sản phẩm từ kho thì thấy có 42 sản phẩm của công ty B. Hãy ước lượng số
sản phẩm của công ty A trong kho với độ tin cậy 95%.
Bài 7: Sản phẩm của 1 nhà máy được đóng gói 1 cách ngẫu nhiên theo quy cách: 10 sp/hộp.
Theo báo cáo của nhà máy thì tỷ lệ hộp có 7 sp loại I là 5%, tỷ lệ hộp có 8 sp loại I là 20%, tỷ lệ
hộp có 9 sp loại I là 50% và tỷ lệ hộp có 10 sp loại I là 25%. Tiến hành kiểm tra 1000 hộp chọn
ngẫu nhiên từ 1 lô hàng gồm 20000 hộp do nhà máy sản xuất, ta được kết quả:
Số sản phẩm loại I có trong 1 hộp
7
8
9
10
Số hộp có số sản phẩm loại I tương ứng
80
210
440
270
Báo cáo của nhà máy có đúng với lô hàng trên không? Kết luận với mức ý nghĩa 5%. Tính p
value tương ứng.
Bài 8: Bắt và đánh dấu 400 con cá trong hồ rồi thả lại. Sau đó bắt 2000 con thì thấy có 12 con có
dấu. Với độ tin cậy 95%, hỏi trong hồ có tối thiểu bao nhiêu con cá?
Bài 9: Các bao bột mì do 1 máy đóng bao sản xuất ra có phân phối chuẩn với trọng lượng quy
định là 25 kg và độ lệch chuẩn là 1 kg. Lấy ngẫu nhiên ra 16 bao để kiểm tra thì ta tìm được
trọng lượng trung bình của mỗi bao là 24,6 kg. Với mức ý nghĩa 5%, hãy xét xem máy có hoạt
động bình thường hay không? Tính p – value tương ứng.
Bài 10: Có số liệu thống kê về doanh số bán hàng X (triệu đồng/ngày) của 100 ngày ở 1 siêu thị
như sau:
xi
< 10
10 - 20
20 - 30
30 - 40
40 - 50
50 - 60
≥ 60
n
i
5
12
18
24
23
11
7
a) Hãy tính các đặc trưng số: trung bình, phương sai và độ lệch điều chỉnh.
b) Ước lượng doanh số trung bình của 1 ngày bán hàng ở siêu thị này với độ tin cậy 98%.
c) Những ngày có doanh số từ 50 triệu đồng trở lên được xem là những ngày bán đắt hàng. Hãy
ước lượng tỷ lệ những ngày bán đắt với độ tin cậy 97%.
d) Với mẫu trên, nếu muốn ước lượng doanh số bán trung bình có độ chính xác 2,5 triệu đồng
thì độ tin cậy đạt được bao nhiêu phần trăm?
e) Với mẫu trên, nếu muốn ước lượng tỷ lệ những ngày bán đắt hàng có độ chính xác 8% thì độ
tin cậy đạt được bao nhiêu phần trăm?
f) Nếu muốn ước lượng doanh số bán trung bình có độ chính xác 2 triệu đồng và độ tin cậy 95%
thì cần khảo sát thêm bao nhiêu ngày nữa?
g) Nếu muốn ước lượng tỷ lệ những ngày bán đắt hàng có độ chính xác 5% và độ tin cậy 95%
thì cần khảo sát thêm bao nhiêu ngày nữa?
h) Ước lượng doanh số bán trung bình của những ngày bán đắt hàng với độ tin cậy 98%, nếu giả
sử doanh số bán của những ngày bán đắt hàng có phân phối chuẩn.
i) Ước lượng phương sai của doanh số bán của những ngày bán đắt hàng, với độ tin cậy 97%,
nếu giả sử doanh số bán của những ngày bán đắt hàng có phân phối chuẩn.
j) Trước đây doanh số bán trung bình ở siêu thị này là 30 triệu đồng/ngày. Số liệu ở bảng trên
được thu thập khi siêu thị tiến hành 1 chương trình khuyến mãi. Hãy cho nhận xét về hiệu quả
của chương trình khuyến mãi này với mức ý nghĩa 1%. Tính p – value tương ứng.
k) Một báo cáo cho rằng tỷ lệ những ngày bán đắt hàng của siêu thị này là 25%. Hãy cho nhận
xét về báo cáo này với mức ý nghĩa 6%. Tính p – value tương ứng. l) Kiểm định quy luật
phân phối chuẩn của X với mức ý nghĩa 5%.
Bài 11: Sản phẩm được sản xuất ra trên 1 dây chuyền tự động được đóng gói 1 cách ngẫu nhiên
theo quy cách 5 sp/hộp. Tiến hành kiểm tra 100 hộp, ta có kết quả:
Số sản phẩm loại A có trong hộp
0
1
2
3
4
5
Số hộp
8
24
36
21
8
3
Gọi X là số sp loại A có trong 1 hộp. Hãy kiểm định giả thiết X có phân phối nhị thức B(5; p),
với p chưa biết và được ước lượng bằng tỷ lệ sản phẩm loại A của mẫu và mức ý nghĩa là 5%.
Bài 12: Theo dõi số tàu biển đến 1 bến cảng để giao hàng trong 100 ngày, ta có kết quả như sau:
Số tàu biển cập bến
0
1
2
3
4
5
Số ngày
5
20
30
22
18
5
Gọi X là số tàu biển cập bến trong 1 ngày. Hãy kiểm định giả thiết X có phân phối Poisson với
mức ý nghĩa 5%.
Bài 13: Một nhà máy có 3 phân xưởng cùng sản xuất 1 loại sản phẩm. Chất lượng sp được chia
thành 3 loại. Kiểm tra ngẫu nhiên 1 số sp từ lô sản phẩm của nhà máy, ta có số liệu:
Chất lượng \ Phân xưởng
I
II
III
Loại A
75
50
65
Loại B
20
15
10
Loại C
5
5
5
Với mức ý nghĩa 5%, hãy xét xem chất lượng sản phẩm có phụ thuộc vào nơi sản xuất ra chúng
hay không? Tính p – value tương ứng.
Bài 14: Có số liệu thống kê về chi tiêu (triệu đồng/tháng) về mặt hàng A (chi tiêu là X) và mặt
hàng B (chi tiêu là Y) của 100 người như sau:
X \ Y
0,2 – 0,8
0,8 – 1,4
1,4 – 2,0
2,0 – 2,6
2,6 – 3,2
m
j
0,5 – 1,0
4
2
6
1,0 – 1,5
5
14
4
2
25
1,5 – 2,0
2
9
11
8
4
34
2,0 – 2,5
4
9
5
5
23
2,5 – 3,0
3
3
6
12
n
i
11
29
27
18
15
100
a) Ước lượng chi tiêu trung bình về mặt hàng A của mỗi người với độ tin cậy 95%.
b) Những người có chi tiêu mặt hàng A từ 2 triệu đồng trở lên được xem là những người có nhu
cầu cao về mặt hàng A. Hãy ước lượng tỷ lệ về những người có nhu cầu cao về mặt hàng A
với độ tin cậy 95%.
c) Ước lượng chi tiêu trung bình về mặt hàng B của mỗi người với độ tin cậy 95%.
d) Những người có chi tiêu mặt hàng B từ 2 triệu đồng trở lên được xem là những người có nhu
cầu cao về mặt hàng BA. Hãy ước lượng tỷ lệ về những người có nhu cầu cao về mặt hàng B
với độ tin cậy 95%.
e) Ước lượng chi tiêu trung bình về mặt hàng A của những người có nhu cầu cao về mặt hàng B
với độ tin cậy 95%.
f) Ước lượng chi tiêu trung bình về mặt hàng B của những người có nhu cầu cao về mặt hàng A
với độ tin cậy 95%.
g) Kiểm định tính phân phối chuẩn của X với mức ý nghĩa 5%.
h) Kiểm định tính phân phối chuẩn của Y với mức ý nghĩa 5%.
i) Xác định hệ số tương quan tuyến tính giữa X và Y.
j) Xét xem nhu cầu về mặt hàng A có độc lập với nhu cầu về mặt hàng B hay không, với mức ý
nghĩa 5%. Xác định p – value tương ứng.
Bài 15: Để so sánh hiệu quả của 3 phương pháp chiết cành đối với một giống cây ăn quả, một
mẫu ngẫu nhiên gồm 30 cây ăn quả cùng loại đang cho trái được chọn ngẫu nhiên từ 3 phương
pháp chiết cành này, mỗi phương pháp chiết cành sẽ chọn ra 10 cây. Năng suất mỗi cây (kg) cho
trong bảng sau (giả sử năng suất quả của 3 phương pháp chiết cành đều có phân phối chuẩn với
phương sai bằng nhau):
Phương pháp 1
Phương pháp 2
Phương pháp 3
8,5
10,7 8,8
10,5
11,7
11,2 9,5
11,8
12,1
10,8
8,7
7,6
7,9
9,5
8,3
10,2
9,5
7,6
7,9
7,5
6,7
5,9
5,2
6,8
5,1
5,6
6,2
6,3
5,4
5,7
Với mức ý nghĩa 5%, có thể nói hiệu quả của 3 phương pháp chiết cành là như nhau được
không?
Bài 16: Có ý kiến cho rằng thời gian chờ để đến lượt thanh toán tiền tại một siêu thị X ở thời
điểm sáng, trưa, chiều, tối là như nhau. Một mẫu ngẫu nhiên gồm các khách hàng được chọn ra.
Kết quả tính toán cho trong bảng sau:
Thời gian mua
Số khách hàng
Thời gian chờ trung bình (phút)
Phương sai
Sáng
6
8,5
0,97
Trưa
5
10,2
1,75
Chiều
6
15,3
0,58
Tối
6
9,8
1,25
Với mức ý nghĩa 5%, hãy cho nhận xét về ý kiến trên.
Bài 17: Phòng đào tạo của một trường đại học muốn nghiên cứu ảnh hưởng của thời gian tự học
đến kết quả học tập của sinh viên. Một mẫu gồm 18 sinh viên được chọn ra. Điểm trung bình
học tập của năm học vừa qua được cho trong bảng sau:
Thời gian tự học
Số sinh viên
Điểm trung bình
Tổng bình phương các
sai lệch
Ít
6
5,85
1,25
Trung bình
6
6,5
1,65
Nhiều
6
5,75
0,65
Với mức ý nghĩa 5%, có thể nói rằng điểm trung bình của 3 nhóm sinh viên là khác nhau không?
Đáp số
Bài 1:
a) x = 6,23; s = 1,94809;.
b) (x - ε; x + ε) = (6,23 - 0,501633; 6,23 + 0,501633) = (5,728367; 6,731633)
c) (p - ε; p + ε) = (0,25 - 0,100675; 0,25 ˆ ˆ + 0,100675) = (0,149325; 0,350675) d) 1 -
= 95,96%
e) 1 - = 74,98%
f) ít nhất 50 người nữa.
g) ít nhất 166 người nữa.
h) (y - ε; y + ε) = (8,56 - 0,279028; 8,56 + 0,279028) = (8,280972; 8,839028)
2 2
(n - 1)s
Y
(n - 1)s
Y
= (0,301962; 1,014009)
i)
1 - α
2
j) z = 2,09657 > z = 1,88 Bác bỏ H
0
. Tỷ lệ sinh viên khá Toán của trường này trong năm
nay ít hơn 35%.
p – value = 0,0358 k)
xi
n
i
p
i
(n
i
– np
i
)
2
/(np
i
)
< 3,5
6
0,0753
0,310876
3,5 – 4,5
10
0,1114
0,116661
4,5 – 5,5
14
0,1653
0,387229
5,5 – 6,5
25
0,2037
1,052376
6,5 – 7,5
20
0,1897
0,055925
7,5 – 8,5
14
0,1516
0,088760
≥ 8,5
11
0,103
0,047573
Tổng
100
1
2,0594
χ = 2,0594 < χ
2
0
2
,05
(4) = 9,488 Chấp nhận H
0
. Vậy điểm môn Toán của sinh viên trường
này có phân phối chuẩn.
Bài 2: P(1774 < X < 1813) = 0,8185 Bài
3:
X
26
26,5
27,5
28,5
29
P
1/6
1/6
2/6
1/6
1/6
Var(X) = 1,083333 Bài
4:
a) (f - ε; f + ε) = (0,4 - 0,10631; 0,4 + 0,10631) =
(0,29369; 0,50631)
b) 1 - = 90,5% Bài 5:
2
a) (108; 184) (ngày)
b) z = 28,58505 > 1,645 = z
α
Bác bỏ H
0
. Vậy quảng cáo thực sự có hiệu quả.
Bài 6:
a) z = 6,98846 > 1,88 = z
α
Bác bỏ H
0
. Vậy biện pháp cải tiến đã thực sự làm cho trọng
lượng trung bình của sản phẩm tăng lên. b) (5506; 11026) (sản phẩm) Bài 7:
xi
n
i
p
i
(n
i
– np
i
)
2
/(np
i
)
7
80
0,05
18
8
210
0,2
0,5
9
440
0,5
7,2
10
270
0,25
1,6
Tổng
1000
1
27,3
χ = 27,3 > χ
2
0
2
,05
(3) = 7,815 Bác bỏ H
0
. Vậy báo cáo của nhà máy không đúng với lô hàng
trên.
p – value = 5,09349×10
-6
Bài 8: 42622 con
Bài 9: z = 1,6 > z = 1,96 Chấp nhận H
0
. Máy hoạt động bình thường.
p – value = 0,1096 Bài
10:
a) x = 35,9; s = 15,57614; s = 240,19ˆ
2
.
b) (x - ε; x + ε) = (35,9 - 3,621453; 35,9 + 3,621453) = (32,278547; 39,521453)
c) (p - ε; p + ε) = (0,18 - 0,083369; 0,18 ˆ ˆ + 0,083369) = (0,096631; 0,263369) d) 1 -
= 89,15%
e) 1 - = 96,24%
f) ít nhất 134 ngày nữa.
g) ít nhất 127 ngày nữa.
h) (y - ε; y + ε) = (58,888889 - 2,748979; 58,888889 + 2,748979) = (56,13991; 61,637868)
2 2
(n - 1)s
Y
; (n - 1)s2
Y
= (13,363879; 62,139069)
i)
χ
χ
1 - α
2 2
j) z = 3,78784 > z = 2,575 Bác bỏ H
0
. Khuyến mãi thực sự làm tăng doanh số bán trung
bình.
p – value = 0,00016
k) z = 1,61658 < z = 1,88 Chấp nhận H
0
. Vậy có thể cho rằng báo cáo này đúng.
p – value = 0,1063
l)
xi
n
i
p
i
(n
i
– np
i
)
2
/(np
i
)
< 10
5
0,0475
0,013158
10 – 20
12
0,1052
0,208213
20 – 30
18
0,1993
0,186899
30 – 40
24
0,2525
0,061881
40 – 50
23
0,2141
0,118080
50 – 60
11
0,1214
0,107051
≥ 60
7
0,06
0,166667
Tổng
100
1
0,861949
χ = 0,861949 < χ
2
0
2
,05
(4) = 9,488 Chấp nhận H
0
. Vậy X có phân phối chuẩn.
Bài 11:
xi
n
i
p
i
(n
i
– np
i
)
2
/(np
i
)
0
8
0,070289
0,134169
1
24
0,246250
0,015864
2
36
0,345085
0,064462
3
21
0,241794
0,418077
4
8
0,084710
0,026191
5
3
0,011871
2,768619
Tổng
100
1
3,427382
χ = 3,427382 < χ
2
0
2
,05
(4) = 9,488 Chấp nhận H
0
. Vậy X có phân phối nhị thức.
Bài 12:
x
i
n
i
p
i
(n
i
– np
i
)
2
/(np
i
)
0
5
0,088037
1,643404
1
20
0,213930
0,090699
2
30
0,259924
0,617894
3
22
0,210539
0,042518
4
18
0,127902
2,122068
5
5
0,099668
2,475152
Tổng
100
1
6,991735
χ = 6,991735 < χ
2
0
2
,05
(4) = 9,488 Chấp nhận H
0
. Vậy X có phân phối Poisson.
Bài 13: χ = 2,847 < χ
2
0
2
,05
(2×2) = 9,488 Chấp nhận H
0
. Vậy chất lượng sản phẩm không phụ
thuộc vào nơi sản xuất.
Bài 14: a)
x
j
0,75
1,25
1,75
2,25
2,75
m
j
6
25
34
23
12
x = 1,8; s = 0,548183; s = 0,2975
X
ˆ
2
X
.
(x - ε; x + ε) = (1,8 - 0,107442; 1,8 + 0,107442) = (1,692558; 1,907442)
b) (p - ε; p + ε) = (0,35 - 0,0935; 0,35 + ˆ
X
ˆ
X
0,0935) = (0,2565; 0,4435) c)
yi
0,5
1,1
1,7
2,3
2,9
n
i
11
29
27
18
15
y = 1,682; s = 0,740786;
Y
.
(y - ε; y + ε) = (1,682 - 0,145191; 1,682 + 0,145191) = (1,536809; 1,827191)
d) (p - ε; p + ε) = (0,33 - 0,0922; 0,33 + ˆ
Y
ˆ
Y
0,0922) = (0,2378; 0,4222) e)
x
i
/Y ≥ 2
1,25
1,75
2,25
2,75
m
j
2
12
10
9
x = 2,143939; s
Y X/Y
= 0,46364; sˆ
X/Y
2
= 0,208448.
(x - ε; x + ε) = (2,143939 - 0,15819; 2,
Y Y
143939 + 0,15819) = (1,985749;
2,302129) f)
y
i
/X ≥ 2
1,1
1,7
2,3
2,9
ni
4
12
8
11
y = 2,145714; s
X Y/X
= 0,623247.
(y - ε; y + ε) = (2,145714 - 0,206482;
X X
2,145714 + 0,206482) = (1,939232;
2,352196) g)
x
j
m
j
p
j
(m
j
– np
j
)
2
/(np
j
)
< 1
6
0,0721
0,203065
1 – 1,5
25
0,2191
0,435787
1,5 – 2
34
0,3512
0,035718
2 – 2,5
23
0,2565
0,273782
≥ 2,5
12
0,1011
0,353323
Tổng
100
1
1,301675
χ = 1,301675 < χ
2
0
2
,05
(2) = 5,991 Chấp nhận H
0
. Vậy X có phân phối chuẩn.
h)
y
i
n
i
q
i
(n
i
– nq
i
)
2
/(nq
i
)
< 0,8
11
0,117
0,041880
0,8 – 1,4
29
0,235
1,287234
1,4 – 2
27
0,3144
0,627023
2 – 2,6
18
0,2261
0,939943
≥ 2,6
15
0,1075
1,680233
Tổng
100
1
4,576313
χ = 4,576313 < χ
2
0
2
,05
(2) = 5,991 Chấp nhận H
0
. Vậy X có phân phối chuẩn.
cov(X,Y)
i) ρ
XY
= = 0,6216 σ σX Y
j) χ = 11,034 < χ
2
0
2
,05
(1) = 3,841 Bác bỏ H
0
. Vậy
nhu cầu của 2 mặt hàng này là không độc lập. p – value =
0,000895

Preview text:

Bài tập phần thống kê
Bài 1: Có mẫu gồm 100 sinh viên trong 1 trường đại học có điểm môn toán được thống kê như sau: xi 0 1 2 3 4 5 6 7 8 9 10 ni 2 1 1 2 10 14 25 20 14 8 3
a) Tính các đặc trưng số: trung bình, phương sai và độ lệch điều chỉnh của mẫu trên.
b) Ước lượng điểm trung bình môn Toán của các sinh viên ở trường đại học này với độ tin cậy 99%.
c) Các sinh viên có điểm môn Toán từ 8 điểm trở lên được xem là sinh viên khá Toán. Hãy ước
lượng tỷ lệ sinh viên khá Toán với độ tin cậy 98%.
d) Với mẫu trên, nếu muốn ước lượng điểm trung bình môn Toán có độ chính xác 0,4 điểm thì
độ tin cậy đạt được bao nhiêu phần trăm?
e) Với mẫu trên, nếu muốn ước lượng tỷ lệ các sinh viên khá Toán có độ chính xác 5% thì độ tin
cậy đạt được bao nhiêu phần trăm?
f) Nếu muốn ước lượng điểm trung bình môn Toán có độ chính xác 0,3 điểm và độ tin cậy 94%
thì cần khảo sát thêm bao nhiêu sinh viên nữa?
g) Nếu muốn ước lượng các sinh viên khá Toán có độ chính xác 5% và độ tin cậy 94% thì cần
khảo sát thêm bao nhiêu sinh viên nữa?
h) Ước lượng điểm trung bình môn Toán của các sinh viên khá Toán với độ tin cậy 95%, giả sử
điểm môn Toán của các sinh viên khá Toán có phân phối chuẩn.
i) Ước lượng phương sai điểm môn Toán của các sinh viên khá Toán với độ tin cậy 96%, giả sử
điểm môn Toán của các sinh viên khá Toán có phân phối chuẩn.
j) Theo thống kê tổng thể năm học trước đây của trường này, người ta thấy điểm số trung bình
môn toán của các sinh viên là 6,6 điểm. Hãy so sánh điểm số trung bình môn Toán của các
sinh viên ở 2 năm học, với mức ý nghĩa 3%.
k) Ban giám hiệu trường này cho rằng tỷ lệ sinh viên khá Toán của trường trong năm nay là
35%. Hãy cho nhận xét về đánh giá của ban giám hiệu, với mức ý nghĩa 6%. Tính p – value tương ứng.
l) Kiểm định xem điểm môn Toán của sinh viên trường này có phân phối chuẩn hay không, với mức ý nghĩa 5%.
Bài 2: Tuổi thọ của các bóng đèn do 1 nhà máy sản xuất là ĐLNN có phân phối chuẩn với tuổi
thọ trung bình là 1800 giờ và độ lệch chuẩn là 130 giờ. Chọn 1 mẫu gồm 100 bóng đèn để kiểm
tra. Tính xác suất để tuổi thọ trung bình 1 bóng đèn của mẫu thuộc khoảng (1774; 1813) giờ.
Bài 3: Xem tổng thể là tập hợp gồm 4 công ty du lịch A, B, C, D với lợi nhuận (tỷ đồng/năm)
lần lượt là 25, 27, 28, 30. Lấy mẫu ngẫu nhiên kích thước n = 2 từ tổng thể này theo phép chọn
không lặp. Lập bảng phân phối xác suất của trung bình mẫu ngẫu nhiên, từ đó tính phương sai
của trung bình mẫu ngẫu nhiên.
Bài 4: Khảo sát về thu nhập của 1 số người làm việc ở 1 công ty, ta có số liệu cho ở bảng sau:
Thu nhập (triệu đồng/tháng) 4 – 6 6 – 8
8 – 10 10 – 12 12 – 16 16 – 20 Số người 11 17 32 22 10 8 a)
Những người có mức thu nhập từ 10 triệu đồng/tháng trở lên là những người có thu nhập
cao. Hãy ước lượng tỷ lệ những người có thu nhập cao của công ty này với độ tin cậy 97%. b)
Nếu muốn ước lượng thu nhập trung bình của 1 người ở công ty này với độ chính xác
= 0,57 triệu đồng/tháng thì độ tin cậy đạt được bao nhiêu phần trăm?
Bài 5: Theo dõi số lượng bán được về mặt hàng A trong 1 số ngày ở 1 siêu thị , ta có số liệu cho
dưới dạng khoảng [ai, bi) ở bảng sau:
Lượng hàng bán được xi 190- 210- 220- 230- 240- 250- 260- (kg/ngày) 210 220 230 240 250 260 280 Số ngày (ni) 5 12 25 30 23 16 9 a)
Những ngày bán được từ 240 kg trở lên là những ngày có doanh thu khá. Hãy ước lượng
số ngày có doanh thu khá của siêu thị này trong năm tới (365 ngày) với độ tin cậy 98%. b)
Giả sử sau đó siêu thị áp dụng 1 chiến dịch quảng cáo làm cho doanh số bán trung bình
của mặt hàng A là 3,36 triệu đồng/ngày. Với mức ý nghĩa 5%, hãy kết luận xem chiến dịch
quảng cáo có tác dụng làm tăng doanh số trung bình của mặt hàng A lên hay không? Biết giá
bán 1 kg hàng A là 12000 đồng. Bài 6: a)
Trong 1 đợt kiểm tra, người ta lấy ngẫu nhiên 100 sản phẩm để khảo sát về trọng lượng,
kết quả cho ở bảng sau (xi là trọng lượng, ni là số sản phẩm): xi (g)
200-250 250-300 300-350 350-400 400-450 450-500 500-600 ni 5 10 18 30 17 12 8
Giả sử sau đợt kiểm tra, người ta áp dụng 1 cải tiến làm cho trọng lượng trung bình của sản
phẩm là 440 g. Với mức ý nghĩa = 3%, hãy cho biết biện pháp cải tiến có làm cho trọng lượng
trung bình của sản phẩm tăng lên hay không? b)
Giả sử trong kho có rất nhiều sản phẩm của công ty A và 2000 sản phẩm của công ty B.
Lấy ngẫu nhiên 200 sản phẩm từ kho thì thấy có 42 sản phẩm của công ty B. Hãy ước lượng số
sản phẩm của công ty A trong kho với độ tin cậy 95%.
Bài 7: Sản phẩm của 1 nhà máy được đóng gói 1 cách ngẫu nhiên theo quy cách: 10 sp/hộp.
Theo báo cáo của nhà máy thì tỷ lệ hộp có 7 sp loại I là 5%, tỷ lệ hộp có 8 sp loại I là 20%, tỷ lệ
hộp có 9 sp loại I là 50% và tỷ lệ hộp có 10 sp loại I là 25%. Tiến hành kiểm tra 1000 hộp chọn
ngẫu nhiên từ 1 lô hàng gồm 20000 hộp do nhà máy sản xuất, ta được kết quả:
Số sản phẩm loại I có trong 1 hộp 7 8 9 10
Số hộp có số sản phẩm loại I tương ứng 80 210 440 270
Báo cáo của nhà máy có đúng với lô hàng trên không? Kết luận với mức ý nghĩa 5%. Tính p – value tương ứng.
Bài 8: Bắt và đánh dấu 400 con cá trong hồ rồi thả lại. Sau đó bắt 2000 con thì thấy có 12 con có
dấu. Với độ tin cậy 95%, hỏi trong hồ có tối thiểu bao nhiêu con cá?
Bài 9: Các bao bột mì do 1 máy đóng bao sản xuất ra có phân phối chuẩn với trọng lượng quy
định là 25 kg và độ lệch chuẩn là 1 kg. Lấy ngẫu nhiên ra 16 bao để kiểm tra thì ta tìm được
trọng lượng trung bình của mỗi bao là 24,6 kg. Với mức ý nghĩa 5%, hãy xét xem máy có hoạt
động bình thường hay không? Tính p – value tương ứng.
Bài 10: Có số liệu thống kê về doanh số bán hàng X (triệu đồng/ngày) của 100 ngày ở 1 siêu thị như sau: xi < 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 ≥ 60 ni 5 12 18 24 23 11 7
a) Hãy tính các đặc trưng số: trung bình, phương sai và độ lệch điều chỉnh.
b) Ước lượng doanh số trung bình của 1 ngày bán hàng ở siêu thị này với độ tin cậy 98%.
c) Những ngày có doanh số từ 50 triệu đồng trở lên được xem là những ngày bán đắt hàng. Hãy
ước lượng tỷ lệ những ngày bán đắt với độ tin cậy 97%.
d) Với mẫu trên, nếu muốn ước lượng doanh số bán trung bình có độ chính xác 2,5 triệu đồng
thì độ tin cậy đạt được bao nhiêu phần trăm?
e) Với mẫu trên, nếu muốn ước lượng tỷ lệ những ngày bán đắt hàng có độ chính xác 8% thì độ
tin cậy đạt được bao nhiêu phần trăm?
f) Nếu muốn ước lượng doanh số bán trung bình có độ chính xác 2 triệu đồng và độ tin cậy 95%
thì cần khảo sát thêm bao nhiêu ngày nữa?
g) Nếu muốn ước lượng tỷ lệ những ngày bán đắt hàng có độ chính xác 5% và độ tin cậy 95%
thì cần khảo sát thêm bao nhiêu ngày nữa?
h) Ước lượng doanh số bán trung bình của những ngày bán đắt hàng với độ tin cậy 98%, nếu giả
sử doanh số bán của những ngày bán đắt hàng có phân phối chuẩn.
i) Ước lượng phương sai của doanh số bán của những ngày bán đắt hàng, với độ tin cậy 97%,
nếu giả sử doanh số bán của những ngày bán đắt hàng có phân phối chuẩn.
j) Trước đây doanh số bán trung bình ở siêu thị này là 30 triệu đồng/ngày. Số liệu ở bảng trên
được thu thập khi siêu thị tiến hành 1 chương trình khuyến mãi. Hãy cho nhận xét về hiệu quả
của chương trình khuyến mãi này với mức ý nghĩa 1%. Tính p – value tương ứng.
k) Một báo cáo cho rằng tỷ lệ những ngày bán đắt hàng của siêu thị này là 25%. Hãy cho nhận
xét về báo cáo này với mức ý nghĩa 6%. Tính p – value tương ứng. l) Kiểm định quy luật
phân phối chuẩn của X với mức ý nghĩa 5%.
Bài 11: Sản phẩm được sản xuất ra trên 1 dây chuyền tự động được đóng gói 1 cách ngẫu nhiên
theo quy cách 5 sp/hộp. Tiến hành kiểm tra 100 hộp, ta có kết quả:
Số sản phẩm loại A có trong hộp 0 1 2 3 4 5 Số hộp 8 24 36 21 8 3
Gọi X là số sp loại A có trong 1 hộp. Hãy kiểm định giả thiết X có phân phối nhị thức B(5; p),
với p chưa biết và được ước lượng bằng tỷ lệ sản phẩm loại A của mẫu và mức ý nghĩa là 5%.
Bài 12: Theo dõi số tàu biển đến 1 bến cảng để giao hàng trong 100 ngày, ta có kết quả như sau: Số tàu biển cập bến 0 1 2 3 4 5 Số ngày 5 20 30 22 18 5
Gọi X là số tàu biển cập bến trong 1 ngày. Hãy kiểm định giả thiết X có phân phối Poisson với mức ý nghĩa 5%.
Bài 13: Một nhà máy có 3 phân xưởng cùng sản xuất 1 loại sản phẩm. Chất lượng sp được chia
thành 3 loại. Kiểm tra ngẫu nhiên 1 số sp từ lô sản phẩm của nhà máy, ta có số liệu:
Chất lượng \ Phân xưởng I II III Loại A 75 50 65 Loại B 20 15 10 Loại C 5 5 5
Với mức ý nghĩa 5%, hãy xét xem chất lượng sản phẩm có phụ thuộc vào nơi sản xuất ra chúng
hay không? Tính p – value tương ứng.
Bài 14: Có số liệu thống kê về chi tiêu (triệu đồng/tháng) về mặt hàng A (chi tiêu là X) và mặt
hàng B (chi tiêu là Y) của 100 người như sau: X \ Y 0,2 – 0,8 0,8 – 1,4 1,4 – 2,0 2,0 – 2,6 2,6 – 3,2 mj 0,5 – 1,0 4 2 6 1,0 – 1,5 5 14 4 2 25 1,5 – 2,0 2 9 11 8 4 34 2,0 – 2,5 4 9 5 5 23 2,5 – 3,0 3 3 6 12 ni 11 29 27 18 15 100
a) Ước lượng chi tiêu trung bình về mặt hàng A của mỗi người với độ tin cậy 95%.
b) Những người có chi tiêu mặt hàng A từ 2 triệu đồng trở lên được xem là những người có nhu
cầu cao về mặt hàng A. Hãy ước lượng tỷ lệ về những người có nhu cầu cao về mặt hàng A với độ tin cậy 95%.
c) Ước lượng chi tiêu trung bình về mặt hàng B của mỗi người với độ tin cậy 95%.
d) Những người có chi tiêu mặt hàng B từ 2 triệu đồng trở lên được xem là những người có nhu
cầu cao về mặt hàng BA. Hãy ước lượng tỷ lệ về những người có nhu cầu cao về mặt hàng B với độ tin cậy 95%.
e) Ước lượng chi tiêu trung bình về mặt hàng A của những người có nhu cầu cao về mặt hàng B với độ tin cậy 95%.
f) Ước lượng chi tiêu trung bình về mặt hàng B của những người có nhu cầu cao về mặt hàng A với độ tin cậy 95%.
g) Kiểm định tính phân phối chuẩn của X với mức ý nghĩa 5%.
h) Kiểm định tính phân phối chuẩn của Y với mức ý nghĩa 5%.
i) Xác định hệ số tương quan tuyến tính giữa X và Y.
j) Xét xem nhu cầu về mặt hàng A có độc lập với nhu cầu về mặt hàng B hay không, với mức ý
nghĩa 5%. Xác định p – value tương ứng.
Bài 15: Để so sánh hiệu quả của 3 phương pháp chiết cành đối với một giống cây ăn quả, một
mẫu ngẫu nhiên gồm 30 cây ăn quả cùng loại đang cho trái được chọn ngẫu nhiên từ 3 phương
pháp chiết cành này, mỗi phương pháp chiết cành sẽ chọn ra 10 cây. Năng suất mỗi cây (kg) cho
trong bảng sau (giả sử năng suất quả của 3 phương pháp chiết cành đều có phân phối chuẩn với phương sai bằng nhau): Phương pháp 1 Phương pháp 2 Phương pháp 3 8,5 8,7 6,7 10,7 8,8 7,6 5,9 10,5 7,9 5,2 11,7 9,5 6,8 11,2 9,5 8,3 5,1 11,8 10,2 5,6 12,1 9,5 6,2 10,8 7,6 6,3 7,9 5,4 7,5 5,7
Với mức ý nghĩa 5%, có thể nói hiệu quả của 3 phương pháp chiết cành là như nhau được không?
Bài 16: Có ý kiến cho rằng thời gian chờ để đến lượt thanh toán tiền tại một siêu thị X ở thời
điểm sáng, trưa, chiều, tối là như nhau. Một mẫu ngẫu nhiên gồm các khách hàng được chọn ra.
Kết quả tính toán cho trong bảng sau: Thời gian mua Số khách hàng
Thời gian chờ trung bình (phút) Phương sai Sáng 6 8,5 0,97 Trưa 5 10,2 1,75 Chiều 6 15,3 0,58 Tối 6 9,8 1,25
Với mức ý nghĩa 5%, hãy cho nhận xét về ý kiến trên.
Bài 17: Phòng đào tạo của một trường đại học muốn nghiên cứu ảnh hưởng của thời gian tự học
đến kết quả học tập của sinh viên. Một mẫu gồm 18 sinh viên được chọn ra. Điểm trung bình
học tập của năm học vừa qua được cho trong bảng sau: Thời gian tự học Số sinh viên Điểm trung bình Tổng bình phương các sai lệch Ít 6 5,85 1,25 Trung bình 6 6,5 1,65 Nhiều 6 5,75 0,65
Với mức ý nghĩa 5%, có thể nói rằng điểm trung bình của 3 nhóm sinh viên là khác nhau không? Đáp số Bài 1: a) x = 6,23; s = 1,94809;.
b) (x - ε; x + ε) = (6,23 - 0,501633; 6,23 + 0,501633) = (5,728367; 6,731633)
c) (p - ε; p + ε) = (0,25 - 0,100675; 0,25 ˆ ˆ
+ 0,100675) = (0,149325; 0,350675) d) 1 - = 95,96% e) 1 - = 74,98%
f) ít nhất 50 người nữa.
g) ít nhất 166 người nữa.
h) (y - ε; y + ε) = (8,56 - 0,279028; 8,56 + 0,279028) = (8,280972; 8,839028) 2 2 (n - 1)sY
(n - 1)sY = (0,301962; 1,014009) i) 1 - α 2
j) z = 2,09657 > z = 1,88 Bác bỏ H0. Tỷ lệ sinh viên khá Toán của trường này trong năm nay ít hơn 35%. p – value = 0,0358 k) xi ni pi (ni – npi)2/(npi) < 3,5 6 0,0753 0,310876 3,5 – 4,5 10 0,1114 0,116661 4,5 – 5,5 14 0,1653 0,387229 5,5 – 6,5 25 0,2037 1,052376 6,5 – 7,5 20 0,1897 0,055925 7,5 – 8,5 14 0,1516 0,088760 ≥ 8,5 11 0,103 0,047573 Tổng 100 1 2,0594 χ = 2,0594 < χ2 2 0 ,05 (4) = 9,488
Chấp nhận H0. Vậy điểm môn Toán của sinh viên trường
này có phân phối chuẩn.
Bài 2: P(1774 < X < 1813) = 0,8185 Bài 3: X 26 26,5 27,5 28,5 29 P 1/6 1/6 2/6 1/6 1/6 Var(X) = 1,083333 Bài 4:
a) (f - ε; f + ε) = (0,4 - 0,10631; 0,4 + 0,10631) = (0,29369; 0,50631) b) 1 - = 90,5% Bài 5: a) (108; 184) (ngày)
b) z = 28,58505 > 1,645 = zα Bác bỏ H0. Vậy quảng cáo thực sự có hiệu quả. Bài 6:
a) z = 6,98846 > 1,88 = zα Bác bỏ H0. Vậy biện pháp cải tiến đã thực sự làm cho trọng
lượng trung bình của sản phẩm tăng lên. b) (5506; 11026) (sản phẩm) Bài 7: xi ni pi (ni – npi)2/(npi) 7 80 0,05 18 8 210 0,2 0,5 9 440 0,5 7,2 10 270 0,25 1,6 Tổng 1000 1 27,3 χ = 27,3 > χ2 2 0 ,05 (3) = 7,815
Bác bỏ H0. Vậy báo cáo của nhà máy không đúng với lô hàng trên. p – value = 5,09349×10-6 Bài 8: 42622 con
Bài 9: z = 1,6 > z = 1,96 Chấp nhận H0. Máy hoạt động bình thường. p – value = 0,1096 Bài 10:
a) x = 35,9; s = 15,57614; s = 240,19ˆ2 .
b) (x - ε; x + ε) = (35,9 - 3,621453; 35,9 + 3,621453) = (32,278547; 39,521453)
c) (p - ε; p + ε) = (0,18 - 0,083369; 0,18 ˆ ˆ
+ 0,083369) = (0,096631; 0,263369) d) 1 - = 89,15% e) 1 - = 96,24%
f) ít nhất 134 ngày nữa.
g) ít nhất 127 ngày nữa.
h) (y - ε; y + ε) = (58,888889 - 2,748979; 58,888889 + 2,748979) = (56,13991; 61,637868) 2 2 (n - 1)sY ; (n - 1)s Y 2 = (13,363879; 62,139069) i) χ2α χ1 - α 2 2 j) z = 3,78784 > 2
z = 2,575 Bác bỏ H0. Khuyến mãi thực sự làm tăng doanh số bán trung bình. p – value = 0,00016
k) z = 1,61658 < z = 1,88 Chấp nhận H0. Vậy có thể cho rằng báo cáo này đúng. p – value = 0,1063 l) xi ni pi (ni – npi)2/(npi) < 10 5 0,0475 0,013158 10 – 20 12 0,1052 0,208213 20 – 30 18 0,1993 0,186899 30 – 40 24 0,2525 0,061881 40 – 50 23 0,2141 0,118080 50 – 60 11 0,1214 0,107051 ≥ 60 7 0,06 0,166667 Tổng 100 1 0,861949 χ = 0,861949 < χ2 2 0 ,05(4) = 9,488
Chấp nhận H0. Vậy X có phân phối chuẩn. Bài 11: xi ni pi (ni – npi)2/(npi) 0 8 0,070289 0,134169 1 24 0,246250 0,015864 2 36 0,345085 0,064462 3 21 0,241794 0,418077 4 8 0,084710 0,026191 5 3 0,011871 2,768619 Tổng 100 1 3,427382 χ = 3,427382 < χ2 2 0 ,05(4) = 9,488
Chấp nhận H0. Vậy X có phân phối nhị thức. Bài 12: xi ni pi (ni – npi)2/(npi) 0 5 0,088037 1,643404 1 20 0,213930 0,090699 2 30 0,259924 0,617894 3 22 0,210539 0,042518 4 18 0,127902 2,122068 5 5 0,099668 2,475152 Tổng 100 1 6,991735 χ = 6,991735 < χ2 2 0 ,05(4) = 9,488
Chấp nhận H0. Vậy X có phân phối Poisson. Bài 13: χ = 2,847 < χ2 2 0 ,05(2×2) = 9,488
Chấp nhận H0. Vậy chất lượng sản phẩm không phụ
thuộc vào nơi sản xuất. Bài 14: a) xj 0,75 1,25 1,75 2,25 2,75 mj 6 25 34 23 12
x = 1,8; s = 0,548183; s = 0,2975X ˆ2X .
(x - ε; x + ε) = (1,8 - 0,107442; 1,8 + 0,107442) = (1,692558; 1,907442)
b) (p - ε; p + ε) = (0,35 - 0,0935; 0,35 + ˆX ˆX 0,0935) = (0,2565; 0,4435) c) yi 0,5 1,1 1,7 2,3 2,9 ni 11 29 27 18 15 y = 1,682; s = 0,740786;Y .
(y - ε; y + ε) = (1,682 - 0,145191; 1,682 + 0,145191) = (1,536809; 1,827191)
d) (p - ε; p + ε) = (0,33 - 0,0922; 0,33 + ˆY ˆY 0,0922) = (0,2378; 0,4222) e) xi/Y ≥ 2 1,25 1,75 2,25 2,75 mj 2 12 10 9 x = 2,143939; s 2
Y X/Y = 0,46364; sˆX/Y = 0,208448.
(x - ε; x + ε) = (2,143939 - 0,15819; 2,Y Y
143939 + 0,15819) = (1,985749; 2,302129) f) yi/X ≥ 2 1,1 1,7 2,3 2,9 ni 4 12 8 11
y = 2,145714; sX Y/X = 0,623247.
(y - ε; y + ε) = (2,145714 - 0,206482; X X
2,145714 + 0,206482) = (1,939232; 2,352196) g) xj mj pj (mj – npj)2/(npj) < 1 6 0,0721 0,203065 1 – 1,5 25 0,2191 0,435787 1,5 – 2 34 0,3512 0,035718 2 – 2,5 23 0,2565 0,273782 ≥ 2,5 12 0,1011 0,353323 Tổng 100 1 1,301675 χ = 1,301675 < χ2 2 0 ,05(2) = 5,991
Chấp nhận H0. Vậy X có phân phối chuẩn. h) yi ni qi (ni – nqi)2/(nqi) < 0,8 11 0,117 0,041880 0,8 – 1,4 29 0,235 1,287234 1,4 – 2 27 0,3144 0,627023 2 – 2,6 18 0,2261 0,939943 ≥ 2,6 15 0,1075 1,680233 Tổng 100 1 4,576313 χ = 4,576313 < χ2 2 0 ,05(2) = 5,991
Chấp nhận H0. Vậy X có phân phối chuẩn. cov(X,Y) i) ρXY = = 0,6216 σ σX Y j) χ = 11,034 < χ2 2 0 ,05(1) = 3,841 Bác bỏ H0. Vậy
nhu cầu của 2 mặt hàng này là không độc lập. p – value = 0,000895