Đề thi các năm về trước - Xác suất thống kê | Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia HCM

Đề thi các năm về trước - Xác suất thống kê | Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia HCM được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

C SUT THỐNG
ĐỀ CUỐI KỲ II NĂM HỌC 2021-2022
Thời gian làm bài: 90 phút
Đ số: 1
Câu 1 (4 điểm). Biết trọng lượng X (g/quả) của mỗi quả trứng phân phối chuẩn. Đem cân 100
quả trứng ta kết quả sau:
x
i
155 160 165 170 175 180 185
n
i
5 12 14 25 24 14 6
Cho biết trứng trọng lượng lớn hơn 170 g trứng loại một.
a) Tìm khoảng tin cậy 97% cho trọng lượng trứng trung bình.
b) Tìm khoảng tin cậy 98% cho tỷ lệ trứng loại một. Nếu ta muốn sai số ước lượng không quá g0.1
thì cần khảo sát thêm bao nhiêu trứng?
c) ý kiến cho rằng trọng lượng trứng trung bình lớn hơn 170 g/quả. Hãy kiểm định ý kiến trên
ứng với mức ý nghĩa .1%
d) ý kiến cho rằng 50% số trứng thuộc loại một. y kiểm định ý kiến trên với mức ý nghĩa .1%
Lời giải.
Gọi X (cm/s) tốc độ cháy của nhiên liệu rắn.
Theo đề bài, ta X N(µ; σ
2
)
σ
2
: chưa biết.
Từ bảng dữ liệu, ta tính được: n = 100; ¯x = 170.85; s 7.7543.
a) Tìm khoảng tin cậy 97% cho trọng lượng trứng trung bình
Độ tin cậy: 97% α = 0.03.
t
α/2;n1
= t
0.015;99
z
0.985
2.17.
Sai số: ǫ = t
α/2;n1
·
s
n
= 2
.17 ·
7.7543
100
1.6827.
KTC 97% cho trung bình µ là:
¯x ǫ µ ¯x ǫ
170.85 1.6827 µ 170 6827.85 + 1.
169.1673 µ 172.5327
µ [169.1673; 172.5327].
b) Tìm khoảng tin cậy 98% cho t lệ trứng loại một.
Gọi Y số trứng loại một.
Ta có:
n = 100, y = 24 + 14 + 6 = 44 tỷ lệ mẫu ˆp =
y
n
=
44
100
= 0. 44.
Độ tin cậy: 98% α = 0.02.
z
1
α
2
= z
0.99
2.33.
Trang 1
Sai số: ǫ = z
1
α
2
·
ˆp(1 ˆp)
n
= 2
.33 ·
0.44 (1 0.44)
100
0.1157.
KTC 98% cho t lệ p
ˆp ǫ p ˆp + ǫ
0. 44 0.1157 p 0.44 + 0.1157
0. 3243 p 0.5557
p [0 5557].3243; 0. .
> Nếu ta muốn sai số ước lượng không quá 0.1 g thì cần khảo sát thêm bao nhiêu trứng?
Để ǫ 0.1 thì
n
z
1α/2
ǫ
2
·
ˆp(1 ˆp) =
Å
2.33
0
.1
ã
2
· 0.44(1 0.44) 133 7681. .
n 134.
Do đó, để ǫ 0.1 thì phải khảo sát ít nhất 134 quả trứng.
Vy để ǫ 0.1 thì phải khảo sát thêm 134 100 = 34 quả trứng nữa.
c) ý kiến cho rằng trọng lượng trứng trung bình lớn hơn 170 g/quả. Hãy kiểm định ý kiến trên
ứng với mức ý nghĩa .1%
σ
2
: chưa biết.
Ta có: n = 100; ¯x = 170. .85; s 7 7543.
Giả Thuyết KĐ:
®
H
0
: µ 170
H
1
: µ > 170
: 1 phía, .µ
0
= 170
Mức ý nghĩa: α = 0.01.
Giá trị Thống kê kiểm định:
t
0
=
¯x µ
0
s
n
=
170.85 170
7.7543
100
1.0962.
Miền bác bỏ: Bác bỏ H
0
nếu .t
0
> t
α;n1
Ta α = 0.01
t
α;n1
= t
0.01;99
z
0.99
2.33.
So sánh và kết luận:
Ta có: t
0
> t
α;n1
1 2.0962 > .33 (sai)
Chưa đủ sở để bác bỏ H
0
: µ 170.
Kết luận: Với mức ý nghĩa 1%, trọng lượng trứng trung bình không lớn hơn 170 g.
d) ý kiến cho rằng 50% số trứng thuộc loại một. Hãy kiểm định ý kiến trên với mức ý nghĩa .1%
Ta có:
n = 100, y = 24 + 14 + 6 = 44 tỷ lệ mẫu ˆp =
y
n
=
44
100
= 0. 44.
GTKĐ:
®
H
0
: p = 0.5
H
1
: p 6= 0.5
: 2 phía, .p
0
= 50% = 0.5
Mức ý nghĩa: α = 1% = 0.01.
Giá trị Thống kê kiểm định:
Trang 2
z
0
=
ˆp p
0
p
0
(1 ) p
0
n
=
0 0.44 .5
0 0.5(1 .5)
100
= 1 2. .
Miền bác bỏ: Bác bỏ H
0
nếu |z
0
| > z
1α/2
.
Ta α = 0.01
z
1α/2
= z
0.995
2.58.
So sánh và kết luận:
Ta có: |z
0
| > z
1α/2
| 1 2. | > 2.58
1 2.2 > .58 (sai)
Chưa đủ sở để bác bỏ .H
0
: p = 0.5
Kết luận: Với mức ý nghĩa 1%, ý kiến cho rằng 50% số trứng thuộc loại một không được chấp
nhận.
Câu 2 (2 điểm). Hai chất xúc tác thể được sử dụng trong một phản ứng hóa học. Mười hai phản
ứng được cho sử dụng chất xúc tác 1, dẫn đến hiệu suất trung bình 86 (đv: %) độ lệch chuẩn mẫu
3. Mười lăm phản ứng được cho sử dụng chất xúc tác 2 và kết quả hiệu suất trung bình 89 với độ
lệch chuẩn mẫu 2. Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn.
bằng chứng để khẳng định rằng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1
hay không? Sử dụng α = 0.01. (Yêu cầu dùng cả 2 phương pháp: miền bác bỏ p-giá trị)
Lời giải.
Gọi X
1
(%) hiệu suất phản ứng khi sử dụng chất xúc tác 1
X
2
(%) hiệu suất phản ứng khi sử dụng chất xúc tác 2.
Theo đề bài X
1
N (µ
1
; σ
2
1
); X
2
N (µ
2
; σ
2
2
)
σ σ
1
=
2
chưa biết.
Mẫu 1: n
1
= 12; ¯x
1
= 86 và .s
1
= 3
Mẫu 2: n
2
= 15; ¯x
2
= 89 và .s
2
= 2
Giả thuyết kiểm định
®
H
0
: µ µ
1
2
H
1
: µ
1
< µ
2
; µ
1
µ
2
= 0; α = 0.01.
Giá trị thống kê kiểm định
s
2
p
=
(n
1
1)s
2
1
+ (n
2
1)s
2
2
n n
1
+
2
2
=
(12 1).3
2
+ (15 1).2
2
12 + 15
2
= 6 2.
t
0
=
¯x
1
¯x
2
(µ
1
µ
2
)
s
2
p
n
1
+
s
2
p
n
2
=
86 89 0
6.2
12
+
6.2
15
= 3.1109.
Miền bác bỏ: Bác bỏ H
0
khi t
0
< t
α;n
1
+n
2
2
.
Ta α = 0.01
t
α;n
1
+n
2
2
= t
0.01;25
= 2.4851.
So sánh và kết luận:
Ta có: t
0
< t
α;n
1
+n
2
2
3.1109 < 2.4851 (đúng)
Bác bỏ H
0
: µ
1
µ
2
.
Kết luận: Với mức ý nghĩa 1% thì bằng chứng để khẳng định được rằng sử dụng chất xúc tác 2 tạo
ra hiệu suất trung bình cao hơn khi dùng chất xúc tác 1.
> Cách 2: Dùng p - giá trị:
Trang 3
t
0
= 3.1109 p-giá trị = P (T T
12+152
t
0
) = P (
12+152
3. .1109) 0 0023.
pgiá trị 0.0023 < 0.01 = α nên bác b .H
0
: µ µ
1
2
Câu 3 (2 điểm). Hai loại giải pháp khác nhau để đánh bóng thấu kính nội nhãn (được dùng trong
mắt người sau phẫu thuật đục thủy tinh thể) đang được đánh giá để sử dụng. Trong 300 thấu kính đã
được đánh bóng bằng giải pháp 1 thì 253 thấu kính không khuyết tật do đánh bóng. Trong 300
thấu kính khác được đánh bóng bằng giải pháp 2 thì 196 thấu kính không khuyết tật do đánh
bóng. do nào để tin rằng hai giải pháp đánh bóng khác nhau không? Sử dụng α = 0.05. pgiá
trị cho kiểm định này bao nhiêu?
Lời giải.
Gọi Y
1
số thấu kính được đánh bóng bằng cách sử dụng giải pháp đánh bóng thứ nhất
Y
2
số thấu kính được đánh bóng bằng cách sử dụng giải pháp đánh bóng thứ hai.
Mẫu 1:
n
1
= 300; y
1
= 253 ˆp
1
=
y
1
n
1
=
253
300
.
Mẫu 2:
n
2
= 300; y
2
= 196 ˆp
2
=
y
2
n
2
=
196
300
=
49
75
.
ˆp =
y
1
+ y
2
n
1
+ n
2
=
253 + 196
300 + 300
=
449
600
Giả thuyết kiểm định:
®
H
0
: p p
1
=
2
H
1
: p p
1
6=
2
;
0
= p
1
p
2
= 0; α = 0.05.
Giá trị thống kê kiểm định
z
0
=
ˆp
1
ˆp
2
0
ˆp(1 ˆp)
Å
1
n
1
+
1
n
2
ã
=
253
300
49
75
0
449
600
Å
1
449
600
ãÅ
1
300
+
1
300
ã
= 5. 3621
Miền bác bỏ: Bác bỏ H
0
khi |z
0
| > z
1α/2
.
Ta α = 0.05
z
1α/2
= z
0.975
= 1. 96.
So sánh và kết luận:
Ta có: |z
0
| > z
1α/2
|5.3621| > z
1α/2
5 1.3621 > .96 (đúng)
bác bỏ .H
0
Kết luận: Với mức ý nghĩa 5% thì hai giải pháp đánh bóng tỷ lệ kính khuyết tật khác nhau.
> p - giá trị:
z
0
= 5. 3621 p-giá trị = 2 (1 Φ(|5.3621|)) 2 (1 1) = 0.
Câu 4 (2 điểm). Dữ liệu bên dưới tả về trọng lượng của các điếu thuốc x (g) được sản xuất từ
các nhà máy khác nhau và hàm lượng nicotin y (mg) trong mỗi điếu thuốc:
x 15.8 14.9 9. 0 4.5 15.0 17.0 8 0 4.6 12. .1 16 0.
y 0. . . . . .957 0.886 0 852 0.911 0.889 0 919 0 969 1.118 0 946 1 094
a)
Tìm phương trình hồi quy tuyến tính đơn y theo x. Giải thích ý nghĩa của
ˆ
β
1
nhận được.
b) Dự đoán hàm lượng nicotin của một điếu thuốc trọng lượng 11 g.
Trang 4
Lời giải.
Giả sử X, Y thỏa mãn hình hồi quy tuyến tính đơn biến.
a) Tìm phương trình hồi quy tuyến tính đơn y theo :x
Từ bảng dữ liệu, dùng máy cầm tay, ta ước lượng được:
ˆ
β
0
0.9184;
ˆ
β
1
3.0563 ·10
3
0.0031.
Phương trình hồi quy tuyến tính đơn
y theo x ˆy =
ˆ
β
0
+
ˆ
β
1
x = 0.9184 + 0.0031x.
>
Giải thích ý nghĩa của
ˆ
β
1
nhận được:
ˆ
β
1
= 0.0031 > 0 nên khi trọng lượng của điếu thuốc tăng 1 g và các yếu tố khác không đổi
thì hàm lượng nicotin trong điếu thuốc tăng 0.0031 mg.
b) Dự đoán hàm lượng nicotin của một điếu thuốc trọng lượng 11 g.
Điếu thuốc trọng lượng 11 g x
0
= 11
ˆy
0
= 0. 9184 + 0.0031 · 11 = 0.9525.
Vy nếu một điếu thuốc trọng lượng 11 g thì hàm lượng nicotin 0.9525 mg.
C SUT THỐNG
ĐỀ CUỐI KỲ II NĂM HỌC 2021-2022 (CNTT Hệ CLC)
Thời gian làm bài: 90 phút
Đ số: 2
Câu 1 (2 điểm). Trong một nhà y sản xuất linh kiện điện tử, biết rằng tuổi thọ của một loại chip
Led (sử dụng trong các bóng đèn Led) phân phối chuẩn với tuổi thọ trung bình 70000 giờ và độ
lệch chuẩn 1500 giờ.
a) Những chip Led tuổi thọ trên 71500 giờ được phân loại sản phẩm loại I. Tính t lệ sản phẩm
loại I.
b) Chọn ngẫu nhiên 15 chip Led trong một y chuyền rất nhiều sản phẩm, tính xác suất chọn
được ít nhất 2 chip Led loại I.
Lời giải.
Gọi X (giờ) tuổi thọ của chip Led.
Theo đề bài, ta .X N(70000; 1500
2
) µ = 70000; σ = 1500
a) Những chip Led tuổi thọ trên 71500 giờ được phân loại sản phẩm loại I. Tính t lệ sản phẩm
loại I:
P
(X > 71500) = P
Å
X 70000
1500
>
71500 70000
1500
ã
= P(Z > 1) 0.8413.
b) Chọn ngẫu nhiên 15 chip Led trong một y chuyền rất nhiều sản phẩm, tính xác suất chọn
được ít nhất 2 chip Led loại I.
Gọi Y số chip Led loại I trong 15 chip.
Khi đó .Y B(15; 0.8413)
Xác suất chọn được ít nhất 2 chip Led loại I trong chip 15
P(Y 2) = 1 P P(Y < 2) = 1 (Y 1) = 1
1
X
x=0
C
x
15
0.8413
x
· (1 0.8413)
15x
= 0. (9) 1.
Trang 5
Câu 2 (1.5 điểm). Một cái cân điện tử luôn hiển thị kết quả bằng cân nặng đúng của vật thể cộng
với sai số ngẫu nhiên. Giả sử rằng sai số ngẫu nhiên này phân phối chuẩn với kỳ vọng bằng 0 và độ
lệch chuẩn 0.23 (kg). Kết quả cân nặng của một vật thể trong 10 lần đo từ cân điện tử này như sau
5.09 5 33 4 61 5 04 5 36 5 22 5 22 5 34 5 23 4. . . . . . . . . 72
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
b) Người ta cần cân vật thể y ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.09 (kg).
Lời giải.
Gọi X (kg) cân nặng của vật thể.
Theo đề bài: X N (µ; 0.23 )
2
σ = 0.23: đã biết.
Từ số liệu đề bài, ta có: n = 10; ¯x = 5.116.
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
Độ tin cậy: 95% α = 0.05.
z z
1α/2
=
0.975
1.96.
Sai số: ǫ = z
1α/2
·
σ
n
= 1
.96 ·
0.23
10
0.1426.
KTC 95% cho trung bình µ là:
¯x ǫ µ ¯x ǫ
5. 116 0.1426 µ 5.116 + 0.1426
4. 9734 µ 5.2586
µ [4 2586].9734; 5. .
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.09 (kg).
Độ tin cậy: 95% α = 0.05.
z z
1α/2
=
0.975
1.96.
Để ǫ 0.09 thì
n
Å
z
1α/2
· σ
ǫ
0
ã
2
=
Å
1. .96 · 0 23
0
.09
ã
2
25. 0890
n 26.
Vy người ta cần cân vật thể này ít nhất 26 lần để sai số ước lượng của khoảng tin cậy 95% cho
cân nặng trung bình của vật thể không quá 0.09 (kg).
Câu 3 (2.5 điểm). Các tác giả của bài báo “Adjuvant Radiotherapy an Chemotherapy in Node-
Positive Premenopausal Women with Breast Cancer” (New Engl. J. of Med., 1997: 956-962) báo cáo
các kết quả nghiên cứu của họ về một thí nghiệm được thiết kế để so sánh hiệu quả của 2 phương pháp
điều trị bệnh ung thư: chỉ điều trị bằng hóa trị (phương pháp I) và điều trị kết hợp giữa hóa trị và xạ
trị (phương pháp II). Trong số 181 bệnh nhân được điều trị bằng phương pháp I, 89 bệnh nhân sống
sót ít nhất 15 năm, trong khi 107 trong số 186 bệnh nhân được điều trị bằng phương pháp II sống
sót ít nhất 15 năm.
Trang 6
a) Tìm khoảng tin cậy 95% cho t lệ bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương
pháp I.
b) ý kiến cho rằng phương pháp điều trị kết hợp giữa hóa trị và xạ trị hiệu quả hơn chỉ điều
trị bằng hóa trị. Dựa trên kết quả thí nghiệm, ta đủ bằng chứng ủng hộ ý kiến trên không với
mức ý nghĩa ?α = 1%
Lời giải.
a) Tìm khoảng tin cậy 95% cho t lệ bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương
pháp I.
Gọi Y
1
số bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp I.
Ta
y
1
= 89; n
1
= 181 t lệ mẫu ˆp
1
=
y
1
n
1
=
89
181
.
Độ tin cậy: 95% α = 0.05.
z
1
α
2
= z
0.975
1.96.
Sai số: ǫ = z
1
α
2
·
ˆp
1
(1 ˆp
1
)
n
1
= 1
.96 ·
Ã
89
181
Å
1
89
181
ã
181
0.0728.
KTC 95% cho t lệ p
ˆp p
1
ǫ
1
ˆp
1
+ ǫ
89
181
0.0728 p
1
89
181
+ 0.0728
0. 4189 p
1
0.5645
p
1
[0 5645].4189; 0. .
b) ý kiến cho rằng phương pháp điều trị kết hợp giữa hóa trị và xạ trị hiệu quả hơn chỉ điều
trị bằng hóa trị. Dựa trên kết quả thí nghiệm, ta đủ bằng chứng ủng hộ ý kiến trên không với
mức ý nghĩa ?α = 1%
Gọi Y
1
số bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp I;
Y
2
số bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp II.
Mẫu 1:
n
1
= 181; y
1
= 89 ˆp
1
=
y
1
n
1
=
89
181
.
Mẫu 2:
n
2
= 186; y
2
= 107 ˆp
2
=
y
2
n
2
=
107
186
.
ˆp =
y
1
+ y
2
n
1
+ n
2
=
89 + 107
181 + 186
=
196
367
Giả thuyết kiểm định:
®
H
0
: p p
1
2
H
1
: p
1
< p
2
;
0
= p
1
p
2
= 0; α = 0.01.
Giá trị thống kê kiểm định
z
0
=
ˆp
1
ˆp
2
0
ˆp(1 ˆp)
Å
1
n
1
+
1
n
2
ã
=
89
181
107
186
0
196
367
Å
1
196
367
ãÅ
1
181
+
1
186
ã
= 1.6043.
Trang 7
Miền bác bỏ: Bác bỏ H
0
khi z
0
< z
1α
.
Ta α = 0.01
z
1α
= z
0.99
= 2.33.
So sánh và kết luận:
Ta có: z
0
< z
1α
1.6043 < 2.33 (sai)
chưa đủ sở để bác bỏ .H
0
: p p
1
2
Kết luận: Với mức ý nghĩa 1% thì ta chưa đủ bằng chứng ủng hộ ý kiến cho rằng phương pháp
điều trị kết hợp giữa hóa trị và xạ trị hiệu quả hơn chỉ điều trị bằng hóa trị.
Câu 4 (4 điểm). Một công ty sản xuất xe ô chế tạo ra một dòng xe ô Z, công ty kiểm tra xe
bằng cách cho 30 xe chạy trên cùng 1 quãng đường 100 km và đo lượng xăng sử dụng X (Đv: lít), kết
quả cho bảng sau
X (lít) 7.0 7 1 7 2 7 3 7 4 7 5. . . . .
Số xe 5 7 6 6 3 3
Giả sử lượng xăng tiêu hao đại lượng ngẫu nhiên phân phối chuẩn.
a) Lời khẳng định: “Lượng xăng tiêu hao trung bình của dòng xe y 7.2 lít (trên 100 km)”
được chấp nhận hay không? (Mức ý nghĩa )α = 5%
b) Những xe lượng xăng tiêu hao từ 7.3 lít trở lên được xếp vào loại không đạt tiêu chuẩn về nhiên
liệu. Giám đốc công ty khẳng định rằng t lệ xe không đạt tiêu chuẩn v nhiên liệu tối đa bằng
10%. Với dữ liệu khảo sát đã cho, ta đủ bằng chứng để bác bỏ ý kiến trên không? .α = 1%
c) Khảo sát lượng xăng tiêu hao Y (Đv: lít/100 km) trên một mẫu gồm 25 xe của dòng xe W cùng
hãng, tính được ¯y = 7.35 (lít/100 km) và s
Y
= 0.2. ý kiến cho rằng dòng xe Z tiêu hao ít
nhiên liệu hơn dòng xe W. Với mức ý nghĩa α = 1%, hãy kiểm định ý kiến trên. Giả sử phương
sai của X và Y bằng nhau.
Lời giải.
a) Lời khẳng định: “Lượng xăng tiêu hao trung bình của dòng xe y 7.2 lít (trên 100 km)”
được chấp nhận hay không? (Mức ý nghĩa )α = 5%
Theo đề bài X N (µ; σ
2
)
σ
2
: chưa biết.
Từ bảng số liệu đề bài, ta tính được: n = 30; ¯x 7.2133; s 0.1570.
Giả Thuyết KĐ:
®
H
0
: µ = 7.2
H
1
: µ 6= 7.2
: 2 phía, .µ
0
= 7. 2
Mức ý nghĩa: α = 0.05.
Giá trị Thống kê kiểm định:
t
0
=
¯x µ
0
s
n
=
7.2133 7.2
0.1570
30
0.4640.
Miền bác bỏ: Bác bỏ H
0
nếu |t
0
| > t
α/2;n1
.
Ta α = 0.05
t
α/2;n1
= t
0.025;29
= 2. 045.
So sánh và kết luận:
Trang 8
Ta có: |t
0
| > t
α/2; 1n
|0.4640| > 2.045
0. 4640 > 2.045 (sai)
Chưa đủ sở để bác bỏ .H
0
: µ = 7.2
Kết luận: Với mức ý nghĩa 5% thì lượng xăng tiêu hao trung bình của dòng xe này 7.2 lít (trên
100 km).
b) Những xe lượng xăng tiêu hao từ 7.3 lít trở lên được xếp vào loại không đạt tiêu chuẩn về nhiên
liệu. Giám đốc công ty khẳng định rằng t lệ xe không đạt tiêu chuẩn v nhiên liệu tối đa bằng
10%. Với dữ liệu khảo sát đã cho, ta đủ bằng chứng để bác bỏ ý kiến trên không? .α = 1%
Gọi Y
1
số xe không đạt tiêu chuẩn.
Ta có:
n = 30, y
1
= 6 + 3 + 3 = 12 tỷ lệ mẫu ˆp =
y
1
n
=
12
30
= 0. 4.
GTKĐ:
®
H
0
: p 0.1
H
1
: p > 0.1
: 1 phía, .p
0
= 10% = 0.1
Mức ý nghĩa: α = 1% = 0.01.
Giá trị Thống kê kiểm định:
z
0
=
ˆp p
0
p
0
(1 ) p
0
n
=
0.4 0.1
0 0.1(1 .1)
30
5.4772.
Miền bác bỏ: Bác bỏ H
0
nếu .z
0
> z
1α
Ta α = 0.01
z
1α
= z
0.99
2.33.
So sánh và kết luận:
Ta có: z
0
> z
1α
5. 4772 > 2.33 (đúng)
bác bỏ H
0
: p 0 1. .
Kết luận: Với mức ý nghĩa 1%, ta đủ bằng chứng để bác bỏ ý kiến trên của vị giám đốc.
c) Khảo sát lượng xăng tiêu hao Y (Đv: lít/100 km) trên một mẫu gồm 25 xe của dòng xe W cùng
hãng, tính được ¯y = 7.35 (lít/100 km) và s
Y
= 0.2. ý kiến cho rằng dòng xe Z tiêu hao ít
nhiên liệu hơn dòng xe W. Với mức ý nghĩa α = 1%, hãy kiểm định ý kiến trên. Giả sử phương
sai của X và Y bằng nhau.
Theo đề bài X N (µ
X
; σ
2
X
) (; Y N µ
Y
; σ
2
Y
)
σ
X
= σ
Y
chưa biết.
Mẫu 1: n
X
= 30; ¯x 7.2133 và .s
X
0.1570
Mẫu 2: n
Y
= 35; ¯y = 7.35 và .s
Y
= 0. 2
Giả thuyết kiểm định
®
H
0
: µ µ
X
Y
H
1
: µ
X
< µ
Y
; µ
X
µ
Y
= 0; α = 0.01.
Giá trị thống kê kiểm định
s
2
p
=
(n
X
1)s
2
X
+ (n
Y
1)s
2
Y
n
X
+ n
Y
2
=
(30 1) 1)· 0.1570
2
+ (25 · 0 2.
2
30 + 25
2
0.0316
t
0
=
¯x ¯y (µ µ
X
Y
)
s
2
p
n
X
+
s
2
p
n
Y
=
7. .2133 7 35 0
0.0316
30
+
0.0316
25
= 2.8397.
Miền bác bỏ: Bác bỏ H
0
khi t
0
< t
α;n
X
+n
Y
2
.
Ta α = 0.01
Trang 9
t
α;n
X
+n
Y
2
= t
0.01;53
z
0.99
2.33.
So sánh và kết luận:
Ta có: t
0
< t
α;n
X
+n
Y
2
2.8397 < 2.33 (đúng)
Bác bỏ H
0
: µ
X
µ
Y
.
Kết luận: Với mức ý nghĩa 1% thì dòng xe Z tiêu hao ít nhiên liệu hơn dòng xe .W
C SUT THỐNG
ĐỀ CUỐI KỲ I NĂM HỌC 2021-2022
Thời gian làm bài: 90 phút
Đ số: 1
Câu 1. Trong cấu tạo của một loại dây thừng, người ta quan tâm đến hàm lượng nylon X (Đv: %)
ảnh hưởng như thế nào đến lực căng Y (Đv: psi) (là lực kéo tối đa trước khi sợi dây bị đứt). Số liệu
bên dưới cho kết quả đo của 10 sợi dây với hàm lượng nylon khác nhau
Hàm lượng nylon X 7 12 17 22 32 42 47 52 52 62
Lực căng Y 169 249 289 329 349 404 459 519 529 559
(Làm tròn các đáp án đến 4 chữ số sau dấu chấm thập phân)
a)
Tìm phương trình đường thẳng hồi quy ước lượng ˆy =
ˆ
β
0
+
ˆ
β
1
x (
ˆ
β
0
: hệ số chặn hay hệ số tự do;
ˆ
β
1
: hệ số góc).
b) Tính hệ số tượng quan r
XY
giữa X và .Y
c) Nếu một sợi y hàm lượng nylon bằng 45% thì giá trị dự báo cho lực căng của sợi dây bằng
bao nhiêu?
Lời giải.
Giả sử X, Y thỏa mãn hình hồi quy tuyến tính đơn.
a)
Tìm phương trình đường thẳng hồi quy ước lượng ˆy =
ˆ
β
0
+
ˆ
β
1
x (
ˆ
β
0
: hệ số chặn hay hệ số tự do;
ˆ
β
1
: hệ số góc).
Từ bảng dữ liệu, dùng y cầm tay, ta ước lượng được:
ˆ
β
0
154.4151;
ˆ
β
1
6.6981.
Phương trình hồi quy tuyến tính đơn
y theo x ˆy =
ˆ
β
0
+
ˆ
β
1
x = 154.4151 + 6.6981x.
b) Tính hệ số tượng quan r
XY
giữa X và .Y
Ta r
XY
0.9836. (bấm máy)
c) Nếu một sợi y hàm lượng nylon bằng 45% thì giá trị dự báo cho lực căng của sợi dây bằng
bao nhiêu?
Sợi y hàm lượng nylon bằng 45% x
0
= 45
ˆy
0
= 154. 4151 + 6. .6981 · 45 = 455 8296.
Nếu một sợi y hàm lượng nylon bằng 45% thì giá trị dự báo cho lực căng của sợi dây bằng
455.8296 psi.
Trang 10
Câu 2. Trong một nhà máy sản xuất vỏ bao bì, các kỹ áp dụng một phương pháp sản xuất mới với
mục đích làm giảm t lệ bao hỏng hoặc kém chất lượng. Để kiểm tra hiệu quả của phương pháp sản
xuất mới này trước khi đi vào áp dụng chính thức, các kỹ so sánh giữa 2 phân xưởng sản xuất: phân
xưởng I vẫn áp dụng phương pháp sản xuất và phân xưởng II được thử nghiệm với phương pháp sản
xuất mới. Đối với 123 bao được sản xuất phân xưởng I, 14 bao kém chất lượng hoặc hỏng.
phân xưởng II, các kỹ thấy 10 bao hỏng/kém chất lượng trong bao được sản xuất. Với194
mức ý nghĩa α = 0.01, ta đủ bằng chứng để kết luận rằng phương pháp sản xuất mới hiệu quả
hơn phương pháp sản xuất không?
Lời giải.
Gọi Y
1
số bao kém chất lượng hoặc bị hỏng phân xưởng I;
Y
2
số bao kém chất lượng hoặc bị hỏng phân xưởng II.
Mẫu 1:
n
1
= 123; y
1
= 14 ˆp
1
=
y
1
n
1
=
14
123
.
Mẫu 2:
n
2
= 194; y
2
= 10 ˆp
2
=
y
2
n
2
=
10
194
=
5
97
.
ˆp =
y
1
+ y
2
n
1
+ n
2
=
14 + 10
123 + 194
=
24
317
Giả thuyết kiểm định:
®
H
0
: p p
1
2
H
1
: p
1
> p
2
;
0
= p
1
p
2
= 0; α = 0.01.
Giá trị thống kê kiểm định
z
0
=
ˆp
1
ˆp
2
0
ˆp(1 ˆp)
Å
1
n
1
+
1
n
2
ã
=
14
123
5
97
0
24
317
Å
1
24
317
ãÅ
1
123
+
1
194
ã
= 2. 0425.
Miền bác bỏ: Bác bỏ H
0
khi .z
0
> z
1α
Ta α = 0.01
z
1α
= z
0.99
= 2. 33.
So sánh và kết luận:
Ta có: z
0
> z
1α
2 2.0425 > .33 (sai)
chưa đủ sở để bác bỏ .H
0
: p
1
p
2
Kết luận: Với mức ý nghĩa 1% thì ta chưa đủ bằng chứng để kết luận rằng phương pháp sản xuất mới
hiệu quả hơn phương pháp sản xuất cũ.
Câu 3. 8 bóng đèn dây c được chọn ngẫu nhiên và ghi nhận tuổi thọ (đơn vị: giờ) như sau: ,41.1, 39.9
39 41 41 40 40 40.2, .5, .2, .6, .7, .6. Giả sử rằng tuổi thọ của các bóng đèn tuân theo phân phối chuẩn.
a) Tìm khoảng tin cậy 92% cho tuổi thọ trung bình của các bóng đèn dây tóc.
b) Giả sử rằng tuổi thọ của các bóng đèn tuân theo phân phối chuẩn với độ lệch tiêu chuẩn 3
(giờ). Người ta cần khảo sát ít nhất bao nhiêu bóng đèn để sai số ước lượng của khoảng tin cậy
92% cho tuổi thọ trung bình của các bóng đèn không quá 0.5 (giờ).
Lời giải.
Gọi X (giờ) tuổi thọ của bóng đèn dây tóc.
Theo đề bài: X N (µ; σ
2
) σ
2
: chưa biết.
Từ số liệu đề bài, ta có: n = 8; ¯x = 40.6; s 0. 7445.
Trang 11
a) Tìm khoảng tin cậy 92% cho tuổi thọ trung bình của các bóng đèn dây tóc.
Độ tin cậy: 92% α = 0.08.
z z
1α/2
=
0.96
1.75.
Sai số: ǫ = z
1α/2
·
σ
n
= 1
.75 ·
0.7445
8
0.4606.
KTC 92% cho trung bình µ là:
¯x ǫ µ ¯x ǫ
40.6 0.4606 µ 40 4606.6 + 0.
40.1394 µ 41 0606.
µ [40 0606].1394; 41. .
b) Giả sử rằng tuổi thọ của các bóng đèn tuân theo phân phối chuẩn với độ lệch tiêu chuẩn 3
(giờ). Người ta cần khảo sát ít nhất bao nhiêu bóng đèn để sai số ước lượng của khoảng tin cậy
92% cho tuổi thọ trung bình của các bóng đèn không quá 0.5 (giờ).
Theo đề bài σ = 3 đã biết.
Để ǫ 0.5 thì
n
Å
z
1α/2
· σ
ǫ
0
ã
2
=
Å
1.75 3·
0
.5
ã
2
= 110. 25
n 111.
Người ta cần khảo sát ít nhất 111 bóng đèn để sai số ước lượng của khoảng tin cậy 92% cho tuổi
thọ trung bình của các bóng đèn không quá 0.5 (giờ).
Câu 4. Một công ty sản xuất trò chơi điện tử thực hiện một nghiên cứu về thời gian người chơi
hoàn thành các cấp độ trong một trò chơi họ vừa phát hành. Họ ghi nhận rằng thời gian để hoàn
thành cấp độ I một biến ngẫu nhiên X
1
phân phối chuẩn với trung bình 48.1 phút và độ lệch
chuẩn 15.1 phút.
a) Tính xác suất để người chơi cần nhiều hơn 50.1 phút để hoàn thành cấp độ I của trò chơi này.
b) Nhà sản xuất cần tính ngưỡng thời gian t
0
sao cho 90.15% người chơi sẽ cần ít hơn t
0
phút để
hoàn thành cấp độ I của trò chơi này. Tính .t
0
c) Giả sử trò chơi gồm 3 cấp độ, trong đó thời gian để hoàn thành các cấp độ II và III lần lượt
các biến ngẫu nhiên X
2
N(55 14, .5
2
) và X
3
N(56 10.8, .5
2
). Giả sử rằng X
1
, X
2
và X
3
các
biến ngẫu nhiên độc lập. Tính trung bình và độ lệch chuẩn cho tổng thời gian để người chơi hoàn
thành cả 3 cấp độ trò chơi này.
Lời giải.
a) Tính xác suất để người chơi cần nhiều hơn 50.1 phút để hoàn thành cấp độ I của trò chơi này.
Theo đề bài: .X
1
N (48.1; 15.1
2
) µ
1
= 48 = 15.1; σ
1
.1
Xác suất để người chơi cần nhiều hơn 50.1 phút để hoàn thành cấp độ I của trò chơi này
P
(X
1
> 50. 1) = P
Å
X
1
48 1.
15
.1
>
50 48 1.1 .
15
.1
ã
= P
Å
Z >
20
151
ã
0.4473.
Trang 12
b) Nhà sản xuất cần tính ngưỡng thời gian t
0
sao cho 90.15% người chơi sẽ cần ít hơn t
0
phút để
hoàn thành cấp độ I của trò chơi này. Tính .t
0
Cần tìm t
0
để .P(X
1
< t
0
) = 90.15%
Ta
P(X
1
< t
0
) = 90.15%
P
Å
Z <
t
0
48 1.
15
.1
ã
= 0.9015
t
0
48 1.
15
.1
1.2901
t
0
67 5805. .
c) Giả sử trò chơi gồm 3 cấp độ, trong đó thời gian để hoàn thành các cấp độ II và III lần lượt
các biến ngẫu nhiên X
2
N(55 14, .5
2
) và X
3
N(56 10.8, .5
2
). Giả sử rằng X
1
, X
2
và X
3
các
biến ngẫu nhiên độc lập. Tính trung bình và độ lệch chuẩn cho tổng thời gian để người chơi hoàn
thành cả 3 cấp độ trò chơi này.
u ý: Nếu X
1
N(µ
1
; σ
2
1
); X
2
N(µ
2
; σ
2
2
); . . . ; X
k
N(µ
k
; σ
2
k
) và X
i
độc lập X
j
với mọi
i 6= j. Xét
X = a a a
1
X
1
+
2
X
2
+ ··· +
k
X
k
khi đó X N (µ; σ
2
) trong đó
µ = a a a
1
µ
1
+
2
µ
2
+ ··· +
k
µ
k
.
σ
2
= a
2
1
σ
2
1
+ a
2
2
σ
2
2
+ ··· + a
2
k
σ
2
k
.
Theo đề bài: X
1
N (48.1; 15.1
2
) µ
1
= 48 = 15 1.1; σ
1
.
X
2
N (55; 14. .5
2
) µ
2
= 55; σ
2
= 14 5
X
3
N (56. .8; 10 5
2
) µ
3
= 56. .8; σ
3
= 10 5
Tổng thời gian để người chơi hoàn thành cả 3 cấp độ trò chơi
X = X X X
1
+
2
+
3
.
Khi đó X N (µ; σ
2
) trong đó
µ = µ µ µ
1
+
2
+
3
= 48. 1 + 55 + 56.8 = 159.9.
σ σ
2
=
2
1
+ σ
2
2
+ σ
2
3
= 15. 1
2
+ 14.5
2
+ 10.5
2
= 548. 51
σ 23 4203. .
Câu 5. Trong sản xuất chất bán dẫn, khắc hóa chất ướt thường được sử dụng để loại bỏ silic từ mặt
sau của tấm wafer trước khi kim loại hóa. T lệ ăn mòn (etch) một đặc tính quan trọng trong quá
trình y và được biết tuân theo phân phối chuẩn. Hai phương pháp khắc khác nhau đã được so
sánh bằng cách sử dụng hai mẫu ngẫu nhiên gồm 8 tấm wafer cho mỗi dung dịch. Gọi X và Y lần lượt
t lệ ăn mòn tương ứng với phương pháp khắc I và II. Kết quả quan sát được như sau
Phương pháp I (x
i
) 11.1 11 1 11 7 11.2 11.4 11. . .4 11.2 11 1.
Phương pháp II (y
i
) 9.1 8 1 8.9 8.9 9. .9 9.2 9 9 3.
Giả sử rằng phương sai của hai tổng thể bằng nhau. Với mức ý nghĩa 8%, hỏi dữ liệu trên hỗ trợ
cho tuyên bố rằng “tỷ lệ ăn mòn trung bình giống nhau cho cả hai phương pháp” không?
Lời giải.
Theo đề bài X N (µ
X
; σ
2
X
) (; Y N µ
Y
; σ
2
Y
)
σ σ
X
=
Y
chưa biết.
Trang 13
Mẫu 1: n
X
= 8; ¯x = 11.275 và s
2
X
= 0. 045.
Mẫu 2: n
Y
= 8; ¯y = 9.05 và s
2
Y
0.0229.
Giả thuyết kiểm định
®
H
0
: µ µ
X
=
Y
H
1
: µ µ
X
6=
Y
; µ
X
µ
Y
= 0; α = 8% = 0.08.
Giá trị thống kê kiểm định
s
2
p
=
(n
X
1)s
2
X
+ (n
Y
1)s
2
Y
n n
X
+
Y
2
=
(8 1) · 0.045 + (8 1) · 0.0229
8 + 8
2
0.0340
t
0
=
¯x ¯y (µ µ
X
Y
)
s
2
p
n
X
+
s
2
p
n
Y
=
11.275 9.05 0
0.0340
8
+
0.0340
8
= 24. 1335.
Miền bác bỏ: Bác bỏ H
0
khi |t
0
| > t
α/2;n
X
+n
Y
2
.
Ta α = 0.08
t
α/2;n
X
+n
Y
2
= t
0.04;14
= 1. 89.
So sánh và kết luận:
Ta có: |t
0
| > t
α/2; 2n
X
+n
Y
|24.1335| > t
α/2; 2n
X
+n
Y
24.1335 > 1. 89 (đúng)
Bác bỏ .H
0
: µ µ
X
=
Y
Kết luận: Với mức ý nghĩa 8% thì tỷ lệ ăn mòn trung bình của hai phương pháp khác nhau.
C SUT THỐNG
ĐỀ CUỐI KỲ I NĂM HỌC 2021-2022
Thời gian làm bài: 90 phút
Đ số: 2
Câu 1. Một cái cân điện tử luôn hiển thị kết quả bằng cân nặng đúng của vật thể cộng với sai số ngẫu
nhiên. Giả sử rằng sai số ngẫu nhiên y phân phối chuẩn với kỳ vọng bằng 0 và độ lệch chuẩn
0.24 (kg). Kết quả cân nặng của một vật thể trong 8 lần đo từ cân điện tử y như sau
5.39 4 89 4 93 4 87 4 66 4.3 4. . .8 4. . .74
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.18 (kg).
Lời giải.
Gọi X (kg) cân nặng của vật thể.
Theo đề bài: X N (µ; 0.24 )
2
σ = 0.24: đã biết.
Từ số liệu đề bài, ta có: n = 8; ¯x = 4.8225.
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
Độ tin cậy: 95% α = 0.05.
z z
1α/2
=
0.975
1.96.
Sai số: ǫ = z
1α/2
·
σ
n
= 1
.96 ·
0.24
8
0.1663.
Trang 14
KTC 95% cho trung bình µ là:
¯x ǫ µ ¯x ǫ
4. 8225 0.1663 µ 4.8225 + 0.1663
4. 6562 µ 4.9888
µ [4 9888].6562; 4. .
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.18 (kg).
Độ tin cậy: 95% α = 0.05.
z z
1α/2
=
0.975
1.96.
Để ǫ 0.18 thì
n
Å
z
1α/2
· σ
ǫ
0
ã
2
=
Å
1 0.96 · .24
0
.18
ã
2
6.8295
n 7.
Vy người ta cần cân vật thể này ít nhất 7 lần để sai số ước lượng của khoảng tin cậy 95% cho
cân nặng trung bình của vật thể không quá 0.18 (kg).
Câu 2. Người ta cần nghiên cứu mối quan hệ giữa lượng thức uống cồn đã sử dụng (x) và nồng
độ cồn trong máu (y) của một người. Trong một thí nghiệm, 20 người thể trạng tương tự được cho
dùng ngẫu nhiên một lượng đồ uống cồn nhất định và kiểm tra nồng độ cồn trong máu của những
người y sau 1 giờ. Biết
20
X
i
x
i
= 78;
20
X
i
x
2
i
= 362;
20
X
i
y
i
= 213;
20
X
i
y
2
i
= 2633. 052;
20
X
i
x
i
y
i
= 969. 36.
a)
Tìm phương trình đường thẳng hồi quy ước lượng ˆy =
ˆ
β
0
+
ˆ
β
1
x dự đoán nồng độ cồn trong máu
theo số lượng thức uống cồn.
b) Tính các tổng bình phương: SST , SSR, SSE.
c) Tính hệ số xác định .R
2
Lời giải.
a)
Tìm phương trình đường thẳng hồi quy ước lượng ˆy =
ˆ
β
0
+
ˆ
β
1
x dự đoán nồng độ cồn trong máu
theo số lượng thức uống cồn.
Ta n = 20 và
S
xy
=
P
n
i
=1
x
i
y
i
(
P
n
i=1
x
i
) (
P
n
i
=1
y
i
)
n
= 969. 36
78 · 213
20
= 138. 66.
S
xx
=
P
n
i
=1
x
2
i
(
P
n
i
=1
x
i
)
2
n
= 362
78
2
20
= 57. 8.
ˆ
β
1
=
S
xy
S
xx
=
138 66.
57
.8
2.3990.
¯x =
1
n
n
X
i=1
x
i
=
1
20
· 78 = 3 9.
¯y =
1
n
n
X
i=1
y
i
=
1
20
· 213 = 10. 65
Trang 15
ˆ
β
0
= ¯y
ˆ
β
1
¯x = 10. .65 2.3990 · 3.9 1 2939.
ˆy =
ˆ
β
0
+
ˆ
β
1
x = 1.2939 + 2.3990x.
Vy ˆy = 1.2939 + 2.3990x
b) Tính các tổng bình phương: SST , SSR, SSE.
SST =
n
X
i
y
2
i
(
P
n
i
=1
y
i
)
2
n
= 2633. 052
213
2
20
= 364. 602
SSR =
ˆ
β
1
S
xy
= 2. 3990 · 138.66 324.3257
SSE = SST SSR = 364.602 324.3257 = 40.2763
c) Tính hệ số xác định .R
2
R
2
=
SSR
SST
=
324.3257
364
.602
0.8895.
Câu 3. Trong một nhà máy sản xuất linh kiện điện tử, các kỹ cân nhắc lựa chọn giữa hai loại nhựa
để tiến hành sản xuất linh kiện. Một yếu tố quan trọng được cân nhắc sức chịu lực phá hủy (đơn vị:
psi) của từng loại nhựa. Đối với loại nhựa 1, các kỹ kiểm tra trên một mẫu cỡ m = 13, tính được sức
chịu lực phá hủy trung bình ¯x = 163.25 và độ lệch chuẩn mẫu s
x
= 1.1. Thử nghiệm trên một mẫu
cỡ n = 14 đối với loại nhựa 2, tính được sức chịu lực phá hủy trung bình ¯y = 163.5 và độ lệch chuẩn
mẫu s
y
= 1.95. Với mức ý nghĩa α = 3%, ta thể khẳng định rằng sức chịu lực phá hủy của hai loại
nhựa y như nhau hay không? Giả sử rằng sức chịu lực phá hủy của hai loại nhựa tuân theo phân
phối chuẩn và phương sai khác nhau.
Lời giải.
Gọi X
1
: sức chịu lực phá hủy của nhựa loại 1.
X
2
: sức chịu lực phá hủy của nhựa loại 2.
Mẫu 1: n
1
= 13; ¯x
1
= 163. 25; s
1
= 1. 1.
Mẫu 2: n
2
= 14; ¯x
2
= 163. .5; s
2
= 1 95.
σ
2
1
6= σ
2
2
: chưa biết.
Giả Thuyết KĐ:
®
H
0
: µ
1
= µ
2
H
1
: µ µ
1
6=
2
: 2 phía, .
0
= µ µ
1
2
= 0
Mức ý nghĩa: α = 0.03.
Giá trị Thống kê kiểm định:
t
0
=
¯x
1
¯x
2
0
s
2
1
n
1
+
s
2
2
n
2
=
163.25 163.5 0
1 1.
2
13
+
1.95
2
14
0.4140.
Miền bác bỏ: Bác bỏ H
0
nếu |t
0
| > t
α;v
trong đó
v
=
[(
s
2
1
/n
1
) + (s
2
2
/n
2
)]
2
(
s
2
1
/n
1
)
2
n
1
1
+
(s
2
2
/n
2
)
2
n
2
1
20 7915. = 20.
α = 0.03 t t
α/2;v
=
0.015;20
= 2. 34.
So sánh và kết luận:
Trang 16
Ta có: |t
0
| > t
α/2;v
| 0.4140| > 2.34
0 2.4140 > .34 (sai)
chưa đủ sở để bác bỏ .H
0
: µ µ
1
=
2
Kết luận: Với mức ý nghĩa 3%, ta thể khẳng định rằng sức chịu lực phá hủy của hai loại nhựa y
như nhau.
Câu 4. Các tác giả của bài báo “Adjuvant Radiotherapy an Chemotherapy in Node-Positive Pre-
menopausal Women with Breast Cancer” (New Engl. J. of Med., 1997: 956-962) báo cáo các kết quả
nghiên cứu của họ về một thí nghiệm được thiết kế để so sánh hiệu quả của 2 phương pháp điều trị bệnh
ung thư: chỉ điều trị bằng hóa trị (phương pháp 1) và điều trị kết hợp giữa hóa trị và xạ trị (phương
pháp 2). Trong số 183 bệnh nhân được điều trị bằng phương pháp 1, 90 bệnh nhân sống sót ít nhất
15 năm, trong khi 108 trong số 173 bệnh nhân được điều trị bằng phương pháp 2 sống sót ít nhất
15 năm. ý kiến cho rằng phương pháp điều trị kết hợp giữa hóa trị và xạ trị hiệu quả hơn chỉ
điều trị bằng hóa trị. Dựa trên kết quả thí nghiệm, ta đủ bằng chứng ủng hộ ý kiến trên không với
mức ý nghĩa ?α = 2%
Lời giải.
Gọi Y
1
số bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp 1;
Y
2
số bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp 2.
Mẫu 1:
n
1
= 183; y
1
= 90 ˆp
1
=
y
1
n
1
=
90
183
=
30
61
.
Mẫu 2:
n
2
= 173; y
2
= 108 ˆp
2
=
y
2
n
2
=
108
173
.
ˆp =
y
1
+ y
2
n
1
+ n
2
=
90 + 108
183 + 173
=
99
178
Giả thuyết kiểm định:
®
H
0
: p p
1
2
H
1
: p
1
< p
2
;
0
= p
1
p
2
= 0; α = 2% = 0.02.
Giá trị thống kê kiểm định
z
0
=
ˆp
1
ˆp
2
0
ˆp(1 ˆp)
Å
1
n
1
+
1
n
2
ã
=
30
61
108
173
0
99
178
Å
1
99
178
ãÅ
1
183
+
1
173
ã
= 2.5145.
Miền bác bỏ: Bác bỏ H
0
khi z
0
< z
1α
.
Ta α = 0.02
z
1α
= z
0.98
= 2.05.
So sánh và kết luận:
Ta có: z
0
< z
1α
2.5145 < 2.05 (đúng)
bác bỏ H
0
: p
1
p
2
.
Kết luận: Với mức ý nghĩa 2% thì ta đủ bằng chứng ủng hộ ý kiến cho rằng phương pháp điều trị
kết hợp giữa hóa trị và xạ trị hiệu quả hơn chỉ điều trị bằng hóa trị.
Câu 5. Một công ty muốn so sánh hiệu quả của hai loại nhiên liệu cho một chiếc ô tô. 5 chiếc xe giống
nhau sẽ chạy 1000 km mỗi chiếc, hai chiếc sử dụng loại nhiên liệu thứ nhất và ba chiếc chạy loại thứ
hai. Gọi X
1
và X
2
hiệu suất nhiên liệu quan sát được đối với loại thứ nhất và Y
1
, Y
2
và Y
3
hiệu
suất đối với loại thứ hai. Giả sử tất cả các biến này độc lập với nhau và X
i
N (21, 8) với i = 1, 2 và
Y
j
N (18, 11) với j = 1, 2, 3. Gọi W biến ngẫu nhiên mới được cho bởi:
W
=
X
1
+ X
2
2
Y
1
+ +Y
2
Y
3
3
.
Trang 17
a) Tìm kỳ vọng của .W
b) Tìm phương sai của .W
c) Tìm .P(W 0)
Lời giải.
u ý: Nếu X
1
N (µ
1
; σ
2
1
); X
2
N (µ
2
; σ
2
2
); ;. . . X
k
N (µ
k
; σ
2
k
) và X
i
độc lập X
j
với mọi i 6= j. Xét
X = a a a
1
X
1
+
2
X
2
+ ··· +
k
X
k
khi đó X N (µ; σ
2
) trong đó
µ = a
1
µ µ µ
1
+ a
2 2
+ ··· + a
k k
.
σ
2
= a
2
1
σ
2
1
+ a
2
2
σ
2
2
+ +··· a
2
k
σ
2
k
.
Theo đề bài: X
i
N (µ
X
i
; σ
2
X
i
) với µ
X
i
= 21; σ
X
i
=
8 = 2 = 1
2, i , 2.
Y
j
N (µ
Y
j
; σ
2
Y
j
) với µ
Y
j
= 18; σ
Y
j
=
11, j = 1, 2, 3.
Ta
W
=
X
1
+ X
2
2
Y
1
+ +Y
2
Y
3
3
=
1
2
X
1
+
1
2
X
2
1
3
Y
1
1
3
Y
2
1
3
Y
3
.
a) Tìm kỳ vọng của .W
µ
W
= E(W ) = E
Å
1
2
X
1
+
1
2
X
2
1
3
Y
1
1
3
Y
2
1
3
Y
3
ã
=
1
2
µ
X
1
+
1
2
µ
X
2
1
3
µ
Y
1
1
3
µ
Y
2
1
3
µ
Y
3
=
1
2
· 21 +
1
2
· 21
1
3
· 18
1
3
· 18
1
3
· 18
= 3.
b) Tìm phương sai của .W
σ
2
W
= V ar(W ) = V ar
Å
1
2
X
1
+
1
2
X
2
1
3
Y
1
1
3
Y
2
1
3
Y
3
ã
=
Å
1
2
ã
2
·
8 +
Å
1
2
ã
2
·
8 +
Å
1
3
ã
2
·
11 +
Å
1
3
ã
2
·
11 +
Å
1
3
ã
2
· 11
=
23
3
.
c) Tìm .P(W 0)
Ta
W N
Å
3;
23
3
ã
, do đó
P
(W 0) = P
Ü
W 3
23
3
0 3
23
3
ê
= P
Ç
Z
3
69
23
å
0.1393.
Trang 18
C SUT THỐNG
ĐỀ CUỐI KỲ II NĂM HỌC 2020-2021
Thời gian làm bài: 90 phút
Đ số: 1
Câu 1 (4 điểm). Đem cân một số trái y T vừa thu hoạch, ta được kết quả sau
Trọng lượng (gam) 205 215 225 235 245
Số trái 12 17 20 18 15
Giả sử rằng trọng lượng của trái y T phân phối chuẩn.
a) Tìm khoảng ước lượng cho trọng lượng trung bình của trái y với độ tin cậy .95%
b) Nếu muốn sai số ước lượng không quá 2 gam độ tin cậy 96% thì phải quan sát ít nhất bao nhiêu
trái?
c) Những trái y trọng lượng 230 gam được xếp vào trái loại I. Hãy ước lượng tỷ lệ trái y
loại I với độ tin cậy .97%
d) Người ta dự đoán rằng những trái cây T trên trọng lượng trung bình 230 gam. y cho biết
dự đoán trên chính xác không mức ý nghĩa .2%
Lời giải.
Theo đề bài: T N(µ; σ
2
)
σ
2
: chưa biết.
Từ bảng số liệu đề bài, ta có: n = 82; ¯x 225.8537; s 13.2592.
a) Tìm khoảng ước lượng cho trọng lượng trung bình của trái y với độ tin cậy .95%
Độ tin cậy: 95% α = 0.05.
t
α/2;n1
= t
0.025;81
z
0.975
1.96.
Sai số: ǫ = t
α/2;n1
·
s
n
= 1
.96 ·
13 2592.
82
2.8699.
KTC 95% cho trung bình µ là:
¯x ǫ µ ¯x ǫ
225.8537 2.8699 µ 225 8699.8537 + 2.
222.9838 µ 228.7236
µ [222.9838; 228.7236].
b) Nếu muốn sai số ước lượng không quá 2 gam độ tin cậy 96% thì phải quan sát ít nhất bao nhiêu
trái?
Độ tin cậy: 96% α = 0.04.
z z
1α/2
=
0.98
2.05.
Để ǫ 2 thì
n
Å
z
1α/2
· s
ǫ
0
ã
2
=
Å
2. .05 · 13 2592
2
ã
2
184 7066.
n 185.
Vy nếu muốn sai số ước lượng không quá 2 gam độ tin cậy 96% thì phải quan sát ít nhất 185
trái.
Trang 19
c) Những trái y trọng lượng 230 gam được xếp vào trái loại I. Hãy ước lượng tỷ lệ trái y
loại I với độ tin cậy .97%
Gọi Y số trái cây loại I.
Ta có:
n = 82, y = 18 + 15 = 33 tỷ lệ mẫu ˆp =
y
n
=
33
82
.
Độ tin cậy: 97% α = 0.03.
z
1
α
2
= z
0.985
2.17.
Sai số: ǫ = z
1
α
2
·
ˆp(1 ˆp)
n
= 2
.17 ·
Ã
33
82
Å
1
33
82
ã
82
0.1175.
KTC 97% cho t lệ p
ˆp ǫ p ˆp + ǫ
33
82
0.1175 p
33
82
+ 0.1175
0. 2849 p 0.5199
p [0 5199].2849; 0. .
d) Người ta dự đoán rằng những trái cây T trên trọng lượng trung bình 230 gam. y cho biết
dự đoán trên chính xác không mức ý nghĩa .2%
σ
2
: chưa biết.
Ta có: n = 82; ¯x 225. .8537; s 13 2592.
Giả Thuyết KĐ:
®
H
0
: µ = 230
H
1
: µ 6= 230
: 2 phía, µ
0
= 230.
Mức ý nghĩa: α = 2% = 0.02.
Giá trị Thống kê kiểm định:
t
0
=
¯x µ
0
s
n
=
225.8537 230
13 2592.
82
2.8317.
Miền bác bỏ: Bác bỏ H
0
nếu |t
0
| > t
α/2;n1
.
Ta α = 0.02
t
α/2;n1
= t
0.01;81
z
0.99
2.33.
So sánh và kết luận:
Ta có: |t
0
| > t
α;n1
| 2.8317| > 2.33
2. 8317 > 2.33 (đúng)
bác bỏ .H
0
: µ = 230
Kết luận: Với mức ý nghĩa 2%, những trái y T trên trọng lượng trung bình không phải
230 gam.
Câu 2 (2 điểm). Vào mùa đông của đại dịch cúm, bố mẹ của 2000 bé đã được các nhà nghiên cứu
khảo sát tại một công ty dược phẩm nổi tiếng để xác định liệu thuốc mới của công ty hiệu quả sau
hai ngày hay không. Trong số 120 bé bị cúm và được cho dùng thuốc, 29 bé khỏi bệnh trong hai ngày.
Trong 280 bé bị cúm những không được cho dùng thuốc mới, 56 bé phục hồi trong hai ngày. Hỏi
Trang 20
dấu hiệu ý nghĩa nào ủng hộ lời tuyên bố của công ty v hiệu quả của thuốc hay không với mức ý
nghĩa 5%? (Yêu cầu dùng cả 2 phương pháp: miền bác b pgiá trị)
Lời giải.
Gọi Y
1
: số bé uống thuốc mới khỏi bệnh trong hai ngày.
Y
2
: số bé không uống thuốc mới khỏi bệnh trong hai ngày.
Mẫu
1: n
1
= 120; y
1
= 29 ˆp
1
=
y
1
n
1
=
29
120
.
Mẫu
2: n
2
= 280; y
2
= 56 ˆp
2
=
y
2
n
2
=
56
280
= 0. 2.
ˆp =
y
1
+ y
2
n
1
+ n
2
=
29 + 56
120 + 280
= 0. 2125.
GTKĐ:
®
H
0
: p
1
p
2
H
1
: p
1
> p
2
: 1 phía, .p p p
0
=
1
2
= 0
Mức ý nghĩa: α = 0.05.
Giá trị Thống kê kiểm định:
z
0
=
ˆp
1
ˆp p p
2
(
1
2
)
ˆp(1 ˆp)
Å
1
n
1
+
1
n
2
ã
=
29
120
0.2 0
0 0.2125(1 .2125)
Å
1
120
+
1
280
ã
0.93352.
Miền bác bỏ: Bác bỏ H
0
nếu .z
0
> z
1α
Ta α = 0.05
z
1α
= z
0.95
= 1. 64485.
So sánh và kết luận:
Ta có: z
0
> z
1α
0. 93352 > 1.64485 (sai)
Chưa đủ sở để bác bỏ H
0
: p
1
p
2
.
Kết luận: Với mức ý nghĩa 5%, tỷ lệ khỏi bệnh khi uống thuốc mới sau hai ngày không nhiều hơn
bé không uống thuốc mới, hay thuốc mới không hiệu quả như tuyên bố của công ty.
> Cách 2: Dùng p-giá trị:
Ta
p giá trị = 1 Φ(z
0
) = 1 Φ(0. .93352) 0 8247.
pgiá trị = 0.8247 > 0.05 = α nên chưa đủ sở để bác bỏ H
0
: p p
1
2
.
Câu 3 (2 điểm). Một nghiên cứu được thực hiện để xem việc tăng nồng độ chất tác dụng đáng
k đến tốc độ của một phản ứng hóa học hay không. Với một nồng độ chất 1.5 mol/l, phản ứng được
chạy 15 lần, với tốc độ trung bình 7.5 micromoles mỗi 30 phút và độ lệch chuẩn 1.5. Với một nồng độ
chất 2.0 mol/l, 12 lần chạy được thực hiện, thu được tốc độ trung bình 8.8 micromoles mỗi 30 phút
và độ lệch chuẩn 1.2. do để tin rằng việc tăng nồng độ chất làm tăng tốc độ trung bình của
phản ứng 0.5 micromoles mỗi 30 phút hay không? Sử dụng mức ý nghĩa 0.01 giả sử rằng các tổng
thể xấp xỉ chuẩn với các phương sai bằng nhau.
Lời giải.
Gọi X
1
(micromoles) tốc độ phản ứng ứng với nồng độ chất 1.5 mol/l;
X
2
(micromoles) tốc độ phản ứng ứng với nồng độ chất 2 mol/l;.
Theo đề bài X
1
N (µ
1
; σ
2
1
); X
2
N (µ
2
; σ
2
2
)
σ
1
= σ
2
chưa biết.
Mẫu 1: n
1
= 15; ¯x
1
= 7. 5 và .s
1
= 1. 5
Mẫu 2: n
2
= 12; ¯x
2
= 8. 8 và .s
2
= 1. 2
Giả thuyết kiểm định
®
H
0
: µ
1
µ
2
0.5
H
1
: µ
1
µ
2
< 0.5
;
0
= µ
1
µ
2
= 0.5; α = 0.01.
Trang 21
Giá trị thống kê kiểm định
s
2
p
=
(n
1
1)s
2
1
+ (n
2
1)s
2
2
n
1
+ n
2
2
=
(15 1) · 1 5.
2
+ (12 1) · 1 2.
2
15 + 12
2
= 1. 8936
t
0
=
¯x
1
¯x
2
0
s
2
p
n
1
+
s
2
p
n
2
=
7 0.5 8.8 ( .5)
1.8936
12
+
1.8936
15
= 1.5011.
Miền bác bỏ: Bác bỏ H
0
khi t
0
< t
α;n
1
+n
2
2
.
Ta α = 0.01
t
α;n
1
+n
2
2
= t
0.01;25
= 2.4851.
So sánh và kết luận:
Ta có: t t
0
<
α;n
1
+n
2
2
1.5011 < 2.4851 (sai)
chưa đủ sở để bác bỏ .H
0
: µ
1
µ
2
0.5
Kết luận: Với mức ý nghĩa 1% thì không do để tin rằng việc tăng nồng độ chất làm tăng tốc
độ trung bình của phản ứng 0.5 micromoles mỗi 30 phút.
Câu 4 (2 điểm). Một nghiên cứu v khối lượng đường bị biến đổi trong một quá trình nào đó các
nhiệt độ khác nhau. Dữ liệu được hóa và ghi lại như sau
Nhiệt độ (x) 1.0 1.1 1 8 1.2 1.3 1.4 1.5 1.6 1.7 1. .9 2 0.
Đường bị biến đổi (y) 8.1 7.8 8 3 9. 5 9.8 9 6 10.5 8.9 8. . 2 9. .2 10 5.
a)
Tìm phương trình hồi quy tuyến tính đơn , Giải thích ý nghĩay theo x
ˆ
β
1
nhận được.
b) Ước lượng khối lượng trung bình của đường bị biến đổi được tạo ra khi nhiệt độ được hóa
1.75.
Lời giải.
a) Tìm phương trình hồi quy tuyến tính đơn y theo :x
Từ bảng dữ liệu đề bài, tiến hành sử dụng máy tính cầm tay, ta tính được:
ˆ
β
0
6.4136;
ˆ
β
1
1.8091
ˆy =
ˆ
β
0
+
ˆ
β x.
1
x = 6.4136 + 1.8091
>
Giải thích ý nghĩa
ˆ
β
1
nhận được:
ˆ
β
1
1.8091 > 0 nên khi nhiệt độ thay đổi 1 đơn vị và các yếu tố khác không thay đổi thì
đường bị biến đối 1.8091 đơn vị.
b) Ước lượng khối lượng trung bình của đường bị biến đổi được tạo ra khi nhiệt độ được hóa
1.75.
Khi nhiệt độ được hóa 1.75 x
0
= 1. 75
ˆy
0
= 6. 4136 + 1. .8091 · 1 75 9.5795.
Khi nhiệt độ được hóa 1.75 thì khối lượng trung bình của đường bị biến đổi được tạo ra
9.5795.
Trang 22
C SUT THỐNG
ĐỀ CUỐI KỲ II NĂM HỌC 2020-2021
Thời gian làm bài: 90 phút
Đ số: 2
Câu 1 (4 điểm). Kết quả quan sát v hàm lượng Vitamin C của một loại trái y cho bởi bảng sau
Hàm lượng Vitamin C (mg) 6 8 10 12 14 16
Số trái 5 10 20 35 25 5
a) Ước lượng hàm lượng Vitamin C trung bình trong một trái y với độ tin cậy .90%
b) Những trái hàm lượng Vitamin C trên 11 mg trở lên trái loại I. Ước lượng tỷ lệ trái loại I
với độ tin cậy .92%
c) ý kiến rằng hàm lượng Vitamin C trung bình 10 mg. Với mức ý nghĩa 6%, y kiểm tra ý
kiến trên.
d) Lời khẳng định: “Tỷ lệ trái cây loại I 60% được chấp nhận hay không với mức ý nghĩa .4%
Lời giải.
Gọi X (mg) hàm lượng vitamin C trong trái y trên.
Giả sử X N (µ; σ
2
)
σ
2
: chưa biết.
Từ bảng số liệu đề bài, ta có: n = 100; ¯x = 11.6; s 2.4288.
a) Ước lượng hàm lượng Vitamin C trung bình trong một trái y với độ tin cậy .90%
Độ tin cậy: 90% α = 0.1.
t
α/2;n1
= t
0.05;99
z
0.95
1.645.
Sai số: ǫ = t
α/2;n1
·
s
n
= 1
.645 ·
2.4288
100
0.3995.
KTC 90% cho trung bình µ là:
¯x ǫ µ ¯x ǫ
11.6 0.3995 µ 11.6 + 0.3995
11.2005 µ 11 9995.
µ [11 9995].2005; 11. .
b) Những trái hàm lượng Vitamin C trên 11 mg trở lên trái loại I. Ước lượng tỷ lệ trái loại I
với độ tin cậy .92%
Gọi Y số trái cây loại I.
Ta có:
n = 100, y = 35 + 25 + 5 = 65 tỷ lệ mẫu ˆp =
y
n
=
65
100
= 0. 65.
Độ tin cậy: 92% α = 0.08.
z
1
α
2
= z
0.96
1.75.
Sai số: ǫ = z
1
α
2
·
ˆp(1 ˆp)
n
= 1
.75 ·
0.65 (1 0.65)
100
0.0835.
Trang 23
KTC 92% cho t lệ p
ˆp ǫ p ˆp + ǫ
0. 65 0.0835 p 0.65 + 0.0835
0. 5665 p 0.7335
p [0 7335].5665; 0. .
c) ý kiến rằng hàm lượng Vitamin C trung bình 10 mg. Với mức ý nghĩa 6%, y kiểm tra ý
kiến trên.
σ
2
: chưa biết.
Ta có: n = 100; ¯x = 11. .6; s 2 4288.
Giả Thuyết KĐ:
®
H
0
: µ = 10
H
1
: µ 6= 10
: 2 phía, µ
0
= 10.
Mức ý nghĩa: α = 6% = 0.06.
Giá trị Thống kê kiểm định:
t
0
=
¯x µ
0
s
n
=
11 10.6
2.4288
100
6.5876.
Miền bác bỏ: Bác bỏ H
0
nếu |t
0
| > t
α/2;n1
.
Ta α = 0.06
t
α/2;n1
= t
0.03;99
z
0.97
1.88.
So sánh và kết luận:
Ta có: |t
0
| > t
α;n1
|6. 5876| > 1.88
6. 5876 > 1.88 (đúng)
bác bỏ .H
0
: µ = 10
Kết luận: Với mức ý nghĩa 6%, những trái cây trên hàm lượng vitamin C trung bình không
phải 10 mg.
d) Lời khẳng định: “Tỷ lệ trái cây loại I 60% được chấp nhận hay không với mức ý nghĩa .4%
Ta
n = 100, y = 35 + 25 + 5 = 65 tỷ lệ mẫu ˆp =
y
n
=
65
100
= 0. 65.
GTKĐ:
®
H
0
: p = 0.6
H
1
: p 6= 0.6
: 1 phía, .p
0
= 60% = 0.6
Mức ý nghĩa: α = 4% = 0.04.
Giá trị Thống kê kiểm định:
z
0
=
ˆp p
0
p
0
(1 ) p
0
n
=
0 0.65 .6
0 0.6(1 .6)
100
1.0206.
Miền bác bỏ: Bác bỏ H
0
nếu |z
0
| > z
1α/2
.
Ta α = 0.04
z z
1α/2
=
0.98
2.05.
So sánh và kết luận:
Ta có: |z
0
| > z
1α/2
|1. 0206| > 2.05
1 2.0206 > .05 (sai)
chưa đủ cở sở để bác bỏ .H
0
: p = 0.6
Kết luận: Với mức ý nghĩa thì tỷ lệ trái y loại I .4% 60%
Trang 24
| 1/75

Preview text:

XÁC SUẤT THỐNG KÊ
ĐỀ CUỐI KỲ II NĂM HỌC 2021-2022
Thời gian làm bài: 90 phút Đề số: 1
Câu 1 (4 điểm). Biết trọng lượng X (g/quả) của mỗi quả trứng có phân phối chuẩn. Đem cân 100
quả trứng ta có kết quả sau: xi 155 160 165 170 175 180 185 ni 5 12 14 25 24 14 6
Cho biết trứng có trọng lượng lớn hơn 170 g là trứng loại một.
a) Tìm khoảng tin cậy 97% cho trọng lượng trứng trung bình.
b) Tìm khoảng tin cậy 98% cho tỷ lệ trứng loại một. Nếu ta muốn sai số ước lượng không quá 0.1 g
thì cần khảo sát thêm bao nhiêu trứng?
c) Có ý kiến cho rằng trọng lượng trứng trung bình lớn hơn 170 g/quả. Hãy kiểm định ý kiến trên
ứng với mức ý nghĩa 1%.
d) Có ý kiến cho rằng 50% số trứng thuộc loại một. Hãy kiểm định ý kiến trên với mức ý nghĩa 1%. ✍ Lời giải.
Gọi X (cm/s) là tốc độ cháy của nhiên liệu rắn.
Theo đề bài, ta có X ∼ N(µ; σ2) σ2: chưa biết.
Từ bảng dữ liệu, ta tính được: n = 100; ¯x = 170.85; s ≈ 7.7543.
a) Tìm khoảng tin cậy 97% cho trọng lượng trứng trung bình
• Độ tin cậy: 97% ⇒ α = 0.03.
⇒ tα/2;n−1 = t0.015;99 ≈ z0.985 ≈ 2.17. s • Sai số: ǫ = tα/2;n √ −1 · n 7.7543 = 2.17 · √100 ≈ 1.6827.
• KTC 97% cho trung bình µ là: ¯ x − ǫ ≤ µ ≤ ¯x − ǫ
⇔ 170.85 − 1.6827 ≤ µ ≤ 170.85 + 1.6827
⇔ 169.1673 ≤ µ ≤ 172.5327
⇒ µ ∈ [169.1673; 172.5327].
b) Tìm khoảng tin cậy 98% cho tỷ lệ trứng loại một.
Gọi Y là số trứng loại một. Ta có: y 44
n = 100, y = 24 + 14 + 6 = 44 ⇒ tỷ lệ mẫu ˆp = = = 0.44. n 100
• Độ tin cậy: 98% ⇒ α = 0.02. ⇒ z1 α = z − 0.99 ≈ 2.33. 2 Trang 1  ˆp(1 − ˆp) • Sai số: ǫ = z1 α · − 2 n  0.44 (1 − 0.44) = 2.33 · 100 ≈ 0.1157.
• KTC 98% cho tỷ lệ p là ˆ p − ǫ ≤ p ≤ ˆp + ǫ
⇔ 0.44 − 0.1157 ≤ p ≤ 0.44 + 0.1157 ⇔ 0.3243 ≤ p ≤ 0.5557 ⇒ p ∈ [0.3243; 0.5557].
> Nếu ta muốn sai số ước lượng không quá 0.1 g thì cần khảo sát thêm bao nhiêu trứng? Để ǫ ≤ 0.1 thì Å ã2  z 2 2.33 n ≥ 1−α/2 · ˆ p(1 − ˆp) =
· 0.44(1 − 0.44) ≈ 133.7681. ǫ 0.1 ⇒ n ≥ 134.
Do đó, để ǫ ≤ 0.1 thì phải khảo sát ít nhất 134 quả trứng.
Vậy để ǫ ≤ 0.1 thì phải khảo sát thêm 134 − 100 = 34 quả trứng nữa.
c) Có ý kiến cho rằng trọng lượng trứng trung bình lớn hơn 170 g/quả. Hãy kiểm định ý kiến trên
ứng với mức ý nghĩa 1%. σ2: chưa biết.
Ta có: n = 100; ¯x = 170.85; s ≈ 7.7543. ®H • Giả Thuyết KĐ: 0 : µ ≤ 170 : KĐ 1 phía, µ0 = 170. H1 : µ > 170
• Mức ý nghĩa: α = 0.01.
• Giá trị Thống kê kiểm định: ¯ x − µ 170.85 − 170 t 0 0 = s = ≈ 1.0962. √ 7.7543 n √100
• Miền bác bỏ: Bác bỏ H nếu t0 > tα;n−1. 0 Ta có α = 0.01
⇒ tα;n−1 = t0.01;99 ≈ z0.99 ≈ 2.33. • So sánh và kết luận: Ta có: t0 > tα;n−1 ⇔ 1.0962 > 2.33 (sai)
⇒ Chưa đủ cơ sở để bác bỏ H0 : µ ≤ 170.
Kết luận: Với mức ý nghĩa 1%, trọng lượng trứng trung bình không lớn hơn 170 g.
d) Có ý kiến cho rằng 50% số trứng thuộc loại một. Hãy kiểm định ý kiến trên với mức ý nghĩa 1%. Ta có: y 44
n = 100, y = 24 + 14 + 6 = 44 ⇒ tỷ lệ mẫu ˆ p = = = 0.44. n 100 ®H • GTKĐ: 0 : p = 0.5 : KĐ 2 phía, p0 = 50% = 0.5. H1 : p 6= 0.5
• Mức ý nghĩa: α = 1% = 0.01.
• Giá trị Thống kê kiểm định: Trang 2 ˆ p − p 0.44 − 0.5 z 0 0 = = = −1.2. … p … 0(1 − p0) 0.5(1 − 0.5) n 100
• Miền bác bỏ: Bác bỏ H nếu . 0 |z0| > z1−α/2 Ta có α = 0.01
⇒ z1−α/2 = z0.995 ≈ 2.58. • So sánh và kết luận: Ta có: |z0| > z1−α/2 | − 1.2| > 2.58 ⇔ 1.2 > 2.58 (sai)
⇒ Chưa đủ cơ sở để bác bỏ H0 : p = 0.5.
Kết luận: Với mức ý nghĩa 1%, ý kiến cho rằng 50% số trứng thuộc loại một không được chấp nhận.
Câu 2 (2 điểm). Hai chất xúc tác có thể được sử dụng trong một phản ứng hóa học. Mười hai phản
ứng được cho sử dụng chất xúc tác 1, dẫn đến hiệu suất trung bình là 86 (đv: %) và độ lệch chuẩn mẫu
là 3. Mười lăm phản ứng được cho sử dụng chất xúc tác 2 và kết quả là hiệu suất trung bình 89 với độ
lệch chuẩn mẫu là 2. Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn.
Có bằng chứng để khẳng định rằng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1
hay không? Sử dụng α = 0.01. (Yêu cầu dùng cả 2 phương pháp: miền bác bỏ và p-giá trị) ✍ Lời giải. Gọi X ( 1
%) là hiệu suất phản ứng khi sử dụng chất xúc tác 1 X ( 2
%) là hiệu suất phản ứng khi sử dụng chất xúc tác 2.
Theo đề bài X1 ∼ N(µ1; σ2); X ) 1 2 ∼ N (µ2; σ2 2 σ chưa biết. 1 = σ2
Mẫu 1: n1 = 12; ¯x1 = 86 và s1 = 3.
Mẫu 2: n2 = 15; ¯x2 = 89 và s2 = 2. ®H
• Giả thuyết kiểm định 0 : µ1 ≥ µ2 ;
⇒ µ1 − µ2 = 0; α = 0.01. H1 : µ1 < µ2
• Giá trị thống kê kiểm định (n + (n (12 − 1).32 + (15 − 1).22 s2 1 − 1)s2 1 2 − 1)s2 2 = = 6.2 p = n1 + n2 − 2 12 + 15 − 2 ¯ x 86 − 89 − 0 t 1 − ¯ x2 − (µ1 − µ2) 0 = = = −3.1109.  … s2 s2 6.2 6.2 p + p + n 12 15 1 n2
• Miền bác bỏ: Bác bỏ H khi . 0 t0 < −tα;n1+n2−2 Ta có α = 0.01
⇒ −tα;n1+n2−2 = −t0.01;25 = −2.4851. • So sánh và kết luận: Ta có: t0 < −tα;n1+n2−2 −3.1109 < −2.4851 (đúng) ⇒ Bác bỏ H . 0 : µ1 ≥ µ2
Kết luận: Với mức ý nghĩa 1% thì có bằng chứng để khẳng định được rằng sử dụng chất xúc tác 2 tạo
ra hiệu suất trung bình cao hơn khi dùng chất xúc tác 1.
> Cách 2: Dùng p - giá trị: Trang 3
t0 = −3.1109 ⇒ p-giá trị = P (T12+15 1109) ≈ 0 0023.
−2 ≤ t0) = P (T12+15−2 ≤ −3. .
Vì p−giá trị ≈ 0.0023 < 0.01 = α nên bác bỏ H0 : µ1 ≥ µ2.
Câu 3 (2 điểm). Hai loại giải pháp khác nhau để đánh bóng thấu kính nội nhãn (được dùng trong
mắt người sau phẫu thuật đục thủy tinh thể) đang được đánh giá để sử dụng. Trong 300 thấu kính đã
được đánh bóng bằng giải pháp 1 thì có 253 thấu kính không có khuyết tật do đánh bóng. Trong 300
thấu kính khác được đánh bóng bằng giải pháp 2 thì có 196 thấu kính không có khuyết tật do đánh
bóng. Có lý do nào để tin rằng hai giải pháp đánh bóng là khác nhau không? Sử dụng α = 0.05. p−giá
trị cho kiểm định này là bao nhiêu? ✍ Lời giải.
Gọi Y là số thấu kính được đánh bóng bằng cách sử dụng giải pháp đánh bóng thứ nhất 1
Y là số thấu kính được đánh bóng bằng cách sử dụng giải pháp đánh bóng thứ hai 2 . Mẫu 1: y 253 n 1 . 1 = 300; y1 = 253 ⇒ ˆ p1 = = n1 300 Mẫu 2: y 196 49 n 2 . 2 = 300; y2 = 196 ⇒ ˆ p2 = = = n2 300 75 y 253 + 196 449 ⇒ ˆ p = 1 + y2 = = n1 + n2 300 + 300 600 ®H
• Giả thuyết kiểm định: 0 : p1 = p2 ;
⇒ ∆0 = p1 − p2 = 0; α = 0.05. H1 : p1 6= p2
• Giá trị thống kê kiểm định 253 49 ˆ p − − 0 z 1 − ˆ p2 − ∆0 300 75 0 = = = 5.3621   Å 1 1 ã 449 Å 449 ã Å 1 1 ã ˆ p(1 − ˆp) + 1 − + n1 n2 600 600 300 300
• Miền bác bỏ: Bác bỏ H khi . 0 |z0| > z1−α/2 Ta có α = 0.05 ⇒ z1−α/2 = z0.975 = 1.96. • So sánh và kết luận: Ta có: |z0| > z1−α/2 |5.3621| > z1−α/2 5.3621 > 1.96 (đúng) ⇒ bác bỏ H0.
Kết luận: Với mức ý nghĩa 5% thì hai giải pháp đánh bóng có tỷ lệ kính khuyết tật khác nhau. > p - giá trị:
z0 = 5.3621 ⇒ p-giá trị = 2 (1 − Φ(|5.3621|)) ≈ 2 (1 − 1) = 0.
Câu 4 (2 điểm). Dữ liệu bên dưới mô tả về trọng lượng của các điếu thuốc lá x (g) được sản xuất từ
các nhà máy khác nhau và hàm lượng nicotin y (mg) trong mỗi điếu thuốc: x 15.8 14.9 9.0 4.5 15.0 17.0 8.6 12.0 4.1 16.0 y 0.957 0.886 0.852 0.911 0.889 0.919 0.969 1.118 0.946 1.094
a) Tìm phương trình hồi quy tuyến tính đơn y theo x. Giải thích ý nghĩa của ˆ β nhận được. 1
b) Dự đoán hàm lượng nicotin của một điếu thuốc có trọng lượng 11 g. Trang 4 ✍ Lời giải.
Giả sử X, Y thỏa mãn mô hình hồi quy tuyến tính đơn biến.
a) Tìm phương trình hồi quy tuyến tính đơn y theo x:
Từ bảng dữ liệu, dùng máy cầm tay, ta ước lượng được: ˆ β0 ≈ 0.9184; ˆ
β1 ≈ 3.0563 · 10−3 ≈ 0.0031.
Phương trình hồi quy tuyến tính đơn y theo x là ˆy = ˆ β0 + ˆ β1x = 0.9184 + 0.0031x.
> Giải thích ý nghĩa của ˆ β nhận được: 1 Vì ˆ
β1 = 0.0031 > 0 nên khi trọng lượng của điếu thuốc lá tăng 1 g và các yếu tố khác không đổi
thì hàm lượng nicotin trong điếu thuốc tăng 0.0031 mg.
b) Dự đoán hàm lượng nicotin của một điếu thuốc có trọng lượng 11 g.
Điếu thuốc có trọng lượng 11 g ⇒ x0 = 11
⇒ ˆy0 = 0.9184 + 0.0031 · 11 = 0.9525.
Vậy nếu một điếu thuốc có trọng lượng 11 g thì hàm lượng nicotin là 0.9525 mg. XÁC SUẤT THỐNG KÊ
ĐỀ CUỐI KỲ II NĂM HỌC 2021-2022 (CNTT Hệ CLC)
Thời gian làm bài: 90 phút Đề số: 2
Câu 1 (2 điểm). Trong một nhà máy sản xuất linh kiện điện tử, biết rằng tuổi thọ của một loại chip
Led (sử dụng trong các bóng đèn Led) có phân phối chuẩn với tuổi thọ trung bình là 70000 giờ và độ lệch chuẩn 1500 giờ.
a) Những chip Led có tuổi thọ trên 71500 giờ được phân loại là sản phẩm loại I. Tính tỷ lệ sản phẩm loại I.
b) Chọn ngẫu nhiên 15 chip Led trong một dây chuyền có rất nhiều sản phẩm, tính xác suất chọn
được ít nhất 2 chip Led loại I. ✍ Lời giải.
Gọi X (giờ) là tuổi thọ của chip Led.
Theo đề bài, ta có X ∼ N(70000; 15002) ⇒ µ = 70000; σ = 1500.
a) Những chip Led có tuổi thọ trên 71500 giờ được phân loại là sản phẩm loại I. Tính tỷ lệ sản phẩm loại I: Å X − 70000 71500 − 70000ã P(X > 71500) = P > = P(Z > 1) ≈ 0.8413. 1500 1500
b) Chọn ngẫu nhiên 15 chip Led trong một dây chuyền có rất nhiều sản phẩm, tính xác suất chọn
được ít nhất 2 chip Led loại I.
Gọi Y là số chip Led loại I trong 15 chip. Khi đó Y ∼ B(15; 0.8413).
Xác suất chọn được ít nhất 2 chip Led loại I trong 15 chip là 1 X P(Y ≥ 2) = 1 − P P
(Y < 2) = 1 − (Y ≤ 1) = 1 − Cx 0.8413x 15
· (1 − 0.8413)15−x = 0.(9) ≈ 1. x=0 Trang 5
Câu 2 (1.5 điểm). Một cái cân điện tử luôn hiển thị kết quả bằng cân nặng đúng của vật thể cộng
với sai số ngẫu nhiên. Giả sử rằng sai số ngẫu nhiên này có phân phối chuẩn với kỳ vọng bằng 0 và độ
lệch chuẩn là 0.23 (kg). Kết quả cân nặng của một vật thể trong 10 lần đo từ cân điện tử này như sau 5.09 5.33 4.61 5.04 5.36 5.22 5.22 5.34 5.23 4.72
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.09 (kg). ✍ Lời giải.
Gọi X (kg) là cân nặng của vật thể.
Theo đề bài: X ∼ N(µ; 0.232) σ = 0.23: đã biết.
Từ số liệu đề bài, ta có: n = 10; ¯x = 5.116.
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
• Độ tin cậy: 95% ⇒ α = 0.05.
⇒ z1−α/2 = z0.975 ≈ 1.96. σ • Sai số: ǫ = z1 √ −α/2 · n 0.23 = 1.96 · √10 ≈ 0.1426.
• KTC 95% cho trung bình µ là: ¯ x − ǫ ≤ µ ≤ ¯x − ǫ
⇔ 5.116 − 0.1426 ≤ µ ≤ 5.116 + 0.1426 ⇔ 4.9734 ≤ µ ≤ 5.2586 ⇒ µ ∈ [4.9734; 5.2586].
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.09 (kg).
• Độ tin cậy: 95% ⇒ α = 0.05.
⇒ z1−α/2 = z0.975 ≈ 1.96. Để ǫ ≤ 0.09 thì Å z ã2 Å 1.96 · 0.23ã2 n ≥ 1−α/2 · σ = ≈ 25.0890 ǫ0 0.09 ⇒ n ≥ 26.
Vậy người ta cần cân vật thể này ít nhất 26 lần để sai số ước lượng của khoảng tin cậy 95% cho
cân nặng trung bình của vật thể không quá 0.09 (kg).
Câu 3 (2.5 điểm). Các tác giả của bài báo “Adjuvant Radiotherapy an Chemotherapy in Node-
Positive Premenopausal Women with Breast Cancer” (New Engl. J. of Med., 1997: 956-962) báo cáo
các kết quả nghiên cứu của họ về một thí nghiệm được thiết kế để so sánh hiệu quả của 2 phương pháp
điều trị bệnh ung thư: chỉ điều trị bằng hóa trị (phương pháp I) và điều trị kết hợp giữa hóa trị và xạ
trị (phương pháp II). Trong số 181 bệnh nhân được điều trị bằng phương pháp I, có 89 bệnh nhân sống
sót ít nhất 15 năm, trong khi 107 trong số 186 bệnh nhân mà được điều trị bằng phương pháp II sống sót ít nhất 15 năm. Trang 6
a) Tìm khoảng tin cậy 95% cho tỷ lệ bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp I.
b) Có ý kiến cho rằng phương pháp điều trị kết hợp giữa hóa trị và xạ trị có hiệu quả hơn là chỉ điều
trị bằng hóa trị. Dựa trên kết quả thí nghiệm, ta có đủ bằng chứng ủng hộ ý kiến trên không với mức ý nghĩa α = 1%? ✍ Lời giải.
a) Tìm khoảng tin cậy 95% cho tỷ lệ bệnh nhân sống sót ít nhất 15 năm khi điều trị bằng phương pháp I.
Gọi Y là số bệnh nhân sống sót ít nhất 1
15 năm khi điều trị bằng phương pháp I. Ta có y 89 y 1 .
1 = 89; n1 = 181 ⇒ tỷ lệ mẫu ˆ p1 = = n1 181
• Độ tin cậy: 95% ⇒ α = 0.05. ⇒ z1 α = z − 0.975 ≈ 1.96. 2  ˆp • Sai số: ǫ = z 1(1 − ˆ p1) 1 α · − 2 n1 Ã 89 Å 89 ã 1 − 181 181 = 1.96 · 181 ≈ 0.0728.
• KTC 95% cho tỷ lệ p là ˆ p1 − ǫ ≤ p1 ≤ ˆp1 + ǫ 89 89 ⇔ − 0.0728 ≤ p + 0.0728 181 1 ≤ 181 ⇔ 0.4189 ≤ p1 ≤ 0.5645 ⇒ p . 1 ∈ [0.4189; 0.5645]
b) Có ý kiến cho rằng phương pháp điều trị kết hợp giữa hóa trị và xạ trị có hiệu quả hơn là chỉ điều
trị bằng hóa trị. Dựa trên kết quả thí nghiệm, ta có đủ bằng chứng ủng hộ ý kiến trên không với mức ý nghĩa α = 1%?
Gọi Y là số bệnh nhân sống sót ít nhất 1
15 năm khi điều trị bằng phương pháp I;
Y là số bệnh nhân sống sót ít nhất 2
15 năm khi điều trị bằng phương pháp II. Mẫu 1: y 89 n 1 . 1 = 181; y1 = 89 ⇒ ˆ p1 = = n1 181 Mẫu 2: y 107 n 2 . 2 = 186; y2 = 107 ⇒ ˆ p2 = = n2 186 y 89 + 107 196 ⇒ ˆ p = 1 + y2 = = n1 + n2 181 + 186 367 ®H
• Giả thuyết kiểm định: 0 : p1 ≥ p2 ;
⇒ ∆0 = p1 − p2 = 0; α = 0.01. H1 : p1 < p2
• Giá trị thống kê kiểm định 89 107 ˆ p − − 0 z 1 − ˆ p2 − ∆0 181 186 0 = = = −1.6043.   Å 1 1 ã 196 Å 196ã Å 1 1 ã ˆ p(1 − ˆp) + 1 − + n1 n2 367 367 181 186 Trang 7
• Miền bác bỏ: Bác bỏ H khi . 0 z0 < −z1−α Ta có α = 0.01
⇒ −z1−α = −z0.99 = −2.33. • So sánh và kết luận: Ta có: z0 < −z1−α −1.6043 < −2.33 (sai)
⇒ chưa đủ cơ sở để bác bỏ H0 : p1 ≥ p2.
Kết luận: Với mức ý nghĩa 1% thì ta chưa đủ bằng chứng ủng hộ ý kiến cho rằng phương pháp
điều trị kết hợp giữa hóa trị và xạ trị có hiệu quả hơn là chỉ điều trị bằng hóa trị.
Câu 4 (4 điểm). Một công ty sản xuất xe ô tô chế tạo ra một dòng xe ô tô Z, công ty kiểm tra xe
bằng cách cho 30 xe chạy trên cùng 1 quãng đường 100 km và đo lượng xăng sử dụng X (Đv: lít), kết quả cho ở bảng sau X (lít) 7.0 7.1 7.2 7.3 7.4 7.5 Số xe 5 7 6 6 3 3
Giả sử lượng xăng tiêu hao là đại lượng ngẫu nhiên có phân phối chuẩn.
a) Lời khẳng định: “Lượng xăng tiêu hao trung bình của dòng xe này là 7.2 lít (trên 100 km)” có
được chấp nhận hay không? (Mức ý nghĩa α = 5%)
b) Những xe có lượng xăng tiêu hao từ 7.3 lít trở lên được xếp vào loại không đạt tiêu chuẩn về nhiên
liệu. Giám đốc công ty khẳng định rằng tỷ lệ xe không đạt tiêu chuẩn về nhiên liệu tối đa bằng
10%. Với dữ liệu khảo sát đã cho, ta có đủ bằng chứng để bác bỏ ý kiến trên không? α = 1%.
c) Khảo sát lượng xăng tiêu hao Y (Đv: lít/100 km) trên một mẫu gồm 25 xe của dòng xe W cùng
hãng, tính được ¯y = 7.35 (lít/100 km) và sY = 0.2. Có ý kiến cho rằng dòng xe Z tiêu hao ít
nhiên liệu hơn dòng xe W. Với mức ý nghĩa α = 1%, hãy kiểm định ý kiến trên. Giả sử phương sai của X và Y bằng nhau. ✍ Lời giải.
a) Lời khẳng định: “Lượng xăng tiêu hao trung bình của dòng xe này là 7.2 lít (trên 100 km)” có
được chấp nhận hay không? (Mức ý nghĩa α = 5%)
Theo đề bài X ∼ N(µ; σ2) σ2: chưa biết.
Từ bảng số liệu đề bài, ta tính được: n = 30; ¯x ≈ 7.2133; s ≈ 0.1570. ®H • Giả Thuyết KĐ: 0 : µ = 7.2 : KĐ 2 phía, µ0 = 7.2. H1 : µ 6= 7.2
• Mức ý nghĩa: α = 0.05.
• Giá trị Thống kê kiểm định: ¯ x − µ 7.2133 − 7.2 t 0 0 = s = 0.1570 ≈ 0.4640. √n √30
• Miền bác bỏ: Bác bỏ H nếu . 0 |t0| > tα/2;n−1 Ta có α = 0.05
⇒ tα/2;n−1 = t0.025;29 = 2.045. • So sánh và kết luận: Trang 8 Ta có: |t0| > tα/2;n−1 |0.4640| > 2.045 ⇔ 0.4640 > 2.045 (sai)
⇒ Chưa đủ cơ sở để bác bỏ H0 : µ = 7.2.
Kết luận: Với mức ý nghĩa 5% thì lượng xăng tiêu hao trung bình của dòng xe này là 7.2 lít (trên 100 km).
b) Những xe có lượng xăng tiêu hao từ 7.3 lít trở lên được xếp vào loại không đạt tiêu chuẩn về nhiên
liệu. Giám đốc công ty khẳng định rằng tỷ lệ xe không đạt tiêu chuẩn về nhiên liệu tối đa bằng
10%. Với dữ liệu khảo sát đã cho, ta có đủ bằng chứng để bác bỏ ý kiến trên không? α = 1%.
Gọi Y là số xe không đạt tiêu chuẩn. 1 Ta có: y 12 n = 30, y 1
1 = 6 + 3 + 3 = 12 ⇒ tỷ lệ mẫu ˆ p = = = 0.4. n 30 ®H • GTKĐ: 0 : p ≤ 0.1 : KĐ 1 phía, p0 = 10% = 0.1. H1 : p > 0.1
• Mức ý nghĩa: α = 1% = 0.01.
• Giá trị Thống kê kiểm định: ˆ p − p 0.4 − 0.1 z 0 0 = = ≈ 5.4772. … p … 0(1 − p0) 0.1(1 − 0.1) n 30
• Miền bác bỏ: Bác bỏ H nếu z0 > z1−α. 0 Ta có α = 0.01 ⇒ z1−α = z0.99 ≈ 2.33. • So sánh và kết luận: Ta có: z0 > z1−α ⇔ 5.4772 > 2.33 (đúng) ⇒ bác bỏ H . 0 : p ≤ 0.1
Kết luận: Với mức ý nghĩa 1%, ta có đủ bằng chứng để bác bỏ ý kiến trên của vị giám đốc.
c) Khảo sát lượng xăng tiêu hao Y (Đv: lít/100 km) trên một mẫu gồm 25 xe của dòng xe W cùng
hãng, tính được ¯y = 7.35 (lít/100 km) và sY = 0.2. Có ý kiến cho rằng dòng xe Z tiêu hao ít
nhiên liệu hơn dòng xe W. Với mức ý nghĩa α = 1%, hãy kiểm định ý kiến trên. Giả sử phương sai của X và Y bằng nhau.
Theo đề bài X ∼ N(µX; σ2 ; X ) Y ∼ N (µY ; σ2 Y ) σ chưa biết. X = σY
Mẫu 1: nX = 30; ¯x ≈ 7.2133 và sX ≈ 0.1570.
Mẫu 2: nY = 35; ¯y = 7.35 và sY = 0.2. ®H
• Giả thuyết kiểm định 0 : µX ≥ µY ;
⇒ µX − µY = 0; α = 0.01. H1 : µX < µY
• Giá trị thống kê kiểm định (n + (n
(30 − 1) · 0.15702 + (25 − 1) · 0.22 s2 X − 1)s2 X Y − 1)s2 Y = p = ≈ 0.0316 nX + nY − 2 30 + 25 − 2 ¯ x − ¯y − (µX − µ 7.2133 − 7.35 − 0 t Y ) 0 = = = −2.8397.  … s2 s2 0.0316 0.0316 p + p + n 30 25 X nY
• Miền bác bỏ: Bác bỏ H khi . 0 t0 < −tα;nX+nY −2 Ta có α = 0.01 Trang 9 ⇒ −tα;n z 2.33.
X +nY −2 = −t0.01;53 ≈ − 0.99 ≈ − • So sánh và kết luận: Ta có: t0 < −tα;nX+nY −2 −2.8397 < −2.33 (đúng) ⇒ Bác bỏ H . 0 : µX ≥ µY
Kết luận: Với mức ý nghĩa 1% thì dòng xe Z tiêu hao ít nhiên liệu hơn dòng xe W. XÁC SUẤT THỐNG KÊ
ĐỀ CUỐI KỲ I NĂM HỌC 2021-2022
Thời gian làm bài: 90 phút Đề số: 1
Câu 1. Trong cấu tạo của một loại dây thừng, người ta quan tâm đến hàm lượng nylon X (Đv: %) có
ảnh hưởng như thế nào đến lực căng Y (Đv: psi) (là lực kéo tối đa trước khi sợi dây bị đứt). Số liệu
bên dưới cho kết quả đo của 10 sợi dây với hàm lượng nylon khác nhau Hàm lượng nylon X 7 12 17 22 32 42 47 52 52 62 Lực căng Y 169 249 289 329 349 404 459 519 529 559
(Làm tròn các đáp án đến 4 chữ số sau dấu chấm thập phân)
a) Tìm phương trình đường thẳng hồi quy ước lượng ˆ y = ˆ β0 + ˆβ1x ( ˆ
β0 : hệ số chặn hay hệ số tự do; ˆ β1 : hệ số góc).
b) Tính hệ số tượng quan r giữa XY X và Y .
c) Nếu một sợi dây có hàm lượng nylon bằng 45% thì giá trị dự báo cho lực căng của sợi dây bằng bao nhiêu? ✍ Lời giải.
Giả sử X, Y thỏa mãn mô hình hồi quy tuyến tính đơn.
a) Tìm phương trình đường thẳng hồi quy ước lượng ˆ y = ˆ β0 + ˆβ1x ( ˆ
β0 : hệ số chặn hay hệ số tự do; ˆ β1 : hệ số góc).
Từ bảng dữ liệu, dùng máy cầm tay, ta ước lượng được: ˆ β0 ≈ 154.4151; ˆ β1 ≈ 6.6981.
Phương trình hồi quy tuyến tính đơn y theo x là ˆy = ˆ β0 + ˆ β1x = 154.4151 + 6.6981x.
b) Tính hệ số tượng quan r giữa XY X và Y .
Ta có rXY ≈ 0.9836. (bấm máy)
c) Nếu một sợi dây có hàm lượng nylon bằng 45% thì giá trị dự báo cho lực căng của sợi dây bằng bao nhiêu?
Sợi dây có hàm lượng nylon bằng 45% ⇒ x0 = 45
⇒ ˆy0 = 154.4151 + 6.6981 · 45 = 455.8296.
Nếu một sợi dây có hàm lượng nylon bằng 45% thì giá trị dự báo cho lực căng của sợi dây bằng 455.8296 psi. Trang 10
Câu 2. Trong một nhà máy sản xuất vỏ bao bì, các kỹ sư áp dụng một phương pháp sản xuất mới với
mục đích làm giảm tỷ lệ bao bì hỏng hoặc kém chất lượng. Để kiểm tra hiệu quả của phương pháp sản
xuất mới này trước khi đi vào áp dụng chính thức, các kỹ sư so sánh giữa 2 phân xưởng sản xuất: phân
xưởng I vẫn áp dụng phương pháp sản xuất cũ và phân xưởng II được thử nghiệm với phương pháp sản
xuất mới. Đối với 123 bao bì được sản xuất ở phân xưởng I, có 14 bao bì kém chất lượng hoặc hỏng. Ở
phân xưởng II, các kỹ sư thấy có 10 bao bì hỏng/kém chất lượng trong 194 bao bì được sản xuất. Với
mức ý nghĩa α = 0.01, ta có đủ bằng chứng để kết luận rằng phương pháp sản xuất mới có hiệu quả
hơn phương pháp sản xuất cũ không? ✍ Lời giải.
Gọi Y là số bao bì kém chất lượng hoặc bị hỏng ở phân xưởng I; 1
Y là số bao bì kém chất lượng hoặc bị hỏng ở phân xưởng II 2 . Mẫu 1: y 14 n 1 . 1 = 123; y1 = 14 ⇒ ˆ p1 = = n1 123 Mẫu 2: y 10 5 n 2 . 2 = 194; y2 = 10 ⇒ ˆ p2 = = = n 194 2 97 y 14 + 10 24 ⇒ ˆ p = 1 + y2 = = n1 + n2 123 + 194 317 ®H
• Giả thuyết kiểm định: 0 : p1 ≤ p2 ;
⇒ ∆0 = p1 − p2 = 0; α = 0.01. H1 : p1 > p2
• Giá trị thống kê kiểm định 14 5 ˆ p − − 0 z 1 − ˆ p2 − ∆0 123 97 0 = = = 2.0425.   Å 1 1 ã 24 Å 24 ã Å 1 1 ã ˆ p(1 − ˆp) + 1 − + n1 n2 317 317 123 194
• Miền bác bỏ: Bác bỏ H khi z0 > z1−α. 0 Ta có α = 0.01 ⇒ z1−α = z0.99 = 2.33. • So sánh và kết luận: Ta có: z0 > z1−α 2.0425 > 2.33 (sai)
⇒ chưa đủ cơ sở để bác bỏ H0 : p1 ≤ p2.
Kết luận: Với mức ý nghĩa 1% thì ta chưa đủ bằng chứng để kết luận rằng phương pháp sản xuất mới
có hiệu quả hơn phương pháp sản xuất cũ.
Câu 3. 8 bóng đèn dây tóc được chọn ngẫu nhiên và ghi nhận tuổi thọ (đơn vị: giờ) như sau: 41.1, 39.9,
39.2, 41.5, 41.2, 40.6, 40.7, 40.6. Giả sử rằng tuổi thọ của các bóng đèn tuân theo phân phối chuẩn.
a) Tìm khoảng tin cậy 92% cho tuổi thọ trung bình của các bóng đèn dây tóc.
b) Giả sử rằng tuổi thọ của các bóng đèn tuân theo phân phối chuẩn với độ lệch tiêu chuẩn là 3
(giờ). Người ta cần khảo sát ít nhất bao nhiêu bóng đèn để sai số ước lượng của khoảng tin cậy
92% cho tuổi thọ trung bình của các bóng đèn là không quá 0.5 (giờ). ✍ Lời giải.
Gọi X (giờ) là tuổi thọ của bóng đèn dây tóc.
Theo đề bài: X ∼ N(µ; σ2) σ2: chưa biết.
Từ số liệu đề bài, ta có: n = 8; ¯x = 40.6; s ≈ 0.7445. Trang 11
a) Tìm khoảng tin cậy 92% cho tuổi thọ trung bình của các bóng đèn dây tóc.
• Độ tin cậy: 92% ⇒ α = 0.08.
⇒ z1−α/2 = z0.96 ≈ 1.75.σ • Sai số: ǫ = z1 √ −α/2 · n 0.7445 = 1.75 · √8 ≈ 0.4606.
• KTC 92% cho trung bình µ là: ¯ x − ǫ ≤ µ ≤ ¯x − ǫ
⇔ 40.6 − 0.4606 ≤ µ ≤ 40.6 + 0.4606 ⇔ 40.1394 ≤ µ ≤ 41.0606 ⇒ µ ∈ [40.1394; 41.0606].
b) Giả sử rằng tuổi thọ của các bóng đèn tuân theo phân phối chuẩn với độ lệch tiêu chuẩn là 3
(giờ). Người ta cần khảo sát ít nhất bao nhiêu bóng đèn để sai số ước lượng của khoảng tin cậy
92% cho tuổi thọ trung bình của các bóng đèn là không quá 0.5 (giờ).
Theo đề bài σ = 3 đã biết. Để ǫ ≤ 0.5 thì Å z ã2 Å 1.75 · 3ã2 n ≥ 1−α/2 · σ = = 110.25 ǫ0 0.5 ⇒ n ≥ 111.
Người ta cần khảo sát ít nhất 111 bóng đèn để sai số ước lượng của khoảng tin cậy 92% cho tuổi
thọ trung bình của các bóng đèn là không quá 0.5 (giờ).
Câu 4. Một công ty sản xuất trò chơi điện tử thực hiện một nghiên cứu về thời gian mà người chơi
hoàn thành các cấp độ trong một trò chơi mà họ vừa phát hành. Họ ghi nhận rằng thời gian để hoàn
thành cấp độ I là một biến ngẫu nhiên X có phân phối chuẩn với trung bình 1 48.1 phút và độ lệch chuẩn 15.1 phút.
a) Tính xác suất để người chơi cần nhiều hơn 50.1 phút để hoàn thành cấp độ I của trò chơi này.
b) Nhà sản xuất cần tính ngưỡng thời gian t sao cho phút để 0
90.15% người chơi sẽ cần ít hơn t0
hoàn thành cấp độ I của trò chơi này. Tính t0.
c) Giả sử trò chơi gồm 3 cấp độ, trong đó thời gian để hoàn thành các cấp độ II và III lần lượt là các biến ngẫu nhiên X , và là các
2 ∼ N (55, 14.52) và X3 ∼ N (56.8, 10.52). Giả sử rằng X1 X2 X3
biến ngẫu nhiên độc lập. Tính trung bình và độ lệch chuẩn cho tổng thời gian để người chơi hoàn
thành cả 3 cấp độ trò chơi này. ✍ Lời giải.
a) Tính xác suất để người chơi cần nhiều hơn 50.1 phút để hoàn thành cấp độ I của trò chơi này.
Theo đề bài: X1 ∼ N(48.1; 15.12) ⇒ µ1 = 48.1; σ1 = 15.1.
Xác suất để người chơi cần nhiều hơn 50.1 phút để hoàn thành cấp độ I của trò chơi này là Å X ã Å ã 1 − 48.1 50.1 − 48.1 20 P(X1 > 50.1) = P > = P Z > ≈ 0.4473. 15.1 15.1 151 Trang 12
b) Nhà sản xuất cần tính ngưỡng thời gian t sao cho phút để 0
90.15% người chơi sẽ cần ít hơn t0
hoàn thành cấp độ I của trò chơi này. Tính t0.
Cần tìm t để P(X1 < t0) = 90.15%. 0 Ta có P(X1 < t0) = 90.15% Å t . ã ⇔ P Z < 0 − 48 1 = 0.9015 15.1 t . ⇒ 0 − 48 1 ≈ 1.2901 15.1 ⇔ t0 ≈ 67.5805.
c) Giả sử trò chơi gồm 3 cấp độ, trong đó thời gian để hoàn thành các cấp độ II và III lần lượt là các biến ngẫu nhiên X , và là các
2 ∼ N (55, 14.52) và X3 ∼ N (56.8, 10.52). Giả sử rằng X1 X2 X3
biến ngẫu nhiên độc lập. Tính trung bình và độ lệch chuẩn cho tổng thời gian để người chơi hoàn
thành cả 3 cấp độ trò chơi này. Lưu ý: Nếu X độc lập với mọi 1 ∼ N (µ1; σ2 ); X ); . . . ; X X 1 2 ∼ N (µ2; σ2 2 k ∼ N (µk; σ2 k) và Xi j i 6= j. Xét
X = a1X1 + a2X2 + · · · + akXk
khi đó X ∼ N(µ; σ2) trong đó • µ = a .
1µ1 + a2µ2 + · · · + akµk • σ2 = a2 σ2 + a2σ2 + σ2 . 1 1 2 2 · · · + a2k k
Theo đề bài: X1 ∼ N(48.1; 15.12) ⇒ µ1 = 48.1; σ1 = 15.1
X2 ∼ N(55; 14.52) ⇒ µ2 = 55; σ2 = 14.5
X3 ∼ N(56.8; 10.52) ⇒ µ3 = 56.8; σ3 = 10.5
Tổng thời gian để người chơi hoàn thành cả 3 cấp độ trò chơi là X = X1 + X2 + X3.
Khi đó X ∼ N(µ; σ2) trong đó
• µ = µ1 + µ2 + µ3 = 48.1 + 55 + 56.8 = 159.9.
• σ2 = σ2 + σ2 + σ2 = 15.12 + 14.52 + 10.52 = 548.51 1 2 3 ⇒ σ ≈ 23.4203.
Câu 5. Trong sản xuất chất bán dẫn, khắc hóa chất ướt thường được sử dụng để loại bỏ silic từ mặt
sau của tấm wafer trước khi kim loại hóa. Tỷ lệ ăn mòn (etch) là một đặc tính quan trọng trong quá
trình này và được biết là tuân theo phân phối chuẩn. Hai phương pháp khắc khác nhau đã được so
sánh bằng cách sử dụng hai mẫu ngẫu nhiên gồm 8 tấm wafer cho mỗi dung dịch. Gọi X và Y lần lượt
là tỷ lệ ăn mòn tương ứng với phương pháp khắc I và II. Kết quả quan sát được như sau Phương pháp I (x ) i 11.1 11.2 11.4 11.1 11.7 11.4 11.2 11.1 Phương pháp II (y ) i 9.1 8.9 8.9 9.1 8.9 9.2 9 9.3
Giả sử rằng phương sai của hai tổng thể bằng nhau. Với mức ý nghĩa 8%, hỏi dữ liệu trên có hỗ trợ
cho tuyên bố rằng “tỷ lệ ăn mòn trung bình là giống nhau cho cả hai phương pháp” không? ✍ Lời giải.
Theo đề bài X ∼ N(µX; σ2 ; X ) Y ∼ N (µY ; σ2 Y ) σ chưa biết. X = σY Trang 13
Mẫu 1: nX = 8; ¯x = 11.275 và s2X = 0.045.
Mẫu 2: nY = 8; ¯y = 9.05 và s2Y ≈ 0.0229. ®H
• Giả thuyết kiểm định 0 : µX = µY ;
⇒ µX − µY = 0; α = 8% = 0.08. H1 : µX 6= µY
• Giá trị thống kê kiểm định (n + (n
(8 − 1) · 0.045 + (8 − 1) · 0.0229 s2 X − 1)s2X Y − 1)s2 Y = p = ≈ 0.0340 nX + nY − 2 8 + 8 − 2 ¯ x − ¯y − (µX − µ 11.275 − 9.05 − 0 t Y ) 0 = = = 24.1335.  … s2 0.0340 0.0340 p s2 + p + n 8 8 X nY
• Miền bác bỏ: Bác bỏ H khi . 0 |t0| > tα/2;nX+nY −2 Ta có α = 0.08
⇒ tα/2;nX+nY −2 = t0.04;14 = 1.89. • So sánh và kết luận: Ta có: |t0| > tα/2;nX+nY −2
|24.1335| > tα/2;nX+nY −2 24.1335 > 1.89 (đúng) ⇒ Bác bỏ H0 : µX = µY .
Kết luận: Với mức ý nghĩa 8% thì tỷ lệ ăn mòn trung bình của hai phương pháp là khác nhau. XÁC SUẤT THỐNG KÊ
ĐỀ CUỐI KỲ I NĂM HỌC 2021-2022
Thời gian làm bài: 90 phút Đề số: 2
Câu 1. Một cái cân điện tử luôn hiển thị kết quả bằng cân nặng đúng của vật thể cộng với sai số ngẫu
nhiên. Giả sử rằng sai số ngẫu nhiên này có phân phối chuẩn với kỳ vọng bằng 0 và độ lệch chuẩn là
0.24 (kg). Kết quả cân nặng của một vật thể trong 8 lần đo từ cân điện tử này như sau 5.39 4.3 4.89 4.93 4.8 4.87 4.66 4.74
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.18 (kg). ✍ Lời giải.
Gọi X (kg) là cân nặng của vật thể.
Theo đề bài: X ∼ N(µ; 0.242) σ = 0.24: đã biết.
Từ số liệu đề bài, ta có: n = 8; ¯x = 4.8225.
a) Tìm khoảng tin cậy 95% cho cân nặng trung bình của vật thể này.
• Độ tin cậy: 95% ⇒ α = 0.05.
⇒ z1−α/2 = z0.975 ≈ 1.96. σ • Sai số: ǫ = z1 √ −α/2 · n 0.24 = 1.96 · √8 ≈ 0.1663. Trang 14
• KTC 95% cho trung bình µ là: ¯ x − ǫ ≤ µ ≤ ¯x − ǫ
⇔ 4.8225 − 0.1663 ≤ µ ≤ 4.8225 + 0.1663 ⇔ 4.6562 ≤ µ ≤ 4.9888 ⇒ µ ∈ [4.6562; 4.9888].
b) Người ta cần cân vật thể này ít nhất bao nhiêu lần để sai số ước lượng của khoảng tin cậy 95%
cho cân nặng trung bình của vật thể không quá 0.18 (kg).
• Độ tin cậy: 95% ⇒ α = 0.05.
⇒ z1−α/2 = z0.975 ≈ 1.96. Để ǫ ≤ 0.18 thì Å z ã2 Å 1.96 · 0.24 ã2 n ≥ 1−α/2 · σ = ≈ 6.8295 ǫ0 0.18 ⇒ n ≥ 7.
Vậy người ta cần cân vật thể này ít nhất 7 lần để sai số ước lượng của khoảng tin cậy 95% cho
cân nặng trung bình của vật thể không quá 0.18 (kg).
Câu 2. Người ta cần nghiên cứu mối quan hệ giữa lượng thức uống có cồn đã sử dụng (x) và nồng
độ cồn trong máu (y) của một người. Trong một thí nghiệm, 20 người có thể trạng tương tự được cho
dùng ngẫu nhiên một lượng đồ uống có cồn nhất định và kiểm tra nồng độ cồn trong máu của những
người này sau 1 giờ. Biết 20 20 20 20 20 X x X X X X i = 78; x2i = 362; yi = 213; y2i = 2633.052; xiyi = 969.36. i i i i i
a) Tìm phương trình đường thẳng hồi quy ước lượng ˆ y = ˆ β0 + ˆ
β1x dự đoán nồng độ cồn trong máu
theo số lượng thức uống có cồn.
b) Tính các tổng bình phương: SST , SSR, SSE.
c) Tính hệ số xác định R2. ✍ Lời giải.
a) Tìm phương trình đường thẳng hồi quy ước lượng ˆ y = ˆ β0 + ˆ
β1x dự đoán nồng độ cồn trong máu
theo số lượng thức uống có cồn. Ta có n = 20 và (Pn x y 78 • · 213 S i=1 i) (Pn i=1 i) xy = Pn x = 969.36 − = 138.66. i=1 iyi − n 20 782 • (Pn x S i=1 i)2 xx = Pn x2 = 362 − = 57.8. i=1 i − n 20 S 138.66 ⇒ ˆβ xy 1 = = ≈ 2.3990. Sxx 57.8 n 1 1 • ¯x = X x · 78 = 3.9 n i = 20 i=1 n 1 1 • ¯y = X y · 213 = 10.65 n i = 20 i=1 Trang 15 ⇒ ˆ β0 = ¯ y − ˆ β1 ¯
x = 10.65 − 2.3990 · 3.9 ≈ 1.2939. ⇒ ˆy = ˆ β0 + ˆ β1x = 1.2939 + 2.3990x. Vậy ˆy = 1.2939 + 2.3990x
b) Tính các tổng bình phương: SST , SSR, SSE. n (Pn y 2132 • X SST = y2 i=1 i)2 = 364.602 i − = 2633.052 − n 20 i • SSR = ˆ
β1Sxy = 2.3990 · 138.66 ≈ 324.3257
• SSE = SST − SSR = 364.602 − 324.3257 = 40.2763
c) Tính hệ số xác định R2. SSR 324.3257 R2 = = ≈ 0.8895. SST 364.602
Câu 3. Trong một nhà máy sản xuất linh kiện điện tử, các kỹ sư cân nhắc lựa chọn giữa hai loại nhựa
để tiến hành sản xuất linh kiện. Một yếu tố quan trọng được cân nhắc là sức chịu lực phá hủy (đơn vị:
psi) của từng loại nhựa. Đối với loại nhựa 1, các kỹ sư kiểm tra trên một mẫu cỡ m = 13, tính được sức
chịu lực phá hủy trung bình là ¯x = 163.25 và độ lệch chuẩn mẫu sx = 1.1. Thử nghiệm trên một mẫu
cỡ n = 14 đối với loại nhựa 2, tính được sức chịu lực phá hủy trung bình là ¯y = 163.5 và độ lệch chuẩn
mẫu sy = 1.95. Với mức ý nghĩa α = 3%, ta có thể khẳng định rằng sức chịu lực phá hủy của hai loại
nhựa này là như nhau hay không? Giả sử rằng sức chịu lực phá hủy của hai loại nhựa tuân theo phân
phối chuẩn và có phương sai khác nhau. ✍ Lời giải.
Gọi X1 : sức chịu lực phá hủy của nhựa loại 1.
X2 : sức chịu lực phá hủy của nhựa loại 2.
Mẫu 1: n1 = 13; ¯x1 = 163.25; s1 = 1.1.
Mẫu 2: n2 = 14; ¯x2 = 163.5; s2 = 1.95. σ2 : chưa biết. 1 6= σ2 2 ®H • Giả Thuyết KĐ: 0 : µ1 = µ2 :
KĐ 2 phía, ∆0 = µ1 − µ2 = 0. H1 : µ1 6= µ2
• Mức ý nghĩa: α = 0.03.
• Giá trị Thống kê kiểm định: ¯ x 163.25 − 163.5 − 0 t 1 − ¯ x2 − ∆0 0 = = ≈ −0.4140.  … s2 s2 1.12 1.952 1 + 2 + n 13 14 1 n2
• Miền bác bỏ: Bác bỏ H nếu trong đó 0 |t0| > tα;v        [(s2/n /n  v = 1) + (s2 2)]2  1 2  ≈ ⌊20.7915⌋ = 20.    (s2/n (s2/n 1 1)2 + 2 2)2  n1 − 1 n2 − 1
α = 0.03 ⇒ tα/2;v = t0.015;20 = 2.34. • So sánh và kết luận: Trang 16 Ta có: |t0| > tα/2;v ⇔ | − 0.4140| > 2.34 ⇔ 0.4140 > 2.34 (sai)
⇒ chưa đủ cơ sở để bác bỏ H0 : µ1 = µ2.
Kết luận: Với mức ý nghĩa 3%, ta có thể khẳng định rằng sức chịu lực phá hủy của hai loại nhựa này là như nhau.
Câu 4. Các tác giả của bài báo “Adjuvant Radiotherapy an Chemotherapy in Node-Positive Pre-
menopausal Women with Breast Cancer” (New Engl. J. of Med., 1997: 956-962) báo cáo các kết quả
nghiên cứu của họ về một thí nghiệm được thiết kế để so sánh hiệu quả của 2 phương pháp điều trị bệnh
ung thư: chỉ điều trị bằng hóa trị (phương pháp 1) và điều trị kết hợp giữa hóa trị và xạ trị (phương
pháp 2). Trong số 183 bệnh nhân được điều trị bằng phương pháp 1, có 90 bệnh nhân sống sót ít nhất
15 năm, trong khi 108 trong số 173 bệnh nhân mà được điều trị bằng phương pháp 2 sống sót ít nhất
15 năm. Có ý kiến cho rằng phương pháp điều trị kết hợp giữa hóa trị và xạ trị có hiệu quả hơn là chỉ
điều trị bằng hóa trị. Dựa trên kết quả thí nghiệm, ta có đủ bằng chứng ủng hộ ý kiến trên không với mức ý nghĩa α = 2%? ✍ Lời giải.
Gọi Y là số bệnh nhân sống sót ít nhất 1
15 năm khi điều trị bằng phương pháp 1;
Y là số bệnh nhân sống sót ít nhất 2
15 năm khi điều trị bằng phương pháp 2. Mẫu 1: y 90 30 n 1 . 1 = 183; y1 = 90 ⇒ ˆ p1 = = = n1 183 61 Mẫu 2: y 108 n 2 . 2 = 173; y2 = 108 ⇒ ˆ p2 = = n2 173 y 90 + 108 99 ⇒ ˆ p = 1 + y2 = = n1 + n2 183 + 173 178 ®H
• Giả thuyết kiểm định: 0 : p1 ≥ p2 ;
⇒ ∆0 = p1 − p2 = 0; α = 2% = 0.02. H1 : p1 < p2
• Giá trị thống kê kiểm định 30 108 ˆ p − − 0 z 1 − ˆ p2 − ∆0 61 173 0 = = = −2.5145.   Å 1 1 ã 99 Å 99 ã Å 1 1 ã ˆ p(1 − ˆp) + 1 − + n1 n2 178 178 183 173
• Miền bác bỏ: Bác bỏ H khi . 0 z0 < −z1−α Ta có α = 0.02
⇒ −z1−α = −z0.98 = −2.05. • So sánh và kết luận: Ta có: z0 < −z1−α −2.5145 < −2.05 (đúng) ⇒ bác bỏ H . 0 : p1 ≥ p2
Kết luận: Với mức ý nghĩa 2% thì ta có đủ bằng chứng ủng hộ ý kiến cho rằng phương pháp điều trị
kết hợp giữa hóa trị và xạ trị có hiệu quả hơn là chỉ điều trị bằng hóa trị.
Câu 5. Một công ty muốn so sánh hiệu quả của hai loại nhiên liệu cho một chiếc ô tô. 5 chiếc xe giống
nhau sẽ chạy 1000 km mỗi chiếc, hai chiếc sử dụng loại nhiên liệu thứ nhất và ba chiếc chạy loại thứ hai. Gọi X và
là hiệu suất nhiên liệu quan sát được đối với loại thứ nhất và , và là hiệu 1 X2 Y1 Y2 Y3
suất đối với loại thứ hai. Giả sử tất cả các biến này độc lập với nhau và Xi ∼ N(21, 8) với i = 1, 2 và
Yj ∼ N(18, 11) với j = 1, 2, 3. Gọi W là biến ngẫu nhiên mới được cho bởi: X Y Y Y W = 1 + X2 − 1 + 2 + 3 . 2 3 Trang 17
a) Tìm kỳ vọng của W .
b) Tìm phương sai của W . c) Tìm P(W ≤ 0). ✍ Lời giải. Lưu ý: Nếu X độc lập với mọi 1 ∼ N (µ1; σ2); X ); . . . ; X X i 1 2 ∼ N (µ2; σ2 2 k ∼ N (µk; σ2k) và Xi j 6= j. Xét
X = a1X1 + a2X2 + · · · + akXk
khi đó X ∼ N(µ; σ2) trong đó • µ = a .
1µ1 + a2µ2 + · · · + akµk
• σ2 = a2 σ2 + a2σ2 + · · · + a2 σ2. 1 1 2 2 k k √ √
Theo đề bài: Xi ∼ N(µX ; σ2 ) với µ = 21; σ = 8 = 2 2, ∀i = 1, 2. i X X X i i i √
Yj ∼ N(µY ; σ2 ) với µ = 18; σ = 11, ∀j = 1, 2, 3. j Y Y Y j j j Ta có X Y Y Y 1 1 1 1 1 W = 1 + X2 − 1 + 2 + 3 = X X Y Y Y 2 3
2 1 + 2 2 − 3 1 − 3 2 − 3 3.
a) Tìm kỳ vọng của W . Å 1 1 1 1 1 ã µW = E(W ) = E X X Y Y Y
2 1 + 2 2 − 3 1 − 3 2 − 3 3 1 1 1 1 1 = µ + µ − µ − µ − µ 2 X1 2 X2 3 Y1 3 Y2 3 Y3 1 1 1 1 1 =
· 21 + · 21 − · 18 − · 18 − · 18 2 2 3 3 3 = 3.
b) Tìm phương sai của W . Å 1 1 1 1 1 ã σ2 = V ar(W ) = V ar X X Y Y Y W
2 1 + 2 2 − 3 1 − 3 2 − 3 3 Å 1 ã2 Å 1ã2 Å 1ã2 Å 1 ã2 Å 1ã2 = · 8 + · 8 + − · 11 + − · 11 + − · 11 2 2 3 3 3 23 = . 3 c) Tìm P(W ≤ 0).Å ã Ta có 23 W ∼ N 3; , do đó 3 Ü ê √ W − 3 Ç 0 − 3 3 69 å P(W ≤ 0) = P ≤ = P Z ≤ − ≈ 0.1393. … 23 … 23 23 3 3 Trang 18 XÁC SUẤT THỐNG KÊ
ĐỀ CUỐI KỲ II NĂM HỌC 2020-2021
Thời gian làm bài: 90 phút Đề số: 1
Câu 1 (4 điểm). Đem cân một số trái cây T vừa thu hoạch, ta được kết quả sau
Trọng lượng (gam) 205 215 225 235 245 Số trái 12 17 20 18 15
Giả sử rằng trọng lượng của trái cây T có phân phối chuẩn.
a) Tìm khoảng ước lượng cho trọng lượng trung bình của trái cây với độ tin cậy 95%.
b) Nếu muốn sai số ước lượng không quá 2 gam ở độ tin cậy 96% thì phải quan sát ít nhất bao nhiêu trái?
c) Những trái cây có trọng lượng ≥ 230 gam được xếp vào trái loại I. Hãy ước lượng tỷ lệ trái cây
loại I với độ tin cậy 97%.
d) Người ta dự đoán rằng những trái cây T trên có trọng lượng trung bình 230 gam. Hãy cho biết
dự đoán trên có chính xác không ở mức ý nghĩa 2%. ✍ Lời giải.
Theo đề bài: T ∼ N(µ; σ2) σ2: chưa biết.
Từ bảng số liệu đề bài, ta có: n = 82; ¯x ≈ 225.8537; s ≈ 13.2592.
a) Tìm khoảng ước lượng cho trọng lượng trung bình của trái cây với độ tin cậy 95%.
• Độ tin cậy: 95% ⇒ α = 0.05.
⇒ tα/2;n−1 = t0.025;81 ≈ z0.975 ≈ 1.96. s • Sai số: ǫ = tα/2;n √ −1 · n 13.2592 = 1.96 · √82 ≈ 2.8699.
• KTC 95% cho trung bình µ là: ¯ x − ǫ ≤ µ ≤ ¯x − ǫ
⇔ 225.8537 − 2.8699 ≤ µ ≤ 225.8537 + 2.8699
⇔ 222.9838 ≤ µ ≤ 228.7236
⇒ µ ∈ [222.9838; 228.7236].
b) Nếu muốn sai số ước lượng không quá 2 gam ở độ tin cậy 96% thì phải quan sát ít nhất bao nhiêu trái?
• Độ tin cậy: 96% ⇒ α = 0.04.
⇒ z1−α/2 = z0.98 ≈ 2.05. Để ǫ ≤ 2 thì Å z ã2 Å 2.05 · 13.2592ã2 n ≥ 1−α/2 · s = ≈ 184.7066 ǫ0 2 ⇒ n ≥ 185.
Vậy nếu muốn sai số ước lượng không quá 2 gam ở độ tin cậy 96% thì phải quan sát ít nhất 185 trái. Trang 19
c) Những trái cây có trọng lượng ≥ 230 gam được xếp vào trái loại I. Hãy ước lượng tỷ lệ trái cây
loại I với độ tin cậy 97%.
Gọi Y là số trái cây loại I. Ta có: y 33
n = 82, y = 18 + 15 = 33 ⇒ tỷ lệ mẫu ˆ p = = . n 82
• Độ tin cậy: 97% ⇒ α = 0.03. ⇒ z1 α = z − 0.985 ≈ 2.17. 2  ˆp(1 − ˆp) • Sai số: ǫ = z1 α · − 2 n à 33 Å 33 ã 1 − 82 82 = 2.17 · 82 ≈ 0.1175.
• KTC 97% cho tỷ lệ p là ˆ p − ǫ ≤ p ≤ ˆp + ǫ 33 33 ⇔ − 0.1175 ≤ p ≤ + 0.1175 82 82 ⇔ 0.2849 ≤ p ≤ 0.5199 ⇒ p ∈ [0.2849; 0.5199].
d) Người ta dự đoán rằng những trái cây T trên có trọng lượng trung bình 230 gam. Hãy cho biết
dự đoán trên có chính xác không ở mức ý nghĩa 2%. σ2: chưa biết.
Ta có: n = 82; ¯x ≈ 225.8537; s ≈ 13.2592. ®H • Giả Thuyết KĐ: 0 : µ = 230: KĐ 2 phía, µ H 0 = 230. 1 : µ 6= 230
• Mức ý nghĩa: α = 2% = 0.02.
• Giá trị Thống kê kiểm định: ¯ x − µ 225.8537 − 230 t 0 0 = s = ≈ −2.8317. √ 13.2592 n √82
• Miền bác bỏ: Bác bỏ H nếu . 0 |t0| > tα/2;n−1 Ta có α = 0.02
⇒ tα/2;n−1 = t0.01;81 ≈ z0.99 ≈ 2.33. • So sánh và kết luận: Ta có: |t0| > tα;n−1 ⇔ | − 2.8317| > 2.33 ⇔ 2.8317 > 2.33 (đúng) ⇒ bác bỏ H0 : µ = 230.
Kết luận: Với mức ý nghĩa 2%, những trái cây T trên có trọng lượng trung bình không phải là 230 gam.
Câu 2 (2 điểm). Vào mùa đông của đại dịch cúm, bố mẹ của 2000 bé đã được các nhà nghiên cứu
khảo sát tại một công ty dược phẩm nổi tiếng để xác định liệu thuốc mới của công ty có hiệu quả sau
hai ngày hay không. Trong số 120 bé bị cúm và được cho dùng thuốc, 29 bé khỏi bệnh trong hai ngày.
Trong 280 bé bị cúm những không được cho dùng thuốc mới, có 56 bé phục hồi trong hai ngày. Hỏi có Trang 20
dấu hiệu có ý nghĩa nào ủng hộ lời tuyên bố của công ty về hiệu quả của thuốc hay không với mức ý
nghĩa 5%? (Yêu cầu dùng cả 2 phương pháp: miền bác bỏ và p−giá trị) ✍ Lời giải.
Gọi Y1 : số bé uống thuốc mới khỏi bệnh trong hai ngày.
Y2 : số bé không uống thuốc mới khỏi bệnh trong hai ngày. Mẫu y 29 1: n 1 . 1 = 120; y1 = 29 ⇒ ˆ p1 = = n1 120 Mẫu y 56 2: n 2 = 0.2. 2 = 280; y2 = 56 ⇒ ˆ p2 = = n2 280 y 29 + 56 ⇒ ˆ p = 1 + y2 = = 0.2125. n1 + n2 120 + 280 ®H • GTKĐ: 0 : p1 ≤ p2:
KĐ 1 phía, p0 = p1 − p2 = 0. H1 : p1 > p2
• Mức ý nghĩa: α = 0.05.
• Giá trị Thống kê kiểm định: 29 ˆ p − 0.2 − 0 z 1 − ˆ p2 − (p1 − p2) 120 0 = = ≈ 0.93352.   Å 1 1 ã Å 1 1 ã ˆ p(1 − ˆp) + 0.2125(1 − 0.2125) + n n 120 280 1 2
• Miền bác bỏ: Bác bỏ H nếu z0 > z1−α. 0 Ta có α = 0.05 ⇒ z1−α = z0.95 = 1.64485. • So sánh và kết luận: Ta có: z0 > z1−α ⇔ 0.93352 > 1.64485 (sai)
⇒ Chưa đủ cơ sở để bác bỏ H . 0 : p1 ≤ p2
Kết luận: Với mức ý nghĩa 5%, tỷ lệ bé khỏi bệnh khi uống thuốc mới sau hai ngày không nhiều hơn
bé không uống thuốc mới, hay thuốc mới không hiệu quả như tuyên bố của công ty.
> Cách 2: Dùng p-giá trị: Ta có
p − giá trị = 1 − Φ(z0) = 1 − Φ(0.93352) ≈ 0.8247.
Vì p−giá trị = 0.8247 > 0.05 = α nên chưa đủ cơ sở để bác bỏ H . 0 : p1 ≤ p2
Câu 3 (2 điểm). Một nghiên cứu được thực hiện để xem việc tăng nồng độ cơ chất có tác dụng đáng
kể đến tốc độ của một phản ứng hóa học hay không. Với một nồng độ cơ chất 1.5 mol/l, phản ứng được
chạy 15 lần, với tốc độ trung bình 7.5 micromoles mỗi 30 phút và độ lệch chuẩn 1.5. Với một nồng độ
cơ chất 2.0 mol/l, 12 lần chạy được thực hiện, thu được tốc độ trung bình 8.8 micromoles mỗi 30 phút
và độ lệch chuẩn 1.2. Có lý do để tin rằng việc tăng nồng độ cơ chất làm tăng tốc độ trung bình của
phản ứng 0.5 micromoles mỗi 30 phút hay không? Sử dụng mức ý nghĩa 0.01 và giả sử rằng các tổng
thể là xấp xỉ chuẩn với các phương sai bằng nhau. ✍ Lời giải.
Gọi X (micromoles) là tốc độ phản ứng ứng với nồng độ cơ chất 1 1.5 mol/l;
X (micromoles) là tốc độ phản ứng ứng với nồng độ cơ chất 2 2 mol/l;.
Theo đề bài X1 ∼ N(µ1; σ2); X 1 2 ∼ N (µ2; σ2 ) 2 σ chưa biết. 1 = σ2
Mẫu 1: n1 = 15; ¯x1 = 7.5 và s1 = 1.5.
Mẫu 2: n2 = 12; ¯x2 = 8.8 và s2 = 1.2. ®H
• Giả thuyết kiểm định 0 : µ1 − µ2 ≥ −0.5 ; ⇒ ∆ H
0 = µ1 − µ2 = −0.5; α = 0.01. 1 : µ1 − µ2 < −0.5 Trang 21
• Giá trị thống kê kiểm định (n + (n
(15 − 1) · 1.52 + (12 − 1) · 1.22 s2 1 − 1)s2 1 2 − 1)s22 = = 1.8936 p = n1 + n2 − 2 15 + 12 − 2 ¯ x 7.5 − 8.8 − (−0.5) t 1 − ¯ x2 − ∆0 0 = = = −1.5011.  … s2 1.8936 1.8936 p s2 + p + n 12 15 1 n2
• Miền bác bỏ: Bác bỏ H khi . 0 t0 < −tα;n1+n2−2 Ta có α = 0.01
⇒ −tα;n1+n2−2 = −t0.01;25 = −2.4851. • So sánh và kết luận: Ta có: t0 < −tα;n1+n2−2 −1.5011 < −2.4851 (sai)
⇒ chưa đủ cơ sở để bác bỏ H0 : µ1 − µ2 ≥ −0.5.
Kết luận: Với mức ý nghĩa 1% thì không có lý do để tin rằng việc tăng nồng độ cơ chất làm tăng tốc
độ trung bình của phản ứng 0.5 micromoles mỗi 30 phút.
Câu 4 (2 điểm). Một nghiên cứu về khối lượng đường bị biến đổi trong một quá trình nào đó ở các
nhiệt độ khác nhau. Dữ liệu được mã hóa và ghi lại như sau Nhiệt độ (x) 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
Đường bị biến đổi (y) 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5
a) Tìm phương trình hồi quy tuyến tính đơn y theo x, Giải thích ý nghĩa ˆ β nhận được. 1
b) Ước lượng khối lượng trung bình của đường bị biến đổi được tạo ra khi nhiệt độ được mã hóa là 1.75. ✍ Lời giải.
a) Tìm phương trình hồi quy tuyến tính đơn y theo x:
Từ bảng dữ liệu đề bài, tiến hành sử dụng máy tính cầm tay, ta tính được: ˆ β0 ≈ 6.4136; ˆ β1 ≈ 1.8091 ⇒ ˆy = ˆ β0 + ˆ β1x = 6.4136 + 1.8091x.
> Giải thích ý nghĩa ˆ β nhận được: 1 Vì ˆ
β1 ≈ 1.8091 > 0 nên khi nhiệt độ thay đổi 1 đơn vị và các yếu tố khác không thay đổi thì
đường bị biến đối 1.8091 đơn vị.
b) Ước lượng khối lượng trung bình của đường bị biến đổi được tạo ra khi nhiệt độ được mã hóa là 1.75.
Khi nhiệt độ được mã hóa là 1.75 ⇒ x0 = 1.75 ˆ
y0 = 6.4136 + 1.8091 · 1.75 ≈ 9.5795.
Khi nhiệt độ được mã hóa là 1.75 thì khối lượng trung bình của đường bị biến đổi được tạo ra 9.5795. Trang 22 XÁC SUẤT THỐNG KÊ
ĐỀ CUỐI KỲ II NĂM HỌC 2020-2021
Thời gian làm bài: 90 phút Đề số: 2
Câu 1 (4 điểm). Kết quả quan sát về hàm lượng Vitamin C của một loại trái cây cho bởi bảng sau Hàm lượng Vitamin C (mg) 6 8 10 12 14 16 Số trái 5 10 20 35 25 5
a) Ước lượng hàm lượng Vitamin C trung bình trong một trái cây với độ tin cậy 90%.
b) Những trái có hàm lượng Vitamin C trên 11 mg trở lên là trái loại I. Ước lượng tỷ lệ trái loại I với độ tin cậy 92%.
c) Có ý kiến rằng hàm lượng Vitamin C trung bình là 10 mg. Với mức ý nghĩa 6%, hãy kiểm tra ý kiến trên.
d) Lời khẳng định: “Tỷ lệ trái cây loại I là 60%” có được chấp nhận hay không với mức ý nghĩa 4%. ✍ Lời giải.
Gọi X (mg) là hàm lượng vitamin C trong trái cây trên. Giả sử X ∼ N(µ; σ2) σ2: chưa biết.
Từ bảng số liệu đề bài, ta có: n = 100; ¯x = 11.6; s ≈ 2.4288.
a) Ước lượng hàm lượng Vitamin C trung bình trong một trái cây với độ tin cậy 90%.
• Độ tin cậy: 90% ⇒ α = 0.1.
⇒ tα/2;n−1 = t0.05;99 ≈ z0.95 ≈ 1.645. s • Sai số: ǫ = tα/2;n √ −1 · n 2.4288 = 1.645 · √100 ≈ 0.3995.
• KTC 90% cho trung bình µ là: ¯ x − ǫ ≤ µ ≤ ¯x − ǫ
⇔ 11.6 − 0.3995 ≤ µ ≤ 11.6 + 0.3995 ⇔ 11.2005 ≤ µ ≤ 11.9995 ⇒ µ ∈ [11.2005; 11.9995].
b) Những trái có hàm lượng Vitamin C trên 11 mg trở lên là trái loại I. Ước lượng tỷ lệ trái loại I với độ tin cậy 92%.
Gọi Y là số trái cây loại I. Ta có: y 65
n = 100, y = 35 + 25 + 5 = 65 ⇒ tỷ lệ mẫu ˆ p = = = 0.65. n 100
• Độ tin cậy: 92% ⇒ α = 0.08. ⇒ z1 α = z − 0.96 ≈ 1.75. 2  ˆp(1 − ˆp) • Sai số: ǫ = z1 α · − 2 n  0.65 (1 − 0.65) = 1.75 · 100 ≈ 0.0835. Trang 23
• KTC 92% cho tỷ lệ p là ˆ p − ǫ ≤ p ≤ ˆp + ǫ
⇔ 0.65 − 0.0835 ≤ p ≤ 0.65 + 0.0835 ⇔ 0.5665 ≤ p ≤ 0.7335 ⇒ p ∈ [0.5665; 0.7335].
c) Có ý kiến rằng hàm lượng Vitamin C trung bình là 10 mg. Với mức ý nghĩa 6%, hãy kiểm tra ý kiến trên. σ2: chưa biết.
Ta có: n = 100; ¯x = 11.6; s ≈ 2.4288. ®H • Giả Thuyết KĐ: 0 : µ = 10: KĐ 2 phía, µ H 0 = 10. 1 : µ 6= 10
• Mức ý nghĩa: α = 6% = 0.06.
• Giá trị Thống kê kiểm định: ¯ x − µ 11.6 − 10 t 0 0 = s = ≈ 6.5876. √ 2.4288 n √100
• Miền bác bỏ: Bác bỏ H nếu . 0 |t0| > tα/2;n−1 Ta có α = 0.06
⇒ tα/2;n−1 = t0.03;99 ≈ z0.97 ≈ 1.88. • So sánh và kết luận: Ta có: |t0| > tα;n−1 ⇔ |6.5876| > 1.88 ⇔ 6.5876 > 1.88 (đúng) ⇒ bác bỏ H0 : µ = 10.
Kết luận: Với mức ý nghĩa 6%, những trái cây trên có hàm lượng vitamin C trung bình không phải là 10 mg.
d) Lời khẳng định: “Tỷ lệ trái cây loại I là 60%” có được chấp nhận hay không với mức ý nghĩa 4%. Ta có y 65
n = 100, y = 35 + 25 + 5 = 65 ⇒ tỷ lệ mẫu ˆ p = = = 0.65. n 100 ®H • GTKĐ: 0 : p = 0.6 : KĐ 1 phía, p0 = 60% = 0.6. H1 : p 6= 0.6
• Mức ý nghĩa: α = 4% = 0.04.
• Giá trị Thống kê kiểm định: ˆ p − p 0.65 − 0.6 z 0 0 = = ≈ 1.0206. … p … 0(1 − p0) 0.6(1 − 0.6) n 100
• Miền bác bỏ: Bác bỏ H nếu . 0 |z0| > z1−α/2 Ta có α = 0.04
⇒ z1−α/2 = z0.98 ≈ 2.05. • So sánh và kết luận: Ta có: |z0| > z1−α/2 ⇔ |1.0206| > 2.05 ⇔ 1.0206 > 2.05 (sai)
⇒ chưa đủ cở sở để bác bỏ H0 : p = 0.6.
Kết luận: Với mức ý nghĩa 4% thì tỷ lệ trái cây loại I là 60%. Trang 24