Ôn Tập Cuối Kì môn Xác suất thống kê | Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia HCM

Ôn Tập Cuối Kì môn Xác suất thống kê | Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia HCM được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

Xác suất-Thống HKI - 2023-2024
Hướng dẫn giải Bài tập nộp 2
Note:
Danh sách bài tập gồm bài24
- - - - - * * * * * - - - - -
Bài 1. Thời gian cho đến khi cần sạc lại pin cho một y tính xách tay trong điều kiện bình thường
phân phối chuẩn với trung bình phút và độ lệch chuẩn 260 50 phút.
(a) Xác suất pin sử dụng kéo dài hơn bốn giờ bao nhiêu?
(b) Xác định thời gian sử dụng pin tại những , giá trị sao cho xác suất , đạtgiá trị phân vị z P(Z z)
25% và 75%. (Hint: tức tìm a sao cho P(Z a) = 25% và tìm b sao cho P(Z b) = 75%)
(c) Xác định thời gian sử dụng pin tương ứng với xác suất ít nhất 0,95.
Hướng dẫn: Ta quan tâm đến thời gian cho đến khi cần sạc lại pin cho một máy tính xách tay.
Gọi X b.n.n. thể hiện thời gian (đơn vị: phút) cho đến khi cần sạc lại pin cho một máy tính xách tay.
Theo đề bài, phân phối chuẩn,X X N(µ; σ
2
) với trung bình µ = 260 phút và độ lệch chuẩn σ = 50 phút.
(a) Xác suất pin sử dụng kéo dài hơn giờ =4 240 phút
P P P
X > 240
= 1
X 240
= 1
X E( )X
p
Var(X)
240 E(X)
p
Var(X)
!
= 1 P
X
µ
σ
240 µ
σ
!
với Z N(0; 1)
= 1 P
Z
240 µ
σ
= 1 Φ
240 µ
σ
= 1
Φ
240 260
50
= 1 Φ
0, 4
= Φ = 0 6554;
0 4,
,
(b) Giá trị w
γ
phân vị mức của b.n.n. nếu thoả .γ X P(X w
γ
) = γ
Do đó, gọi thời gian sử dụng pin tại , nghĩa a phân vị 25%
P
X a
= 25% = 0, 25 P
X µ
σ
a µ
σ
!
= 0, 25
Φ
a µ
σ
= 0, 25
a µ
σ
= Φ
1
0, ,25 25 (0
= Φ
1
1 0,
= Φ
1
75)
suy ra
a = µ + σ ×
Φ
1
(0, 75) 675
260 + 50 ×
0,
= 226, 25 phút ;
Tương tự, gọi b thời gian sử dụng pin tại , nghĩa phân vị 75%
P
X b
= 75% = 0, 75 Φ
b µ
σ
= 0, 75
b µ
σ
= Φ
1
0, 75
suy ra b = µ + σ × Φ
1
(0, 75) 260 + 50 × 0, 675 = 293, 75 phút ;
(c) Gọi thời gian sử dụng pin tương ứng với xác suất ít nhất , ta c 0 95,
P
X c
0, 95 Φ
c µ
σ
0, 95
c µ
σ
Φ
1
0, 95 95
c µ + σ × Φ
1
0,
260 + 50 × 1, 645 = 342, 25.
Vậy, thời gian sử dụng pin tương ứng với xác suất ít nhất 0, 95 342, 25 phút.
Nhắc lại: với
Z N(0; 1) thì hàm số Φ( (a) := P Z a) =
Z
a
−∞
1
2π
.e
t
2
2
dt.
và P(a < Z < b) = ) = ) = ) = Φ(P(a Z < b P(a < Z b P(a Z b b) Φ(a) .
1
Xác suất-Thống HKI - 2023-2024
Bài 2. Đường kính một sợi bán dẫn giả sử phân phối chuẩn với trung bình m và0 5, µ
độ lệch chuẩn m.0, 05 µ
(a) Tính xác suất để đường kính của một sợi lớn hơn m.0, 62 µ
(b) Tính xác suất để đường kính của một sợi nằm giữa 0, 47 m.0, 63 µ
(c) Đường kính sợi của mẫu nhỏ hơn giá trị nào? ( )
90% Tức là, tìm x sao cho P
X < x
= 0, 9
Hướng dẫn: Ta quan tâm đến đường kính sợi bán dẫn.
Gọi X b.n.n. thể hiện đường kính sợi bán dẫn ( ).đơn vị: mµ
Theo đề bài, X phân phối chuẩn, X N(µ; σ
2
) với trung bình µ = 0, 5 µm và độ lệch chuẩn m.σ = 0, 05 µ
(a) Xác suất để đường kính của một sợi lớn hơn m 0, 62 µ
P P P
X > 0, 62
= 1
X 0, 62
= 1
X E( )X
p
Var(X)
0 ( ), 62 E X
p
Var(X)
!
= 1 P
X µ
σ
0, 62 µ
σ
!
với Z N(0; 1)
= 1 P
Z
0, 62 µ
σ
= 1 Φ
0, 62 µ
σ
= 1
Φ
0, 62 0 5,
0
, 05
= 1 Φ
2 4,
= 1 0, 9918 = 0 9982;,
(b) Xác suất để đường kính của một sợi nằm giữa 0, 47 và 0, 63 µm
P
0 0, 47 X , 63
= P
X µ
σ
0, 63 µ
σ
!
P
X µ
σ
0, 47 µ
σ
!
với Z N(0; 1)
= P
Z
0, 63 µ
σ
P
Z
0, 47 µ
σ
= Φ
0, 63 µ
σ
Φ
0, 47 µ
σ
= Φ
0, 63 0 5,
0
, 05
Φ
0, 47 5 0,
0
, 05
= Φ = Φ
2 6 0 6,
Φ
,
2 6 0 6 7257,
h
1 Φ
,
i
= 0, 9953
h
1 0,
i
= 0 721;,
(c) Đường kính sợi của mẫu nhỏ hơn giá trị , ta 90% c
P
X < c
= 90% = 0, 9 Φ
c µ
σ
= 0, 9
c µ
σ
= Φ
1
0, ,9 0
c = µ + σ × Φ
1
9
0, 5 + 0, 05 × 1, ,282 = 0 5641.
Vậy, 90% mẫu đường kính nhỏ hơn m.0, 5641 µ
Bài 3. Dây điện được sản xuất để sử dụng trong một hệ thống y tính được chỉ định phải điện
trở giữa 0,12 0,14 ohms. Các điện trở thực tế của dây điện được sản xuất bởi công ty A phân
phối chuẩn với trung bình ohm và độ lệch chuẩn ohm.0, 13 0, 01
(a) Xác suất để một dây điện được chọn ngẫu nhiên từ sản phẩm của công ty A sẽ phù hợp với các
đặc điểm kỹ thuật này;
(b) Nếu mỗi hệ thống máy tính đều dùng dây điện chọn từ công ty A, thì xác suất để ít hơn15 6
dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này bao nhiêu?
(c) Nếu mỗi hệ thống máy tính đều dùng dây điện được chọn từ công ty A, thì xác suất để 400
ít nhất 200 dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật y
bao nhiêu? (Sử dụng xấp xỉ chuẩn)
2
Xác suất-Thống HKI - 2023-2024
Hướng dẫn: Ta quan tâm đến điện trở của dây điện.
Gọi X biến ngẫu nhiên thể hiện điện trở (đơn vị: ohm) của dây điện.
Theo đề bài, X phân phối chuẩn, , với trung bình và độ lệch chuẩn .X N(µ; σ
2
) µ = 0, 13 σ = 0, 01
(a) Theo đề bài, dây điện phù hợp đặc điểm kỹ thuật nếu điện trở nằm giữa 0, 12 ohm và ohm,0, 14
tức nếu .0, 12 X 0 14,
Do đó, xác suất để một dây điện được chọn ngẫu nhiên phù hợp các đặc điểm kỹ thuật
P
(0 0 14, 12 X , ) = P
0, 12 µ
σ
X µ
σ
0, 14 µ
σ
= P
0, 12 µ
σ
Z
0, 14 µ
σ
= Φ
0, 14 µ
σ
Φ
0, 12 µ
σ
( với Z N(0; 1) )
= Φ
0, 14 13 0,
0
, 01
Φ
0, 12 0, 13
0
, 01
= Φ (1)
Φ ( 1) = Φ (1) Φ (1)
h
1 Φ (1)
i
= 2 × 1 2 × 0, 8413 1 = 0, 6826 .
(b) Gọi b.n.n. thể hiện số dây điện điện trở phù hợp đặc điểm kỹ thuật trong tổng sốY 15 dây điện.
Thì Y phân phối nhị thức B(n; p) với n = 15
và "p = xác suất để 1 dây điện phù hợp đặc điểm kỹ thuật" = (tính câu (a)).0, 6862
Xác suất để trong số dây điện, dây phù hợp đặc điểm kỹ thuật, 15 ít hơn 6
P P P P
Y < 6
= P
Y = 0
+
Y = 1
+ P
Y = 2
+
Y = 3
+ P
Y = 4
+
Y = 5
=
C
0
n
p
0
(1 p)
n0
+ C
1
n
p
1
(1 p)
n1
+ +... C
5
n
p
5
(1 p)
n5
0, 0058.
(c) Gọi b.n.n. thể hiện số dây điện điện trở phù hợp đặc điểm kỹ thuật trong tổng sốW 400 y điện.
Thì W phân phối nhị thức B(m; p) với m = 400
và "p = xác suất để 1 dây điện phù hợp đặc điểm kỹ thuật" = (tính câu (a)).0, 6862
Ta thấy 0 0 9, 1 < p < , , hơn nữa m ×p = 400 ×0, 6862 5 và m × (1 (1p) = 400 × 0, 6862) 5, do đó,
thể dùng phân phối chuẩn để tính xấp xỉ cho phân phối nhị thức
N
m.p ; m.p.(1 p)
B(m; p) của .W
Cụ thể, ta có, xác suất để ít nhất dây điện phù hợp đặc điểm kỹ thuật 200
P P P P(W 200) = 1 (W < 200) = 1 (W 199) = 1 (W < 199 + 0, 5 ) ( )hiệu chỉnh sự liên tục
( (
W phân phối nhị thức, W B m; p)) = 1 P
W E( )W
p
Var(W )
<
199 + 0, 5 E( )W
p
Var(W )
!
(
dùng Z phân phối chuẩn để xấp xỉ, Z N(0; 1)) 1 P
Z <
199 + 0 ), 5 E(W
p
Var(W )
= 1
Φ
199 + 0 ), 5 E(W
p
Var(W )
!
= 1
Φ
199 + 0, 5 m.p
p
m.p. p(1 )
= 1
Φ
199 + 0 6862, 5 400 × 0,
q
400 × 0 6862, .
1 0, 6862
1 Φ ( 7, 8996 )
= Φ ( 7
, 8996 ) 1 .
3
Xác suất-Thống HKI - 2023-2024
Bài 4 (dựa theo câu 1 đề thi cuối kỳ, 2022-2023, hk1).
Một nhà máy sản xuất ra bu lông với đường kính tuân theo phân phối chuẩn (đv: mm).N(4; 0, 09)
Các bu lông được đo đạc một cách chính xác và những cái nào đường kính nhỏ hơn mm hoặc3 5,
lớn hơn mm sẽ bị loại bỏ. Chọn ngẫu nhiên một bu lông được máy sản xuất.4 4,
(a) Tính xác suất bu lông này được chấp nhận.
(b) Một gồm bu lông được xản suất. Khoảng bao nhiêu bu lông trong số này được chấp nhận?900
Hướng dẫn: Ta quan tâm đến đường kính của bu lông.
Gọi Y biến ngẫu nhiên thể hiện đường kính của bu lông. Theo đề bài, phân phối chuẩn,Y Y N( )µ; σ
2
với trung bình µ = 4 phương sai .σ
2
= 0 = 0, 09 σ , 3
(a) Theo đề bài, một bu lông sẽ bị loại b nếu đường kính nhỏ hơn 3, 5mm hoặc lớn hơn 4 4, mm ,
tức nếu .Y < 3, 5 hoặc Y > 4, 4
= Ngược lại, bu lông được chấp nhận nếu đường kính " 3,5" và " 4,4", tức .3 4, 5 Y , 4
Do đó, xác suất để một bu lông được chấp nhận
P
(3 4 4, 5 Y , ) = P
3, 5 µ
σ
Y µ
σ
4, 4 µ
σ
= P
3, 5 µ
σ
Z
4, 4 µ
σ
(với Z N(0; 1))
= Φ
4, 4 µ
σ
Φ
3, 5 µ
σ
= Φ
4, 4 4
0
, 3
Φ
3, 5 4
0
, 3
= Φ
4
3
Φ
5
3
0 0, 909 , 048 = 0, 861 .
(b) Một gồm bu lông được sản xuất. Từ câu (a) ta đã tính đượcm = 900
p = " xác suất để 1 bu lông được chấp nhận " = 0, 861 .
Cho nên trong m = 900 bu lông được sản xuất, số bu lông được chấp nhận sẽ khoảng
m × p = 900 × 0, ,861 = 774 9 .
Vậy, trong tổng số bu lông được sản xuất sẽ khoảng bu lông được chấp nhận.m = 900 775
Bài 5. Trọng lượng một túi rau khi thu hoạch tại một nông trại b.n.n. phân phối chuẩn với
trung bình g và độ lệch chuẩn g. Biết rằng trong một ngày túi rau được thu hoạch.550 125 4000
Ước lượng số túi rau trọng lượng lớn hơn g được thu hoạch trong một ngày.325
(Hint: tính p = xác suất để một túi rau trọng lượng lớn hơn g,325
sau đó lấy xác suất này nhân với tổng số gói rau thì sẽ ra số gói rau có trọng lượng lớn hơnp 325 )
Hướng dẫn: Ta quan tâm đến trọng lượng một túi rau.
Gọi X biến ngẫu nhiên thể hiện trọng lượng của một túi rau.
Theo đề bài, phân phối chuẩn, với trung bìnhX X N(µ; σ
2
) µ = 550 và độ lệch chuẩn .σ = 125
Trong tổng số túi rau được thu hoạch, ta muốn ước lượng số túi rau trọng lượng lớn hơn g.m = 4000 325
4
Xác suất-Thống HKI - 2023-2024
Trước tiên, ta tính xác suất để một túi rau trọng lượng lớn hơn g 325
p
= P(X > 325) = 1 P(X 325) = 1 P
X µ
σ
<
325 µ
σ
= 1 P
Z <
325 µ
σ
= 1
Φ
325 µ
σ
(với Z N(0; 1))
(
nhắc lại, ta Φ( Φ( )a) = 1 a ) = 1 Φ
325 550
125
= 1 Φ( 1 0 .8) = Φ(1.8) , 964 .
Cho nên trong m = 4000 túi rau được thu hoạch, số túi rau trọng lượng lớn hơn g 325
m × p = 4000 × 0, 964 = 3856 .
Vậy, trong tổng số túi rau được thu hoạch sẽ khoảng túi trọng lượng lớn hơn g.m = 4000 3856 325
Bài 6. Chiều dài (đv: cm) của một loài sâu tuân theo phân phối chuẩn N(µ; σ
2
) với .σ > 0
(a) Bắt ngẫu nhiên một con sâu. Nếu cm và cm, hãy tính xác suất để chiều dài sâuµ = 15 σ = 3, 5
(i) ngắn hơn cm; (iii) từ cm đến cm.18, 5 cm; (ii) ít nhất 16, 75 11, 5 18, 5
(b) Biết rằng số sâu dài ít nhất cm, số sâu ngắn hơn cm.(Không bắt buộc) 30% 16 15% 10
Tìm trung bình µ độ lệch chuẩn σ của chiều dài của các con sâu.
Hướng dẫn: Gọi Y biến ngẫu nhiên thể hiện chiều dài của một loài sâu đang xét.
Theo đề bài, Y phân phối chuẩn, với trung bìnhY N(µ; σ
2
) mu độ lệch chuẩn .σ
(a) Với cm và cm.µ = 15 σ = 3, 5
(i) Xác suất để chiều dài sâu ngắn hơn cm 18, 5
P P
( 18Y < , 5) =
Y µ
σ
<
18, 5 µ
σ
= Φ
18, 5 µ
σ
= Φ
18, 5 15
3
, 5
= Φ(1) 0, 84134 .
(ii) Xác suất để chiều dài sâu ít nhất cm 16, 75
P
(Y 16, 75) = 1 P( 16Y < , 75) = 1 P
Y µ
σ
<
16, 75 µ
σ
= 1 Φ
16, 75 µ
σ
= 1 Φ
16, 75 15
3
, 5
= 1 Φ(0 0.5) 1 , 6915 = 0, 3085 .
(iii) Xác suất để chiều dài sâu từ cm đến cm 11, 5 18, 5
P
(11 18, 5 Y , 5) = P
11, 5 µ
σ
Y µ
σ
18, 5 µ
σ
= Φ
18, 5 µ
σ
Φ
11, 5 µ
σ
= Φ
18, 5 15
3
, 5
Φ
11, 5 15
3
, 5
= Φ(1)
Φ( Φ(1)1) = Φ(1)
1
= 2 × Φ(1) 1 2 × 0, 84134 1 = 0, 68268 .
(b) Giả thiết 30% số sâu dài ít nhất cm, tức ta .16 P(X 16) = 30% = 0, 3
Tương tự, số sâu dài ngắn hơn cm, tức ta .15% 10 P( 15X < 10) = 15% = 0,
Do đó, ta hệ phương trình sau
(
P(X 16) = 0 3,
P
(X < 10) = 0, 15
P
X µ
σ
<
16 µ
σ
= 1 0, 3 = 0, 7
P
X µ
σ
<
10 µ
σ
= 0, 15
Φ
16 µ
σ
= 0, 7
Φ
10 µ
σ
= 0, 15
5
Xác suất-Thống HKI - 2023-2024
Φ hàm đồng biến (hàm tăng) nên ta suy ra
16 µ
σ
= Φ
1
0, 7
10 µ
σ
= Φ
1
0, 15
(
µ + σ.Φ
1
0 7,
= 16
µ
+ σ.Φ
1
0, 15
= 10
σ
=
16 10
Φ Φ
1
0 7,
1
0 15,
µ
= 10 σ.Φ
1
0, 15
với Φ
1
0 7 0,
, 5244 Φ
1
0 1, 15
, 0364
σ 3, 8441;
µ 13, 98415.
Bài 7. Xác suất để một bu lông được sản xuất đáp ứng yêu cầu kỹ thuật .0 86,
(a) Chọn ngẫu nhiên bu lông được sản xuất. Tính xác suất ít nhất bu lông đáp ứng50 48
yêu cầu kỹ thuật.
(b) Một gồm bu lông được sản xuất ra. Dùng một xấp xỉ phù hợp để tính xác suất ít nhất500
250 bu lông đáp ứng yêu cầu kỹ thuật.
Hướng dẫn: (a) Gọi b.n.n. thể hiện số bu lông đáp ứng kỹ thuật trong tổng số bu lông.Y 50
Thì Y phân phối nhị thức B(n; p) với n = 50
và "p = xác suất để 1 bu lông đáp ứng kỹ thuật" = (theo dữ kiện đề bài).0, 86
Xác suất để trong số bu lông, bu lông đáp ứng yêu cầu kỹ thuật, 50 ít nhất 48
P P P
Y 48
= P
Y = 48
+
Y = 49
+
Y = 50
=
C
48
n
p
48
(1 p)
n48 49
+ C
n
p
49
(1 p)
n49 50
+ C
n
p
50
(1 p)
n50
0, 0221.
(c) Gọi b.n.n. thể hiện số bu lông đáp ứng kỹ thuật trong tổng số bu lông.W 500
Thì W phân phối nhị thức B(m; p) với m = 500 "p = xác suất để 1 bu lông đáp ứng kỹ thuật" = .0 86,
Ta thấy 0 0 9, 1 < p < , , hơn nữa m × p = 500 × 0, 86 5 và m × (1 p) = 500 ×(1 0, 86) 5, do đó,
thể dùng phân phối chuẩn để tính xấp xỉ cho phân phối nhị thức
N
m.p ; m.p. p(1 )
B(m; p) của .W
Cụ thể, ta có, xác suất để ít nhất bu lông đáp ứng yêu cầu kỹ thuật 250
P P P P(W 250) = 1 (W < 250) = 1 (W 249) = 1 (W < 249 + 0, 5 ) ( )hiệu chỉnh sự liên tục
( (
W phân phối nhị thức, W B m; p)) = 1 P
W E( )W
p
Var(W )
<
249 + 0, 5 E( )W
p
Var(W )
!
(
dùng Z phân phối chuẩn để xấp xỉ, Z N(0; 1)) 1 P
Z <
249 + 0 ), 5 E(W
p
Var(W )
= 1
Φ
249 + 0 ), 5 E(W
p
Var(W )
!
= 1
Φ
249 + 0, 5 m.p
p
m.p. p(1 )
= 1
Φ
249 + 0 86, 5 500 × 0,
q
500 × 0 86, .
1 0, 86
1 Φ ( 23, 26371 ) = Φ ( 23 26371 ), 1 .
6
Xác suất-Thống HKI - 2023-2024
Bài 8 (Bài 4.20 - trang 121 giáo trình XSTK).
Giả sử tuổi thọ bóng đèn do một công ty sản xuất xấp xỉ phân phối chuẩn với độ lệch chuẩn 40
giờ. Một mẫu bóng đèn cho thấy tuổi thọ trung bình giờ.30 780
a) Hãy tìm khoảng tin cậy cho tuổi thọ trung bình của tất cả các bóng đèn do công ty sản xuất.96%
b) Nếu muốn sai số ước lượng không quá giờ, thì phải quan sát ít nhất bao nhiêu bóng đèn.10
Hướng dẫn: Ta quan tâm tuổi thọ trung bình bóng đèn. Đặt tuổi thọ trung bình của bóng đèn.µ =
Theo đề bài, " tuổi thọ bóng đèn xấp xỉ phân phối chuẩn với độ lệch chuẩn 40 giờ "
= độ lệch chuẩn σ = 40 = phương sai đã biết.σ
2
= 40
2
Lấy mẫu: cỡ mẫu n = 30 bóng đèn và trung bình mẫu giờ.x = 780
a) Độ tin cậy 1 α = 96% = 0.96 = α = 0.04.
Dung sai (trong trường hợp phương sai đã biết) được xác định bởiε
ε = z
1
α
2
.
σ
n
= z
0.98
.
σ
n
= z
0.98
.
40
30
2, 055 ×
40
30
14 998, .
Vậy khoảng tin cậy cho tuổi thọ trung bình của các bóng đèn do công ty sản xuất 96%
x ε < µ < x + ε 780 14, 998 < µ < 780 + 14, 998 765 794, 002 < µ < , 998 .
b) Sai số ước lượng không quá giờ, nghĩa , ta 10 ε 10 ε = z
1
α
2
.
σ
n
, nên
ε 10 z
1
α
2
.
σ
n
10 n
z
1
α
2
.
σ
10
2
n
2, 055 ×
40
10
2
n 67, 5684 .
Vậy nếu muốn sai số ước lượng không quá giờ độ tin cậy , thì phải quan sát ít nhất bóng đèn.10 96% 68
Bài 9 (Bài 4.47 - trang 126 giáo trình XSTK). Đem cân một số trái cây vừa thu hoạch được
bảng số liệu
X (g) 200-210 210 220 220 240 240 250- -230 230- -
Số trái 12 17 20 18 15
a) Tìm khoảng ước lượng trọng lượng trung bình của trái cây với độ tin cậy 0, 95 và .0 99,
b) Muốn sai số ước lượng không quá g độ tin cậy thì phải quan sát ít nhất bao nhiêuE = 2 99%
trái cây ?
Hướng dẫn: Ta quan tâm trọng lượng trung bình trái cây. Đặt trọng ợng trung bình của trái cây.µ =
Lấy mẫu: cỡ mẫu n = 12 + 17 + 20 + 18 + 15 = 82 và trung bình mẫu được tính như sau
x
=
P
x
i
. n
i
P
n
i
=
205 × 12 + 215 17 + 225 20 + 235 18 + 245 15× × × ×
n
= 225, 8537 ,
( xét khoảng thứ nhất với trọng lượng g nên ta lấy giá trị đại diện g. )200-210 205
a) Trong trường hợp này cỡ mẫu mẫu lớn và phương sai KHÔNG biết.n = 82 30 σ
2
7
Xác suất-Thống HKI - 2023-2024
Ta cần tính phương sai mẫu như sau:
s
2
=
P
( )x x
i
2
. n
i
n
1
=
205
× × × × ×x
2
12 +
215 x
2
17 +
225 x
2
20 +
235 x
2
18 +
245 x
2
15
n 1
= 175, 8055.
Độ tin cậy 1 α = 0.95 = α = 0.05.
Dung sai (trong trường hợp mẫu lớn , phương sai KHÔNG biết) được xác định bởiε
ε = z
1
α
2
.
s
n
= z
0,975
.
s
n
= z
0.975
.
175 8055,
82
1, 96 ×
175 8055,
82
2, 8698 .
Vậy khoảng tin cậy cho trọng lượng trung bình của trái cây 95%
x ε < µ < x + ε 222 228, 9838 < µ < , 7236 .
Độ tin cậy 1 α = 0.99 = α = 0.01.
Dung sai (trong trường hợp mẫu lớn , phương sai KHÔNG biết) được xác định bởiε
ε = z
1
α
2
.
s
n
= z
0,995
.
s
n
= z
0.995
.
175 8055,
82
2, 575 ×
175 8055,
82
3, 7704 .
Vậy khoảng tin cậy cho trọng lượng trung bình của trái cây 95%
x ε < µ < x + ε 222 229, 0833 < µ < , 6241 .
b) Sai số ước lượng g, nghĩa , ta không quá 2 ε 2 ε = z
1
α
2
.
s
n
,
nên độ tin cậy 1 α = 99% = 0, 99 , thì
ε 2 z
1
α
2
.
s
n
2 n
z
1
α
2
.
s
2
2
n
2, 575 ×
175 8055,
2
2
n 291, 4251 .
Vậy nếu muốn sai số ước lượng không quá g độ tin cậy , thì phải quan sát ít nhất trái cây.2 99% 292
Bài 10. Người ta đo ion Na trên một số người ghi nhận lại được kết quả như sau
+
129 132 140 141 138 143 133 137 140 143 138, , , , , , , , , , , 140 .
a) Tính trung bình mẫu và phương sai mẫu.
b) Ước lượng trung bình tổng thể độ tin cậy .0 95,
Hint: => tính từ số liệu, dữ liệu thực nghiệm đề cho.trung bình mẫu phương sai mẫu= x = S
2
trung bình tổng thể phương sai tổng thể= µ (không biết!!) = σ
2
(ở bài này, cũng không biết!)σ
2
Hướng dẫn: Ta quan tâm chỉ số trung bình ion Na của một người.
+
Đặt µ = chỉ số trung bình ion Na của một người.
+
a) Lấy mẫu: cỡ mẫu (vì ta thấy dữ liệu chỉ số đo được của 12 người)n = 12
8
Xác suất-Thống HKI - 2023-2024
và trung bình mẫu x được tính như sau
x
=
P
x
i
n
=
129 + 132 + 140 + ... + 143 + 138 + 140
12
137, 833 ,
Trong trường hợp này cỡ mẫu mẫu nhỏ phương sai KHÔNG biết.n = 12 < 30 σ
2
Ta cần tính phương sai mẫu như sau:s
2
s
2
=
P
( )x x
i
2
n
1
=
129
x
2
+
132 x
2
+
140 x
2
+ ... +
143 x
2
+
138 x
2
+
140 x
2
n
1
19 424, .
b) Độ tin cậy 1 α = 0.95 = α = 0.05.
Dung sai (trong trường hợp , phương sai KHÔNG biết) được xác định bởiε mẫu nhỏ
ε
= t
n1
1
α
2
.
s
n
= t
121
0
,975
.
s
n
= t
11
0,975
.
19 424,
12
2, 201 ×
19 424,
12
2, 8 .
Vậy khoảng tin cậy cho chỉ số trung bình ion Na 95%
+
x ε < µ < x + ε 135 140, 033 < µ < , 633 .
Bài 11 (Bài 4.54 - trang 127 giáo trình XSTK).
Một mẫu ngẫu nhiên gồm bảo hiểm được sử dụng bởi những người đi xe máy đã được thử50
nghiệm va chạm, và trong số những chiếc bảo hiểm đã bị thiệt hại.18
a) Tìm khoảng tin cậy cho tỷ lệ bảo hiểm loại này sẽ cho thấy thiệt hại từ thử nghiệm này.95%
b) (Không bắt buộc) Bao nhiêu bảo hiểm phải được kiểm tra để khi ước lượng giá trị thựcsai số
của p nhỏ hơn 2% với độ tin cậy ?95%
Hướng dẫn: Ta quan tâm tỷ lệ bảo hiểm bị thiệt hại. Đặt tỷ lệ bảo hiểm bị thiệt hại.p =
Theo đề bài: " mẫu ngẫu nhiên gồm mũ được thử nghiệm thấy cái bị thiệt hại "50 18
=
cỡ mẫu mũ bảo hiểm và tỷ lệ mẫun = 50 bp =
18
n
=
18
50
.
a) Độ tin cậy 1 α = 95% = 0.95 = α = 0.05.
Dung sai :
ε = z
1
α
2
.
s
bp.
1 bp
n
= z
0.975
.
s
bp.
1 bp
n
= 1, 96 ×
v
u
u
t
18
50
.
1
18
50
50
0, 133.
Vậy khoảng tin cậy cho tỷ lệ bảo hiểm bị thiệt hại 96%
b
p ε < p < bp + ε
18
50
0, 133 < p <
18
50
+ 0, 133 0 0, 227 < p < , 493 .
9
Xác suất-Thống HKI - 2023-2024
b) Sai số ước lượng nhỏ hơn , nghĩa , ta 2% ε < 2% ε = z
1
α
2
.
r
bp.
1 bp
n
, nên
ε < 2% z
1
α
2
.
s
bp.
1 bp
n
< 0, 02 n >
z
1
α
2
.
q
bp.
1 bp
0
, 02
2
n >
1, 96 ×
r
18
50
.
1
18
50
0
, 02
2
n > 2212, 762 .
Vậy muốn sai số ước lượng nhỏ hơn độ tin cậy , thì phải quan sát ít nhất bảo hiểm.2% 95% 2213
Bài 12 (dựa theo Bài 5.30 - trang 149 giáo trình XSTK).
Nhiệt độ nước trung bình tại một trạm bơm nước cung cấp cho một khu dân không được vượt
quá 100
o
F . Những khảo sát trong quá khứ đã chỉ ra rằng độ lệch chuẩn của nhiệt độ . Đo2
o
F
nhiệt độ nước tại trạm bơm trong ngày được chọn ngẫu nhiên và tính được nhiệt độ trung bình 9
98
o
F . Biết rằng nhiệt độ nước tuân theo phân phối chuẩn.
(a) bằng chứng cho thấy nhiệt độ nước thể chấp nhận được hay không, mức ý nghĩa ?0 05.
(b) Tính mức ý nghĩa nhỏ nhất khi bạn đưa ra kết luận bác b giả thuyết .H
0
(Hint: p-giá trị = mức ý nghĩa nhỏ nhất để bác b H
0
)
Hướng dẫn: Ta quan tâm nhiệt độ nước trung bình. Đặt nhiệt độ nước trung bình.µ =
Theo đề bài, "Những khảo sát trong quá khứ đã chỉ ra rằng độ lệch chuẩn của nhiệt độ F"2
độ lệch chuẩn phương sai đã biết.σ = 2 σ
2
= 4
Lấy mẫu:
" Đo nhiệt độ nước trong ngày được chọn ngẫu nhiên và tính được nhiệt độ trung bình "9 98
o
F
cỡ mẫu và trung bình mẫu .n = 9 x = 98
" Nhiệt độ nước trung bình hạ lưu từ ống tháp xả giải nhiệt của nhà máy .không được vượt quá 100
F
bằng chứng cho ta thấy nhiệt độ nước thể chấp nhận được hay không "
= H
0
: µ 100 = H
1
: µ > 100. ( )Dấu " = " luôn nằm giả thuyết H
0
Giả thuyết cần kiểm định
(
H
0
: µ = µ
0
H
1
: µ > µ
0
(
H
0
: µ = µ
0
= 100
H
1
: µ > µ
0
;
cũng thể viết
(
H
0
: µ µ
0
= 100
H
1
: µ > µ
0
!
Mức ý nghĩa .α = 5% = 0, 05
Tính thống kiểm định: Lấy mẫu: cỡ mẫu trung bình mẫu ;n = 9 x = 98
Phương sai đã biếtσ
2
= 4 dùng phân phối chuẩn.
10
Xác suất-Thống HKI - 2023-2024
Ta thống kiểm định:
z
0
=
x µ
0
σ/
n
=
98 100
2
/
9
= 3 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu .z z
0
> z
1α
=
0,95
= 1, 645
Kết luận: do z
0
= 3 < 1, 645 = z
1α
= KHÔNG bác b tức ;H
0
µ = µ
0
= 100
(hoặc µ µ
0
= 100 nếu lúc đầu đặt )H
0
: µ µ
0
= 100
Vậy nhiệt độ nước trung bình , với mức ý nghĩa .KHÔNG vượt quá F100
o
α = 5%
Do đó nhiệt độ nước chấp nhận được.
Tính p-giá trị: trong trường hợp này ta -giá trịp = 1 Φ( Φ( 0 9987z
0
) = 1 3) = Φ(3) , .
Ta thấy p-giá trị = 0, 9987 > 0 =, 05 = α KHÔNG bác b H
0
= cùng kết luận khi sử dụng miền bác bỏ.
Bài 13. Đo hàm lượng natri (đv: mg) của hai mươi hộp bắp hữu g của nhà sản xuất ,300 A
thu được dữ liệu
131, 15 130 69 130 91 129 54 129 64 128 77 130 72 128 33 128 24 129 78, , , , , , , , ,
129, 65 130 14 129 29 128 39 130 42 129 53 130 12 130 92, , , 71 129 129, , , , ,
Giả sử theo tiêu chuẩn, hàm lượng natri trung bình không được phép vượt quá mg.130
Sử dụng mức ý nghĩa , dữ liệu trên cho thấy các hộp bắp hữu của nhà sản xuất đảm bảo0, 02 A
tiêu chuẩn hay không? Tính -giá trị.p
Hướng dẫn: Ta quan tâm hàm lượng natri trung bình của hộp bắp hữu cơ.
Đặt µ = hàm lượng natri trung bình của hộp bắp hữu của nhà sản xuất A.
Lấy mẫu: cỡ mẫu n = 20 và
Trung bình mẫu:
x =
131, 15 + 129 65 + 130 69 + 130 14 + + 129 78 + 130 92, , , ... , ,
n
= 129, 747;
Phương sai mẫu:
s
2
=
131, , , ,15 x
2
+
129 65 x
2
+ ... +
129 78 x
2
+
130 92 x
2
n
1
0 7681;,
Độ lệch chuẩn mẫu: phương sai mẫus =
p
=
s
2
0 8764;,
" Giả sử theo tiêu chuẩn, .hàm lượng natri trung bình không được phép vượt quá 130mg
Sử dụng mức ý nghĩa , dữ liệu trên cho thấy các hộp bắp hữu của nhà sản xuất đảm bảo0, 02 A
tiêu chuẩn hay không?
= H
0
: µ 130 = H
1
: µ > 130. ( )Dấu " = " luôn nằm giả thuyết H
0
Giả thuyết cần kiểm định
(
H
0
: µ µ
0
= 130 : đảm bảo tiêu chuẩn
H
1
: µ > µ
0
: KHÔNG đảm bảo tiêu chuẩn
;
Mức ý nghĩa .α = 0, 02
Tính thống kiểm định: Phương sai KHÔNG biết và cỡ mẫu (mẫu nhỏ)σ
2
n = 20 < 30
dùng phân phối t-Student với bậc tự do .(n 1)
11
Xác suất-Thống HKI - 2023-2024
Ta thống kiểm định:
t
0
=
x µ
0
s/
n
=
129, 747 130
0
, 7681/
20
= 1, 291 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu t
0
> t
n1
1
α
= t
19
0
,98
2, 1 .
Kết luận: do t t
0
= 1, 291 < 2, 1 =
n1
1
α
= KHÔNG bác bỏ tức H
0
µ µ
0
= 130 ;
Vậy hàm lượng natri trung bình của hộp ngũ cốc , với mức ý nghĩa . 130 mg α = 0, 02
Tính p-giá trị: gọi biến ngẫu nhiên phân phối -Student với bậc tự do ,T
19
t (n 1) = 19
ta
p
-giá trị = P
T t T T
19
0
= P
19
1, 291
= 1 P
19
< 1, 291
=
P
T
19
< 1 291 85,
0, .
Ta thấy p-giá trị = 0, 85 > 0 =, 02 = α KHÔNG bác b H
0
= cùng kết luận khi sử dụng miền bác bỏ.
Bài 14 (dựa theo Bài 5.77 - trang 160 giáo trình XSTK).
Một nhà y sản xuất ống kính interocular một y nghiền mới. Máy nghiền mới y được coi
đủ điều kiện nếu bằng chứng cho thấy tỷ lệ phần trăm của các thấu kính được đánh bóng
chứa khuyết tật bề mặt dưới . Người ta khảo sát một mẫu ngẫu nhiên gồm2% 300 thấu kính thì
thấy 8 ống kính bị lỗi.
a) Xây dựng và kiểm tra giả thuyết phù hợp để xác định xem máy mới này đủ điều kiện hay
không, với mức ý nghĩa , đồng thời tìm -giá trị.0.05 p
b) (không bắt buộc) Giải thích thêm cho kết luận trên bằng cách sử dụng khoảng tin cậy cho .p
Hướng dẫn: Ta quan tâm tỷ lệ thấu kính được đánh bóng chứa khuyết tật (bị lỗi).
Đặt p = tỷ lệ thấu kính được đánh bóng chứa khuyết tật (bị lỗi).
Theo đề bài, " khảo sát một mẫu ngẫu nhiên gồm thấu kính thì thấy ống kính bị lỗi300 8 ".
=
cỡ mẫu và t lệ mẫun = 300 bp =
8
n
=
8
300
.
" Máy nghiền được coi đủ điều kiện nếu tỷ lệ phần trăm của các thấu kính được đánh bóng
chứa khuyết tật bề mặt dưới 2%
kiểm tra giả thuyết phù hợp để xác định xem máy mới này đủ điều kiện hay không "
= H
1
: p < 2% = 0, 02 = H
0
: p 0, 02 . ( )Dấu " = " luôn nằm giả thuyết H
0
Giả thuyết cần kiểm định
(
H
0
: p = p
0
= 0, 02 : KHÔNG đủ điều kiện
H
1
: p < p
0
: đủ điều kiện
;
(
Dấu " = " luôn nằm giả thuyết H
0
)
cũng thể viết
(
H
0
: p p
0
= 0, 02
H
1
: p < p
0
!
Mức ý nghĩa .α = 0, 05
12
Xác suất-Thống HKI - 2023-2024
Tính thống kiểm định: với cỡ mẫu và t lệ mẫun = 300 bp =
8
300
, ta
z
0
=
bp p
0
s
p
0
.
1 p
0
n
=
8
300
0, 02
s
0 02, .
1 0, 02
300
0, 825 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu .z
0
< z
1α
= z
0,95
= 1, 645
Kết luận: do z
0
= 0, 825 > 1, 645 = z
1α
= KHÔNG bác b tức .H
0
p = p
0
= 0, 02
(hoặc p p
0
= 0, 02 nếu lúc đầu đặt )H
0
: p p
0
= 0, 02
Vậy tỷ lệ thấu kính bị lỗi KHÔNG dưới , nên máy mới KHÔNG đủ điều kiện, mức ý nghĩa .2% α = 5%
Tính p-giá trị: trong trường hợp này ta -giá trịp = Φ(z
0
) = Φ(0, 825) 0, 7953.
Ta thấy p-giá trị = 0, 7953 > 0 =, 05 = α KHÔNG bác b .H
0
Bài 15 (dựa theo Bài 5.69 - trang 158 giáo trình XSTK).
Một nhà máy sản xuất chất bán dẫn sản xuất b điều khiển sử dụng trong công nghệ động ô tô.
Nhà sản xuất chất bán dẫn lấy mẫu ngẫu nhiên gồm 200 sản phẩm và thấy chín sản phẩm bị lỗi.
Khách hàng yêu cầu tỷ lệ lỗi của sản phẩm phải dưới . Hỏi nhà sản xuất thể chứng minh khả0, 05
năng đáp ứng mức chất lượng này cho khách hàng không? Sử dụng mức ý nghĩa .1%
Hướng dẫn: Ta quan tâm tỷ lệ sản phẩm bị lỗi của nhà sản xuất này.
Đặt p = tỷ lệ sản phẩm bị lỗi của nhà sản xuất này.
Theo đề bài, " Lấy mẫu ngẫu nhiên gồm sản phẩm và thấy 200 chín sản phẩm bị lỗi "
cỡ mẫu và t lệ mẫun = 200 bp =
9
n
=
9
200
.
" Khách hàng yêu cầu tỷ lệ lỗi của sản phẩm phải dưới 0, 05 "
= H
1
: p < 0, 05 = H
0
: p 0, 05 ( Dấu " = " luôn nằm giả thuyết H
0
)
Giả thuyết cần kiểm định
(
H
0
: p = p
0
= 0, 05 : KHÔNG đáp ứng được yêu cầu
H
1
: p < p
0
: đáp ứng được yêu cầu của khách hàng
;
cũng thể viết
(
H
0
: p p
0
= 0, 05 : KHÔNG đáp ứng được yêu cầu
H
1
: p < p
0
: đáp ứng được yêu cầu của khách hàng
!
Mức ý nghĩa .α = 1% = 0, 01
Tính thống kiểm định: với cỡ mẫu và t lệ mẫun = 200 bp =
9
200
, thì thống kiểm định:
z
0
=
bp p
0
s
p
0
.
1 p
0
n
=
9
200
0 05,
s
0, 05.
1 0, 05
200
= 0, 3244 ;
13
Xác suất-Thống HKI - 2023-2024
Miền bác bỏ: ta sẽ bác b H
0
nếu .z
0
< z
1α
= z
0,99
= 2, 325
Kết luận: do KHÔNG bác bỏz
0
= 0, 3244 > 2, 325 = z
1α
H
0
tức .p = p
0
= 0, 05
Vậy tỷ lệ lỗi của sản phẩm KHÔNG dưới , với mức ý nghĩa .0 05, α = 1%
Do đó không đáp ứng yêu cầu khách hàng, với mức ý nghĩa .α = 1%
Bài 16. Biết trọng lượng X (g/quả) của mỗi quả trứng phân phối chuẩn. Đem cân quả trứng100
kết quả sau:
x
i
155 160 165 170 175 180 185
n
i
5 12 14 25 24 14 6
Cho biết trứng trọng lượng g trứng loại một.lớn hơn 170
(a) Tìm khoảng tin cậy cho trọng lượng trứng trung bình. Nếu ta muốn sai số ước lượng97%
không quá g thì cần khảo sát thêm bao nhiêu trứng?0 1,
(b) Tìm khoảng tin cậy cho tỷ lệ trứng loại một.98%
(c) ý kiến rằng trọng lượng trứng trung bình lớn hơn g/quả. Kiểm định ý kiến trên170
với mức ý nghĩa .1%
(d) ý kiến cho số trứng thuộc loại một. Kiểm định ý kiến trên với mức ý nghĩa .ít nhất 65% 1%
Hướng dẫn: Ta quan tâm trọng lượng trứng trung bình. Đặt trọng lượng trứng trung bình.µ =
Lấy mẫu: cỡ mẫu ;n = 5 + 12 + 14 + 25 + 24 + 14 + 6 = 100
Trung bình mẫu:
x
=
155 × 5 + 160 + 180 + 185× 12 + ... ×14 ×6
n
= 170, 85;
Phương sai mẫu:
s
2
=
155 x
2
× ×5 +
160 x
2
12 + ... +
180 ×x
2
14 +
185 ×x
2
6
n
1
60 1288;,
Độ lệch chuẩn mẫu: phương sai mẫus =
p
=
s
2
7 7543;,
(a) Độ tin cậy suy ra .1 α = 97% = 0, 97 α = 0, 03
Phương sai không biết, cỡ mẫu (mẫu lớn) TH2: sử dụng phân phối Gauss.σ
2
n = 100 30
Sai số KTC (dung sai):
ε = z
1
α
2
×
s
n
= z
0,985
×
s
n
2, 17 ×
7, 7543
100
1, 6827 ;
Vậy KTC cho doanh thu trung bình một ngày của cửa hàng 97%
x x ε µ + ε 170, ,85 1, ,6827 µ 170 85 + 1 6827 169, ,1673 µ 172 5327 .
14
Xác suất-Thống HKI - 2023-2024
Để sai số ước lượng không quá 0 1, g thì
ε 0, 1 z
1
α
2
×
s
n
0, 1 n
z
1
α
2
×
s
0
, 1
2
= 2
, 17
2
×
60 1288,
0 1
,
2
= 28314, 05.
(b) Gọi p = tỷ lệ trứng loại 1. Trứng loại 1 trọng lượng g. trên 170
Ta có: cỡ mẫu , số trứng loại 1 , nên tỷ lệ mẫu
n = 100 Y = 24 + 14 + 6 = 44 bp =
Y
n
=
44
100
;
Độ tin cậy suy ra .1 α = 98% = 0, 98 α = 0, 02
Sai số KTC (dung sai):
eε = z
1
α
2
×
s
bp ×
1 bp
n
= z
0,99
×
s
bp ×
1 bp
n
= 2, 325 ×
v
u
u
t
44
100
×
1
44
100
100
0, 1154;
Vậy KTC cho tỷ lệ trứng loại 1 98%
b
p eε p bp + eε
44
100
0, 1154 p
44
100
+ 0, 1154 0, 3246 5554; p 0,
(c) " ý kiến cho rằng .trọng lượng trứng trung bình lớn hơn 170g/quả
= H
1
: µ > 170 = H
0
: µ 170 . ( Dấu " = " luôn nằm giả thuyết H
0
)
Giả thuyết cần kiểm định
(
H
0
: µ µ
0
= 170
H
1
: µ > µ
0
;
Mức ý nghĩa .α = 0, 01
Tính thống kiểm định: Phương sai KHÔNG biết và cỡ mẫu (mẫu lớn)σ
2
n = 100 30
dùng phân phối Gauss.
Ta thống kiểm định:
z
0
=
x µ
0
s/
n
=
170, 85 170
7
, 7543/
100
= 1, 0962 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu .z z
0
> z
1α
=
0,99
2, 325
Kết luận: do KHÔNG bác bỏ tức ;z
0
= 1, 0962 < 2, 325 = z
1α
H
0
µ µ
0
= 170
Vậy trọng lượng trung bình của trứng , với mức ý nghĩa . 170 g/quả α = 0, 01
(d) ý kiến "50% số trứng thuộc loại một "
= H
0
: p = 0, 5 = H
1
: p = 0, 5 ( Dấu " = " luôn nằm giả thuyết H
0
)
Giả thuyết cần kiểm định
(
H
0
: p = p
0
= 0, 5
H
1
: p = p
0
;
Mức ý nghĩa .α = 0, 01
Tính thống kiểm định:
z
0
=
bp p
0
r
p
0
.
1 p
0
n
=
44
100
0 5,
r
0 5, .
1 0 5,
100
= = 2 ;1,
Miền bác bỏ: ta sẽ bác b H
0
nếu
z
0
> z
1
α
2
= z
0,995
2, 575 .
Kết luận: do
z
0
= 1, 2 < 2, 575 = z
1
α
2
= KHÔNG bác b tức ;H
0
p = p
0
= 0, 5
Vậy tỷ lệ trứng loại 1 , với mức ý nghĩap = 0, 5 α = 1%.
15
Xác suất-Thống HKI - 2023-2024
Bài 17 (dựa theo Bài 5.93 - trang 163 giáo trình XSTK).
Hai loại nhựa phù hợp để sử dụng cho một nhà sản xuất linh kiện điện tử. Sức mạnh chịu sự phá
huỷ của loại nhựa này quan trọng. Biết psi. Từ hai mẫu ngẫu nhiên kích thướcσ σ
1
=
2
= 1
n
1
= 10 và vàn
2
= 12, ta được x
1
= 162, 5 x
2
= 155. Công ty sẽ không áp dụng nhựa loại 1 trừ
khi sức chịu phá vỡ trung bình của vượt quá nhựa loại 2 một mức hơn psi.10
Trên sở thông tin đó, ta nên sử dụng nhựa loại 1? Sử dụng và tìm -giá trị.α = 0, 05 p
(Hint: " Công ty sẽ không áp dụng nhựa loại 1 trừ khi sức chịu phá vỡ trung bình của vượt quá
nhựa loại 2 một mức hơn psi10 " H
1
: µ µ
1
2
> D
0
= 10 )
Hướng dẫn: Ta muốn so sánh sức chịu phá vỡ trung bình của nhựa loại 1 so với loại 2.
Đặt µ
1
= sức chịu phá vỡ trung bình của loại 1 và sức chịu phá vỡ trung bình của loại 2.µ
2
=
" Công ty sẽ không áp dụng nhựa loại 1 trừ khi sức chịu phá vỡ trung bình của vượt quá
nhựa loại 2 một mức hơn 10 psi "
= H
1
: µ
1
µ
2
> 10 = H
0
: µ µ
1
2
10 ( Dấu " " luôn nằm giả thuyết= H
0
)
Giả thuyết cần kiểm định
(
H
0
: µ µ
1
2
= D
0
= 10 : KHÔNG nên sử dụng nhựa loại 1
H
1
: µ µ
1
2
> D
0
: nên sử dụng nhựa loại 1
;
cũng thể viết
(
H
0
: µ µ
1
2
D
0
= 10
H
1
: µ µ
1
2
> D
0
!
Mức ý nghĩa .α = 0, 05
Tính thống kiểm định:
Lấy mẫu: nhựa loại 1 : cỡ mẫu trung bình mẫu ;n = 10 x = 162, 5
nhựa loại 2 : cỡ mẫu trung bình mẫu ,m = 12 y = 155
Phương sai σ
2
1
= σ
2
2
= 1
2
đã biết = dùng phân phối chuẩn.
Ta thống kiểm định:
z
0
=
x y D
0
r
σ
2
1
n
+
σ
2
2
m
=
162, 5 155 10
r
1
2
10
+
1
2
12
5, 839 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu .z
0
> z
1α
= z
0,95
= 1, 645
Kết luận: do z
0
= 5 1 =, 839 < , 645 = z
1α
KHÔNG bác bỏ , tức H
0
µ
1
µ
2
= D
0
= 10
(hoặc µ
1
µ
2
10 nếu lúc đầu đặt )H
0
: µ µ
1
2
10
Vậy sức chịu phá v trung bình của nhựa loại 1 KHÔNG cao hơn độ sức chịu phá vỡ trung bình của
nhựa loại 2 một mức hơn pssi, với mức ý nghĩa .10 α = 1%
Do đó KHÔNG nên sử dụng nhựa loại 1, với mức ý nghĩa .α = 1%
Tính p-giá trị: trong trường hợp này ta p-giá trị = 1 Φ( Φ( 1z
0
) = 1 5, 839) = Φ(5, 839) .
Ta thấy p-giá trị 1 > 0 =, 05 = α KHÔNG bác b H
0
16
Xác suất-Thống HKI - 2023-2024
Bài 18 (dựa theo Bài 5.100 - trang 675 giáo trình XSTK).
Hai chất xúc tác thể được sử dụng trong một phản ứng hoá học. Mười hai phản ứng được cho sử
dụng chất xúc tác 1, dẫn đến hiệu suất trung bình ) và độ lệch chuẩn mẫu 3. Mười86 (đv: %
lăm phản ứng được cho sử dụng chất xúc tác 2, và kết quả hiệu suất trung bình với độ lệch89
chuẩn mẫu 2. Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn.
bằng chứng để khẳng định rằng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1
hay không? Sử dụng . (α = 0, 01 Yêu cầu dùng c 2 phương pháp: miền bác b -giá trịp )
Hướng dẫn: Ta muốn so sánh hiệu suất trung bình của chất 1 so với hiệu suất của chất 2.
Đặt µ
1
= hiệu suất của chất xúc tác 1 và hiệu suất của chất xúc tác 2.µ
2
=
" bằng chứng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1 hay không? "
= H
1
: µ
1
< µ
2
hay µ µ
1
2
< 0 = H
0
: µ µ
1
2
0 .
Giả thuyết cần kiểm định
(
H
0
: µ µ
1
=
2
H
1
: µ
1
< µ
2
(
H
0
: µ µ
1
2
= D
0
= 0
H
1
: µ µ
1
2
< D
0
;
(
Dấu " = " luôn nằm giả thuyết H
0
)
cũng thể viết
(
H
0
: µ
1
µ
2
D
0
= 0
H
1
: µ
1
µ
2
< D
0
!
Mức ý nghĩa α = 0, 01. Tính thống kiểm định:
Lấy mẫu: chất A : cỡ mẫu trung bình mẫu , độ lệch chuẩn mẫu ;n = 12 x = 86 s
1
= 3
chất B : cỡ mẫu , độ lệch chuẩn mẫu ;m = 15 trung bình mẫu y = 89 s
1
= 2
Phương sai σ
2
1
và σ
2
2
KHÔNG biết với cỡ mẫu n = 12 < 30 và m = 15 < 30 cỡ mẫu nhỏ
= dùng phân phối t-Student với bậc tự do df = n 1 + m 1.
Dữ kiện đề bài: " Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn "
= σ
1
= σ
2
hay phương sai bằng nhau σ
2
1
= σ
2
2
= tính s
2
p
=
(n 1).s
2
1
+ (m 1).s
2
2
n
1 + m 1
=
(12 1).3
2
+ (15 1) 2.
2
12
1 + 15 1
= 6, 2.
Ta thống kiểm định:
t
0
=
x y D
0
r
s
2
p
n
+
s
2
p
m
=
86 89 0
r
6 2,
12
+
6 2,
15
3, 111 ;
Miền bác bỏ: ta sẽ bác bỏ H
0
nếu t
0
< t
n1+ 1m
1
α
= t
12 1+15 1
0
,99
= t
25
0
,99
= 2, 4851
(tra bảng phân phối Student để tìm giá trị cho t
25
0 99
,
)
Kết luận: do t
0
= 3, 111 < 2, 4851 = t
n1+m1
1
α
bác b H
0
chấp nhận H
1
tức µ
1
µ
2
< D
0
= 0 hay .µ
1
< µ
2
Vậy chất xúc tác 2 tạo ra hiệu suất trung bình hiệu suất của chất xúc tác 1, với mức ý nghĩa .cao hơn α = 1%
Tính p-giá trị: với biến ngẫu nhiên phân phối Student( ) ta T
n1+m1
n 1 + m 1
p
-giá trị = P
T T T
n 1+m 1
< t
0
= P
25
< 3, 111
= 1 P
25
< 3 111,
tra bảng phân phối Student với bậc tự do df = n 1 + m 1 = 25 ta thấy
P
T
25
2, 7874
= 0, 995 P
T
25
3, 7251
= 0, 9995 = P
T
25
< 3 111,
0. .995 + 0 9995
2
= 0.9975 ;
=
p-giá trị = 1 P
T
25
< 3, 111
1 0, 9975 = 0, 0025 .
17
Xác suất-Thống HKI - 2023-2024
Bài 19. Để tìm ra liệu một loại huyết thanh mới kiềm hãm được bệnh bạch cầu hay không, 9
con chuột, tất cả các con đều trong giai đoạn tiến triển của bệnh, được chọn. Năm con chuột nhận
được trị liệu và con không. Thời gian sống, theo năm, từ thời điểm thí nghiệm bắt đầu như sau4
Trị liệu 2, 1 5 3 1 4 4 6 0 9, , , ,
Không trị liệu 1, 9 0 5 2 8 3 1, , ,
Tại mức ý nghĩa , huyết thanh thể được nói hiệu quả hay không?0, 05
Giả sử hai tổng thể phân phối chuẩn với các phương sai bằng nhau.
Hướng dẫn: Ta muốn so sánh tuổi thọ trung bình chuột được trị liệu so với KHÔNG trị liệu.
Đặt µ
1
= tuổi thọ trung bình nhóm được trị liệu và tuổi thọ trung bình KHÔNG trị liệu.µ
2
=
" huyết thanh thể được nói hiệu quả hay không? "
= H
1
: µ
1
> µ
2
hay µ µ
1
2
> 0 = H
0
: µ µ
1
2
0 .
Giả thuyết cần kiểm định
(
H
0
: µ
1
= µ
2
H
1
: µ
1
> µ
2
(
H
0
: µ
1
µ
2
= D
0
= 0 : KHÔNG hiệu quả
H
1
: µ µ
1
2
> D
0
: hiệu quả
;
(
Dấu " = " luôn nằm giả thuyết H
0
)
cũng thể viết
(
H
0
: µ µ
1
2
D
0
= 0
H
1
: µ µ
1
2
> D
0
!
Mức ý nghĩa α = 0, 05. Tính thống kiểm định:
Lấy mẫu: trị liệu : cỡ mẫu n = 5 trung bình mẫu ,x = 2, 86
độ lệch chuẩn mẫu ;
s
1
=
3, 883 1 9705,
KHÔNG trị liệu : cỡ mẫu m = 4 trung bình mẫu ,y = 2, 075
độ lệch chuẩn mẫu ;
s
2
=
1, 3625 1, 1673
Phương sai σ
2
1
và σ
2
2
KHÔNG biết với cỡ mẫu n = 5 < 30 và m = 4 < 30 cỡ mẫu nhỏ
= dùng phân phối t-Student với bậc tự do df = n 1 + m 1.
Dữ kiện đề bài: " Giả sử hai tổng thể phân phối chuẩn với các phương sai bằng nhau "
= phương sai bằng nhau σ
2
1
= σ
2
2
= tính s
2
p
=
(n 1).s
2
1
+ (m 1).s
2
2
n
1 + m 1
=
(5 × ×1) 3, 883 + (4 1) 1, 3625
5
1 + 4 1
2 8028, .
Ta thống kiểm định:
t
0
=
x y D
0
r
s
2
p
n
+
s
2
p
m
=
2, 86 2, 075 0
r
2 8028,
5
+
2, 8028
4
0, 699 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu t
0
> t
n 1+m 1
1
α
= t
5 1+4 1
0
,95
= t
7
0
,95
= 1 8946,
(tra bảng phân phối Student để tìm giá trị cho t
7
0 95
,
)
Kết luận: do t t
0
= 0, 699 < 1, 8946 =
n1+m1
1
α
KHÔNG bác b H
0
tức µ
1
µ
2
0.
Vậy tuổi thọ trung bình nhóm được trị liệu nhóm KHÔNG được trị liệu,KHÔNG cao hơn
tức huyết thanh KHÔNG hiệu quả, với mức ý nghĩa α = 5%.
18
Xác suất-Thống HKI - 2023-2024
Bài 20. Đo chỉ số chất béo trong sữa bò (tính theo Hà-Ấn), được bảngX % của 130 con bò lai F
1
số liệu
X 3, , , ,3 3, 9 4 5 5 1 5 7 6, ,3 6 9
n
i
2 8 35 43 22 15 5
Giả thiết rằng X phân phối chuẩn.
(a) Hãy ước lượng trung bình chỉ số chất béo trong sữa giống bò lai trên độ tin cậy .99%
(b) Nếu muốn ước lượng trung bình chỉ số chất béo trong sữa của lai -Hà-Ấn với sai số ướcF
1
lượng không quá 0, 15% và độ tin cậy thì phải lấy mẫu tối thiểu bao nhiêu?99%
(c) Biết rằng trung bình chỉ số chất béo trong sữa của giống thuần chủng 4 95, . Hỏi việc
lai tạo trên cho trung bình chỉ số chất béo trong sữa bò tăng lên không với mức ý nghĩa ?1%
Hướng dẫn: Ta quan tâm chỉ số chất béo trung bình. Đặt số chất béo trung bình trong sữa bò.µ =
Phương sai KHÔNG biết.σ
2
Lấy mẫu: cỡ mẫu ;n = 2 + 8 + 35 + 43 + 22 + 15 + 5 = 130
trung bình mẫu
x =
3, 3 × 2 + 3, 9 × 8 + 4, 5 × 35 + + 6... , 9 × 5
n
5, 1462 ;
và phương sai mẫu
s
2
=
3, ,3 ×x
2
2 +
3 9 x x
2
× 8 + ... +
6, 9
2
× 5
n
0, 5895 .
(a) Độ tin cậy 1 α = 99% = 0.99 = α = 0.01.
Dung sai (trường hợp phương sai KHÔNG biết và cỡ mẫu lớn ) được xác định bởiε n = 130 30
ε = z
1
α
2
.
s
n
= z
0.995
.
s
n
= z
0.995
.
0 5895,
130
2, 575 ×
0 5895,
130
0, 1734 .
Vậy khoảng tin cậy cho chỉ số chất béo trung bình trong sữa bò 99%
x ε < µ < x + ε 5, 1462 0, 1734 < µ < < µ < .5, 1462 + 0, 1734 4, 9728 5, 3196
(b) Độ tin cậy 1 α = 99% = 0.99 = α = 0.01.
Sai số ước lượng không quá 0, 15 (đv: %),
Lưu ý: µ, x, σ và ε cùng đơn vị, và trong bài này cùng đơn vị %.
Do đó, , ta sai số ước lượng không quá 0, 15 (đv: %), nghĩa ε 0, 15 ε = z
1
α
2
.
s
n
, nên
ε 0, 15 z
1
α
2
.
s
n
0, 15 n
z
1
α
2
.
s
0 15
,
2
n
z
0,995
.
s
0
, 15
2
n
2, 575 ×
0 5895,
0
, 15
2
n 173, 7224 .
Vậy muốn sai số ước lượng không quá ) độ tin cậy , thì phải quan sát ít nhất con bò.0, 15 (% 99% 174
19
Xác suất-Thống HKI - 2023-2024
(c) " Biết rằng trung bình chỉ số chất béo trong sữa của giống bò thuần chủng .4, 95
Hỏi việc lai tạo trên cho trung bình chỉ số chất béo trong sữa bò tăng lên không "
= H
1
: µ > 4, 95 = H
0
: µ 4, 95 ( Dấu " = " luôn nằm giả thuyết H
0
)
Giả thuyết cần kiểm định
(
H
0
: µ = µ
0
H
1
: µ > µ
0
(
H
0
: µ = µ
0
= 4, 95 : KHÔNG tăng
H
1
: µ > µ
0
: tăng
;
cũng thể viết
(
H
0
: µ µ
0
= 4, 95
H
1
: µ > µ
0
!
Mức ý nghĩa .α = 1% = 0, 01
Tính thống kiểm định:
Lấy mẫu: cỡ mẫu trung bình mẫu và độ lệch chuẩn mẫu ;
n = 130 x = 5, 1462 s =
0, 5895
Phương sai KHÔNG biết cỡ mẫu mẫu lớnσ
2
n = 130 30 dùng phân phối chuẩn.
Ta thống kiểm định:
z
0
=
x µ
0
s/
n
=
5, 1462 4, 95
0, 5895/
130
= 2, 9136 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu .z z
0
> z
1α
=
0,99
= 2, 325
Kết luận: do z
0
= 2, 9136 > 2, 325 = z
1α
= bác b H
0
= chấp nhận H
1
, tức µ > µ
0
= 4, 95 ;
Vậy việc lai tạo cho trung bình chỉ số chất béo trong sữa , với mức ý nghĩa .tăng lên α = 1%
Bài 21 (dựa theo Bài 5.128 - trang 175 giáo trình XSTK).
Một mẫu ngẫu nhiên dân trưởng thành của quận Maricopa chỉ ra rằng người ủng hộ500 385
việc tăng giới hạn tốc độ đường cao tốc lên dặm một giờ, một mẫu khác gồm dân của75 400
quận Pima đã chỉ ra rằng người ủng hộ giới hạn tăng lên. Những dữ liệu này cho thấy sự267
khác biệt trong việc hỗ trợ tăng giới hạn tốc độ cho dân của hai quận y hay không? Sử dụng
α = 0, 02, và tính -giá trị cho kiểm định này bao nhiêu?p
Hướng dẫn: Ta muốn so sánh giữa tỷ lệ dân quận Maricopa so với tỷ lệ dân quận Pima
trong việc ủng hộ tăng giới hạn tốc độ đường cao tốc.
Đặt p
1
= tỷ lệ dân quận Maricopa ủng hộ và tỷ lệ dân quận Pima ủng hộ.p
2
=
" sự khác biệt trong việc hỗ trợ tăng giới hạn tốc độ cho dân của hai quận này hay không? "
= ta muốn so sánh tỷ lệ ủng hộ của dân 2 quận:
bằng nhau (" = ") hay khác nhau (" ").=
= H
1
: p
1
= p
2
hay p
1
p
2
= 0 = H
0
: p
1
= p
2
.
Giả thuyết cần kiểm định
(
H
0
: p
1
= p
2
H p p
1
:
1
=
2
(
H
0
: p p
1
2
= D
0
= 0
H
1
: µ µ
1
2
= D
0
;
( Dấu " = " luôn nằm giả thuyết H
0
)
20
Xác suất-Thống HKI - 2023-2024
Mức ý nghĩa: .α = 0, 02
Tính thống kiểm định:
Lấy mẫu: dân quận Maricopa : cỡ mẫu tỷ lệ mẫun = 500 bp
1
=
385
n
=
385
500
;
dân quận Pima : cỡ mẫu tỷ lệ mẫu
m = 400 bp
2
=
267
m
=
267
400
;
Ta bp =
385 + 267
n
+ m
=
385 + 267
500 + 400
=
652
900
,
z
0
=
bp
1
bp
2
D
0
r
bp.
1 bp
.
1
n
+
1
m
=
385
500
267
400
0
r
652
900
.
1
652
900
.
1
500
+
1
400
3, 42 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu
z
0
> z
1
α
2
= z
0,975
= 1, 96 .
Kết luận: do
z
0
=
3, 42
= 3, 42 > 1, 96 = z
1
α
2
= bác b ,H
0
= chấp nhận H
1
, tức ;µ
1
µ
2
= D
0
= 0
Vậy tỷ lệ ủng hộ của dân 2 quận KHÁC NHAU , với mức ý nghĩa .α = 5%
Tính p-giá trị: ta
p . . .
-giá trị = 2
h
1 Φ(|z
0
|)
i
= 2
h
1 Φ(3, 43) 2
i
.
1 0, 9997
= 0, 0006
ta thấy -giá trịp = 0, 0006 < 0, 05 = α = bác b .H
0
Bài 22. Tạp chí Y học New England báo cáo một thử nghiệm để đánh giá hiệu quả của phẫu thuật
trên những người đàn ông được chẩn đoán mắc bệnh J. Một nửa số mẫu ngẫu nhiên của 695 (là )347
nam giới trong nghiên cứu đã phẫu thuật và người trong số họ cuối cùng đã qua đời bệnh J so18
với 31 trong số 348 người không phẫu thuật. bằng chứng nào cho thấy rằng phẫu thuật giảm tỷ
lệ những người qua đời bệnh J hay không? Sử dụng . Tính -giá trị.α = 0, 05 p
Hướng dẫn: Ta muốn so sánh tỷ lệ tử vong giữa nhóm được phẫu thuật so với nhóm KHÔNG phẫu thuật.
Đặt p
1
= tỷ lệ tử vong nhóm phẫu thuật tỷ lệ tử vong nhóm KHÔNG phẫu thuật.p
2
=
" bằng chứng nào cho thấy rằng phẫu thuật giảm tỷ lệ những người chết bệnh J hay không? "
= H
1
: p
1
< p
2
hay p
1
p
2
< 0 = H
0
: p
1
p
2
.
Giả thuyết cần kiểm định
(
H
0
: p
1
= p
2
H p
1
:
1
< p
2
(
H
0
: p p
1
2
= D
0
= 0
H
1
: µ
1
µ
2
< D
0
;
(
Dấu " = " luôn nằm giả thuyết H
0
)
cũng thể viết
(
H
0
: p p
1
2
D
0
= 0
H
1
: p p
1
2
< D
0
!
Mức ý nghĩa: .α = 0, 05
21
Xác suất-Thống HKI - 2023-2024
Tính thống kiểm định:
Lấy mẫu: nhóm phẫu thuật : cỡ mẫu tỷ lệ mẫun = 347 bp
1
=
18
n
=
18
347
;
nhóm KHÔNG phẫu thuật : cỡ mẫu tỷ lệ mẫu
m = 348 bp
2
=
31
m
=
31
348
;
Ta bp =
18 + 31
n
+ m
=
18 + 31
347 + 348
=
49
695
,
z
0
=
bp
1
bp
2
D
0
r
bp.
1 bp
.
1
n
+
1
m
=
18
347
31
348
0
r
49
695
.
1
49
695
.
1
347
+
1
348
1, 916 ;
Miền bác bỏ: ta sẽ bác b H
0
nếu .z
0
< z
1α
= z
0,95
= 1, 645
Kết luận: do z
0
= 1, 916 < 1, 645 = z
1α
= bác b ,H
0
= chấp nhận H
1
, tức ;p p
1
2
< 0
Vậy phẫu thuật giúp GIẢM tỷ lệ tử vong , với mức ý nghĩa .α = 5%
Tính p-giá trị: ta
p .-giá trị = Φ(z
0
) = Φ(1, 916) = 1 Φ(1, 916) 1 0, 9723 = 0, 0277
ta thấy -giá trịp = 0, 0277 < 0, 05 = α = bác b .H
0
Bài 23. Một người sử dụng một sợi dây thun (hoặc một xo) độ đàn hồi cao để làm một cái
cân đơn giản. Anh ta treo các vật nặng lên dây và ghi lại chiều dài sợi dây cho mỗi lần cân. Dưới đây
một số dữ liệu cho một số lần cân:
Khối lượng g (x) 50 100 150 200 250 300 350 400
Chiều dài mm (y) 37 48 60 71 80 90 102 109
(a) Tìm phương trình hồi quy tuyến tính đơn . Giải thích ý nghĩa củay theo x
b
β
1
nhận được.
(b) Bạn dự đoán chiều dài sợi dây bao nhiêu nếu một vật trọng lượng g được treo lên?375
(c) Tính hệ số xác định . Nhận xét mối liên hệ tuyến tính giữa chiều dài sợi y vàR
2
trọng lượng vật nặng.
(d) Tính hệ số tương quan .r
xy
Hướng dẫn:
(a) Phương trình đường thẳng hồi quy tuyến tính dạng y =
b
β
0
+
b
β
1
. x .
Công thức tính các hệ số
b
β
1
và
b
β
0
b
β
1
=
S
xy
S
xx
=
n
X
i=1
x
i
. y n . x . y
i
n
X
i=1
x
2
i
n.
x
2
và
b
β
0
= y
b
β
1
. x .
22
Xác suất-Thống HKI - 2023-2024
Ta
n
X
i=1
x
i
. y
i
= 50 × 37 + +100 × 48 150 × 60 + ... + 400 × 109 = 156150 ;
x =
x
1
+ x
2
+ ... + x
n
n
=
50 150+ 100 + + ... + 400
8
= 225 ;
y =
y
1
+ y
2
+ ... + y
n
n
=
37 60+ 48 + + ... + 109
8
74, 625 ;
n
X
i=1
x
2
i
= 50
2
+ 100
2
+ 150
2
+ ... + 400
2
= 510000 ;
thay vào công thức ta được S
xy
= 21825 S
xx
= 105000, do đó
b
β
1
0, 2079 và
b
β
0
27, 8571 .
Vậy phương trình đường thẳng hồi quy tuyến tính y =
b
β
0
+
b
β
1
. x . x= 27, 8571 + 0, 2079 .
Ý nghĩa của hệ số
b
β
1
: hệ số
b
β
1
hệ số góc của phương trình đường thẳng hồi quy.
b
β
1
= 0, 2079 > 0 = nếu x tăng thì cũng tăng theo.y
Chẳng hạn, nếu x tăng thêm (hoặc giảm đi) sẽ tăng thêm (hoặc giảm đi) đơn vị.1 đơn vị thì y 0, 2079
(b) Với , thay vào phương trình đường thẳng hồi quy tìm được câu (a) ta đượcx = 375
y
=
b
β
0
+
b
β
1
.x .= 27, 8571 + 0, 2079 × 375 = 105, 8196
Vậy nếu treo một vật nặng g thì chiều dài của sợi dây sẽ khoảng375 105, 8196 mm .
(c) Ta hệ số xác định R
2
=
SSR
SST
(lưu ý ) với0 R
2
1
SSR
=
b
β .S
1 xy
0, 2079×21825 = 4537, 418, và SST =
n
X
i
=1
y
i
y
2
= 4547, 875, suy ra R
2
0 9975, .
R
2
gần 1, nên giữa y (chiều dài sợi dây) (trọng lượng vật nặng) mối liên hệ tuyến tính mạng.x
(d) Hệ số tương quan được tính bởir
xy
r
xy
=
S
xy
S
xx
× SST
=
21825
105000 × 4547, 875
0 9987;,
r
xy
> 0 nên giữa x và y mối tương quan dương,
và r
xy
gần 1 nên mối liên hệ tuyến tính thuận giữa x và mạnh.y
Bài 24. Đo lượng mỡ trong thể của một người một cách để theo dõi tiến độ kiểm soát
cân nặng, nhưng đo chính xác phải sử dụng đến thiết bị X-quang đắt tiền. Thay vào đó, chỉ
số khối thể (BMI) thường được sử dụng làm đại diện cho mỡ thể dễ đo: BMI =
khối lượng (kg) chiều cao (m) khối lượng (lb) chiều cao (in)
/
2
= 703 /
2
. Trong một nghiên cứu
của 250 người đàn ông tại Đại học Bingham Young, cả BMI (biến ) và mỡ thể (biến ) được đox y
lường. Các nhà nghiên cứu đã tìm thấy các thống tóm tắt sau:
n
X
i=1
x
i
= 6322, 28;
n
X
i=1
x
2
i
= 162674 18;,
n
X
i=1
y
i
= 4757, 90;
n
X
i=1
y
2
i
= 107679 27;,
n
X
i=1
x
i
.y
i
= 125471, 10;
(a) Tìm phương trình của đường thẳng hồi quy. Cho biết ý nghĩa của hệ số
b
β
1
.
(b) Sử dụng đường thẳng hồi quy, hãy tiên đoán lượng mỡ thể ( ) của một người đàn ông sẽ đượcy
quan trắc nếu chỉ số BMI .x = 30
(c) Tính hệ số xác định . Nhận xét về mối liên hệ tuyến tính giữa chỉ số BMI và lượng mỡ thể.R
2
(d) Tính hệ số tương quan .r
xy
23
Xác suất-Thống HKI - 2023-2024
Hướng dẫn: (a) Phương trình đường thẳng hồi quy tuyến tính dạng y =
b
β
0
+
b
β
1
. x .
Công thức tính các hệ số
b
β
1
và
b
β
0
b
β
1
=
S
xy
S
xx
=
n
X
i=1
x
i
. y n . x . y
i
n
X
i=1
x
2
i
n.
x
2
và
b
β
0
= y
b
β
1
. x .
Từ dữ kiện đề bài, ta ("Trong một nghiên cứu của người đàn ông")n = 250 250
n
X
i=1
x
i
. y
i
= 125471, 10 và
n
X
i=1
x
2
i
= 162674, 18 ;
x =
x
1
+ x
2
+ ... + x
n
n
=
6322 28,
250
= 25, 289 ;
y =
y
1
+ y
2
+ ... + y
n
n
=
4757 90,
250
19, 0316 ;
thay vào công thức ta được S
xy
= 5147, 996 và S
xx
= 2789, 2824, do đó
b
β
1
1, 8456 và
b
β
0
27, 642 .
Vậy phương trình đường thẳng hồi quy tuyến tính y =
b
β
0
+
b
β
1
. x . x= 27, 642 + 1, 8456 .
Ý nghĩa của hệ số
b
β
1
: hệ số
b
β
1
hệ số góc của phương trình đường thẳng hồi quy.
b
β
1
= 1, 8456 > 0 = nếu x tăng thì cũng tăng theo.y
Chẳng hạn, nếu x tăng thêm đơn vị.1 đơn vị thì y sẽ tăng thêm 1, 8456
(b) Với , thay vào phương trình đường thẳng hồi quy tìm được câu (a) ta đượcx = 30
y
=
b
β
0
+
b
β
1
.x .= 27, 642 + 1, 8456 × 30 = 27, 726
Vậy nếu chỉ số BMI thì lượng mỡ thể sẽ khoảng .30 27, 726
(c) Ta hệ số xác định R
2
=
SSR
SST
(lưu ý ) với0 R
2
1 SSR =
b
β .S
1 xy
1, 8456 × 5147, 996 = 9501, 1414 ,
và SST =
n
X
i
=1
y
i
y
2
=
n
X
i=1
y
2
i
×n
y
2
= 17128, 8204, nên R
2
0 5547, .
0 < R
2
nhưng KHÔNG gần 1, nên giữa y (mỡ thể) và (chỉ số BMI) mối liên hệ tuyến tính yếu.x
(d) Hệ số tương quan (lưu ý ) được tính bởir
xy
1 r
xy
1
r
xy
=
S
xy
S
xx
× SST
=
5147, 996
2789 17128, 2824 × , 8204
0 7448;,
r
xy
> 0 nên giữa x và y mối tương quan dương,
r
xy
KHÔNG gần nên mối liên hệ tuyến tính thuận giữa1 x và y yếu.
- - - Hết - - -
24
| 1/24

Preview text:

Xác suất-Thống kê HKI - 2023-2024
Hướng dẫn giải Bài tập nộp 2 Note:
Danh sách bài tập gồm 24 bài - - - - - * * * * * - - - - -
Bài 1. Thời gian cho đến khi cần sạc lại pin cho một máy tính xách tay trong điều kiện bình thường
là phân phối chuẩn với trung bình 260 phút và độ lệch chuẩn là 50 phút.
(a) Xác suất pin sử dụng kéo dài hơn bốn giờ là bao nhiêu?
(b) Xác định thời gian sử dụng pin tại những giá trị phân vị, là giá trị z sao cho xác suất P(Z ≤ z), đạt 25% và 75%.
(Hint: tức là tìm a sao cho P(Z ≤ a) = 25% và
tìm b sao cho P(Z ≤ b) = 75%)
(c) Xác định thời gian sử dụng pin tương ứng với xác suất ít nhất 0,95. Hướng dẫn:
Ta quan tâm đến thời gian cho đến khi cần sạc lại pin cho một máy tính xách tay.
Gọi X là b.n.n. thể hiện thời gian (đơn vị: phút) cho đến khi cần sạc lại pin cho một máy tính xách tay.
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2) với trung bình µ = 260 phút và độ lệch chuẩn σ = 50 phút.
■ (a) Xác suất pin sử dụng kéo dài hơn 4 giờ = 240 phút là ! !     X − E(X) 240 − E(X) X − µ 240 − µ
P X > 240 = 1 − P X ≤ 240 = 1 − P p p = 1 ≤ Var ≤ − P (X) Var(X) σ σ      với  240 − µ 240 − µ Z ∼ N (0; 1) = 1 − P Z ≤ = 1 − Φ σ σ 240 − 260     = 1 − Φ = 1 − Φ −0, 4 = Φ 0, 4 = 0, 6554; 50
■ (b) Giá trị w là phân vị mức γ của b.n.n. X nếu thoả P(X ≤ wγ) = γ. γ
▷ Do đó, gọi a là thời gian sử dụng pin tại phân vị 25%, nghĩa là !   X − µ a − µ P X ≤ a = 25% = 0, 25 ⇔ P ≤ = 0, 25 σ σ a − µ a − µ     ⇔ Φ = 0, 25 ⇔
= Φ−1 0, 25 = −Φ−1 1 − 0, 25 = −Φ−1(0, 75) σ σ   suy ra  
a = µ + σ × − Φ−1(0, 75) ≈ 260 + 50 × − 0, 675 = 226, 25 phút ;
▷ Tương tự, gọi b là thời gian sử dụng pin tại phân vị 75%, nghĩa là   b − µ b − µ   P X ≤ b = 75% = 0, 75 ⇔ Φ = 0, 75 ⇔ = Φ−1 0, 75 σ σ suy ra
b = µ + σ × Φ−1(0, 75) ≈ 260 + 50 × 0, 675 = 293, 75 phút ;
■ (c) Gọi c là thời gian sử dụng pin tương ứng với xác suất ít nhất 0, 95, ta có   c − µ c − µ     P X ≤ c ≥ 0, 95 ⇔ Φ ≥ 0, 95 ⇔ ≥ Φ−1 0, 95
⇔ c ≥ µ + σ × Φ−1 0, 95 σ σ
≈ 260 + 50 × 1, 645 = 342, 25.
Vậy, thời gian sử dụng pin tương ứng với xác suất ít nhất 0, 95 là 342, 25 phút. □ Z a Nhắc lại: với 1 t2
Z ∼ N (0; 1) thì hàm số Φ(a) := P(Z ≤ a) = .e− 2 dt. 2π −∞ và
P(a < Z < b) = P(a ≤ Z < b) = P(a < Z ≤ b) = P(a ≤ Z ≤ b) = Φ(b) − Φ(a) . 1 Xác suất-Thống kê HKI - 2023-2024
Bài 2. Đường kính một sợi bán dẫn giả sử có phân phối chuẩn với trung bình 0, 5µm và
độ lệch chuẩn 0, 05 µm.
(a) Tính xác suất để đường kính của một sợi lớn hơn 0, 62 µm.
(b) Tính xác suất để đường kính của một sợi nằm giữa 0, 47 và 0, 63 µm.
(c) Đường kính sợi của  
90% mẫu nhỏ hơn giá trị nào?
(Tức là, tìm x sao cho P X < x = 0, 9) Hướng dẫn:
Ta quan tâm đến đường kính sợi bán dẫn.
Gọi X là b.n.n. thể hiện đường kính sợi bán dẫn (đơn vị: µm).
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2) với trung bình µ = 0, 5 µm và độ lệch chuẩn σ = 0, 05 µm.
■ (a) Xác suất để đường kính của một sợi lớn hơn 0, 62 µm là ! !     X − E(X) 0, 62 − E(X) X − µ 0, 62 − µ
P X > 0, 62 = 1 − P X ≤ 0, 62 = 1 − P p p = 1 ≤ Var ≤ − P (X) Var(X) σ σ      với  0, 62 − µ 0, 62 − µ Z ∼ N (0; 1) = 1 − P Z ≤ = 1 − Φ σ σ 0, 62 − 0, 5   = 1 − Φ = 1 − Φ 2, 4 = 1 − 0, 9918 = 0, 9982; 0, 05
■ (b) Xác suất để đường kính của một sợi nằm giữa 0, 47 và 0, 63 µm là ! !   X − µ 0, 63 − µ X − µ 0, 47 − µ P 0, 47 ≤ X ≤ 0, 63 = P ≤ − P ≤ σ σ σ σ          với  0, 63 − µ 0, 47 − µ 0, 63 − µ 0, 47 − µ Z ∼ N (0; 1) = P Z ≤ − P Z ≤ = Φ − Φ σ σ σ σ 0, 63 − 0, 5 0, 47 − 0, 5 = Φ − Φ 0, 05 0, 05       h  i h i
= Φ 2, 6 − Φ − 0, 6 = Φ 2, 6 − 1 − Φ 0, 6
= 0, 9953 − 1 − 0, 7257 = 0, 721;
■ (c) Đường kính sợi của 90% mẫu nhỏ hơn giá trị c, ta có   c − µ c − µ     P X < c = 90% = 0, 9 ⇔ Φ = 0, 9 ⇔ = Φ−1 0, 9 ⇔ c = µ + σ × Φ−1 0, 9 σ σ
≈ 0, 5 + 0, 05 × 1, 282 = 0, 5641.
Vậy, 90% mẫu có đường kính nhỏ hơn 0, 5641 µm. □
Bài 3. Dây điện được sản xuất để sử dụng trong một hệ thống máy tính được chỉ định phải có điện
trở giữa 0,12 và 0,14 ohms. Các điện trở thực tế của dây điện được sản xuất bởi công ty A có phân
phối chuẩn với trung bình 0, 13 ohm và độ lệch chuẩn 0, 01 ohm.
(a) Xác suất để một dây điện được chọn ngẫu nhiên từ sản phẩm của công ty A sẽ phù hợp với các
đặc điểm kỹ thuật này;
(b) Nếu mỗi hệ thống máy tính đều dùng 15 dây điện chọn từ công ty A, thì xác suất để có ít hơn 6
dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này là bao nhiêu?
(c) Nếu mỗi hệ thống máy tính đều dùng 400 dây điện được chọn từ công ty A, thì xác suất để có
ít nhất 200 dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này là
bao nhiêu? (Sử dụng xấp xỉ chuẩn) 2 Xác suất-Thống kê HKI - 2023-2024 Hướng dẫn:
Ta quan tâm đến điện trở của dây điện.
Gọi X là biến ngẫu nhiên thể hiện điện trở (đơn vị: ohm) của dây điện.
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2), với trung bình µ = 0, 13 và độ lệch chuẩn σ = 0, 01.
■ (a) Theo đề bài, dây điện phù hợp đặc điểm kỹ thuật nếu có điện trở nằm giữa 0, 12 ohm và 0, 14 ohm,
tức là nếu 0, 12 ≤ X ≤ 0, 14.
Do đó, xác suất để một dây điện được chọn ngẫu nhiên phù hợp các đặc điểm kỹ thuật là     0, 12 − µ X − µ 0, 14 − µ 0, 12 − µ 0, 14 − µ P(0, 12 ≤ X ≤ 0, 14) = P ≤ ≤ = P ≤ Z ≤ σ σ σ σ σ     0, 14 − µ 0, 12 − µ = Φ − Φ ( với Z ∼ N (0; 1) ) σ σ     0, 14 − 0, 13 0, 12 − 0, 13 = Φ − Φ 0, 01 0, 01 h i
= Φ (1) − Φ (−1) = Φ (1) − 1 − Φ (1)
= 2 × Φ (1) − 1 ≈ 2 × 0, 8413 − 1 = 0, 6826 .
■ (b) Gọi Y là b.n.n. thể hiện số dây điện có điện trở phù hợp đặc điểm kỹ thuật trong tổng số 15 dây điện.
Thì Y có phân phối nhị thức B(n; p) với n = 15 và
p = "xác suất để 1 dây điện phù hợp đặc điểm kỹ thuật" = 0, 6862 (tính ở câu (a)).
Xác suất để trong số 15 dây điện, có ít hơn 6 dây phù hợp đặc điểm kỹ thuật, là              
P Y < 6 = P Y = 0 + P Y = 1 + P Y = 2 + P Y = 3 + P Y = 4 + P Y = 5 = C0 p0(1 p1(1 ... C5 p5(1 n − p)n−0 + C1n − p)n−1 + + n − p)n−5 ≈ 0, 0058.
■ (c) Gọi W là b.n.n. thể hiện số dây điện có điện trở phù hợp đặc điểm kỹ thuật trong tổng số 400 dây điện.
Thì W có phân phối nhị thức B(m; p) với m = 400 và
p = "xác suất để 1 dây điện phù hợp đặc điểm kỹ thuật" = 0, 6862 (tính ở câu (a)).
Ta thấy 0, 1 < p < 0, 9, hơn nữa m × p = 400 × 0, 6862 ≥ 5 và m × (1 − p) = 400 × (1 − 0, 6862) ≥ 5, do đó,
có thể dùng phân phối chuẩn  
N m.p ; m.p.(1 − p) để tính xấp xỉ cho phân phối nhị thức B(m; p) của W .
Cụ thể, ta có, xác suất để có ít nhất 200 dây điện phù hợp đặc điểm kỹ thuật là
P(W ≥ 200) = 1 − P(W < 200) = 1 − P(W ≤ 199) = 1 − P(W < 199 + 0, 5 )
(hiệu chỉnh sự liên tục) ! W − E(W ) 199 + 0, 5 − E(W )
(W có phân phối nhị thức, W ∼ B(m; p)) = 1 − P p < p Var(W ) Var(W )  199 + 0, 5 − E(W )
(dùng Z có phân phối chuẩn để xấp xỉ, Z ∼ N (0; 1)) ≈ 1 − P Z < pVar(W) ! 199 + 0, 5 − E(W ) = 1 − Φ pVar(W)  199 + 0, 5 − m.p  = 1 − Φ pm.p.(1 − p)   , 5 − 400 × 0, = 1 − Φ  199 + 0 6862 q    400 × 0, 6862. 1 − 0, 6862 ≈ 1 − Φ ( −7, 8996 ) = Φ ( 7, 8996 ) ≈ 1 . □ 3 Xác suất-Thống kê HKI - 2023-2024
Bài 4 (dựa theo câu 1 đề thi cuối kỳ, 2022-2023, hk1).
Một nhà máy sản xuất ra bu lông với đường kính tuân theo phân phối chuẩn N (4; 0, 09) (đv: mm).
Các bu lông được đo đạc một cách chính xác và những cái nào có đường kính nhỏ hơn 3, 5mm hoặc
lớn hơn 4, 4mm sẽ bị loại bỏ. Chọn ngẫu nhiên một bu lông được máy sản xuất.
(a) Tính xác suất bu lông này được chấp nhận.
(b) Một lô gồm 900 bu lông được xản suất. Khoảng bao nhiêu bu lông trong số này được chấp nhận? Hướng dẫn:
Ta quan tâm đến đường kính của bu lông.
Gọi Y là biến ngẫu nhiên thể hiện đường kính của bu lông. Theo đề bài, Y có phân phối chuẩn, Y ∼ N (µ; σ2)
với trung bình µ = 4 và phương sai σ2 = 0, 09 ⇒ σ = 0, 3.
■ (a) Theo đề bài, một bu lông sẽ bị loại bỏ nếu đường kính
nhỏ hơn 3, 5mm hoặc lớn hơn 4, 4mm ,
tức là nếu Y < 3, 5 hoặc Y > 4, 4.
=⇒ Ngược lại, bu lông được chấp nhận nếu đường kính "≥ 3,5" và "≤ 4,4", tức là 3, 5 ≤ Y ≤ 4, 4 .
Do đó, xác suất để một bu lông được chấp nhận là     3, 5 − µ Y − µ 4, 4 − µ 3, 5 − µ 4, 4 − µ P(3, 5 ≤ Y ≤ 4, 4) = P ≤ ≤ = P ≤ Z ≤ (với Z ∼ N (0; 1)) σ σ σ σ σ     4, 4 − µ 3, 5 − µ = Φ − Φ σ σ         4, 4 − 4 3, 5 − 4 4 −5 = Φ − Φ = Φ − Φ
≈ 0, 909 − 0, 048 = 0, 861 . 0, 3 0, 3 3 3 ■ (b) Một lô gồm m = 900
bu lông được sản xuất. Từ câu (a) ta đã tính được
p = " xác suất để 1 bu lông được chấp nhận " = 0, 861 .
Cho nên trong m = 900 bu lông được sản xuất, số bu lông được chấp nhận sẽ khoảng
m × p = 900 × 0, 861 = 774, 9 .
Vậy, trong tổng số m = 900 bu lông được sản xuất sẽ có khoảng 775 bu lông được chấp nhận. □
Bài 5. Trọng lượng một túi rau khi thu hoạch tại một nông trại là b.n.n. có phân phối chuẩn với
trung bình 550 g và độ lệch chuẩn 125 g. Biết rằng trong một ngày có 4000 túi rau được thu hoạch.
Ước lượng số túi rau có trọng lượng lớn hơn 325 g được thu hoạch trong một ngày.
(Hint: tính p = xác suất để một túi rau có trọng lượng lớn hơn 325 g,
sau đó lấy xác suất p này nhân với tổng số gói rau thì sẽ ra số gói rau có trọng lượng lớn hơn 325 ) Hướng dẫn:
Ta quan tâm đến trọng lượng một túi rau.
Gọi X là biến ngẫu nhiên thể hiện trọng lượng của một túi rau.
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2) với trung bình µ = 550 và độ lệch chuẩn σ = 125.
Trong tổng số m = 4000 túi rau được thu hoạch, ta muốn ước lượng số túi rau có trọng lượng lớn hơn 325g. 4 Xác suất-Thống kê HKI - 2023-2024
• Trước tiên, ta tính xác suất để một túi rau có trọng lượng lớn hơn 325g là X − µ 325 − µ  325 − µ
p = P(X > 325) = 1 − P(X ≤ 325) = 1 − P < = 1 − P Z < σ σ σ 325 − µ = 1 − Φ (với Z ∼ N (0; 1)) σ 325 − 550
( nhắc lại, ta có Φ(−a) = 1 − Φ(a)) = 1 − Φ
= 1 − Φ(−1.8) = Φ(1.8) ≈ 0, 964 . 125
Cho nên trong m = 4000 túi rau được thu hoạch, số túi rau có trọng lượng lớn hơn 325g là
m × p = 4000 × 0, 964 = 3856 .
Vậy, trong tổng số m = 4000 túi rau được thu hoạch sẽ có khoảng 3856 túi có trọng lượng lớn hơn 325g. □
Bài 6. Chiều dài (đv: cm) của một loài sâu tuân theo phân phối chuẩn N (µ; σ2) với σ > 0.
(a) Bắt ngẫu nhiên một con sâu. Nếu µ = 15 cm và σ = 3, 5 cm, hãy tính xác suất để chiều dài sâu (i) ngắn hơn 18, 5 cm; (ii) ít nhất 16, 75 cm;
(iii) từ 11, 5 cm đến 18, 5 cm.
(b) (Không bắt buộc) Biết rằng 30% số sâu dài ít nhất 16cm, và 15% số sâu ngắn hơn 10 cm.
Tìm trung bình µ và độ lệch chuẩn σ của chiều dài của các con sâu. Hướng dẫn:
Gọi Y là biến ngẫu nhiên thể hiện chiều dài của một loài sâu đang xét.
Theo đề bài, Y có phân phối chuẩn, Y ∼ N (µ; σ2) với trung bình mu và độ lệch chuẩn σ.
■ (a) Với µ = 15 cm và σ = 3, 5 cm.
• (i) Xác suất để chiều dài sâu ngắn hơn 18, 5 cm là Y − µ 18, 5 − µ  18, 5 − µ 18, 5 − 15 P(Y < 18, 5) = P < = Φ = Φ = Φ(1) ≈ 0, 84134 . σ σ σ 3, 5
• (ii) Xác suất để chiều dài sâu ít nhất 16, 75 cm là Y − µ 16, 75 − µ 16, 75 − µ 16, 75 − 15
P(Y ≥ 16, 75) = 1 − P(Y < 16, 75) = 1 − P < = 1 − Φ = 1 − Φ σ σ σ 3, 5
= 1 − Φ(0.5) ≈ 1 − 0, 6915 = 0, 3085 .
• (iii) Xác suất để chiều dài sâu từ 11, 5 cm đến 18, 5 cm là
11, 5 − µ Y − µ 18, 5 − µ P(11, 5 ≤ Y ≤ 18, 5) = P ≤ ≤ σ σ σ 18, 5 − µ  11, 5 − µ 18, 5 − 15 11, 5 − 15 = Φ − Φ = Φ − Φ σ σ 3, 5 3, 5  
= Φ(1) − Φ(−1) = Φ(1) − 1 − Φ(1) = 2 × Φ(1) − 1 ≈ 2 × 0, 84134 − 1 = 0, 68268 .
■ (b) Giả thiết 30% số sâu dài ít nhất 16 cm, tức là ta có P(X ≥ 16) = 30% = 0, 3.
Tương tự, 15% số sâu dài ngắn hơn 10 cm, tức là ta có P(X < 10) = 15% = 0, 15.
Do đó, ta có hệ phương trình sau    (     X − µ 16 − µ  16 − µ P(X ≥ 16) = 0, 3  P < = 1 − 0, 3 = 0, 7  Φ = 0, 7 ⇔ σ σ σ   ⇔   P(X < 10) = 0, 15   X − µ 10 − µ 10 − µ P < = 0, 15   Φ = 0, 15 σ σ σ 5 Xác suất-Thống kê HKI - 2023-2024
vì Φ là hàm đồng biến (hàm tăng) nên ta suy ra   16 − µ      16 − 10  = Φ−1 0, 7 ( µ + σ.Φ−1 0, 7 = 16  σ σ =     ⇒ Φ−1 0, 7 − Φ−1 0, 15     10 − µ   ⇔    = Φ−1 0, 15 µ + σ.Φ−1 0, 15 = 10 µ = 10 − σ.Φ−1 0, 15 σ     σ ≈ 3, 8441; với     Φ−1 0, 7 ≈ 0, 5244
và Φ−1 0, 15 ≈ −1, 0364 ⇔  µ ≈ 13,98415. □
Bài 7. Xác suất để một bu lông được sản xuất đáp ứng yêu cầu kỹ thuật là 0, 86.
(a) Chọn ngẫu nhiên 50 bu lông được sản xuất. Tính xác suất có ít nhất 48 bu lông đáp ứng yêu cầu kỹ thuật.
(b) Một lô gồm 500 bu lông được sản xuất ra. Dùng một xấp xỉ phù hợp để tính xác suất có ít nhất
250 bu lông đáp ứng yêu cầu kỹ thuật. Hướng dẫn:
■ (a) Gọi Y là b.n.n. thể hiện số bu lông đáp ứng kỹ thuật trong tổng số 50 bu lông.
Thì Y có phân phối nhị thức B(n; p) với n = 50 và
p = "xác suất để 1 bu lông đáp ứng kỹ thuật" = 0, 86 (theo dữ kiện đề bài).
Xác suất để trong số 50 bu lông, có ít nhất 48 bu lông đáp ứng yêu cầu kỹ thuật, là         P Y ≥ 48 = P Y = 48 + P Y = 49 + P Y = 50 = C48 p48(1 p49(1 p50(1 n − p)n−48 49 + C n − p)n−49 50 + Cn − p)n−50 ≈ 0, 0221.
■ (c) Gọi W là b.n.n. thể hiện số bu lông đáp ứng kỹ thuật trong tổng số 500 bu lông.
Thì W có phân phối nhị thức B(m; p) với m = 500 và p = "xác suất để 1 bu lông đáp ứng kỹ thuật" = 0, 86.
Ta thấy 0, 1 < p < 0, 9, hơn nữa m × p = 500 × 0, 86 ≥ 5 và m × (1 − p) = 500 × (1 − 0, 86) ≥ 5, do đó,
có thể dùng phân phối chuẩn  
N m.p ; m.p.(1 − p) để tính xấp xỉ cho phân phối nhị thức B(m; p) của W .
Cụ thể, ta có, xác suất để có ít nhất 250 bu lông đáp ứng yêu cầu kỹ thuật là
P(W ≥ 250) = 1 − P(W < 250) = 1 − P(W ≤ 249) = 1 − P(W < 249 + 0, 5 )
(hiệu chỉnh sự liên tục) ! W − E(W ) 249 + 0, 5 − E(W )
(W có phân phối nhị thức, W ∼ B(m; p)) = 1 − P p < p Var(W ) Var(W )  249 + 0, 5 − E(W )
(dùng Z có phân phối chuẩn để xấp xỉ, Z ∼ N (0; 1)) ≈ 1 − P Z < pVar(W) ! 249 + 0, 5 − E(W ) = 1 − Φ pVar(W)  249 + 0, 5 − m.p  = 1 − Φ pm.p.(1 − p)   , 5 − 500 × 0, = 1 − Φ  249 + 0 86 q    500 × 0, 86. 1 − 0, 86
≈ 1 − Φ ( −23, 26371 ) = Φ ( 23, 26371 ) ≈ 1 . □ 6 Xác suất-Thống kê HKI - 2023-2024
Bài 8 (Bài 4.20 - trang 121 giáo trình XSTK).
Giả sử tuổi thọ bóng đèn do một công ty sản xuất xấp xỉ phân phối chuẩn với độ lệch chuẩn là 40
giờ. Một mẫu 30 bóng đèn cho thấy tuổi thọ trung bình là 780 giờ.
a) Hãy tìm khoảng tin cậy 96% cho tuổi thọ trung bình của tất cả các bóng đèn do công ty sản xuất.
b) Nếu muốn sai số ước lượng không quá 10 giờ, thì phải quan sát ít nhất bao nhiêu bóng đèn.
Hướng dẫn: Ta quan tâm tuổi thọ trung bình bóng đèn. Đặt
µ = tuổi thọ trung bình của bóng đèn.
□ Theo đề bài, " tuổi thọ bóng đèn xấp xỉ phân phối chuẩn với độ lệch chuẩn là 40 giờ " =⇒ độ lệch chuẩn σ = 40 =⇒ phương sai σ2 = 402 đã biết. □ Lấy mẫu: cỡ mẫu n = 30 bóng đèn và
trung bình mẫu x = 780 giờ. ■ a) Độ tin cậy 1 − α = 96% = 0.96 =⇒ α = 0.04. • Dung sai ε
(trong trường hợp phương sai đã biết) được xác định bởi σ σ 40 40 ε = z1 α . √ = z √ = z √ √ ≈ 14, 998. − 0.98 . 0.98 . ≈ 2, 055 × 2 n n 30 30
• Vậy khoảng tin cậy 96% cho tuổi thọ trung bình của các bóng đèn do công ty sản xuất là x − ε < µ < x + ε ⇐⇒
780 − 14, 998 < µ < 780 + 14, 998 ⇐⇒
765, 002 < µ < 794, 998 . σ
■ b) Sai số ước lượng không quá 10 giờ,
nghĩa là ε ≤ 10, mà ta có ε = z , nên 1 α . √ − 2 n σ  σ 2 ε ≤ 10 ⇐⇒ z1 α . √ ≤ 10 ⇐⇒ n ≥ z α . − 1− 2 n 2 10   40 2 ⇐⇒ n ≥ 2, 055 × ⇐⇒ n ≥ 67, 5684 . 10
Vậy nếu muốn sai số ước lượng không quá 10 giờ ở độ tin cậy 96%, thì phải quan sát ít nhất 68 bóng đèn. □
Bài 9 (Bài 4.47 - trang 126 giáo trình XSTK). Đem cân một số trái cây vừa thu hoạch được bảng số liệu X (g) 200-210 210-220 220-230 230-240 240-250 Số trái 12 17 20 18 15
a) Tìm khoảng ước lượng trọng lượng trung bình của trái cây với độ tin cậy 0, 95 và 0, 99.
b) Muốn sai số ước lượng không quá E = 2 g ở độ tin cậy 99% thì phải quan sát ít nhất bao nhiêu trái cây ?
Hướng dẫn: Ta quan tâm trọng lượng trung bình trái cây. Đặt µ = trọng lượng trung bình của trái cây. □ Lấy mẫu:
cỡ mẫu n = 12 + 17 + 20 + 18 + 15 = 82 và
trung bình mẫu được tính như sau P x
205 × 12 + 215 × 17 + 225 × 20 + 235 × 18 + 245 × 15 x = i . ni P = = 225, 8537 , ni n
( xét khoảng thứ nhất với trọng lượng 200-210g nên ta lấy giá trị đại diện là 205g. )
■ a) Trong trường hợp này
cỡ mẫu n = 82 ≥ 30 là mẫu lớn và
phương sai σ2 KHÔNG biết. 7 Xác suất-Thống kê HKI - 2023-2024
Ta cần tính phương sai mẫu như sau: P  2  2  2  2  2 (x 2 i − x) . n
205 − x × 12 + 215 − x × 17 + 225 − x × 20 + 235 − x × 18 + 245 − x × 15 s2 = i = n − 1 n − 1 = 175, 8055. □ Độ tin cậy 1 − α = 0.95 =⇒ α = 0.05. • Dung sai ε
(trong trường hợp mẫu lớn , phương sai KHÔNG biết) được xác định bởi √ √ s s 175, 8055 175, 8055 ε = z1 α . √ = z √ = z √ ≈ 1, 96 × √ ≈ 2, 8698 . − 0,975 . 0.975 . 2 n n 82 82
• Vậy khoảng tin cậy 95% cho trọng lượng trung bình của trái cây là x − ε < µ < x + ε ⇐⇒
222, 9838 < µ < 228, 7236 . □ Độ tin cậy 1 − α = 0.99 =⇒ α = 0.01. • Dung sai ε
(trong trường hợp mẫu lớn , phương sai KHÔNG biết) được xác định bởi √ √ s s 175, 8055 175, 8055 ε = z1 α . √ = z √ = z √ ≈ 2, 575 × √ ≈ 3, 7704 . − 0,995 . 0.995 . 2 n n 82 82
• Vậy khoảng tin cậy 95% cho trọng lượng trung bình của trái cây là x − ε < µ < x + ε ⇐⇒
222, 0833 < µ < 229, 6241 . s
■ b) Sai số ước lượng không quá 2 g,
nghĩa là ε ≤ 2, mà ta có ε = z , 1 α . √ − 2 n
nên ở độ tin cậy 1 − α = 99% = 0, 99 , thì s  s 2 ε ≤ 2 ⇐⇒ z1 α . √ ≤ 2 ⇐⇒ n ≥ z α . − 1− 2 n 2 2  √ 2 175, 8055 ⇐⇒ n ≥ 2, 575 × ⇐⇒ n ≥ 291, 4251 . 2
Vậy nếu muốn sai số ước lượng không quá 2 g ở độ tin cậy 99%, thì phải quan sát ít nhất 292 trái cây. □
Bài 10. Người ta đo ion Na+ trên một số người và ghi nhận lại được kết quả như sau
129, 132, 140, 141, 138, 143, 133, 137, 140, 143, 138, 140 .
a) Tính trung bình mẫu và phương sai mẫu.
b) Ước lượng trung bình tổng thể ở độ tin cậy 0, 95.
Hint: trung bình mẫu = x và phương sai mẫu = S2 => tính từ số liệu, dữ liệu thực nghiệm đề cho.
trung bình tổng thể = µ (không biết!!) và phương sai tổng thể = σ2 (ở bài này, σ2 cũng không biết!) Hướng dẫn:
Ta quan tâm chỉ số trung bình ion Na+ của một người.
Đặt µ = chỉ số trung bình ion Na+ của một người. ■ a) Lấy mẫu:
cỡ mẫu n = 12 (vì ta thấy dữ liệu là chỉ số đo được của 12 người) 8 Xác suất-Thống kê HKI - 2023-2024 và
trung bình mẫu x được tính như sau P x
129 + 132 + 140 + ... + 143 + 138 + 140 x = i = ≈ 137, 833 , n 12 Trong trường hợp này
cỡ mẫu n = 12 < 30 là mẫu nhỏ và
phương sai σ2 KHÔNG biết.
Ta cần tính phương sai mẫu s2 như sau: P  2  2  2  2  2  2 (x 2 i − x)
129 − x + 132 − x + 140 − x + ... + 143 − x + 138 − x + 140 − x s2 = = ≈ 19, 424. n − 1 n − 1 ■ b) Độ tin cậy 1 − α = 0.95 =⇒ α = 0.05. • Dung sai ε
(trong trường hợp mẫu nhỏ , phương sai KHÔNG biết) được xác định bởi √ √ s s 19, 424 19, 424 ε = tn−1 . √ = t12−1 . √ = t11 √ ≈ 2, 201 × √ ≈ 2, 8 . 1 α 0,975 . − 0,975 2 n n 12 12
• Vậy khoảng tin cậy 95% cho chỉ số trung bình ion Na+ là x − ε < µ < x + ε ⇐⇒
135, 033 < µ < 140, 633 . □
Bài 11 (Bài 4.54 - trang 127 giáo trình XSTK).
Một mẫu ngẫu nhiên gồm 50 mũ bảo hiểm được sử dụng bởi những người đi xe máy đã được thử
nghiệm va chạm, và 18 trong số những chiếc mũ bảo hiểm đã bị thiệt hại.
a) Tìm khoảng tin cậy 95% cho tỷ lệ mũ bảo hiểm loại này sẽ cho thấy thiệt hại từ thử nghiệm này.
b) (Không bắt buộc) Bao nhiêu mũ bảo hiểm phải được kiểm tra để sai số khi ước lượng giá trị thực
của p nhỏ hơn 2% với độ tin cậy 95%?
Hướng dẫn: Ta quan tâm tỷ lệ mũ bảo hiểm bị thiệt hại. Đặt
p = tỷ lệ mũ bảo hiểm bị thiệt hại. □ Theo đề bài:
" mẫu ngẫu nhiên gồm 50 mũ được thử nghiệm và thấy có 18 cái bị thiệt hại " 18 18 =⇒
cỡ mẫu n = 50 mũ bảo hiểm và tỷ lệ mẫu bp = = . n 50 ■ a) Độ tin cậy 1 − α = 95% = 0.95 =⇒ α = 0.05. • Dung sai : v s u     s   u 18 18 b p. 1 − b p b p. 1 − b p t . 1 − ε = z 50 50 1 α . = z = 1, 96 × − 0.975 . ≈ 0, 133. 2 n n 50
• Vậy khoảng tin cậy 96% cho tỷ lệ mũ bảo hiểm bị thiệt hại là 18 18 b p − ε < p < b p + ε ⇐⇒ − 0, 133 < p < + 0, 133 ⇐⇒ 0, 227 < p < 0, 493 . 50 50 9 Xác suất-Thống kê HKI - 2023-2024 r   b p. 1 − b p
■ b) Sai số ước lượng nhỏ hơn 2%,
nghĩa là ε < 2%, mà ta có ε = z , nên 1 α . − 2 n s q     2 b p. 1 − b p b p. 1 − b p ε < 2% ⇐⇒ z   1 α . < 0, 02 ⇐⇒ n > z α . − 1− 2 n 2 0, 02  r 2 18  18   . 1 −  ⇐⇒ 50 50 n >   1, 96 × ⇐⇒ n > 2212, 762 . 0, 02 
Vậy muốn sai số ước lượng nhỏ hơn 2% ở độ tin cậy 95%, thì phải quan sát ít nhất 2213 mũ bảo hiểm. □
Bài 12 (dựa theo Bài 5.30 - trang 149 giáo trình XSTK).
Nhiệt độ nước trung bình tại một trạm bơm nước cung cấp cho một khu dân cư không được vượt
quá 100oF . Những khảo sát trong quá khứ đã chỉ ra rằng độ lệch chuẩn của nhiệt độ là 2oF . Đo
nhiệt độ nước tại trạm bơm trong 9 ngày được chọn ngẫu nhiên và tính được nhiệt độ trung bình là
98oF . Biết rằng nhiệt độ nước tuân theo phân phối chuẩn.
(a) Có bằng chứng cho thấy nhiệt độ nước có thể chấp nhận được hay không, mức ý nghĩa 0.05?
(b) Tính mức ý nghĩa nhỏ nhất khi bạn đưa ra kết luận bác bỏ giả thuyết H0.
(Hint: p-giá trị = mức ý nghĩa nhỏ nhất để bác bỏ H ) 0 Hướng dẫn:
Ta quan tâm nhiệt độ nước trung bình.
Đặt µ = nhiệt độ nước trung bình. □ Theo đề bài,
"Những khảo sát trong quá khứ đã chỉ ra rằng độ lệch chuẩn của nhiệt độ là 2◦F" ⇒ độ lệch chuẩn σ = 2 ⇒
phương sai σ2 = 4 đã biết. □ Lấy mẫu:
" Đo nhiệt độ nước trong 9 ngày được chọn ngẫu nhiên và tính được nhiệt độ trung bình là 98oF " ⇒ cỡ mẫu n = 9 và trung bình mẫu x = 98.
" Nhiệt độ nước trung bình hạ lưu từ ống tháp xả giải nhiệt của nhà máy không được vượt quá 100◦F.
Có bằng chứng gì cho ta thấy nhiệt độ nước có thể chấp nhận được hay không " =⇒ H0 : µ ≤ 100 =⇒ H1 : µ > 100.
( Dấu " = " luôn nằm ở giả thuyết H0 ) ( ( H0 : µ = µ0 H0 : µ = µ0 = 100
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : µ > µ0 H1 : µ > µ0 ( ! cũng có thể viết H0 : µ ≤ µ0 = 100 H1 : µ > µ0
• Mức ý nghĩa α = 5% = 0, 05.
• Tính thống kê kiểm định: Lấy mẫu: cỡ mẫu n = 9 có trung bình mẫu x = 98 ;
Phương sai σ2 = 4 đã biết ⇒ dùng phân phối chuẩn. 10 Xác suất-Thống kê HKI - 2023-2024
Ta có thống kê kiểm định: x − µ 98 − 100 z 0 0 = √ = √ = −3 ; σ/ n 2/ 9 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,95 = 1, 645 . 0 • Kết luận: do z0 = −3 < 1, 645 = z1 H µ = µ −α =⇒ KHÔNG bác bỏ 0 tức là 0 = 100 ;
(hoặc µ ≤ µ0 = 100 nếu lúc đầu đặt H0 : µ ≤ µ0 = 100)
Vậy nhiệt độ nước trung bình KHÔNG vượt quá 100oF, với mức ý nghĩa α = 5%.
Do đó nhiệt độ nước là chấp nhận được.
■ Tính p-giá trị: trong trường hợp này ta có
p-giá trị = 1 − Φ(z0) = 1 − Φ(−3) = Φ(3) ≈ 0, 9987.
Ta thấy p-giá trị = 0, 9987 > 0, 05 = α =⇒ KHÔNG bác bỏ H0 =⇒
có cùng kết luận khi sử dụng miền bác bỏ. □
Bài 13. Đo hàm lượng natri (đv: mg) của hai mươi hộp bắp hữu cơ 300g của nhà sản xuất A, thu được dữ liệu 131, 15 130, 69 130, 91 129, 54 129, 64 128, 77 130, 72 128, 33 128, 24 129, 78 129, 65 130, 14 129, 29 128, 71 129 129, 39 130, 42 129, 53 130, 12 130, 92
Giả sử theo tiêu chuẩn, hàm lượng natri trung bình không được phép vượt quá 130mg.
Sử dụng mức ý nghĩa 0, 02, dữ liệu trên có cho thấy các hộp bắp hữu cơ của nhà sản xuất A đảm bảo
tiêu chuẩn hay không? Tính p-giá trị. Hướng dẫn:
Ta quan tâm hàm lượng natri trung bình của hộp bắp hữu cơ.
Đặt µ = hàm lượng natri trung bình của hộp bắp hữu cơ của nhà sản xuất A. □ Lấy mẫu: cỡ mẫu n = 20 và • Trung bình mẫu:
131, 15 + 129, 65 + 130, 69 + 130, 14 + ... + 129, 78 + 130, 92 x = = 129, 747; n • Phương sai mẫu:  2  2  2  2
131, 15 − x + 129, 65 − x + ... + 129, 78 − x + 130, 92 − x s2 = ≈ 0, 7681; n − 1 p √
• Độ lệch chuẩn mẫu: s = phương sai mẫu = s2 ≈ 0, 8764;
" Giả sử theo tiêu chuẩn, hàm lượng natri trung bình không được phép vượt quá 130mg.
Sử dụng mức ý nghĩa 0, 02, dữ liệu trên có cho thấy các hộp bắp hữu cơ của nhà sản xuất A đảm bảo tiêu chuẩn hay không? =⇒ H0 : µ ≤ 130 =⇒ H1 : µ > 130.
( Dấu " = " luôn nằm ở giả thuyết H0 )
( H0 : µ ≤ µ0 = 130 : đảm bảo tiêu chuẩn
• Giả thuyết cần kiểm định ; H
: KHÔNG đảm bảo tiêu chuẩn 1 : µ > µ0
• Mức ý nghĩa α = 0, 02.
• Tính thống kê kiểm định:
Phương sai σ2 KHÔNG biết và cỡ mẫu n = 20 < 30 (mẫu nhỏ) ⇒
dùng phân phối t-Student với bậc tự do (n − 1). 11 Xác suất-Thống kê HKI - 2023-2024
Ta có thống kê kiểm định: x − µ 129, 747 − 130 t 0 0 = √ = √ = −1, 291 ; s/ n 0, 7681/ 20 • Miền bác bỏ: ta sẽ bác bỏ H nếu 0 t0 > tn−1 = t19 1−α 0,98 ≈ 2, 1 . • Kết luận: do t n−1 0 = −1, 291 < 2, 1 = t = H µ 1
⇒ KHÔNG bác bỏ 0 tức là ≤ µ0 = 130 ; −α
Vậy hàm lượng natri trung bình của hộp ngũ cốc ≤ 130 mg, với mức ý nghĩa α = 0, 02.
■ Tính p-giá trị: gọi T19 là biến ngẫu nhiên có phân phối t-Student với bậc tự do (n − 1) = 19, ta có      
p-giá trị = P T19 ≥ t0 = P T19 ≥ −1, 291 = 1 − P T19 < −1, 291   = P T19 < 1, 291 ≈ 0, 85.
Ta thấy p-giá trị = 0, 85 > 0, 02 = α =⇒ KHÔNG bác bỏ H0 =⇒
có cùng kết luận khi sử dụng miền bác bỏ. □
Bài 14 (dựa theo Bài 5.77 - trang 160 giáo trình XSTK).
Một nhà máy sản xuất ống kính interocular có một máy nghiền mới. Máy nghiền mới này được coi
là đủ điều kiện nếu có bằng chứng cho thấy tỷ lệ phần trăm của các thấu kính được đánh bóng có
chứa khuyết tật bề mặt là dưới 2%. Người ta khảo sát một mẫu ngẫu nhiên gồm 300 thấu kính thì
thấy 8 ống kính bị lỗi.
a) Xây dựng và kiểm tra giả thuyết phù hợp để xác định xem máy mới này có đủ điều kiện hay
không, với mức ý nghĩa 0.05, đồng thời tìm p-giá trị.
b) (không bắt buộc) Giải thích thêm cho kết luận trên bằng cách sử dụng khoảng tin cậy cho p. Hướng dẫn:
Ta quan tâm tỷ lệ thấu kính được đánh bóng có chứa khuyết tật (bị lỗi). Đặt
p = tỷ lệ thấu kính được đánh bóng có chứa khuyết tật (bị lỗi). □ Theo đề bài,
" khảo sát một mẫu ngẫu nhiên gồm 300 thấu kính thì thấy 8 ống kính bị lỗi ". 8 8 =⇒ cỡ mẫu n = 300 và tỷ lệ mẫu bp = = . n 300
" Máy nghiền được coi là đủ điều kiện nếu tỷ lệ phần trăm của các thấu kính được đánh bóng
có chứa khuyết tật bề mặt là dưới 2%
kiểm tra giả thuyết phù hợp để xác định xem máy mới này có đủ điều kiện hay không " =⇒ H1 : p < 2% = 0, 02 =⇒ H0 : p ≥ 0, 02 .
( Dấu " = " luôn nằm ở giả thuyết H0 )
( H0 : p = p0 = 0,02 : KHÔNG đủ điều kiện
• Giả thuyết cần kiểm định ; H : đủ điều kiện 1 : p < p0 ( ! ( H Dấu " 0 : p ≥ p0 = 0, 02 = "
luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : p < p0
• Mức ý nghĩa α = 0, 05. 12 Xác suất-Thống kê HKI - 2023-2024 8
• Tính thống kê kiểm định: với cỡ mẫu n = 300 và tỷ lệ mẫu bp = , ta có 300 8 b p − p − 0, 02 z 0 300 0 = s   = s   ≈ 0, 825 ; p0. 1 − p0 0, 02. 1 − 0, 02 n 300 • Miền bác bỏ: ta sẽ bác bỏ H nếu z0 < −z1 z 1, 645 −α = − 0,95 = − . 0
• Kết luận: do z0 = 0, 825 > −1, 645 = −z1 H p = p −α =⇒ KHÔNG bác bỏ 0 tức là 0 = 0, 02.
(hoặc p ≥ p0 = 0, 02 nếu lúc đầu đặt H0 : p ≥ p0 = 0, 02)
Vậy tỷ lệ thấu kính bị lỗi KHÔNG dưới 2%, nên máy mới KHÔNG đủ điều kiện, mức ý nghĩa α = 5%.
■ Tính p-giá trị: trong trường hợp này ta có
p-giá trị = Φ(z0) = Φ(0, 825) ≈ 0, 7953.
Ta thấy p-giá trị = 0, 7953 > 0, 05 = α =⇒ KHÔNG bác bỏ H0 . □
Bài 15 (dựa theo Bài 5.69 - trang 158 giáo trình XSTK).
Một nhà máy sản xuất chất bán dẫn sản xuất bộ điều khiển sử dụng trong công nghệ động cơ ô tô.
Nhà sản xuất chất bán dẫn lấy mẫu ngẫu nhiên gồm 200 sản phẩm và thấy có chín sản phẩm bị lỗi.
Khách hàng yêu cầu tỷ lệ lỗi của sản phẩm phải dưới 0, 05. Hỏi nhà sản xuất có thể chứng minh khả
năng đáp ứng ở mức chất lượng này cho khách hàng không? Sử dụng mức ý nghĩa 1%. Hướng dẫn:
Ta quan tâm tỷ lệ sản phẩm bị lỗi của nhà sản xuất này. Đặt
p = tỷ lệ sản phẩm bị lỗi của nhà sản xuất này. □ Theo đề bài,
" Lấy mẫu ngẫu nhiên gồm 200 sản phẩm và thấy có chín sản phẩm bị lỗi " 9 9 ⇒ cỡ mẫu n = 200 và tỷ lệ mẫu bp = = . n 200
" Khách hàng yêu cầu tỷ lệ lỗi của sản phẩm phải dưới 0, 05 " =⇒ H ) 1 : p < 0, 05 =⇒ H0 : p ≥ 0, 05
( Dấu " = " luôn nằm ở giả thuyết H0 ( H
• Giả thuyết cần kiểm định 0 : p = p0 = 0, 05
: KHÔNG đáp ứng được yêu cầu ; H
: đáp ứng được yêu cầu của khách hàng 1 : p < p0 ( ! cũng có thể viết H0 : p ≥ p0 = 0, 05
: KHÔNG đáp ứng được yêu cầu H
: đáp ứng được yêu cầu của khách hàng 1 : p < p0
• Mức ý nghĩa α = 1% = 0, 01. 9
• Tính thống kê kiểm định:
với cỡ mẫu n = 200 và tỷ lệ mẫu bp =
, thì thống kê kiểm định: 200 9 b p − p − 0, 05 z 0 200 0 = s   = s   = −0, 3244 ; p0. 1 − p0 0, 05. 1 − 0, 05 n 200 13 Xác suất-Thống kê HKI - 2023-2024 • Miền bác bỏ: ta sẽ bác bỏ H nếu z0 < −z1 z 2, 325 −α = − 0,99 = − . 0 • Kết luận: do
z0 = −0, 3244 > −2, 325 = −z1 H −α ⇒ KHÔNG bác bỏ 0 tức là p = p0 = 0, 05.
Vậy tỷ lệ lỗi của sản phẩm KHÔNG dưới 0, 05, với mức ý nghĩa α = 1%.
Do đó không đáp ứng yêu cầu khách hàng, với mức ý nghĩa α = 1%. □
Bài 16. Biết trọng lượng X (g/quả) của mỗi quả trứng có phân phối chuẩn. Đem cân 100 quả trứng có kết quả sau: xi 155 160 165 170 175 180 185 ni 5 12 14 25 24 14 6
Cho biết trứng có trọng lượng lớn hơn 170g là trứng loại một.
(a) Tìm khoảng tin cậy 97% cho trọng lượng trứng trung bình. Nếu ta muốn sai số ước lượng
không quá 0, 1g thì cần khảo sát thêm bao nhiêu trứng?
(b) Tìm khoảng tin cậy 98% cho tỷ lệ trứng loại một.
(c) Có ý kiến rằng trọng lượng trứng trung bình lớn hơn 170g/quả. Kiểm định ý kiến trên với mức ý nghĩa 1%.
(d) Có ý kiến cho là ít nhất 65% số trứng thuộc loại một. Kiểm định ý kiến trên với mức ý nghĩa 1%. Hướng dẫn:
Ta quan tâm trọng lượng trứng trung bình. Đặt µ = trọng lượng trứng trung bình. □ Lấy mẫu: cỡ mẫu
n = 5 + 12 + 14 + 25 + 24 + 14 + 6 = 100; • Trung bình mẫu:
155 × 5 + 160 × 12 + ... + 180 × 14 + 185 × 6 x = = 170, 85; n • Phương sai mẫu:  2  2  2  2
155 − x × 5 + 160 − x × 12 + ... + 180 − x × 14 + 185 − x × 6 s2 = ≈ 60, 1288; n − 1 p √
• Độ lệch chuẩn mẫu: s = phương sai mẫu = s2 ≈ 7, 7543;
■ (a) Độ tin cậy 1 − α = 97% = 0, 97 suy ra α = 0, 03.
• Phương sai σ2 không biết, cỡ mẫu n = 100 ≥ 30 (mẫu lớn) ⇒ TH2: sử dụng phân phối Gauss. • Sai số KTC (dung sai): s s 7, 7543 ε = z1 α × √ = z √ √ ≈ 1, 6827 ; − 0,985 × ≈ 2, 17 × 2 n n 100
• Vậy KTC 97% cho doanh thu trung bình một ngày của cửa hàng là
x − ε ≤ µ ≤ x + ε ⇔ 170, 85 − 1, 6827 ≤ µ ≤ 170, 85 + 1, 6827 ⇔ 169, 1673 ≤ µ ≤ 172, 5327 . 14 Xác suất-Thống kê HKI - 2023-2024
■ Để sai số ước lượng không quá 0, 1g thì   s s 2 60, 1288
ε ≤ 0, 1 ⇔ z1 α × √ ≤ 0, 1 ⇔ n ≥ z α × = 2, 172 × = 28314, 05. − 1− 2 2 n 2 0, 1 0, 1
■ (b) Gọi p = tỷ lệ trứng loại 1.
Trứng là loại 1 ⇔ có trọng lượng trên 170g. Ta có: cỡ mẫu Y 44
n = 100, số trứng gà loại 1 là Y = 24 + 14 + 6 = 44, nên tỷ lệ mẫu là bp = = ; n 100
• Độ tin cậy 1 − α = 98% = 0, 98 suy ra α = 0, 02. • Sai số KTC (dung sai): v s u     s   u 44 44 b p × 1 − b p b p × 1 − b p t × 1 − e ε = z = 2, 325 100 100 1 α × = z × ≈ 0, 1154; − 0,99 × 2 n n 100
• Vậy KTC 98% cho tỷ lệ trứng loại 1 là 44 44 b p − e ε ≤ p ≤ b p + e ε ⇔ − 0, 1154 ≤ p ≤
+ 0, 1154 ⇔ 0, 3246 ≤ p ≤ 0, 5554; 100 100
■ (c) " Có ý kiến cho rằng trọng lượng trứng trung bình lớn hơn 170g/quả. =⇒ H ) 1 : µ > 170 =⇒ H0 : µ ≤ 170 .
( Dấu " = " luôn nằm ở giả thuyết H0 ( H0 : µ ≤ µ0 = 170
• Giả thuyết cần kiểm định ; H1 : µ > µ0
• Mức ý nghĩa α = 0, 01.
• Tính thống kê kiểm định:
Phương sai σ2 KHÔNG biết và cỡ mẫu n = 100 ≥ 30 (mẫu lớn) ⇒ dùng phân phối Gauss.
Ta có thống kê kiểm định: x − µ 170, 85 − 170 z 0 0 = √ = √ = 1, 0962 ; s/ n 7, 7543/ 100 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,99 ≈ 2, 325 . 0
• Kết luận: do z0 = 1, 0962 < 2, 325 = z1 H µ ≤ µ −α ⇒ KHÔNG bác bỏ 0 tức là 0 = 170;
Vậy trọng lượng trung bình của trứng ≤ 170 g/quả, với mức ý nghĩa α = 0, 01. ■ (d)
Có ý kiến là "50% số trứng thuộc loại một " =⇒ H ) 0 : p = 0, 5 =⇒ H1 : p = 0, 5
( Dấu " = " luôn nằm ở giả thuyết H0 ( H0 : p = p0 = 0,5
• Giả thuyết cần kiểm định ; H1 : p = p0 44
• Mức ý nghĩa α = 0, 01. b p − p − 0, 5 z 0 100 0 = r   = r   = = −1, 2 ;
• Tính thống kê kiểm định: p0. 1 − p0 0, 5. 1 − 0, 5 n 100  • Miền bác bỏ: ta sẽ bác bỏ H nếu   0 z0 > z1 α = z − 0,995 ≈ 2, 575 . 2 
• Kết luận: do z  0
= 1, 2 < 2, 575 = z1 α =⇒ KHÔNG bác bỏ H0 tức là p = p0 = 0, 5 ; − 2
Vậy tỷ lệ trứng loại 1 là p = 0, 5 , với mức ý nghĩa α = 1%. □ 15 Xác suất-Thống kê HKI - 2023-2024
Bài 17 (dựa theo Bài 5.93 - trang 163 giáo trình XSTK).
Hai loại nhựa phù hợp để sử dụng cho một nhà sản xuất linh kiện điện tử. Sức mạnh chịu sự phá
huỷ của loại nhựa này là quan trọng. Biết σ1 = σ2 = 1 psi. Từ hai mẫu ngẫu nhiên có kích thước
n1 = 10 và n2 = 12, ta có được x1 = 162, 5 và x2 = 155. Công ty sẽ không áp dụng nhựa loại 1 trừ
khi sức chịu phá vỡ trung bình của nó vượt quá nhựa loại 2 một mức hơn 10 psi.
Trên cơ sở thông tin đó, ta có nên sử dụng nhựa loại 1? Sử dụng α = 0, 05 và tìm p-giá trị.
(Hint: " Công ty sẽ không áp dụng nhựa loại 1 trừ khi sức chịu phá vỡ trung bình của nó vượt quá
nhựa loại 2 một mức hơn 10 psi "
⇒ H1 : µ1 − µ2 > D0 = 10 ) Hướng dẫn:
Ta muốn so sánh sức chịu phá vỡ trung bình của nhựa loại 1 so với loại 2. Đặt
µ1 = sức chịu phá vỡ trung bình của loại 1 và
µ2 = sức chịu phá vỡ trung bình của loại 2.
" Công ty sẽ không áp dụng nhựa loại 1 trừ khi sức chịu phá vỡ trung bình của nó vượt quá
nhựa loại 2 một mức hơn 10 psi " =⇒ H ) 1 : µ1 − µ2 > 10 =⇒ H0 : µ1 − µ2 ≤ 10
( Dấu " = " luôn nằm ở giả thuyết H0
( H0 : µ1 − µ2 = D0 = 10 : KHÔNG nên sử dụng nhựa loại 1
• Giả thuyết cần kiểm định ; H
: nên sử dụng nhựa loại 1 1 : µ1 − µ2 > D0 ( ! cũng có thể viết H0 : µ1 − µ2 ≤ D0 = 10 H1 : µ1 − µ2 > D0 • Mức ý nghĩa α = 0, 05 .
• Tính thống kê kiểm định: Lấy mẫu:
nhựa loại 1 : cỡ mẫu n = 10 có trung bình mẫu x = 162, 5;
nhựa loại 2 : cỡ mẫu m = 12 có trung bình mẫu y = 155, Phương sai σ2 = σ2 1 = 12 đã biết = 2 ⇒ dùng phân phối chuẩn.
Ta có thống kê kiểm định: x − y − D 162, 5 − 155 − 10 z 0 0 = r = r ≈ −5, 839 ; σ2 σ2 12 1 12 + 2 + n m 10 12 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,95 = 1, 645 . 0
• Kết luận: do z0 = −5, 839 < 1, 645 = z1 ⇒
KHÔNG bác bỏ H0, tức là µ −α = 1 −µ2 = D0 = 10
(hoặc µ1 −µ2 ≤ 10 nếu lúc đầu đặt H0 : µ1 −µ2 ≤ 10)
Vậy sức chịu phá vỡ trung bình của nhựa loại 1 KHÔNG cao hơn độ sức chịu phá vỡ trung bình của
nhựa loại 2 một mức hơn 10pssi, với mức ý nghĩa α = 1%.
Do đó KHÔNG nên sử dụng nhựa loại 1, với mức ý nghĩa α = 1%.
■ Tính p-giá trị: trong trường hợp này ta có
p-giá trị = 1 − Φ(z0) = 1 − Φ(−5, 839) = Φ(5, 839) ≈ 1.
Ta thấy p-giá trị ≈ 1 > 0, 05 = α =⇒ KHÔNG bác bỏ H0 □ 16 Xác suất-Thống kê HKI - 2023-2024
Bài 18 (dựa theo Bài 5.100 - trang 675 giáo trình XSTK).
Hai chất xúc tác có thể được sử dụng trong một phản ứng hoá học. Mười hai phản ứng được cho sử
dụng chất xúc tác 1, dẫn đến hiệu suất trung bình là 86 (đv: %) và độ lệch chuẩn mẫu là 3. Mười
lăm phản ứng được cho sử dụng chất xúc tác 2, và kết quả là hiệu suất trung bình là 89 với độ lệch
chuẩn mẫu là 2. Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn. Có
bằng chứng để khẳng định rằng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1
hay không? Sử dụng α = 0, 01. (Yêu cầu dùng cả 2 phương pháp: miền bác bỏ và p-giá trị) Hướng dẫn:
Ta muốn so sánh hiệu suất trung bình của chất 1 so với hiệu suất của chất 2. Đặt
µ1 = hiệu suất của chất xúc tác 1 và
µ2 = hiệu suất của chất xúc tác 2.
" Có bằng chứng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1 hay không? " =⇒ H hay 1 : µ1 < µ2 µ1 − µ2 < 0 =⇒ H0 : µ1 − µ2 ≥ 0 . ( ( H0 : µ1 = µ2 H0 : µ1 − µ2 = D0 = 0
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : µ1 < µ2 H1 : µ1 − µ2 < D0 ( ! ( H Dấu " 0 : µ1 − µ2 ≥ D0 = 0 = "
luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : µ1 − µ2 < D0
■ Mức ý nghĩa α = 0, 01.
■ Tính thống kê kiểm định: • Lấy mẫu:
chất A : cỡ mẫu n = 12 có trung bình mẫu x = 86,
độ lệch chuẩn mẫu s1 = 3;
chất B : cỡ mẫu m = 15 có trung bình mẫu y = 89,
độ lệch chuẩn mẫu s1 = 2; • Phương sai σ2 và σ2 KHÔNG biết với
cỡ mẫu n = 12 < 30 và m = 15 < 30 là cỡ mẫu nhỏ 1 2 =⇒
dùng phân phối t-Student với bậc tự do df = n − 1 + m − 1.
• Dữ kiện đề bài: " Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn " =⇒ σ hay phương sai bằng nhau 1 = σ2 σ2 = σ2 1 2 (n − 1).s2 + (m − 1).s2 (12 − 1).32 + (15 − 1).22 =⇒ tính s2 = 1 2 p = = 6, 2. n − 1 + m − 1 12 − 1 + 15 − 1
• Ta có thống kê kiểm định: x − y − D 86 − 89 − 0 t 0 0 = r = r ≈ −3, 111 ; s2 s2 6, 2 6, 2 p + p + n m 12 15 • Miền bác bỏ: ta sẽ bác bỏ H nếu m− − − 0 t0 < −tn−1+ 1 = = = 1 −t12 1+15 1 −t25 −2, 4851 −α 0,99 0,99
(tra bảng phân phối Student để tìm giá trị cho t25 ) 0,99 • Kết luận: do
t0 = −3, 111 < −2, 4851 = −tn−1+m−1 1 ⇒ bác bỏ H0 ⇒ chấp nhận H1 −α
tức là µ1−µ2 < D0 = 0 hay µ1 < µ2.
Vậy chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn hiệu suất của chất xúc tác 1, với mức ý nghĩa α = 1%. ■
Tính p-giá trị: với biến ngẫu nhiên Tn n − 1 + m − 1
−1+m−1 có phân phối Student( ) ta có       p-giá trị = P Tn = = 1 − , −1+ − m 1 < t0 P T25 < −3, 111 P T25 < 3 111
tra bảng phân phối Student với bậc tự do df = n − 1 + m − 1 = 25 ta thấy       0.995 + 0.9995
P T25 ≤ 2, 7874 = 0, 995 và P T25 ≤ 3, 7251 = 0, 9995 =⇒ P T25 < 3, 111 ≈ = 0.9975 ; 2   =⇒
p-giá trị = 1 − P T25 < 3, 111 ≈ 1 − 0, 9975 = 0, 0025 . 17 Xác suất-Thống kê HKI - 2023-2024
Bài 19. Để tìm ra liệu một loại huyết thanh mới có kiềm hãm được bệnh bạch cầu hay không, 9
con chuột, tất cả các con đều trong giai đoạn tiến triển của bệnh, được chọn. Năm con chuột nhận
được trị liệu và 4 con không. Thời gian sống, theo năm, từ thời điểm thí nghiệm bắt đầu là như sau Trị liệu 2, 1 5, 3 1, 4 4, 6 0, 9 Không trị liệu 1, 9 0, 5 2, 8 3, 1
Tại mức ý nghĩa 0, 05, huyết thanh có thể được nói là có hiệu quả hay không?
Giả sử hai tổng thể có phân phối chuẩn với các phương sai bằng nhau. Hướng dẫn:
Ta muốn so sánh tuổi thọ trung bình chuột được trị liệu so với KHÔNG trị liệu. Đặt
µ1 = tuổi thọ trung bình nhóm được trị liệu và
µ2 = tuổi thọ trung bình KHÔNG trị liệu.
" huyết thanh có thể được nói là có hiệu quả hay không? " =⇒ H hay 1 : µ1 > µ2 µ1 − µ2 > 0 =⇒ H0 : µ1 − µ2 ≤ 0 . ( ( H0 : µ1 = µ2
H0 : µ1 − µ2 = D0 = 0 : KHÔNG hiệu quả
• Giả thuyết cần kiểm định ⇔ ; H1 : µ1 > µ2 H : có hiệu quả 1 : µ1 − µ2 > D0 ( ! ( H Dấu " 0 : µ1 − µ2 ≤ D0 = 0 = "
luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : µ1 − µ2 > D0
■ Mức ý nghĩa α = 0, 05.
■ Tính thống kê kiểm định: • Lấy mẫu:
có trị liệu : cỡ mẫu n = 5 có trung bình mẫu x = 2, 86, độ lệch chuẩn mẫu √ s1 = 3, 883 ≈ 1, 9705;
KHÔNG trị liệu : cỡ mẫu m = 4 có trung bình mẫu y = 2, 075, độ lệch chuẩn mẫu √ s2 = 1, 3625 ≈ 1, 1673; • Phương sai σ2 và σ2 KHÔNG biết với
cỡ mẫu n = 5 < 30 và m = 4 < 30 là cỡ mẫu nhỏ 1 2 =⇒
dùng phân phối t-Student với bậc tự do df = n − 1 + m − 1.
• Dữ kiện đề bài: " Giả sử hai tổng thể có phân phối chuẩn với các phương sai bằng nhau " =⇒
phương sai bằng nhau σ2 = σ2 1 2 (n − 1).s2 + (m − 1).s2
(5 − 1) × 3, 883 + (4 − 1) × 1, 3625 =⇒ tính s2 = 1 2 = . p ≈ 2, 8028 n − 1 + m − 1 5 − 1 + 4 − 1
• Ta có thống kê kiểm định: x − y − D 2, 86 − 2, 075 − 0 t 0 0 = r = r ≈ 0, 699 ; s2 2, 8028 p s2p 2, 8028 + + n m 5 4 • Miền bác bỏ: ta sẽ bác bỏ H nếu 1+m 1 − − 0 t0 > tn− − = t5 1+4 1 = t7 = 1, 8946 1−α 0,95 0,95
(tra bảng phân phối Student để tìm giá trị cho t7 ) 0,95 • Kết luận: do t n−1+m−1 tức là 0 = 0, 699 < 1, 8946 = t µ 1 ⇒ KHÔNG bác bỏ H0 1 − µ2 ≤ 0. −α
Vậy tuổi thọ trung bình nhóm được trị liệu KHÔNG cao hơn nhóm KHÔNG được trị liệu,
tức là huyết thanh KHÔNG hiệu quả, với mức ý nghĩa α = 5%. □ 18 Xác suất-Thống kê HKI - 2023-2024
Bài 20. Đo chỉ số chất béo trong sữa bò X (tính theo % của 130 con bò lai F1 Hà-Ấn), được bảng số liệu X 3, 3 3, 9 4, 5 5, 1 5, 7 6, 3 6, 9 ni 2 8 35 43 22 15 5
Giả thiết rằng X có phân phối chuẩn.
(a) Hãy ước lượng trung bình chỉ số chất béo trong sữa giống bò lai trên ở độ tin cậy 99%.
(b) Nếu muốn ước lượng trung bình chỉ số chất béo trong sữa của bò lai F1-Hà-Ấn với sai số ước
lượng không quá 0, 15% và độ tin cậy 99% thì phải lấy mẫu tối thiểu bao nhiêu?
(c) Biết rằng trung bình chỉ số chất béo trong sữa của giống bò Hà thuần chủng là 4, 95. Hỏi việc
lai tạo trên có cho trung bình chỉ số chất béo trong sữa bò tăng lên không với mức ý nghĩa 1%? Hướng dẫn:
Ta quan tâm chỉ số chất béo trung bình. Đặt µ = số chất béo trung bình trong sữa bò. Phương sai σ2 KHÔNG biết. □ Lấy mẫu:
cỡ mẫu n = 2 + 8 + 35 + 43 + 22 + 15 + 5 = 130 ; trung bình mẫu
3, 3 × 2 + 3, 9 × 8 + 4, 5 × 35 + ... + 6, 9 × 5 x = ≈ 5, 1462 ; n  2  2  2 và phương sai mẫu
3, 3 − x × 2 + 3, 9 − x × 8 + ... + 6, 9 − x × 5 s2 = ≈ 0, 5895 . n ■ (a) Độ tin cậy 1 − α = 99% = 0.99 =⇒ α = 0.01. • Dung sai ε
(trường hợp phương sai KHÔNG biết và cỡ mẫu lớn n = 130 ≥ 30) được xác định bởi √ √ s s 0, 5895 0, 5895 ε = z1 α . √ = z √ = z √ ≈ 2, 575 × √ ≈ 0, 1734 . − 0.995 . 0.995 . 2 n n 130 130
• Vậy khoảng tin cậy 99% cho chỉ số chất béo trung bình trong sữa bò là x − ε < µ < x + ε ⇔
5, 1462 − 0, 1734 < µ < 5, 1462 + 0, 1734 ⇔ 4, 9728 < µ < 5, 3196 . ■ (b) Độ tin cậy 1 − α = 99% = 0.99 =⇒ α = 0.01.
□ Sai số ước lượng không quá 0, 15 (đv: %), Lưu ý: µ, x, σ
và ε có cùng đơn vị, và trong bài này có cùng đơn vị là %.
Do đó, sai số ước lượng không quá s 0, 15 (đv: %), nghĩa là ε ≤ 0, 15, mà ta có ε = z , nên 1 α . √ − 2 n     s s 2 s 2 ε ≤ 0, 15 ⇔ z1 α . √ ≤ 0, 15 ⇔ n ≥ z α . ⇔ n ≥ z − 1− 0,995 . 2 n 2 0, 15 0, 15  √  0, 5895 2 ⇔ n ≥ 2, 575 × 0,15 ⇔ n ≥ 173, 7224 .
Vậy muốn sai số ước lượng không quá 0, 15 (%) ở độ tin cậy 99%, thì phải quan sát ít nhất 174 con bò. 19 Xác suất-Thống kê HKI - 2023-2024 ■ (c)
" Biết rằng trung bình chỉ số chất béo trong sữa của giống bò Hà thuần chủng là 4, 95.
Hỏi việc lai tạo trên có cho trung bình chỉ số chất béo trong sữa bò tăng lên không " =⇒ H ) 1 : µ > 4, 95 =⇒ H0 : µ ≤ 4, 95
( Dấu " = " luôn nằm ở giả thuyết H0 ( ( H0 : µ = µ0
H0 : µ = µ0 = 4, 95 : KHÔNG tăng
• Giả thuyết cần kiểm định ⇔ ; H1 : µ > µ0 H : có tăng 1 : µ > µ0 ( ! cũng có thể viết H0 : µ ≤ µ0 = 4, 95 H1 : µ > µ0
• Mức ý nghĩa α = 1% = 0, 01.
• Tính thống kê kiểm định: Lấy mẫu: cỡ mẫu √ n = 130 có
trung bình mẫu x = 5, 1462 và độ lệch chuẩn mẫu s = 0, 5895 ;
Phương sai σ2 KHÔNG biết và cỡ mẫu n = 130 ≥ 30 là mẫu lớn ⇒ dùng phân phối chuẩn.
Ta có thống kê kiểm định: x − µ 5, 1462 − 4, 95 z 0 0 = √ = √ √ = 2, 9136 ; s/ n 0, 5895/ 130 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,99 = 2, 325 . 0 • Kết luận: do
z0 = 2, 9136 > 2, 325 = z1−α =⇒ bác bỏ H0 =⇒ chấp nhận H , tức là 1 µ > µ0 = 4, 95 ;
Vậy việc lai tạo cho trung bình chỉ số chất béo trong sữa tăng lên, với mức ý nghĩa α = 1%. □
Bài 21 (dựa theo Bài 5.128 - trang 175 giáo trình XSTK).
Một mẫu ngẫu nhiên 500 cư dân trưởng thành của quận Maricopa chỉ ra rằng 385 người ủng hộ
việc tăng giới hạn tốc độ đường cao tốc lên 75 dặm một giờ, và một mẫu khác gồm 400 cư dân của
quận Pima đã chỉ ra rằng 267 người ủng hộ giới hạn tăng lên. Những dữ liệu này có cho thấy có sự
khác biệt trong việc hỗ trợ tăng giới hạn tốc độ cho cư dân của hai quận này hay không? Sử dụng
α = 0, 02, và tính p-giá trị cho kiểm định này là bao nhiêu? Hướng dẫn:
Ta muốn so sánh giữa tỷ lệ dân cư quận Maricopa so với tỷ lệ dân cư quận Pima
trong việc ủng hộ tăng giới hạn tốc độ đường cao tốc.
Đặt p1 = tỷ lệ dân quận Maricopa ủng hộ và
p2 = tỷ lệ dân quận Pima ủng hộ.
" có sự khác biệt trong việc hỗ trợ tăng giới hạn tốc độ cho cư dân của hai quận này hay không? " =⇒
ta muốn so sánh tỷ lệ ủng hộ của cư dân ở 2 quận: là bằng nhau (" = ") hay khác nhau (" = "). =⇒ H hay . 1 : p1 = p2 p1 − p2 = 0 =⇒ H0 : p1 = p2 ( ( H0 : p1 = p2 H0 : p1 − p2 = D0 = 0
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : p1 = p2 H1 : µ1 − µ2 = D0
( Dấu " = " luôn nằm ở giả thuyết H ) 0 20 Xác suất-Thống kê HKI - 2023-2024 ■ Mức ý nghĩa: α = 0, 02.
■ Tính thống kê kiểm định: 385 385 • Lấy mẫu: cư dân quận Maricopa : cỡ mẫu n = 500 có tỷ lệ mẫu bp ; 1 = = n 500 cư dân quận Pima : cỡ mẫu 267 267 m = 400 có tỷ lệ mẫu bp ; 2 = = m 400 385 + 267 385 + 267 652 • Ta có b p = = = , n + m 500 + 400 900 385 267 b p − − 0 z 1 − b p2 − D0 500 400 0 = r r    1 1  = 652  652   1 1  ≈ 3, 42 ; b p. 1 − b p . + . 1 − . + n m 900 900 500 400  • Miền bác bỏ: ta sẽ bác bỏ H nếu   0 z0 > z1 α = z − 0,975 = 1, 96 . 2    • Kết luận: do  z    0
= 3, 42 = 3, 42 > 1, 96 = z1 α =⇒ bác bỏ H0, − 2 =⇒
chấp nhận H , tức là µ1−µ2 = D0 = 0; 1
Vậy tỷ lệ ủng hộ của cư dân ở 2 quận là KHÁC NHAU , với mức ý nghĩa α = 5%. ■ Tính p-giá trị: ta có h i h i   p-giá trị = 2. 1 − Φ(|z0|) = 2. 1 − Φ(3, 43) ≈ 2. 1 − 0, 9997 = 0, 0006 .
ta thấy p-giá trị = 0, 0006 < 0, 05 = α =⇒ bác bỏ H0. □
Bài 22. Tạp chí Y học New England báo cáo một thử nghiệm để đánh giá hiệu quả của phẫu thuật
trên những người đàn ông được chẩn đoán mắc bệnh J. Một nửa số mẫu ngẫu nhiên của 695 (là 347)
nam giới trong nghiên cứu đã phẫu thuật và 18 người trong số họ cuối cùng đã qua đời vì bệnh J so
với 31 trong số 348 người không phẫu thuật. Có bằng chứng nào cho thấy rằng phẫu thuật giảm tỷ
lệ những người qua đời vì bệnh J hay không? Sử dụng α = 0, 05. Tính p-giá trị.
Hướng dẫn: Ta muốn so sánh tỷ lệ tử vong giữa
nhóm được phẫu thuật so với nhóm KHÔNG phẫu thuật. Đặt
p1 = tỷ lệ tử vong nhóm phẫu thuật và
p2 = tỷ lệ tử vong nhóm KHÔNG phẫu thuật.
" Có bằng chứng nào cho thấy rằng phẫu thuật giảm tỷ lệ những người chết vì bệnh J hay không? " =⇒ H hay . 1 : p1 < p2 p1 − p2 < 0 =⇒ H0 : p1 ≥ p2 ( ( H0 : p1 = p2 H0 : p1 − p2 = D0 = 0
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : p1 < p2 H1 : µ1 − µ2 < D0 ( ! ( H Dấu " 0 : p1 − p2 ≥ D0 = 0
= " luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : p1 − p2 < D0 ■ Mức ý nghĩa: α = 0, 05. 21 Xác suất-Thống kê HKI - 2023-2024
■ Tính thống kê kiểm định: 18 18 • Lấy mẫu: nhóm phẫu thuật : cỡ mẫu n = 347 có tỷ lệ mẫu bp ; 1 = = n 347 nhóm KHÔNG phẫu thuật : cỡ mẫu 31 31 m = 348 có tỷ lệ mẫu bp ; 2 = = m 348 18 + 31 18 + 31 49 • Ta có b p = = = , n + m 347 + 348 695 18 31 b p − − 0 z 1 − b p2 − D0 347 348 0 = r r    1 1  = 49  49   1 1  ≈ −1, 916 ; b p. 1 − b p . + . 1 − . + n m 695 695 347 348 • Miền bác bỏ: ta sẽ bác bỏ H nếu z0 < −z1 z 1, 645 −α = − 0,95 = − . 0 • Kết luận: do
z0 = −1, 916 < −1, 645 = −z1 H −α =⇒ bác bỏ 0, =⇒
chấp nhận H , tức là p1 − p2 < 0; 1
Vậy phẫu thuật giúp GIẢM tỷ lệ tử vong , với mức ý nghĩa α = 5%. ■ Tính p-giá trị: ta có p-giá trị
= Φ(z0) = Φ(−1, 916) = 1 − Φ(1, 916) ≈ 1 − 0, 9723 = 0, 0277 .
ta thấy p-giá trị = 0, 0277 < 0, 05 = α =⇒ bác bỏ H0. □
Bài 23. Một người sử dụng một sợi dây thun (hoặc một lò xo) có độ đàn hồi cao để làm một cái
cân đơn giản. Anh ta treo các vật nặng lên dây và ghi lại chiều dài sợi dây cho mỗi lần cân. Dưới đây
là một số dữ liệu cho một số lần cân: Khối lượng g (x) 50 100 150 200 250 300 350 400 Chiều dài mm (y) 37 48 60 71 80 90 102 109
(a) Tìm phương trình hồi quy tuyến tính đơn y theo x. Giải thích ý nghĩa của bβ nhận được. 1
(b) Bạn dự đoán chiều dài sợi dây là bao nhiêu nếu một vật có trọng lượng 375g được treo lên?
(c) Tính hệ số xác định R2. Nhận xét mối liên hệ tuyến tính giữa chiều dài sợi dây và trọng lượng vật nặng.
(d) Tính hệ số tương quan rxy. Hướng dẫn: ■ (a)
Phương trình đường thẳng hồi quy tuyến tính có dạng y = b β0 + b β1 . x .
Công thức tính các hệ số b β và b 1 β0  n X  xi . yi − n . x . y S b β xy i=1 và b 1 = = β0 = y − b β1 . x . S  n  xx X   x2 2 x i − n. i=1 22 Xác suất-Thống kê HKI - 2023-2024 n Ta có X •
xi . yi = 50 × 37 + 100 × 48 + 150 × 60 + ... + 400 × 109 = 156150 ; i=1 x1 + x2 + ... + x 50 + 100 + 150 + ... + 400 • x = n = = 225 ; n 8 y1 + y2 + ... + y 37 + 48 + 60 + ... + 109 • y = n = ≈ 74, 625 ; n 8 n X • x2
= 502 + 1002 + 1502 + ... + 4002 = 510000 ; i i=1
thay vào công thức ta được Sxy = 21825 và Sxx = 105000, do đó bβ1 ≈ 0, 2079 và b β0 ≈ 27, 8571 .
Vậy phương trình đường thẳng hồi quy tuyến tính là y = b β . 0 + b
β1 . x = 27, 8571 + 0, 2079 . x
□ Ý nghĩa của hệ số b β :
hệ số b là hệ số góc của phương trình đường thẳng hồi quy. 1 β1 Vì b β1 = 0, 2079 > 0 =⇒
nếu x tăng thì y cũng tăng theo.
Chẳng hạn, nếu x tăng thêm (hoặc giảm đi) 1 đơn vị thì y sẽ tăng thêm (hoặc giảm đi) 0, 2079 đơn vị.
■ (b) Với x = 375, thay vào phương trình đường thẳng hồi quy tìm được ở câu (a) ta được y = b β0 + b
β1.x = 27, 8571 + 0, 2079 × 375 = 105, 8196 .
Vậy nếu treo một vật nặng 375g thì chiều dài của sợi dây sẽ khoảng 105, 8196 mm . SSR
■ (c) Ta có hệ số xác định R2 = (lưu ý 0 ≤ R2 ≤ 1) với SST n X 2 SSR = b β .
1.Sxy ≈ 0, 2079×21825 = 4537, 418, và SST = yi−y = 4547, 875, suy ra R2 ≈ 0, 9975 i=1
Vì R2 gần 1, nên giữa y (chiều dài sợi dây) và x (trọng lượng vật nặng) có mối liên hệ tuyến tính mạng. Sxy 21825
■ (d) Hệ số tương quan rxy được tính bởi rxy = √ = √ ≈ 0, 9987; Sxx × SST 105000 × 4547, 875
Vì rxy > 0 nên giữa x và y có mối tương quan dương, và vì r gần xy
1 nên mối liên hệ tuyến tính thuận giữa x và y mạnh. □
Bài 24. Đo lượng mỡ trong cơ thể của một người là một cách để theo dõi tiến độ kiểm soát
cân nặng, nhưng đo chính xác nó phải sử dụng đến thiết bị X-quang đắt tiền. Thay vào đó, chỉ
số khối cơ thể (BMI) thường được sử dụng làm đại diện cho mỡ cơ thể vì nó dễ đo: BMI = khối lượng (kg)  2  2 / chiều cao (m)
= 703 khối lượng (lb)/ chiều cao (in) . Trong một nghiên cứu
của 250 người đàn ông tại Đại học Bingham Young, cả BMI (biến x) và mỡ cơ thể (biến y) được đo
lường. Các nhà nghiên cứu đã tìm thấy các thống kê tóm tắt sau: n X n X n X n X n X xi = 6322, 28; x2 y y2 x i = 162674, 18; i = 4757, 90; i = 107679, 27; i.yi = 125471, 10; i=1 i=1 i=1 i=1 i=1
(a) Tìm phương trình của đường thẳng hồi quy. Cho biết ý nghĩa của hệ số bβ . 1
(b) Sử dụng đường thẳng hồi quy, hãy tiên đoán lượng mỡ cơ thể (y) của một người đàn ông sẽ được
quan trắc nếu có chỉ số BMI là x = 30.
(c) Tính hệ số xác định R2. Nhận xét về mối liên hệ tuyến tính giữa chỉ số BMI và lượng mỡ cơ thể.
(d) Tính hệ số tương quan rxy. 23 Xác suất-Thống kê HKI - 2023-2024 Hướng dẫn: ■ (a)
Phương trình đường thẳng hồi quy tuyến tính có dạng y = b β0 + b β1 . x .
Công thức tính các hệ số b β và b 1 β0  n X  xi . yi − n . x . y S b β xy i=1 và b 1 = = β0 = y − b β1 . x . S  n  xx X   x2 2 x i − n. i=1
Từ dữ kiện đề bài, ta có n = 250
("Trong một nghiên cứu của 250 người đàn ông") n X n X • xi . yi = 125471, 10 và x2i = 162674, 18 ; i=1 i=1 x1 + x2 + ... + x 6322, 28 • x = n = = 25, 289 ; n 250 y1 + y2 + ... + y 4757, 90 • y = n = ≈ 19, 0316 ; n 250
thay vào công thức ta được Sxy = 5147, 996 và Sxx = 2789, 2824, do đó b β1 ≈ 1, 8456 và b β0 ≈ −27, 642 .
Vậy phương trình đường thẳng hồi quy tuyến tính là y = b β . 0 +
bβ1 . x = −27, 642 + 1, 8456 . x
□ Ý nghĩa của hệ số b β :
hệ số b là hệ số góc của phương trình đường thẳng hồi quy. 1 β1 Vì b β1 = 1, 8456 > 0 =⇒
nếu x tăng thì y cũng tăng theo.
Chẳng hạn, nếu x tăng thêm 1 đơn vị thì y sẽ tăng thêm 1, 8456 đơn vị.
■ (b) Với x = 30, thay vào phương trình đường thẳng hồi quy tìm được ở câu (a) ta được y = b β0 + b
β1.x = −27, 642 + 1, 8456 × 30 = 27, 726 .
Vậy nếu chỉ số BMI là 30 thì lượng mỡ cơ thể sẽ khoảng 27, 726 . SSR
■ (c) Ta có hệ số xác định R2 =
(lưu ý 0 ≤ R2 ≤ 1) với SSR = bβ1.S SST
xy ≈ 1, 8456 × 5147, 996 = 9501, 1414 , n X  n X  và    2 SST = y 2 i − y = y2 n y = 17128, 8204, nên R2 , . i − × ≈ 0 5547 i=1 i=1
Vì 0 < R2 nhưng KHÔNG gần 1, nên giữa y (mỡ cơ thể) và x (chỉ số BMI) có mối liên hệ tuyến tính yếu.
■ (d) Hệ số tương quan rxy (lưu ý −1 ≤ rxy ≤ 1) được tính bởi S 5147, 996 r xy xy = √ = √ ≈ 0, 7448; Sxx × SST 2789, 2824 × 17128, 8204
Vì rxy > 0 nên giữa x và y có mối tương quan dương,
mà r KHÔNG gần 1 nên mối liên hệ tuyến tính thuận giữa xy x và y là yếu. □ - - - Hết - - - 24