Ôn Tập Cuối Kì môn Xác suất thống kê | Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia HCM
Ôn Tập Cuối Kì môn Xác suất thống kê | Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia HCM được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!
Trường: Trường Đại học Khoa học tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh
Thông tin:
Tác giả:
Preview text:
Xác suất-Thống kê HKI - 2023-2024
Hướng dẫn giải Bài tập nộp 2 Note:
Danh sách bài tập gồm 24 bài - - - - - * * * * * - - - - -
Bài 1. Thời gian cho đến khi cần sạc lại pin cho một máy tính xách tay trong điều kiện bình thường
là phân phối chuẩn với trung bình 260 phút và độ lệch chuẩn là 50 phút.
(a) Xác suất pin sử dụng kéo dài hơn bốn giờ là bao nhiêu?
(b) Xác định thời gian sử dụng pin tại những giá trị phân vị, là giá trị z sao cho xác suất P(Z ≤ z), đạt 25% và 75%.
(Hint: tức là tìm a sao cho P(Z ≤ a) = 25% và
tìm b sao cho P(Z ≤ b) = 75%)
(c) Xác định thời gian sử dụng pin tương ứng với xác suất ít nhất 0,95. Hướng dẫn:
Ta quan tâm đến thời gian cho đến khi cần sạc lại pin cho một máy tính xách tay.
Gọi X là b.n.n. thể hiện thời gian (đơn vị: phút) cho đến khi cần sạc lại pin cho một máy tính xách tay.
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2) với trung bình µ = 260 phút và độ lệch chuẩn σ = 50 phút.
■ (a) Xác suất pin sử dụng kéo dài hơn 4 giờ = 240 phút là ! ! X − E(X) 240 − E(X) X − µ 240 − µ
P X > 240 = 1 − P X ≤ 240 = 1 − P p p = 1 ≤ Var ≤ − P (X) Var(X) σ σ với 240 − µ 240 − µ Z ∼ N (0; 1) = 1 − P Z ≤ = 1 − Φ σ σ 240 − 260 = 1 − Φ = 1 − Φ −0, 4 = Φ 0, 4 = 0, 6554; 50
■ (b) Giá trị w là phân vị mức γ của b.n.n. X nếu thoả P(X ≤ wγ) = γ. γ
▷ Do đó, gọi a là thời gian sử dụng pin tại phân vị 25%, nghĩa là ! X − µ a − µ P X ≤ a = 25% = 0, 25 ⇔ P ≤ = 0, 25 σ σ a − µ a − µ ⇔ Φ = 0, 25 ⇔
= Φ−1 0, 25 = −Φ−1 1 − 0, 25 = −Φ−1(0, 75) σ σ suy ra
a = µ + σ × − Φ−1(0, 75) ≈ 260 + 50 × − 0, 675 = 226, 25 phút ;
▷ Tương tự, gọi b là thời gian sử dụng pin tại phân vị 75%, nghĩa là b − µ b − µ P X ≤ b = 75% = 0, 75 ⇔ Φ = 0, 75 ⇔ = Φ−1 0, 75 σ σ suy ra
b = µ + σ × Φ−1(0, 75) ≈ 260 + 50 × 0, 675 = 293, 75 phút ;
■ (c) Gọi c là thời gian sử dụng pin tương ứng với xác suất ít nhất 0, 95, ta có c − µ c − µ P X ≤ c ≥ 0, 95 ⇔ Φ ≥ 0, 95 ⇔ ≥ Φ−1 0, 95
⇔ c ≥ µ + σ × Φ−1 0, 95 σ σ
≈ 260 + 50 × 1, 645 = 342, 25.
Vậy, thời gian sử dụng pin tương ứng với xác suất ít nhất 0, 95 là 342, 25 phút. □ Z a Nhắc lại: với 1 t2
Z ∼ N (0; 1) thì hàm số Φ(a) := P(Z ≤ a) = .e− 2 dt. 2π −∞ và
P(a < Z < b) = P(a ≤ Z < b) = P(a < Z ≤ b) = P(a ≤ Z ≤ b) = Φ(b) − Φ(a) . 1 Xác suất-Thống kê HKI - 2023-2024
Bài 2. Đường kính một sợi bán dẫn giả sử có phân phối chuẩn với trung bình 0, 5µm và
độ lệch chuẩn 0, 05 µm.
(a) Tính xác suất để đường kính của một sợi lớn hơn 0, 62 µm.
(b) Tính xác suất để đường kính của một sợi nằm giữa 0, 47 và 0, 63 µm.
(c) Đường kính sợi của
90% mẫu nhỏ hơn giá trị nào?
(Tức là, tìm x sao cho P X < x = 0, 9) Hướng dẫn:
Ta quan tâm đến đường kính sợi bán dẫn.
Gọi X là b.n.n. thể hiện đường kính sợi bán dẫn (đơn vị: µm).
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2) với trung bình µ = 0, 5 µm và độ lệch chuẩn σ = 0, 05 µm.
■ (a) Xác suất để đường kính của một sợi lớn hơn 0, 62 µm là ! ! X − E(X) 0, 62 − E(X) X − µ 0, 62 − µ
P X > 0, 62 = 1 − P X ≤ 0, 62 = 1 − P p p = 1 ≤ Var ≤ − P (X) Var(X) σ σ với 0, 62 − µ 0, 62 − µ Z ∼ N (0; 1) = 1 − P Z ≤ = 1 − Φ σ σ 0, 62 − 0, 5 = 1 − Φ = 1 − Φ 2, 4 = 1 − 0, 9918 = 0, 9982; 0, 05
■ (b) Xác suất để đường kính của một sợi nằm giữa 0, 47 và 0, 63 µm là ! ! X − µ 0, 63 − µ X − µ 0, 47 − µ P 0, 47 ≤ X ≤ 0, 63 = P ≤ − P ≤ σ σ σ σ với 0, 63 − µ 0, 47 − µ 0, 63 − µ 0, 47 − µ Z ∼ N (0; 1) = P Z ≤ − P Z ≤ = Φ − Φ σ σ σ σ 0, 63 − 0, 5 0, 47 − 0, 5 = Φ − Φ 0, 05 0, 05 h i h i
= Φ 2, 6 − Φ − 0, 6 = Φ 2, 6 − 1 − Φ 0, 6
= 0, 9953 − 1 − 0, 7257 = 0, 721;
■ (c) Đường kính sợi của 90% mẫu nhỏ hơn giá trị c, ta có c − µ c − µ P X < c = 90% = 0, 9 ⇔ Φ = 0, 9 ⇔ = Φ−1 0, 9 ⇔ c = µ + σ × Φ−1 0, 9 σ σ
≈ 0, 5 + 0, 05 × 1, 282 = 0, 5641.
Vậy, 90% mẫu có đường kính nhỏ hơn 0, 5641 µm. □
Bài 3. Dây điện được sản xuất để sử dụng trong một hệ thống máy tính được chỉ định phải có điện
trở giữa 0,12 và 0,14 ohms. Các điện trở thực tế của dây điện được sản xuất bởi công ty A có phân
phối chuẩn với trung bình 0, 13 ohm và độ lệch chuẩn 0, 01 ohm.
(a) Xác suất để một dây điện được chọn ngẫu nhiên từ sản phẩm của công ty A sẽ phù hợp với các
đặc điểm kỹ thuật này;
(b) Nếu mỗi hệ thống máy tính đều dùng 15 dây điện chọn từ công ty A, thì xác suất để có ít hơn 6
dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này là bao nhiêu?
(c) Nếu mỗi hệ thống máy tính đều dùng 400 dây điện được chọn từ công ty A, thì xác suất để có
ít nhất 200 dây trong một hệ thống được chọn ngẫu nhiên sẽ phù hợp đặc điểm kỹ thuật này là
bao nhiêu? (Sử dụng xấp xỉ chuẩn) 2 Xác suất-Thống kê HKI - 2023-2024 Hướng dẫn:
Ta quan tâm đến điện trở của dây điện.
Gọi X là biến ngẫu nhiên thể hiện điện trở (đơn vị: ohm) của dây điện.
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2), với trung bình µ = 0, 13 và độ lệch chuẩn σ = 0, 01.
■ (a) Theo đề bài, dây điện phù hợp đặc điểm kỹ thuật nếu có điện trở nằm giữa 0, 12 ohm và 0, 14 ohm,
tức là nếu 0, 12 ≤ X ≤ 0, 14.
Do đó, xác suất để một dây điện được chọn ngẫu nhiên phù hợp các đặc điểm kỹ thuật là 0, 12 − µ X − µ 0, 14 − µ 0, 12 − µ 0, 14 − µ P(0, 12 ≤ X ≤ 0, 14) = P ≤ ≤ = P ≤ Z ≤ σ σ σ σ σ 0, 14 − µ 0, 12 − µ = Φ − Φ ( với Z ∼ N (0; 1) ) σ σ 0, 14 − 0, 13 0, 12 − 0, 13 = Φ − Φ 0, 01 0, 01 h i
= Φ (1) − Φ (−1) = Φ (1) − 1 − Φ (1)
= 2 × Φ (1) − 1 ≈ 2 × 0, 8413 − 1 = 0, 6826 .
■ (b) Gọi Y là b.n.n. thể hiện số dây điện có điện trở phù hợp đặc điểm kỹ thuật trong tổng số 15 dây điện.
Thì Y có phân phối nhị thức B(n; p) với n = 15 và
p = "xác suất để 1 dây điện phù hợp đặc điểm kỹ thuật" = 0, 6862 (tính ở câu (a)).
Xác suất để trong số 15 dây điện, có ít hơn 6 dây phù hợp đặc điểm kỹ thuật, là
P Y < 6 = P Y = 0 + P Y = 1 + P Y = 2 + P Y = 3 + P Y = 4 + P Y = 5 = C0 p0(1 p1(1 ... C5 p5(1 n − p)n−0 + C1n − p)n−1 + + n − p)n−5 ≈ 0, 0058.
■ (c) Gọi W là b.n.n. thể hiện số dây điện có điện trở phù hợp đặc điểm kỹ thuật trong tổng số 400 dây điện.
Thì W có phân phối nhị thức B(m; p) với m = 400 và
p = "xác suất để 1 dây điện phù hợp đặc điểm kỹ thuật" = 0, 6862 (tính ở câu (a)).
Ta thấy 0, 1 < p < 0, 9, hơn nữa m × p = 400 × 0, 6862 ≥ 5 và m × (1 − p) = 400 × (1 − 0, 6862) ≥ 5, do đó,
có thể dùng phân phối chuẩn
N m.p ; m.p.(1 − p) để tính xấp xỉ cho phân phối nhị thức B(m; p) của W .
Cụ thể, ta có, xác suất để có ít nhất 200 dây điện phù hợp đặc điểm kỹ thuật là
P(W ≥ 200) = 1 − P(W < 200) = 1 − P(W ≤ 199) = 1 − P(W < 199 + 0, 5 )
(hiệu chỉnh sự liên tục) ! W − E(W ) 199 + 0, 5 − E(W )
(W có phân phối nhị thức, W ∼ B(m; p)) = 1 − P p < p Var(W ) Var(W ) 199 + 0, 5 − E(W )
(dùng Z có phân phối chuẩn để xấp xỉ, Z ∼ N (0; 1)) ≈ 1 − P Z < pVar(W) ! 199 + 0, 5 − E(W ) = 1 − Φ pVar(W) 199 + 0, 5 − m.p = 1 − Φ pm.p.(1 − p) , 5 − 400 × 0, = 1 − Φ 199 + 0 6862 q 400 × 0, 6862. 1 − 0, 6862 ≈ 1 − Φ ( −7, 8996 ) = Φ ( 7, 8996 ) ≈ 1 . □ 3 Xác suất-Thống kê HKI - 2023-2024
Bài 4 (dựa theo câu 1 đề thi cuối kỳ, 2022-2023, hk1).
Một nhà máy sản xuất ra bu lông với đường kính tuân theo phân phối chuẩn N (4; 0, 09) (đv: mm).
Các bu lông được đo đạc một cách chính xác và những cái nào có đường kính nhỏ hơn 3, 5mm hoặc
lớn hơn 4, 4mm sẽ bị loại bỏ. Chọn ngẫu nhiên một bu lông được máy sản xuất.
(a) Tính xác suất bu lông này được chấp nhận.
(b) Một lô gồm 900 bu lông được xản suất. Khoảng bao nhiêu bu lông trong số này được chấp nhận? Hướng dẫn:
Ta quan tâm đến đường kính của bu lông.
Gọi Y là biến ngẫu nhiên thể hiện đường kính của bu lông. Theo đề bài, Y có phân phối chuẩn, Y ∼ N (µ; σ2)
với trung bình µ = 4 và phương sai σ2 = 0, 09 ⇒ σ = 0, 3.
■ (a) Theo đề bài, một bu lông sẽ bị loại bỏ nếu đường kính
nhỏ hơn 3, 5mm hoặc lớn hơn 4, 4mm ,
tức là nếu Y < 3, 5 hoặc Y > 4, 4.
=⇒ Ngược lại, bu lông được chấp nhận nếu đường kính "≥ 3,5" và "≤ 4,4", tức là 3, 5 ≤ Y ≤ 4, 4 .
Do đó, xác suất để một bu lông được chấp nhận là 3, 5 − µ Y − µ 4, 4 − µ 3, 5 − µ 4, 4 − µ P(3, 5 ≤ Y ≤ 4, 4) = P ≤ ≤ = P ≤ Z ≤ (với Z ∼ N (0; 1)) σ σ σ σ σ 4, 4 − µ 3, 5 − µ = Φ − Φ σ σ 4, 4 − 4 3, 5 − 4 4 −5 = Φ − Φ = Φ − Φ
≈ 0, 909 − 0, 048 = 0, 861 . 0, 3 0, 3 3 3 ■ (b) Một lô gồm m = 900
bu lông được sản xuất. Từ câu (a) ta đã tính được
p = " xác suất để 1 bu lông được chấp nhận " = 0, 861 .
Cho nên trong m = 900 bu lông được sản xuất, số bu lông được chấp nhận sẽ khoảng
m × p = 900 × 0, 861 = 774, 9 .
Vậy, trong tổng số m = 900 bu lông được sản xuất sẽ có khoảng 775 bu lông được chấp nhận. □
Bài 5. Trọng lượng một túi rau khi thu hoạch tại một nông trại là b.n.n. có phân phối chuẩn với
trung bình 550 g và độ lệch chuẩn 125 g. Biết rằng trong một ngày có 4000 túi rau được thu hoạch.
Ước lượng số túi rau có trọng lượng lớn hơn 325 g được thu hoạch trong một ngày.
(Hint: tính p = xác suất để một túi rau có trọng lượng lớn hơn 325 g,
sau đó lấy xác suất p này nhân với tổng số gói rau thì sẽ ra số gói rau có trọng lượng lớn hơn 325 ) Hướng dẫn:
Ta quan tâm đến trọng lượng một túi rau.
Gọi X là biến ngẫu nhiên thể hiện trọng lượng của một túi rau.
Theo đề bài, X có phân phối chuẩn, X ∼ N (µ; σ2) với trung bình µ = 550 và độ lệch chuẩn σ = 125.
Trong tổng số m = 4000 túi rau được thu hoạch, ta muốn ước lượng số túi rau có trọng lượng lớn hơn 325g. 4 Xác suất-Thống kê HKI - 2023-2024
• Trước tiên, ta tính xác suất để một túi rau có trọng lượng lớn hơn 325g là X − µ 325 − µ 325 − µ
p = P(X > 325) = 1 − P(X ≤ 325) = 1 − P < = 1 − P Z < σ σ σ 325 − µ = 1 − Φ (với Z ∼ N (0; 1)) σ 325 − 550
( nhắc lại, ta có Φ(−a) = 1 − Φ(a)) = 1 − Φ
= 1 − Φ(−1.8) = Φ(1.8) ≈ 0, 964 . 125
Cho nên trong m = 4000 túi rau được thu hoạch, số túi rau có trọng lượng lớn hơn 325g là
m × p = 4000 × 0, 964 = 3856 .
Vậy, trong tổng số m = 4000 túi rau được thu hoạch sẽ có khoảng 3856 túi có trọng lượng lớn hơn 325g. □
Bài 6. Chiều dài (đv: cm) của một loài sâu tuân theo phân phối chuẩn N (µ; σ2) với σ > 0.
(a) Bắt ngẫu nhiên một con sâu. Nếu µ = 15 cm và σ = 3, 5 cm, hãy tính xác suất để chiều dài sâu (i) ngắn hơn 18, 5 cm; (ii) ít nhất 16, 75 cm;
(iii) từ 11, 5 cm đến 18, 5 cm.
(b) (Không bắt buộc) Biết rằng 30% số sâu dài ít nhất 16cm, và 15% số sâu ngắn hơn 10 cm.
Tìm trung bình µ và độ lệch chuẩn σ của chiều dài của các con sâu. Hướng dẫn:
Gọi Y là biến ngẫu nhiên thể hiện chiều dài của một loài sâu đang xét.
Theo đề bài, Y có phân phối chuẩn, Y ∼ N (µ; σ2) với trung bình mu và độ lệch chuẩn σ.
■ (a) Với µ = 15 cm và σ = 3, 5 cm.
• (i) Xác suất để chiều dài sâu ngắn hơn 18, 5 cm là Y − µ 18, 5 − µ 18, 5 − µ 18, 5 − 15 P(Y < 18, 5) = P < = Φ = Φ = Φ(1) ≈ 0, 84134 . σ σ σ 3, 5
• (ii) Xác suất để chiều dài sâu ít nhất 16, 75 cm là Y − µ 16, 75 − µ 16, 75 − µ 16, 75 − 15
P(Y ≥ 16, 75) = 1 − P(Y < 16, 75) = 1 − P < = 1 − Φ = 1 − Φ σ σ σ 3, 5
= 1 − Φ(0.5) ≈ 1 − 0, 6915 = 0, 3085 .
• (iii) Xác suất để chiều dài sâu từ 11, 5 cm đến 18, 5 cm là
11, 5 − µ Y − µ 18, 5 − µ P(11, 5 ≤ Y ≤ 18, 5) = P ≤ ≤ σ σ σ 18, 5 − µ 11, 5 − µ 18, 5 − 15 11, 5 − 15 = Φ − Φ = Φ − Φ σ σ 3, 5 3, 5
= Φ(1) − Φ(−1) = Φ(1) − 1 − Φ(1) = 2 × Φ(1) − 1 ≈ 2 × 0, 84134 − 1 = 0, 68268 .
■ (b) Giả thiết 30% số sâu dài ít nhất 16 cm, tức là ta có P(X ≥ 16) = 30% = 0, 3.
Tương tự, 15% số sâu dài ngắn hơn 10 cm, tức là ta có P(X < 10) = 15% = 0, 15.
Do đó, ta có hệ phương trình sau ( X − µ 16 − µ 16 − µ P(X ≥ 16) = 0, 3 P < = 1 − 0, 3 = 0, 7 Φ = 0, 7 ⇔ σ σ σ ⇔ P(X < 10) = 0, 15 X − µ 10 − µ 10 − µ P < = 0, 15 Φ = 0, 15 σ σ σ 5 Xác suất-Thống kê HKI - 2023-2024
vì Φ là hàm đồng biến (hàm tăng) nên ta suy ra 16 − µ 16 − 10 = Φ−1 0, 7 ( µ + σ.Φ−1 0, 7 = 16 σ σ = ⇒ Φ−1 0, 7 − Φ−1 0, 15 10 − µ ⇔ = Φ−1 0, 15 µ + σ.Φ−1 0, 15 = 10 µ = 10 − σ.Φ−1 0, 15 σ σ ≈ 3, 8441; với Φ−1 0, 7 ≈ 0, 5244
và Φ−1 0, 15 ≈ −1, 0364 ⇔ µ ≈ 13,98415. □
Bài 7. Xác suất để một bu lông được sản xuất đáp ứng yêu cầu kỹ thuật là 0, 86.
(a) Chọn ngẫu nhiên 50 bu lông được sản xuất. Tính xác suất có ít nhất 48 bu lông đáp ứng yêu cầu kỹ thuật.
(b) Một lô gồm 500 bu lông được sản xuất ra. Dùng một xấp xỉ phù hợp để tính xác suất có ít nhất
250 bu lông đáp ứng yêu cầu kỹ thuật. Hướng dẫn:
■ (a) Gọi Y là b.n.n. thể hiện số bu lông đáp ứng kỹ thuật trong tổng số 50 bu lông.
Thì Y có phân phối nhị thức B(n; p) với n = 50 và
p = "xác suất để 1 bu lông đáp ứng kỹ thuật" = 0, 86 (theo dữ kiện đề bài).
Xác suất để trong số 50 bu lông, có ít nhất 48 bu lông đáp ứng yêu cầu kỹ thuật, là P Y ≥ 48 = P Y = 48 + P Y = 49 + P Y = 50 = C48 p48(1 p49(1 p50(1 n − p)n−48 49 + C n − p)n−49 50 + Cn − p)n−50 ≈ 0, 0221.
■ (c) Gọi W là b.n.n. thể hiện số bu lông đáp ứng kỹ thuật trong tổng số 500 bu lông.
Thì W có phân phối nhị thức B(m; p) với m = 500 và p = "xác suất để 1 bu lông đáp ứng kỹ thuật" = 0, 86.
Ta thấy 0, 1 < p < 0, 9, hơn nữa m × p = 500 × 0, 86 ≥ 5 và m × (1 − p) = 500 × (1 − 0, 86) ≥ 5, do đó,
có thể dùng phân phối chuẩn
N m.p ; m.p.(1 − p) để tính xấp xỉ cho phân phối nhị thức B(m; p) của W .
Cụ thể, ta có, xác suất để có ít nhất 250 bu lông đáp ứng yêu cầu kỹ thuật là
P(W ≥ 250) = 1 − P(W < 250) = 1 − P(W ≤ 249) = 1 − P(W < 249 + 0, 5 )
(hiệu chỉnh sự liên tục) ! W − E(W ) 249 + 0, 5 − E(W )
(W có phân phối nhị thức, W ∼ B(m; p)) = 1 − P p < p Var(W ) Var(W ) 249 + 0, 5 − E(W )
(dùng Z có phân phối chuẩn để xấp xỉ, Z ∼ N (0; 1)) ≈ 1 − P Z < pVar(W) ! 249 + 0, 5 − E(W ) = 1 − Φ pVar(W) 249 + 0, 5 − m.p = 1 − Φ pm.p.(1 − p) , 5 − 500 × 0, = 1 − Φ 249 + 0 86 q 500 × 0, 86. 1 − 0, 86
≈ 1 − Φ ( −23, 26371 ) = Φ ( 23, 26371 ) ≈ 1 . □ 6 Xác suất-Thống kê HKI - 2023-2024
Bài 8 (Bài 4.20 - trang 121 giáo trình XSTK).
Giả sử tuổi thọ bóng đèn do một công ty sản xuất xấp xỉ phân phối chuẩn với độ lệch chuẩn là 40
giờ. Một mẫu 30 bóng đèn cho thấy tuổi thọ trung bình là 780 giờ.
a) Hãy tìm khoảng tin cậy 96% cho tuổi thọ trung bình của tất cả các bóng đèn do công ty sản xuất.
b) Nếu muốn sai số ước lượng không quá 10 giờ, thì phải quan sát ít nhất bao nhiêu bóng đèn.
Hướng dẫn: Ta quan tâm tuổi thọ trung bình bóng đèn. Đặt
µ = tuổi thọ trung bình của bóng đèn.
□ Theo đề bài, " tuổi thọ bóng đèn xấp xỉ phân phối chuẩn với độ lệch chuẩn là 40 giờ " =⇒ độ lệch chuẩn σ = 40 =⇒ phương sai σ2 = 402 đã biết. □ Lấy mẫu: cỡ mẫu n = 30 bóng đèn và
trung bình mẫu x = 780 giờ. ■ a) Độ tin cậy 1 − α = 96% = 0.96 =⇒ α = 0.04. • Dung sai ε
(trong trường hợp phương sai đã biết) được xác định bởi σ σ 40 40 ε = z1 α . √ = z √ = z √ √ ≈ 14, 998. − 0.98 . 0.98 . ≈ 2, 055 × 2 n n 30 30
• Vậy khoảng tin cậy 96% cho tuổi thọ trung bình của các bóng đèn do công ty sản xuất là x − ε < µ < x + ε ⇐⇒
780 − 14, 998 < µ < 780 + 14, 998 ⇐⇒
765, 002 < µ < 794, 998 . σ
■ b) Sai số ước lượng không quá 10 giờ,
nghĩa là ε ≤ 10, mà ta có ε = z , nên 1 α . √ − 2 n σ σ 2 ε ≤ 10 ⇐⇒ z1 α . √ ≤ 10 ⇐⇒ n ≥ z α . − 1− 2 n 2 10 40 2 ⇐⇒ n ≥ 2, 055 × ⇐⇒ n ≥ 67, 5684 . 10
Vậy nếu muốn sai số ước lượng không quá 10 giờ ở độ tin cậy 96%, thì phải quan sát ít nhất 68 bóng đèn. □
Bài 9 (Bài 4.47 - trang 126 giáo trình XSTK). Đem cân một số trái cây vừa thu hoạch được bảng số liệu X (g) 200-210 210-220 220-230 230-240 240-250 Số trái 12 17 20 18 15
a) Tìm khoảng ước lượng trọng lượng trung bình của trái cây với độ tin cậy 0, 95 và 0, 99.
b) Muốn sai số ước lượng không quá E = 2 g ở độ tin cậy 99% thì phải quan sát ít nhất bao nhiêu trái cây ?
Hướng dẫn: Ta quan tâm trọng lượng trung bình trái cây. Đặt µ = trọng lượng trung bình của trái cây. □ Lấy mẫu:
cỡ mẫu n = 12 + 17 + 20 + 18 + 15 = 82 và
trung bình mẫu được tính như sau P x
205 × 12 + 215 × 17 + 225 × 20 + 235 × 18 + 245 × 15 x = i . ni P = = 225, 8537 , ni n
( xét khoảng thứ nhất với trọng lượng 200-210g nên ta lấy giá trị đại diện là 205g. )
■ a) Trong trường hợp này
cỡ mẫu n = 82 ≥ 30 là mẫu lớn và
phương sai σ2 KHÔNG biết. 7 Xác suất-Thống kê HKI - 2023-2024
Ta cần tính phương sai mẫu như sau: P 2 2 2 2 2 (x 2 i − x) . n
205 − x × 12 + 215 − x × 17 + 225 − x × 20 + 235 − x × 18 + 245 − x × 15 s2 = i = n − 1 n − 1 = 175, 8055. □ Độ tin cậy 1 − α = 0.95 =⇒ α = 0.05. • Dung sai ε
(trong trường hợp mẫu lớn , phương sai KHÔNG biết) được xác định bởi √ √ s s 175, 8055 175, 8055 ε = z1 α . √ = z √ = z √ ≈ 1, 96 × √ ≈ 2, 8698 . − 0,975 . 0.975 . 2 n n 82 82
• Vậy khoảng tin cậy 95% cho trọng lượng trung bình của trái cây là x − ε < µ < x + ε ⇐⇒
222, 9838 < µ < 228, 7236 . □ Độ tin cậy 1 − α = 0.99 =⇒ α = 0.01. • Dung sai ε
(trong trường hợp mẫu lớn , phương sai KHÔNG biết) được xác định bởi √ √ s s 175, 8055 175, 8055 ε = z1 α . √ = z √ = z √ ≈ 2, 575 × √ ≈ 3, 7704 . − 0,995 . 0.995 . 2 n n 82 82
• Vậy khoảng tin cậy 95% cho trọng lượng trung bình của trái cây là x − ε < µ < x + ε ⇐⇒
222, 0833 < µ < 229, 6241 . s
■ b) Sai số ước lượng không quá 2 g,
nghĩa là ε ≤ 2, mà ta có ε = z , 1 α . √ − 2 n
nên ở độ tin cậy 1 − α = 99% = 0, 99 , thì s s 2 ε ≤ 2 ⇐⇒ z1 α . √ ≤ 2 ⇐⇒ n ≥ z α . − 1− 2 n 2 2 √ 2 175, 8055 ⇐⇒ n ≥ 2, 575 × ⇐⇒ n ≥ 291, 4251 . 2
Vậy nếu muốn sai số ước lượng không quá 2 g ở độ tin cậy 99%, thì phải quan sát ít nhất 292 trái cây. □
Bài 10. Người ta đo ion Na+ trên một số người và ghi nhận lại được kết quả như sau
129, 132, 140, 141, 138, 143, 133, 137, 140, 143, 138, 140 .
a) Tính trung bình mẫu và phương sai mẫu.
b) Ước lượng trung bình tổng thể ở độ tin cậy 0, 95.
Hint: trung bình mẫu = x và phương sai mẫu = S2 => tính từ số liệu, dữ liệu thực nghiệm đề cho.
trung bình tổng thể = µ (không biết!!) và phương sai tổng thể = σ2 (ở bài này, σ2 cũng không biết!) Hướng dẫn:
Ta quan tâm chỉ số trung bình ion Na+ của một người.
Đặt µ = chỉ số trung bình ion Na+ của một người. ■ a) Lấy mẫu:
cỡ mẫu n = 12 (vì ta thấy dữ liệu là chỉ số đo được của 12 người) 8 Xác suất-Thống kê HKI - 2023-2024 và
trung bình mẫu x được tính như sau P x
129 + 132 + 140 + ... + 143 + 138 + 140 x = i = ≈ 137, 833 , n 12 Trong trường hợp này
cỡ mẫu n = 12 < 30 là mẫu nhỏ và
phương sai σ2 KHÔNG biết.
Ta cần tính phương sai mẫu s2 như sau: P 2 2 2 2 2 2 (x 2 i − x)
129 − x + 132 − x + 140 − x + ... + 143 − x + 138 − x + 140 − x s2 = = ≈ 19, 424. n − 1 n − 1 ■ b) Độ tin cậy 1 − α = 0.95 =⇒ α = 0.05. • Dung sai ε
(trong trường hợp mẫu nhỏ , phương sai KHÔNG biết) được xác định bởi √ √ s s 19, 424 19, 424 ε = tn−1 . √ = t12−1 . √ = t11 √ ≈ 2, 201 × √ ≈ 2, 8 . 1 α 0,975 . − 0,975 2 n n 12 12
• Vậy khoảng tin cậy 95% cho chỉ số trung bình ion Na+ là x − ε < µ < x + ε ⇐⇒
135, 033 < µ < 140, 633 . □
Bài 11 (Bài 4.54 - trang 127 giáo trình XSTK).
Một mẫu ngẫu nhiên gồm 50 mũ bảo hiểm được sử dụng bởi những người đi xe máy đã được thử
nghiệm va chạm, và 18 trong số những chiếc mũ bảo hiểm đã bị thiệt hại.
a) Tìm khoảng tin cậy 95% cho tỷ lệ mũ bảo hiểm loại này sẽ cho thấy thiệt hại từ thử nghiệm này.
b) (Không bắt buộc) Bao nhiêu mũ bảo hiểm phải được kiểm tra để sai số khi ước lượng giá trị thực
của p nhỏ hơn 2% với độ tin cậy 95%?
Hướng dẫn: Ta quan tâm tỷ lệ mũ bảo hiểm bị thiệt hại. Đặt
p = tỷ lệ mũ bảo hiểm bị thiệt hại. □ Theo đề bài:
" mẫu ngẫu nhiên gồm 50 mũ được thử nghiệm và thấy có 18 cái bị thiệt hại " 18 18 =⇒
cỡ mẫu n = 50 mũ bảo hiểm và tỷ lệ mẫu bp = = . n 50 ■ a) Độ tin cậy 1 − α = 95% = 0.95 =⇒ α = 0.05. • Dung sai : v s u s u 18 18 b p. 1 − b p b p. 1 − b p t . 1 − ε = z 50 50 1 α . = z = 1, 96 × − 0.975 . ≈ 0, 133. 2 n n 50
• Vậy khoảng tin cậy 96% cho tỷ lệ mũ bảo hiểm bị thiệt hại là 18 18 b p − ε < p < b p + ε ⇐⇒ − 0, 133 < p < + 0, 133 ⇐⇒ 0, 227 < p < 0, 493 . 50 50 9 Xác suất-Thống kê HKI - 2023-2024 r b p. 1 − b p
■ b) Sai số ước lượng nhỏ hơn 2%,
nghĩa là ε < 2%, mà ta có ε = z , nên 1 α . − 2 n s q 2 b p. 1 − b p b p. 1 − b p ε < 2% ⇐⇒ z 1 α . < 0, 02 ⇐⇒ n > z α . − 1− 2 n 2 0, 02 r 2 18 18 . 1 − ⇐⇒ 50 50 n > 1, 96 × ⇐⇒ n > 2212, 762 . 0, 02
Vậy muốn sai số ước lượng nhỏ hơn 2% ở độ tin cậy 95%, thì phải quan sát ít nhất 2213 mũ bảo hiểm. □
Bài 12 (dựa theo Bài 5.30 - trang 149 giáo trình XSTK).
Nhiệt độ nước trung bình tại một trạm bơm nước cung cấp cho một khu dân cư không được vượt
quá 100oF . Những khảo sát trong quá khứ đã chỉ ra rằng độ lệch chuẩn của nhiệt độ là 2oF . Đo
nhiệt độ nước tại trạm bơm trong 9 ngày được chọn ngẫu nhiên và tính được nhiệt độ trung bình là
98oF . Biết rằng nhiệt độ nước tuân theo phân phối chuẩn.
(a) Có bằng chứng cho thấy nhiệt độ nước có thể chấp nhận được hay không, mức ý nghĩa 0.05?
(b) Tính mức ý nghĩa nhỏ nhất khi bạn đưa ra kết luận bác bỏ giả thuyết H0.
(Hint: p-giá trị = mức ý nghĩa nhỏ nhất để bác bỏ H ) 0 Hướng dẫn:
Ta quan tâm nhiệt độ nước trung bình.
Đặt µ = nhiệt độ nước trung bình. □ Theo đề bài,
"Những khảo sát trong quá khứ đã chỉ ra rằng độ lệch chuẩn của nhiệt độ là 2◦F" ⇒ độ lệch chuẩn σ = 2 ⇒
phương sai σ2 = 4 đã biết. □ Lấy mẫu:
" Đo nhiệt độ nước trong 9 ngày được chọn ngẫu nhiên và tính được nhiệt độ trung bình là 98oF " ⇒ cỡ mẫu n = 9 và trung bình mẫu x = 98.
" Nhiệt độ nước trung bình hạ lưu từ ống tháp xả giải nhiệt của nhà máy không được vượt quá 100◦F.
Có bằng chứng gì cho ta thấy nhiệt độ nước có thể chấp nhận được hay không " =⇒ H0 : µ ≤ 100 =⇒ H1 : µ > 100.
( Dấu " = " luôn nằm ở giả thuyết H0 ) ( ( H0 : µ = µ0 H0 : µ = µ0 = 100
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : µ > µ0 H1 : µ > µ0 ( ! cũng có thể viết H0 : µ ≤ µ0 = 100 H1 : µ > µ0
• Mức ý nghĩa α = 5% = 0, 05.
• Tính thống kê kiểm định: Lấy mẫu: cỡ mẫu n = 9 có trung bình mẫu x = 98 ;
Phương sai σ2 = 4 đã biết ⇒ dùng phân phối chuẩn. 10 Xác suất-Thống kê HKI - 2023-2024
Ta có thống kê kiểm định: x − µ 98 − 100 z 0 0 = √ = √ = −3 ; σ/ n 2/ 9 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,95 = 1, 645 . 0 • Kết luận: do z0 = −3 < 1, 645 = z1 H µ = µ −α =⇒ KHÔNG bác bỏ 0 tức là 0 = 100 ;
(hoặc µ ≤ µ0 = 100 nếu lúc đầu đặt H0 : µ ≤ µ0 = 100)
Vậy nhiệt độ nước trung bình KHÔNG vượt quá 100oF, với mức ý nghĩa α = 5%.
Do đó nhiệt độ nước là chấp nhận được.
■ Tính p-giá trị: trong trường hợp này ta có
p-giá trị = 1 − Φ(z0) = 1 − Φ(−3) = Φ(3) ≈ 0, 9987.
Ta thấy p-giá trị = 0, 9987 > 0, 05 = α =⇒ KHÔNG bác bỏ H0 =⇒
có cùng kết luận khi sử dụng miền bác bỏ. □
Bài 13. Đo hàm lượng natri (đv: mg) của hai mươi hộp bắp hữu cơ 300g của nhà sản xuất A, thu được dữ liệu 131, 15 130, 69 130, 91 129, 54 129, 64 128, 77 130, 72 128, 33 128, 24 129, 78 129, 65 130, 14 129, 29 128, 71 129 129, 39 130, 42 129, 53 130, 12 130, 92
Giả sử theo tiêu chuẩn, hàm lượng natri trung bình không được phép vượt quá 130mg.
Sử dụng mức ý nghĩa 0, 02, dữ liệu trên có cho thấy các hộp bắp hữu cơ của nhà sản xuất A đảm bảo
tiêu chuẩn hay không? Tính p-giá trị. Hướng dẫn:
Ta quan tâm hàm lượng natri trung bình của hộp bắp hữu cơ.
Đặt µ = hàm lượng natri trung bình của hộp bắp hữu cơ của nhà sản xuất A. □ Lấy mẫu: cỡ mẫu n = 20 và • Trung bình mẫu:
131, 15 + 129, 65 + 130, 69 + 130, 14 + ... + 129, 78 + 130, 92 x = = 129, 747; n • Phương sai mẫu: 2 2 2 2
131, 15 − x + 129, 65 − x + ... + 129, 78 − x + 130, 92 − x s2 = ≈ 0, 7681; n − 1 p √
• Độ lệch chuẩn mẫu: s = phương sai mẫu = s2 ≈ 0, 8764;
" Giả sử theo tiêu chuẩn, hàm lượng natri trung bình không được phép vượt quá 130mg.
Sử dụng mức ý nghĩa 0, 02, dữ liệu trên có cho thấy các hộp bắp hữu cơ của nhà sản xuất A đảm bảo tiêu chuẩn hay không? =⇒ H0 : µ ≤ 130 =⇒ H1 : µ > 130.
( Dấu " = " luôn nằm ở giả thuyết H0 )
( H0 : µ ≤ µ0 = 130 : đảm bảo tiêu chuẩn
• Giả thuyết cần kiểm định ; H
: KHÔNG đảm bảo tiêu chuẩn 1 : µ > µ0
• Mức ý nghĩa α = 0, 02.
• Tính thống kê kiểm định:
Phương sai σ2 KHÔNG biết và cỡ mẫu n = 20 < 30 (mẫu nhỏ) ⇒
dùng phân phối t-Student với bậc tự do (n − 1). 11 Xác suất-Thống kê HKI - 2023-2024
Ta có thống kê kiểm định: x − µ 129, 747 − 130 t 0 0 = √ = √ = −1, 291 ; s/ n 0, 7681/ 20 • Miền bác bỏ: ta sẽ bác bỏ H nếu 0 t0 > tn−1 = t19 1−α 0,98 ≈ 2, 1 . • Kết luận: do t n−1 0 = −1, 291 < 2, 1 = t = H µ 1
⇒ KHÔNG bác bỏ 0 tức là ≤ µ0 = 130 ; −α
Vậy hàm lượng natri trung bình của hộp ngũ cốc ≤ 130 mg, với mức ý nghĩa α = 0, 02.
■ Tính p-giá trị: gọi T19 là biến ngẫu nhiên có phân phối t-Student với bậc tự do (n − 1) = 19, ta có
p-giá trị = P T19 ≥ t0 = P T19 ≥ −1, 291 = 1 − P T19 < −1, 291 = P T19 < 1, 291 ≈ 0, 85.
Ta thấy p-giá trị = 0, 85 > 0, 02 = α =⇒ KHÔNG bác bỏ H0 =⇒
có cùng kết luận khi sử dụng miền bác bỏ. □
Bài 14 (dựa theo Bài 5.77 - trang 160 giáo trình XSTK).
Một nhà máy sản xuất ống kính interocular có một máy nghiền mới. Máy nghiền mới này được coi
là đủ điều kiện nếu có bằng chứng cho thấy tỷ lệ phần trăm của các thấu kính được đánh bóng có
chứa khuyết tật bề mặt là dưới 2%. Người ta khảo sát một mẫu ngẫu nhiên gồm 300 thấu kính thì
thấy 8 ống kính bị lỗi.
a) Xây dựng và kiểm tra giả thuyết phù hợp để xác định xem máy mới này có đủ điều kiện hay
không, với mức ý nghĩa 0.05, đồng thời tìm p-giá trị.
b) (không bắt buộc) Giải thích thêm cho kết luận trên bằng cách sử dụng khoảng tin cậy cho p. Hướng dẫn:
Ta quan tâm tỷ lệ thấu kính được đánh bóng có chứa khuyết tật (bị lỗi). Đặt
p = tỷ lệ thấu kính được đánh bóng có chứa khuyết tật (bị lỗi). □ Theo đề bài,
" khảo sát một mẫu ngẫu nhiên gồm 300 thấu kính thì thấy 8 ống kính bị lỗi ". 8 8 =⇒ cỡ mẫu n = 300 và tỷ lệ mẫu bp = = . n 300
" Máy nghiền được coi là đủ điều kiện nếu tỷ lệ phần trăm của các thấu kính được đánh bóng
có chứa khuyết tật bề mặt là dưới 2%
kiểm tra giả thuyết phù hợp để xác định xem máy mới này có đủ điều kiện hay không " =⇒ H1 : p < 2% = 0, 02 =⇒ H0 : p ≥ 0, 02 .
( Dấu " = " luôn nằm ở giả thuyết H0 )
( H0 : p = p0 = 0,02 : KHÔNG đủ điều kiện
• Giả thuyết cần kiểm định ; H : đủ điều kiện 1 : p < p0 ( ! ( H Dấu " 0 : p ≥ p0 = 0, 02 = "
luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : p < p0
• Mức ý nghĩa α = 0, 05. 12 Xác suất-Thống kê HKI - 2023-2024 8
• Tính thống kê kiểm định: với cỡ mẫu n = 300 và tỷ lệ mẫu bp = , ta có 300 8 b p − p − 0, 02 z 0 300 0 = s = s ≈ 0, 825 ; p0. 1 − p0 0, 02. 1 − 0, 02 n 300 • Miền bác bỏ: ta sẽ bác bỏ H nếu z0 < −z1 z 1, 645 −α = − 0,95 = − . 0
• Kết luận: do z0 = 0, 825 > −1, 645 = −z1 H p = p −α =⇒ KHÔNG bác bỏ 0 tức là 0 = 0, 02.
(hoặc p ≥ p0 = 0, 02 nếu lúc đầu đặt H0 : p ≥ p0 = 0, 02)
Vậy tỷ lệ thấu kính bị lỗi KHÔNG dưới 2%, nên máy mới KHÔNG đủ điều kiện, mức ý nghĩa α = 5%.
■ Tính p-giá trị: trong trường hợp này ta có
p-giá trị = Φ(z0) = Φ(0, 825) ≈ 0, 7953.
Ta thấy p-giá trị = 0, 7953 > 0, 05 = α =⇒ KHÔNG bác bỏ H0 . □
Bài 15 (dựa theo Bài 5.69 - trang 158 giáo trình XSTK).
Một nhà máy sản xuất chất bán dẫn sản xuất bộ điều khiển sử dụng trong công nghệ động cơ ô tô.
Nhà sản xuất chất bán dẫn lấy mẫu ngẫu nhiên gồm 200 sản phẩm và thấy có chín sản phẩm bị lỗi.
Khách hàng yêu cầu tỷ lệ lỗi của sản phẩm phải dưới 0, 05. Hỏi nhà sản xuất có thể chứng minh khả
năng đáp ứng ở mức chất lượng này cho khách hàng không? Sử dụng mức ý nghĩa 1%. Hướng dẫn:
Ta quan tâm tỷ lệ sản phẩm bị lỗi của nhà sản xuất này. Đặt
p = tỷ lệ sản phẩm bị lỗi của nhà sản xuất này. □ Theo đề bài,
" Lấy mẫu ngẫu nhiên gồm 200 sản phẩm và thấy có chín sản phẩm bị lỗi " 9 9 ⇒ cỡ mẫu n = 200 và tỷ lệ mẫu bp = = . n 200
" Khách hàng yêu cầu tỷ lệ lỗi của sản phẩm phải dưới 0, 05 " =⇒ H ) 1 : p < 0, 05 =⇒ H0 : p ≥ 0, 05
( Dấu " = " luôn nằm ở giả thuyết H0 ( H
• Giả thuyết cần kiểm định 0 : p = p0 = 0, 05
: KHÔNG đáp ứng được yêu cầu ; H
: đáp ứng được yêu cầu của khách hàng 1 : p < p0 ( ! cũng có thể viết H0 : p ≥ p0 = 0, 05
: KHÔNG đáp ứng được yêu cầu H
: đáp ứng được yêu cầu của khách hàng 1 : p < p0
• Mức ý nghĩa α = 1% = 0, 01. 9
• Tính thống kê kiểm định:
với cỡ mẫu n = 200 và tỷ lệ mẫu bp =
, thì thống kê kiểm định: 200 9 b p − p − 0, 05 z 0 200 0 = s = s = −0, 3244 ; p0. 1 − p0 0, 05. 1 − 0, 05 n 200 13 Xác suất-Thống kê HKI - 2023-2024 • Miền bác bỏ: ta sẽ bác bỏ H nếu z0 < −z1 z 2, 325 −α = − 0,99 = − . 0 • Kết luận: do
z0 = −0, 3244 > −2, 325 = −z1 H −α ⇒ KHÔNG bác bỏ 0 tức là p = p0 = 0, 05.
Vậy tỷ lệ lỗi của sản phẩm KHÔNG dưới 0, 05, với mức ý nghĩa α = 1%.
Do đó không đáp ứng yêu cầu khách hàng, với mức ý nghĩa α = 1%. □
Bài 16. Biết trọng lượng X (g/quả) của mỗi quả trứng có phân phối chuẩn. Đem cân 100 quả trứng có kết quả sau: xi 155 160 165 170 175 180 185 ni 5 12 14 25 24 14 6
Cho biết trứng có trọng lượng lớn hơn 170g là trứng loại một.
(a) Tìm khoảng tin cậy 97% cho trọng lượng trứng trung bình. Nếu ta muốn sai số ước lượng
không quá 0, 1g thì cần khảo sát thêm bao nhiêu trứng?
(b) Tìm khoảng tin cậy 98% cho tỷ lệ trứng loại một.
(c) Có ý kiến rằng trọng lượng trứng trung bình lớn hơn 170g/quả. Kiểm định ý kiến trên với mức ý nghĩa 1%.
(d) Có ý kiến cho là ít nhất 65% số trứng thuộc loại một. Kiểm định ý kiến trên với mức ý nghĩa 1%. Hướng dẫn:
Ta quan tâm trọng lượng trứng trung bình. Đặt µ = trọng lượng trứng trung bình. □ Lấy mẫu: cỡ mẫu
n = 5 + 12 + 14 + 25 + 24 + 14 + 6 = 100; • Trung bình mẫu:
155 × 5 + 160 × 12 + ... + 180 × 14 + 185 × 6 x = = 170, 85; n • Phương sai mẫu: 2 2 2 2
155 − x × 5 + 160 − x × 12 + ... + 180 − x × 14 + 185 − x × 6 s2 = ≈ 60, 1288; n − 1 p √
• Độ lệch chuẩn mẫu: s = phương sai mẫu = s2 ≈ 7, 7543;
■ (a) Độ tin cậy 1 − α = 97% = 0, 97 suy ra α = 0, 03.
• Phương sai σ2 không biết, cỡ mẫu n = 100 ≥ 30 (mẫu lớn) ⇒ TH2: sử dụng phân phối Gauss. • Sai số KTC (dung sai): s s 7, 7543 ε = z1 α × √ = z √ √ ≈ 1, 6827 ; − 0,985 × ≈ 2, 17 × 2 n n 100
• Vậy KTC 97% cho doanh thu trung bình một ngày của cửa hàng là
x − ε ≤ µ ≤ x + ε ⇔ 170, 85 − 1, 6827 ≤ µ ≤ 170, 85 + 1, 6827 ⇔ 169, 1673 ≤ µ ≤ 172, 5327 . 14 Xác suất-Thống kê HKI - 2023-2024
■ Để sai số ước lượng không quá 0, 1g thì s s 2 60, 1288
ε ≤ 0, 1 ⇔ z1 α × √ ≤ 0, 1 ⇔ n ≥ z α × = 2, 172 × = 28314, 05. − 1− 2 2 n 2 0, 1 0, 1
■ (b) Gọi p = tỷ lệ trứng loại 1.
Trứng là loại 1 ⇔ có trọng lượng trên 170g. Ta có: cỡ mẫu Y 44
n = 100, số trứng gà loại 1 là Y = 24 + 14 + 6 = 44, nên tỷ lệ mẫu là bp = = ; n 100
• Độ tin cậy 1 − α = 98% = 0, 98 suy ra α = 0, 02. • Sai số KTC (dung sai): v s u s u 44 44 b p × 1 − b p b p × 1 − b p t × 1 − e ε = z = 2, 325 100 100 1 α × = z × ≈ 0, 1154; − 0,99 × 2 n n 100
• Vậy KTC 98% cho tỷ lệ trứng loại 1 là 44 44 b p − e ε ≤ p ≤ b p + e ε ⇔ − 0, 1154 ≤ p ≤
+ 0, 1154 ⇔ 0, 3246 ≤ p ≤ 0, 5554; 100 100
■ (c) " Có ý kiến cho rằng trọng lượng trứng trung bình lớn hơn 170g/quả. =⇒ H ) 1 : µ > 170 =⇒ H0 : µ ≤ 170 .
( Dấu " = " luôn nằm ở giả thuyết H0 ( H0 : µ ≤ µ0 = 170
• Giả thuyết cần kiểm định ; H1 : µ > µ0
• Mức ý nghĩa α = 0, 01.
• Tính thống kê kiểm định:
Phương sai σ2 KHÔNG biết và cỡ mẫu n = 100 ≥ 30 (mẫu lớn) ⇒ dùng phân phối Gauss.
Ta có thống kê kiểm định: x − µ 170, 85 − 170 z 0 0 = √ = √ = 1, 0962 ; s/ n 7, 7543/ 100 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,99 ≈ 2, 325 . 0
• Kết luận: do z0 = 1, 0962 < 2, 325 = z1 H µ ≤ µ −α ⇒ KHÔNG bác bỏ 0 tức là 0 = 170;
Vậy trọng lượng trung bình của trứng ≤ 170 g/quả, với mức ý nghĩa α = 0, 01. ■ (d)
Có ý kiến là "50% số trứng thuộc loại một " =⇒ H ) 0 : p = 0, 5 =⇒ H1 : p = 0, 5
( Dấu " = " luôn nằm ở giả thuyết H0 ( H0 : p = p0 = 0,5
• Giả thuyết cần kiểm định ; H1 : p = p0 44
• Mức ý nghĩa α = 0, 01. b p − p − 0, 5 z 0 100 0 = r = r = = −1, 2 ;
• Tính thống kê kiểm định: p0. 1 − p0 0, 5. 1 − 0, 5 n 100 • Miền bác bỏ: ta sẽ bác bỏ H nếu 0 z0 > z1 α = z − 0,995 ≈ 2, 575 . 2
• Kết luận: do z 0
= 1, 2 < 2, 575 = z1 α =⇒ KHÔNG bác bỏ H0 tức là p = p0 = 0, 5 ; − 2
Vậy tỷ lệ trứng loại 1 là p = 0, 5 , với mức ý nghĩa α = 1%. □ 15 Xác suất-Thống kê HKI - 2023-2024
Bài 17 (dựa theo Bài 5.93 - trang 163 giáo trình XSTK).
Hai loại nhựa phù hợp để sử dụng cho một nhà sản xuất linh kiện điện tử. Sức mạnh chịu sự phá
huỷ của loại nhựa này là quan trọng. Biết σ1 = σ2 = 1 psi. Từ hai mẫu ngẫu nhiên có kích thước
n1 = 10 và n2 = 12, ta có được x1 = 162, 5 và x2 = 155. Công ty sẽ không áp dụng nhựa loại 1 trừ
khi sức chịu phá vỡ trung bình của nó vượt quá nhựa loại 2 một mức hơn 10 psi.
Trên cơ sở thông tin đó, ta có nên sử dụng nhựa loại 1? Sử dụng α = 0, 05 và tìm p-giá trị.
(Hint: " Công ty sẽ không áp dụng nhựa loại 1 trừ khi sức chịu phá vỡ trung bình của nó vượt quá
nhựa loại 2 một mức hơn 10 psi "
⇒ H1 : µ1 − µ2 > D0 = 10 ) Hướng dẫn:
Ta muốn so sánh sức chịu phá vỡ trung bình của nhựa loại 1 so với loại 2. Đặt
µ1 = sức chịu phá vỡ trung bình của loại 1 và
µ2 = sức chịu phá vỡ trung bình của loại 2.
" Công ty sẽ không áp dụng nhựa loại 1 trừ khi sức chịu phá vỡ trung bình của nó vượt quá
nhựa loại 2 một mức hơn 10 psi " =⇒ H ) 1 : µ1 − µ2 > 10 =⇒ H0 : µ1 − µ2 ≤ 10
( Dấu " = " luôn nằm ở giả thuyết H0
( H0 : µ1 − µ2 = D0 = 10 : KHÔNG nên sử dụng nhựa loại 1
• Giả thuyết cần kiểm định ; H
: nên sử dụng nhựa loại 1 1 : µ1 − µ2 > D0 ( ! cũng có thể viết H0 : µ1 − µ2 ≤ D0 = 10 H1 : µ1 − µ2 > D0 • Mức ý nghĩa α = 0, 05 .
• Tính thống kê kiểm định: Lấy mẫu:
nhựa loại 1 : cỡ mẫu n = 10 có trung bình mẫu x = 162, 5;
nhựa loại 2 : cỡ mẫu m = 12 có trung bình mẫu y = 155, Phương sai σ2 = σ2 1 = 12 đã biết = 2 ⇒ dùng phân phối chuẩn.
Ta có thống kê kiểm định: x − y − D 162, 5 − 155 − 10 z 0 0 = r = r ≈ −5, 839 ; σ2 σ2 12 1 12 + 2 + n m 10 12 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,95 = 1, 645 . 0
• Kết luận: do z0 = −5, 839 < 1, 645 = z1 ⇒
KHÔNG bác bỏ H0, tức là µ −α = 1 −µ2 = D0 = 10
(hoặc µ1 −µ2 ≤ 10 nếu lúc đầu đặt H0 : µ1 −µ2 ≤ 10)
Vậy sức chịu phá vỡ trung bình của nhựa loại 1 KHÔNG cao hơn độ sức chịu phá vỡ trung bình của
nhựa loại 2 một mức hơn 10pssi, với mức ý nghĩa α = 1%.
Do đó KHÔNG nên sử dụng nhựa loại 1, với mức ý nghĩa α = 1%.
■ Tính p-giá trị: trong trường hợp này ta có
p-giá trị = 1 − Φ(z0) = 1 − Φ(−5, 839) = Φ(5, 839) ≈ 1.
Ta thấy p-giá trị ≈ 1 > 0, 05 = α =⇒ KHÔNG bác bỏ H0 □ 16 Xác suất-Thống kê HKI - 2023-2024
Bài 18 (dựa theo Bài 5.100 - trang 675 giáo trình XSTK).
Hai chất xúc tác có thể được sử dụng trong một phản ứng hoá học. Mười hai phản ứng được cho sử
dụng chất xúc tác 1, dẫn đến hiệu suất trung bình là 86 (đv: %) và độ lệch chuẩn mẫu là 3. Mười
lăm phản ứng được cho sử dụng chất xúc tác 2, và kết quả là hiệu suất trung bình là 89 với độ lệch
chuẩn mẫu là 2. Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn. Có
bằng chứng để khẳng định rằng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1
hay không? Sử dụng α = 0, 01. (Yêu cầu dùng cả 2 phương pháp: miền bác bỏ và p-giá trị) Hướng dẫn:
Ta muốn so sánh hiệu suất trung bình của chất 1 so với hiệu suất của chất 2. Đặt
µ1 = hiệu suất của chất xúc tác 1 và
µ2 = hiệu suất của chất xúc tác 2.
" Có bằng chứng chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn chất xúc tác 1 hay không? " =⇒ H hay 1 : µ1 < µ2 µ1 − µ2 < 0 =⇒ H0 : µ1 − µ2 ≥ 0 . ( ( H0 : µ1 = µ2 H0 : µ1 − µ2 = D0 = 0
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : µ1 < µ2 H1 : µ1 − µ2 < D0 ( ! ( H Dấu " 0 : µ1 − µ2 ≥ D0 = 0 = "
luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : µ1 − µ2 < D0
■ Mức ý nghĩa α = 0, 01.
■ Tính thống kê kiểm định: • Lấy mẫu:
chất A : cỡ mẫu n = 12 có trung bình mẫu x = 86,
độ lệch chuẩn mẫu s1 = 3;
chất B : cỡ mẫu m = 15 có trung bình mẫu y = 89,
độ lệch chuẩn mẫu s1 = 2; • Phương sai σ2 và σ2 KHÔNG biết với
cỡ mẫu n = 12 < 30 và m = 15 < 30 là cỡ mẫu nhỏ 1 2 =⇒
dùng phân phối t-Student với bậc tự do df = n − 1 + m − 1.
• Dữ kiện đề bài: " Giả sử hiệu suất các phản ứng xấp xỉ phân phối chuẩn với cùng độ lệch chuẩn " =⇒ σ hay phương sai bằng nhau 1 = σ2 σ2 = σ2 1 2 (n − 1).s2 + (m − 1).s2 (12 − 1).32 + (15 − 1).22 =⇒ tính s2 = 1 2 p = = 6, 2. n − 1 + m − 1 12 − 1 + 15 − 1
• Ta có thống kê kiểm định: x − y − D 86 − 89 − 0 t 0 0 = r = r ≈ −3, 111 ; s2 s2 6, 2 6, 2 p + p + n m 12 15 • Miền bác bỏ: ta sẽ bác bỏ H nếu m− − − 0 t0 < −tn−1+ 1 = = = 1 −t12 1+15 1 −t25 −2, 4851 −α 0,99 0,99
(tra bảng phân phối Student để tìm giá trị cho t25 ) 0,99 • Kết luận: do
t0 = −3, 111 < −2, 4851 = −tn−1+m−1 1 ⇒ bác bỏ H0 ⇒ chấp nhận H1 −α
tức là µ1−µ2 < D0 = 0 hay µ1 < µ2.
Vậy chất xúc tác 2 tạo ra hiệu suất trung bình cao hơn hiệu suất của chất xúc tác 1, với mức ý nghĩa α = 1%. ■
Tính p-giá trị: với biến ngẫu nhiên Tn n − 1 + m − 1
−1+m−1 có phân phối Student( ) ta có p-giá trị = P Tn = = 1 − , −1+ − m 1 < t0 P T25 < −3, 111 P T25 < 3 111
tra bảng phân phối Student với bậc tự do df = n − 1 + m − 1 = 25 ta thấy 0.995 + 0.9995
P T25 ≤ 2, 7874 = 0, 995 và P T25 ≤ 3, 7251 = 0, 9995 =⇒ P T25 < 3, 111 ≈ = 0.9975 ; 2 =⇒
p-giá trị = 1 − P T25 < 3, 111 ≈ 1 − 0, 9975 = 0, 0025 . 17 Xác suất-Thống kê HKI - 2023-2024
Bài 19. Để tìm ra liệu một loại huyết thanh mới có kiềm hãm được bệnh bạch cầu hay không, 9
con chuột, tất cả các con đều trong giai đoạn tiến triển của bệnh, được chọn. Năm con chuột nhận
được trị liệu và 4 con không. Thời gian sống, theo năm, từ thời điểm thí nghiệm bắt đầu là như sau Trị liệu 2, 1 5, 3 1, 4 4, 6 0, 9 Không trị liệu 1, 9 0, 5 2, 8 3, 1
Tại mức ý nghĩa 0, 05, huyết thanh có thể được nói là có hiệu quả hay không?
Giả sử hai tổng thể có phân phối chuẩn với các phương sai bằng nhau. Hướng dẫn:
Ta muốn so sánh tuổi thọ trung bình chuột được trị liệu so với KHÔNG trị liệu. Đặt
µ1 = tuổi thọ trung bình nhóm được trị liệu và
µ2 = tuổi thọ trung bình KHÔNG trị liệu.
" huyết thanh có thể được nói là có hiệu quả hay không? " =⇒ H hay 1 : µ1 > µ2 µ1 − µ2 > 0 =⇒ H0 : µ1 − µ2 ≤ 0 . ( ( H0 : µ1 = µ2
H0 : µ1 − µ2 = D0 = 0 : KHÔNG hiệu quả
• Giả thuyết cần kiểm định ⇔ ; H1 : µ1 > µ2 H : có hiệu quả 1 : µ1 − µ2 > D0 ( ! ( H Dấu " 0 : µ1 − µ2 ≤ D0 = 0 = "
luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : µ1 − µ2 > D0
■ Mức ý nghĩa α = 0, 05.
■ Tính thống kê kiểm định: • Lấy mẫu:
có trị liệu : cỡ mẫu n = 5 có trung bình mẫu x = 2, 86, độ lệch chuẩn mẫu √ s1 = 3, 883 ≈ 1, 9705;
KHÔNG trị liệu : cỡ mẫu m = 4 có trung bình mẫu y = 2, 075, độ lệch chuẩn mẫu √ s2 = 1, 3625 ≈ 1, 1673; • Phương sai σ2 và σ2 KHÔNG biết với
cỡ mẫu n = 5 < 30 và m = 4 < 30 là cỡ mẫu nhỏ 1 2 =⇒
dùng phân phối t-Student với bậc tự do df = n − 1 + m − 1.
• Dữ kiện đề bài: " Giả sử hai tổng thể có phân phối chuẩn với các phương sai bằng nhau " =⇒
phương sai bằng nhau σ2 = σ2 1 2 (n − 1).s2 + (m − 1).s2
(5 − 1) × 3, 883 + (4 − 1) × 1, 3625 =⇒ tính s2 = 1 2 = . p ≈ 2, 8028 n − 1 + m − 1 5 − 1 + 4 − 1
• Ta có thống kê kiểm định: x − y − D 2, 86 − 2, 075 − 0 t 0 0 = r = r ≈ 0, 699 ; s2 2, 8028 p s2p 2, 8028 + + n m 5 4 • Miền bác bỏ: ta sẽ bác bỏ H nếu 1+m 1 − − 0 t0 > tn− − = t5 1+4 1 = t7 = 1, 8946 1−α 0,95 0,95
(tra bảng phân phối Student để tìm giá trị cho t7 ) 0,95 • Kết luận: do t n−1+m−1 tức là 0 = 0, 699 < 1, 8946 = t µ 1 ⇒ KHÔNG bác bỏ H0 1 − µ2 ≤ 0. −α
Vậy tuổi thọ trung bình nhóm được trị liệu KHÔNG cao hơn nhóm KHÔNG được trị liệu,
tức là huyết thanh KHÔNG hiệu quả, với mức ý nghĩa α = 5%. □ 18 Xác suất-Thống kê HKI - 2023-2024
Bài 20. Đo chỉ số chất béo trong sữa bò X (tính theo % của 130 con bò lai F1 Hà-Ấn), được bảng số liệu X 3, 3 3, 9 4, 5 5, 1 5, 7 6, 3 6, 9 ni 2 8 35 43 22 15 5
Giả thiết rằng X có phân phối chuẩn.
(a) Hãy ước lượng trung bình chỉ số chất béo trong sữa giống bò lai trên ở độ tin cậy 99%.
(b) Nếu muốn ước lượng trung bình chỉ số chất béo trong sữa của bò lai F1-Hà-Ấn với sai số ước
lượng không quá 0, 15% và độ tin cậy 99% thì phải lấy mẫu tối thiểu bao nhiêu?
(c) Biết rằng trung bình chỉ số chất béo trong sữa của giống bò Hà thuần chủng là 4, 95. Hỏi việc
lai tạo trên có cho trung bình chỉ số chất béo trong sữa bò tăng lên không với mức ý nghĩa 1%? Hướng dẫn:
Ta quan tâm chỉ số chất béo trung bình. Đặt µ = số chất béo trung bình trong sữa bò. Phương sai σ2 KHÔNG biết. □ Lấy mẫu:
cỡ mẫu n = 2 + 8 + 35 + 43 + 22 + 15 + 5 = 130 ; trung bình mẫu
3, 3 × 2 + 3, 9 × 8 + 4, 5 × 35 + ... + 6, 9 × 5 x = ≈ 5, 1462 ; n 2 2 2 và phương sai mẫu
3, 3 − x × 2 + 3, 9 − x × 8 + ... + 6, 9 − x × 5 s2 = ≈ 0, 5895 . n ■ (a) Độ tin cậy 1 − α = 99% = 0.99 =⇒ α = 0.01. • Dung sai ε
(trường hợp phương sai KHÔNG biết và cỡ mẫu lớn n = 130 ≥ 30) được xác định bởi √ √ s s 0, 5895 0, 5895 ε = z1 α . √ = z √ = z √ ≈ 2, 575 × √ ≈ 0, 1734 . − 0.995 . 0.995 . 2 n n 130 130
• Vậy khoảng tin cậy 99% cho chỉ số chất béo trung bình trong sữa bò là x − ε < µ < x + ε ⇔
5, 1462 − 0, 1734 < µ < 5, 1462 + 0, 1734 ⇔ 4, 9728 < µ < 5, 3196 . ■ (b) Độ tin cậy 1 − α = 99% = 0.99 =⇒ α = 0.01.
□ Sai số ước lượng không quá 0, 15 (đv: %), Lưu ý: µ, x, σ
và ε có cùng đơn vị, và trong bài này có cùng đơn vị là %.
Do đó, sai số ước lượng không quá s 0, 15 (đv: %), nghĩa là ε ≤ 0, 15, mà ta có ε = z , nên 1 α . √ − 2 n s s 2 s 2 ε ≤ 0, 15 ⇔ z1 α . √ ≤ 0, 15 ⇔ n ≥ z α . ⇔ n ≥ z − 1− 0,995 . 2 n 2 0, 15 0, 15 √ 0, 5895 2 ⇔ n ≥ 2, 575 × 0,15 ⇔ n ≥ 173, 7224 .
Vậy muốn sai số ước lượng không quá 0, 15 (%) ở độ tin cậy 99%, thì phải quan sát ít nhất 174 con bò. 19 Xác suất-Thống kê HKI - 2023-2024 ■ (c)
" Biết rằng trung bình chỉ số chất béo trong sữa của giống bò Hà thuần chủng là 4, 95.
Hỏi việc lai tạo trên có cho trung bình chỉ số chất béo trong sữa bò tăng lên không " =⇒ H ) 1 : µ > 4, 95 =⇒ H0 : µ ≤ 4, 95
( Dấu " = " luôn nằm ở giả thuyết H0 ( ( H0 : µ = µ0
H0 : µ = µ0 = 4, 95 : KHÔNG tăng
• Giả thuyết cần kiểm định ⇔ ; H1 : µ > µ0 H : có tăng 1 : µ > µ0 ( ! cũng có thể viết H0 : µ ≤ µ0 = 4, 95 H1 : µ > µ0
• Mức ý nghĩa α = 1% = 0, 01.
• Tính thống kê kiểm định: Lấy mẫu: cỡ mẫu √ n = 130 có
trung bình mẫu x = 5, 1462 và độ lệch chuẩn mẫu s = 0, 5895 ;
Phương sai σ2 KHÔNG biết và cỡ mẫu n = 130 ≥ 30 là mẫu lớn ⇒ dùng phân phối chuẩn.
Ta có thống kê kiểm định: x − µ 5, 1462 − 4, 95 z 0 0 = √ = √ √ = 2, 9136 ; s/ n 0, 5895/ 130 • Miền bác bỏ: ta sẽ bác bỏ H
nếu z0 > z1−α = z0,99 = 2, 325 . 0 • Kết luận: do
z0 = 2, 9136 > 2, 325 = z1−α =⇒ bác bỏ H0 =⇒ chấp nhận H , tức là 1 µ > µ0 = 4, 95 ;
Vậy việc lai tạo cho trung bình chỉ số chất béo trong sữa tăng lên, với mức ý nghĩa α = 1%. □
Bài 21 (dựa theo Bài 5.128 - trang 175 giáo trình XSTK).
Một mẫu ngẫu nhiên 500 cư dân trưởng thành của quận Maricopa chỉ ra rằng 385 người ủng hộ
việc tăng giới hạn tốc độ đường cao tốc lên 75 dặm một giờ, và một mẫu khác gồm 400 cư dân của
quận Pima đã chỉ ra rằng 267 người ủng hộ giới hạn tăng lên. Những dữ liệu này có cho thấy có sự
khác biệt trong việc hỗ trợ tăng giới hạn tốc độ cho cư dân của hai quận này hay không? Sử dụng
α = 0, 02, và tính p-giá trị cho kiểm định này là bao nhiêu? Hướng dẫn:
Ta muốn so sánh giữa tỷ lệ dân cư quận Maricopa so với tỷ lệ dân cư quận Pima
trong việc ủng hộ tăng giới hạn tốc độ đường cao tốc.
Đặt p1 = tỷ lệ dân quận Maricopa ủng hộ và
p2 = tỷ lệ dân quận Pima ủng hộ.
" có sự khác biệt trong việc hỗ trợ tăng giới hạn tốc độ cho cư dân của hai quận này hay không? " =⇒
ta muốn so sánh tỷ lệ ủng hộ của cư dân ở 2 quận: là bằng nhau (" = ") hay khác nhau (" = "). =⇒ H hay . 1 : p1 = p2 p1 − p2 = 0 =⇒ H0 : p1 = p2 ( ( H0 : p1 = p2 H0 : p1 − p2 = D0 = 0
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : p1 = p2 H1 : µ1 − µ2 = D0
( Dấu " = " luôn nằm ở giả thuyết H ) 0 20 Xác suất-Thống kê HKI - 2023-2024 ■ Mức ý nghĩa: α = 0, 02.
■ Tính thống kê kiểm định: 385 385 • Lấy mẫu: cư dân quận Maricopa : cỡ mẫu n = 500 có tỷ lệ mẫu bp ; 1 = = n 500 cư dân quận Pima : cỡ mẫu 267 267 m = 400 có tỷ lệ mẫu bp ; 2 = = m 400 385 + 267 385 + 267 652 • Ta có b p = = = , n + m 500 + 400 900 385 267 b p − − 0 z 1 − b p2 − D0 500 400 0 = r r 1 1 = 652 652 1 1 ≈ 3, 42 ; b p. 1 − b p . + . 1 − . + n m 900 900 500 400 • Miền bác bỏ: ta sẽ bác bỏ H nếu 0 z0 > z1 α = z − 0,975 = 1, 96 . 2 • Kết luận: do z 0
= 3, 42 = 3, 42 > 1, 96 = z1 α =⇒ bác bỏ H0, − 2 =⇒
chấp nhận H , tức là µ1−µ2 = D0 = 0; 1
Vậy tỷ lệ ủng hộ của cư dân ở 2 quận là KHÁC NHAU , với mức ý nghĩa α = 5%. ■ Tính p-giá trị: ta có h i h i p-giá trị = 2. 1 − Φ(|z0|) = 2. 1 − Φ(3, 43) ≈ 2. 1 − 0, 9997 = 0, 0006 .
ta thấy p-giá trị = 0, 0006 < 0, 05 = α =⇒ bác bỏ H0. □
Bài 22. Tạp chí Y học New England báo cáo một thử nghiệm để đánh giá hiệu quả của phẫu thuật
trên những người đàn ông được chẩn đoán mắc bệnh J. Một nửa số mẫu ngẫu nhiên của 695 (là 347)
nam giới trong nghiên cứu đã phẫu thuật và 18 người trong số họ cuối cùng đã qua đời vì bệnh J so
với 31 trong số 348 người không phẫu thuật. Có bằng chứng nào cho thấy rằng phẫu thuật giảm tỷ
lệ những người qua đời vì bệnh J hay không? Sử dụng α = 0, 05. Tính p-giá trị.
Hướng dẫn: Ta muốn so sánh tỷ lệ tử vong giữa
nhóm được phẫu thuật so với nhóm KHÔNG phẫu thuật. Đặt
p1 = tỷ lệ tử vong nhóm phẫu thuật và
p2 = tỷ lệ tử vong nhóm KHÔNG phẫu thuật.
" Có bằng chứng nào cho thấy rằng phẫu thuật giảm tỷ lệ những người chết vì bệnh J hay không? " =⇒ H hay . 1 : p1 < p2 p1 − p2 < 0 =⇒ H0 : p1 ≥ p2 ( ( H0 : p1 = p2 H0 : p1 − p2 = D0 = 0
• Giả thuyết cần kiểm định ⇐⇒ ; H1 : p1 < p2 H1 : µ1 − µ2 < D0 ( ! ( H Dấu " 0 : p1 − p2 ≥ D0 = 0
= " luôn nằm ở giả thuyết H ) cũng có thể viết 0 H1 : p1 − p2 < D0 ■ Mức ý nghĩa: α = 0, 05. 21 Xác suất-Thống kê HKI - 2023-2024
■ Tính thống kê kiểm định: 18 18 • Lấy mẫu: nhóm phẫu thuật : cỡ mẫu n = 347 có tỷ lệ mẫu bp ; 1 = = n 347 nhóm KHÔNG phẫu thuật : cỡ mẫu 31 31 m = 348 có tỷ lệ mẫu bp ; 2 = = m 348 18 + 31 18 + 31 49 • Ta có b p = = = , n + m 347 + 348 695 18 31 b p − − 0 z 1 − b p2 − D0 347 348 0 = r r 1 1 = 49 49 1 1 ≈ −1, 916 ; b p. 1 − b p . + . 1 − . + n m 695 695 347 348 • Miền bác bỏ: ta sẽ bác bỏ H nếu z0 < −z1 z 1, 645 −α = − 0,95 = − . 0 • Kết luận: do
z0 = −1, 916 < −1, 645 = −z1 H −α =⇒ bác bỏ 0, =⇒
chấp nhận H , tức là p1 − p2 < 0; 1
Vậy phẫu thuật giúp GIẢM tỷ lệ tử vong , với mức ý nghĩa α = 5%. ■ Tính p-giá trị: ta có p-giá trị
= Φ(z0) = Φ(−1, 916) = 1 − Φ(1, 916) ≈ 1 − 0, 9723 = 0, 0277 .
ta thấy p-giá trị = 0, 0277 < 0, 05 = α =⇒ bác bỏ H0. □
Bài 23. Một người sử dụng một sợi dây thun (hoặc một lò xo) có độ đàn hồi cao để làm một cái
cân đơn giản. Anh ta treo các vật nặng lên dây và ghi lại chiều dài sợi dây cho mỗi lần cân. Dưới đây
là một số dữ liệu cho một số lần cân: Khối lượng g (x) 50 100 150 200 250 300 350 400 Chiều dài mm (y) 37 48 60 71 80 90 102 109
(a) Tìm phương trình hồi quy tuyến tính đơn y theo x. Giải thích ý nghĩa của bβ nhận được. 1
(b) Bạn dự đoán chiều dài sợi dây là bao nhiêu nếu một vật có trọng lượng 375g được treo lên?
(c) Tính hệ số xác định R2. Nhận xét mối liên hệ tuyến tính giữa chiều dài sợi dây và trọng lượng vật nặng.
(d) Tính hệ số tương quan rxy. Hướng dẫn: ■ (a)
Phương trình đường thẳng hồi quy tuyến tính có dạng y = b β0 + b β1 . x .
Công thức tính các hệ số b β và b 1 β0 n X xi . yi − n . x . y S b β xy i=1 và b 1 = = β0 = y − b β1 . x . S n xx X x2 2 x i − n. i=1 22 Xác suất-Thống kê HKI - 2023-2024 n Ta có X •
xi . yi = 50 × 37 + 100 × 48 + 150 × 60 + ... + 400 × 109 = 156150 ; i=1 x1 + x2 + ... + x 50 + 100 + 150 + ... + 400 • x = n = = 225 ; n 8 y1 + y2 + ... + y 37 + 48 + 60 + ... + 109 • y = n = ≈ 74, 625 ; n 8 n X • x2
= 502 + 1002 + 1502 + ... + 4002 = 510000 ; i i=1
thay vào công thức ta được Sxy = 21825 và Sxx = 105000, do đó bβ1 ≈ 0, 2079 và b β0 ≈ 27, 8571 .
Vậy phương trình đường thẳng hồi quy tuyến tính là y = b β . 0 + b
β1 . x = 27, 8571 + 0, 2079 . x
□ Ý nghĩa của hệ số b β :
hệ số b là hệ số góc của phương trình đường thẳng hồi quy. 1 β1 Vì b β1 = 0, 2079 > 0 =⇒
nếu x tăng thì y cũng tăng theo.
Chẳng hạn, nếu x tăng thêm (hoặc giảm đi) 1 đơn vị thì y sẽ tăng thêm (hoặc giảm đi) 0, 2079 đơn vị.
■ (b) Với x = 375, thay vào phương trình đường thẳng hồi quy tìm được ở câu (a) ta được y = b β0 + b
β1.x = 27, 8571 + 0, 2079 × 375 = 105, 8196 .
Vậy nếu treo một vật nặng 375g thì chiều dài của sợi dây sẽ khoảng 105, 8196 mm . SSR
■ (c) Ta có hệ số xác định R2 = (lưu ý 0 ≤ R2 ≤ 1) với SST n X 2 SSR = b β .
1.Sxy ≈ 0, 2079×21825 = 4537, 418, và SST = yi−y = 4547, 875, suy ra R2 ≈ 0, 9975 i=1
Vì R2 gần 1, nên giữa y (chiều dài sợi dây) và x (trọng lượng vật nặng) có mối liên hệ tuyến tính mạng. Sxy 21825
■ (d) Hệ số tương quan rxy được tính bởi rxy = √ = √ ≈ 0, 9987; Sxx × SST 105000 × 4547, 875
Vì rxy > 0 nên giữa x và y có mối tương quan dương, và vì r gần xy
1 nên mối liên hệ tuyến tính thuận giữa x và y mạnh. □
Bài 24. Đo lượng mỡ trong cơ thể của một người là một cách để theo dõi tiến độ kiểm soát
cân nặng, nhưng đo chính xác nó phải sử dụng đến thiết bị X-quang đắt tiền. Thay vào đó, chỉ
số khối cơ thể (BMI) thường được sử dụng làm đại diện cho mỡ cơ thể vì nó dễ đo: BMI = khối lượng (kg) 2 2 / chiều cao (m)
= 703 khối lượng (lb)/ chiều cao (in) . Trong một nghiên cứu
của 250 người đàn ông tại Đại học Bingham Young, cả BMI (biến x) và mỡ cơ thể (biến y) được đo
lường. Các nhà nghiên cứu đã tìm thấy các thống kê tóm tắt sau: n X n X n X n X n X xi = 6322, 28; x2 y y2 x i = 162674, 18; i = 4757, 90; i = 107679, 27; i.yi = 125471, 10; i=1 i=1 i=1 i=1 i=1
(a) Tìm phương trình của đường thẳng hồi quy. Cho biết ý nghĩa của hệ số bβ . 1
(b) Sử dụng đường thẳng hồi quy, hãy tiên đoán lượng mỡ cơ thể (y) của một người đàn ông sẽ được
quan trắc nếu có chỉ số BMI là x = 30.
(c) Tính hệ số xác định R2. Nhận xét về mối liên hệ tuyến tính giữa chỉ số BMI và lượng mỡ cơ thể.
(d) Tính hệ số tương quan rxy. 23 Xác suất-Thống kê HKI - 2023-2024 Hướng dẫn: ■ (a)
Phương trình đường thẳng hồi quy tuyến tính có dạng y = b β0 + b β1 . x .
Công thức tính các hệ số b β và b 1 β0 n X xi . yi − n . x . y S b β xy i=1 và b 1 = = β0 = y − b β1 . x . S n xx X x2 2 x i − n. i=1
Từ dữ kiện đề bài, ta có n = 250
("Trong một nghiên cứu của 250 người đàn ông") n X n X • xi . yi = 125471, 10 và x2i = 162674, 18 ; i=1 i=1 x1 + x2 + ... + x 6322, 28 • x = n = = 25, 289 ; n 250 y1 + y2 + ... + y 4757, 90 • y = n = ≈ 19, 0316 ; n 250
thay vào công thức ta được Sxy = 5147, 996 và Sxx = 2789, 2824, do đó b β1 ≈ 1, 8456 và b β0 ≈ −27, 642 .
Vậy phương trình đường thẳng hồi quy tuyến tính là y = b β . 0 +
bβ1 . x = −27, 642 + 1, 8456 . x
□ Ý nghĩa của hệ số b β :
hệ số b là hệ số góc của phương trình đường thẳng hồi quy. 1 β1 Vì b β1 = 1, 8456 > 0 =⇒
nếu x tăng thì y cũng tăng theo.
Chẳng hạn, nếu x tăng thêm 1 đơn vị thì y sẽ tăng thêm 1, 8456 đơn vị.
■ (b) Với x = 30, thay vào phương trình đường thẳng hồi quy tìm được ở câu (a) ta được y = b β0 + b
β1.x = −27, 642 + 1, 8456 × 30 = 27, 726 .
Vậy nếu chỉ số BMI là 30 thì lượng mỡ cơ thể sẽ khoảng 27, 726 . SSR
■ (c) Ta có hệ số xác định R2 =
(lưu ý 0 ≤ R2 ≤ 1) với SSR = bβ1.S SST
xy ≈ 1, 8456 × 5147, 996 = 9501, 1414 , n X n X và 2 SST = y 2 i − y = y2 n y = 17128, 8204, nên R2 , . i − × ≈ 0 5547 i=1 i=1
Vì 0 < R2 nhưng KHÔNG gần 1, nên giữa y (mỡ cơ thể) và x (chỉ số BMI) có mối liên hệ tuyến tính yếu.
■ (d) Hệ số tương quan rxy (lưu ý −1 ≤ rxy ≤ 1) được tính bởi S 5147, 996 r xy xy = √ = √ ≈ 0, 7448; Sxx × SST 2789, 2824 × 17128, 8204
Vì rxy > 0 nên giữa x và y có mối tương quan dương,
mà r KHÔNG gần 1 nên mối liên hệ tuyến tính thuận giữa xy x và y là yếu. □ - - - Hết - - - 24