Ôn tập môn xác suất thống kê| Đại học Kinh tế Quốc Dân
Đại học Kinh tế Quốc dân với những kiến thức và thông tin bổ ích giúp các bạn định hướng và họp tập dễ dàng hơn. Mời bạn đọc đón xem. Chúc bạn ôn luyện thật tốt và đạt điểm cao trong kì thi sắp tới
Môn: Xác suất thống kê (XSTK021)
Trường: Đại học Kinh Tế Quốc Dân
Thông tin:
Tác giả:
Preview text:
Bài 1. Cho mẫu về độ tuổi người ng tuy ứ ển ở m t công ty ộ Độ tuổi Tần số 20 – 29 20 30 – 39 25 40 – 49 35 50 – 59 20
Tính được trung bình mẫu là 40; phương sai mẫu là 105,8081. Giả thiết tuổi của các ứng viên phân
phối Chuẩn. Lấy độ tin cậy 95%. a) Ước lượ ằ ng b ả
ng kho ng tin cậy đối xứng tuổ ủ i trung bình c a các ứng viên.
b) Ước lượng độ lệch chuẩn tối đa của tuổi của các ứng viên. Hướ ẫ ả ng d n gi i
Gọi X là tuổi của một ứng viên bất kì thì X ~ N(μ; σ2)
Mẫu có 𝑛 𝑛 = 100; 𝑥𝑥 = 40; 𝑠𝑠2 = 105,8081 → 𝑠𝑠 = 10,286. Với 1 – α = 0,95 → α = 0,05
a) Tuổi trung bình của tất cả c
ác ứng viên là μ. Cần ước lượ ả
ng kho ng tin cậy đối xứng S ( − S n 1) (n 1 − ) X − t < µ < + (𝑛𝑛−1) (99) / α 2 X t /α2 ; với 𝑡𝑡 = 𝑡𝑡 = 1,96 𝛼𝛼 0 n n /2 ,025 Thay s ta có: 37,984 < ố μ < 42,016
b) Độ lệch chuẩn mẫu của tuổi của các ứng viên là σ. Cần ước lượng tối đa σ2 2 (n −1) 2 S σ <
; với 𝜒𝜒2(𝑛𝑛−1) 2(99) 2( = 𝜒𝜒 = 77,05 n 1 − ) χ 1−𝛼𝛼 0,95 1−α Thay s ố thì σ2 < 135,951 → σ < 11,66
Bài 2. Điều tra chi tiêu hàng tháng (triệu đồng) của 100 h
ộ gia đình thì có bảng s ố liệu sau: Chi tiêu 8 10 12 14 16 Số h ộ gia đình 5 15 30 30 20
Tính được trung bình mẫu là 12,9; phương sai mẫu là 5,0404. Giả thiết chi tiêu hàng tháng của ộ h
gia đình phân phối Chuẩn. Lấy độ tin cậy 90%.
a) Chi tiêu trung bình của hộ gia đình tối thiểu là bao nhiêu?
b) Ước lượng tỷ lệ hộ gia đình chi tiêu từ 10 triệu đồng/tháng trở xuống. Hướ ẫ ả ng d n gi i
Gọi X là chi tiêu hàng tháng của một hộ gia đình bất kì thì X ~ N(μ; σ2)
Mẫu có 𝑛 𝑛 = 100; 𝑥𝑥 = 12,9; 𝑠𝑠2 = 5,0404 → 𝑠𝑠 = 2,245. Với 1 – α = 0,9 → α = 0,1
a) Chi tiêu trung bình của tất cả c
ác hộ gia đình l à μ. Cần ước lượng khoảng tin cậy tối đa S (n 1 − ) µ < X + t ; với (𝑛𝑛−1) (99) α 𝑡𝑡𝛼𝛼 = 𝑡𝑡0 = 1,282 n ,1 Thay s
ố thì μ < 13,188
b) Gọi p là tỷ lệ hộ gia đình chi tiêu từ 10 triệu đồng/tháng trở xu ng ố 5+15 𝑝𝑝 là tỷ lệ ng trên m tương ứ ẫu thì 𝑝𝑝 = = 0,2 100 � � Áp dụ ứ ng công th c: 𝑝𝑝�(1−𝑝𝑝 �) 𝑝𝑝�(1−𝑝𝑝 �)
𝑝𝑝 − 𝑧𝑧𝛼𝛼
< 𝑝 𝑝 < 𝑝𝑝 + 𝑧𝑧𝛼𝛼 2 √𝑛 𝑛 2 √𝑛 𝑛
với 𝑧𝑧𝛼 𝛼= 𝑧𝑧0,05 = 1,645 2
Thay s ta có: 0,1342 < p < 0,2658. ố
Bài 3. Hỏi ngẫu nhiên 200 sinh viên thì có 90 người đi làm thêm ngoài giờ. Lấy α = 0,05.
a) Hãy ước lượng bằng khoảng tin cậy đối xứng tỷ lệ sinh viên đi làm thêm ngoài giờ.
b) Muốn sai số của ước lượng ở câu (a) chỉ còn một nửa thì phải hỏi thêm bao nhiêu sinh viên Hướ ẫ ả ng d n gi i
Gọi p là tỷ lệ sinh viên đi làm thêm ngoài giờ; f là tỷ lệ ng trên m tương ứ ẫu 90
𝑛 𝑛 = 200; 𝑝𝑝 = = 0,45; 𝑧𝑧 200
𝛼𝛼/2 = 𝑧𝑧0,025 = 1,96 a)
�𝑝𝑝�(1−𝑝�𝑝) �𝑝𝑝�(1−𝑝𝑝 �)
Ước lượng đối xứng p: 𝑝𝑝 − 𝑧𝑧𝛼𝛼
< 𝑝 𝑝 < 𝑝𝑝 + 𝑧𝑧𝛼𝛼 2 √𝑛 𝑛 2 √𝑛 𝑛
Thay s : 0,381 < p < 0,519 ố � 𝑝 ( 𝑝
1−𝑝�𝑝)𝑧𝑧2𝛼𝛼
b) Áp dụng công thức: 𝑛𝑛 2 0 ≥ 𝜀𝜀2 0 �
Sai số giảm còn một nửa nên 𝑝𝑝 (1−𝑝𝑝 �) 𝜀𝜀0 = 𝑧𝑧 200 800 2√𝑛 𝑛
𝛼𝛼/2. Khi đó 𝑛𝑛0 ≥ 4𝑛𝑛 = 4. = Nếu 𝑛𝑛 𝑙𝑙 𝑜 𝑜 ≥ 801,2 => ấ𝑦𝑦 𝑛𝑛 0 = 802
Phải hỏi thêm 800 – 200 = 600 sinh viên. Bài 4. Cho t ng th ổ
ể với biến ngẫu nhiên gốc X. Từ t ng th ổ
ể lập hai mẫu ngẫu nhiên độc lập có kích thước ẫ
m u lần lượt là 10 và 16, trung bình mẫu lần lượt là 𝑋𝑋 �1 và 𝑋𝑋
�2. Cho biết trong hai trung bình
mẫu này thì ước lượng nào hiệu quả hơn cho trung bình tổ ng thể? Hướ ẫ ả ng d n gi i
Tổng thể với biến ngẫu nhiên gốc X, trung bình tổng thể là 𝜇𝜇, phương sai tổng thể là σ2
Theo tính chất c a trung bình m ủ ẫu thì 𝜎𝜎2 𝜎𝜎2 𝐸𝐸(�𝑋𝑋 � � � 1) = 𝐸𝐸(𝑋𝑋 2) = 𝜇𝜇; 𝑉𝑉( 1 𝑋𝑋 ) = ; 𝑉𝑉(𝑋𝑋 10 2) = 16 Vậy 𝑋𝑋 � � � 1 và 𝑋𝑋
�2 là các ước lượng không chệch của m và 𝑉𝑉(𝑋𝑋 1) > 𝑉𝑉(𝑋𝑋 2) nên 𝑋𝑋
�2 hiệu quả hơn 𝑋𝑋 �1.
Bài 5. Theo dõi ngẫu nhiên 100 chuyến xe chạy trên một đoạn đường người ta tính được mức tiêu
hao nhiên liệu bình quân là 24,5 lít; độ lệch chuẩn là 1,28 lít. Với mức ý nghĩa 5%, có thể cho rằng
mức tiêu hao nhiên liệu bình quân của các chuyến xe chạy trên đoạn đường này là trên 20 lít được
không? Biết rằng m c tiêu hao nhiên li ứ
ệu tuân theo quy luật phân phối Chuẩn. Gi i ả .
Gọi X là “Mức tiêu hao nhiên liệu”. Theo giả thiết X có phân phối Chuẩn, X ~ N(µ; σ2)
Trong đó µ là kỳ vọng của X và là mức tiêu hao nhiên liệu trung bình của các chu ế y n xe chạy trên đoạn đường này. Theo yêu c
ầu đề bài, ta kiểm định giả thuyết: H : μ = 20 0 H : μ > 20 1
Trong đó giả thuyết H1 thể hiệ ậ
n nh n định ở đề bài là đúng. ( − µ ) Tiêu chuẩn kiểm định 0 = X n T ; miền bác bỏ H ( 1) 0: = { : n W T T > t − α α } S (x − µ ) n (24,5 − 20) 100 Với mẫu cụ thể trên, 0 T = = = 3,906 qs s 1, 28
Ta xác định giá trị tới hạn: (n 1 − ) (99) t = t ≈ z
= 1,645 ⇒ W = T : T > 1,645 α 0,05 0,05 α { }
Do đó Tqs > 1,645, T ∈W bác b ỏ H
y có th nói mức tiêu hao nhiên liệu bình quân của các qs α 0. Như vậ ể
chuyến xe chạy trên đoạn đường này là trên 20 lít
Bài 6. Điều tra ngẫu nhiên 200 hộ gia đình ở tỉnh A thì tính được mức chi cho y tế bình quân là 10,89
triệu đồng/năm, độ lệch chuẩn mẫu là 1,25 triệu đồng/năm. Biết rằng mức chi cho y tế của h ộ gia
đình có phân phối Chuẩn. Với mức ý nghĩa 5%, có thể nói mức chi cho y tế của ộ h gia đình ở tỉnh A
đã ổn định hơn so với trước đây hay không, nếu biết trước đây độ phân tán của mức cho cho y tế của
các hộ gia đình tỉnh này là 2 (triệu đồng/năm)2 Gi i ả .
Gọi X là “Mức cho cho y tế trong năm của hộ gia đình ở tỉnh ”.
A Theo giả thiết X có phân phối
Chuẩn, X ~ N(µ; σ2) Trong đó σ2 phân tán c là phương sai, đo độ ủa m c c ứ
ho cho y tế. Kiểm định cặp giả thuyết: 2 H : σ = 2 0 2 H : σ < 2 1
Trong đó giả thuyết H0 nghĩa là ý kiế
n sai, H1 là ý kiến đúng. 2 (n −1)S Tiêu chuẩn kiểm định 2 χ = ; Miền bác bỏ H = χ χ < χ α { 2 2 2( 1) : n W − 2 σ 0: 1−α } 0 2 2 (n −1) s 199 1 × , 25
Với mẫu cụ thể trên ta tính được: 2 χ = = =155, 46 qs 2 σ 2 0
Tìm được giá trị tới hạn: 2( n 1 − ) 2(199) χ = χ
=168,3 ⇒ W = χ χ < −α α { 2 2 : 168,3 1 0,95 } Do đó 2 χ > 168,3: bác b
ỏ H0, có thể nói ý kiến cho rằ độ ng ổn định của ứ m c chi cho y tế của h ộ gia qs
đình tỉnh A đã tăng hơn trước đây là đúng.
Bài 7. Điều tra ngẫu nhiên 150 hành khách đi máy bay của hãng B thì thấy có 10 khách đã từng bị
thất lạc hành lý. Với mức ý nghĩa 5%, hãy kiểm định về ý kiến cho rằng tỷ lệ khách của hãng B bị
thất lạc hành lý là trên 5%. Gi i ả .
Đặt p là tỷ lệ hành khách đi máy bay của hãng B bị thất lạc hành lý. Đề bài yêu cầu kiểm định p có
lớn hơn 0,05 hay không, cặp giả thuyết là: H : p = , 0 05 0 H : p > , 0 05 1 Tiêu chuẩn �− 𝑝 𝑝 𝑝 𝑝 𝑍𝑍 0 𝑞𝑞𝑞𝑞 =
�𝑝𝑝0(1−𝑝𝑝0)/𝑛𝑛
Miền bác bỏ W = { Z : Z > z α } α
Tỷ lệ hành khách bị thất lạc hành lý trong mẫu 10 𝑝𝑝 = = 0,066 150
Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định: (0, 066 − 0, 05) Z = = 0,899 qs 0, 05(1 0 − , 05) /150
Với mức ý nghĩa cụ thể: z = z
=1,645 ⇒W = Z : Z >1,645 α 0,05 α { }
Do đó Zqs <1,645 chưa đủ cơ sở bác bỏ H0. Như vậy chưa thể nói tỷ lệ hành khách đi máy bay hãng
B bị thất lạc hành lý là trên 5%.
Bài 8. Tuổi thọ sản phẩm do m t
ộ doanh nghiệp sản xuất ra có phân phối Chuẩn. Qua quá trình theo dõi tuổi th c ọ ủa một s s
ố ản phẩm được sử dụng người ta có s ố liệu sau: Tuổi thọ (giờ) 320 350 390 400 450 Số sản phẩm 12 25 35 20 8
Có trung bình mẫu là 378,4 (giờ), độ lệch chuẩn mẫu là 34,25 (giờ) .
(a) Với mức ý nghĩa 5% có thể nói tuổi thọ trung bình của sản phẩm là dưới 400 giờ?
(b) Trước đây độ phân tán của tuổi thọ sản phẩm (đo bằng độ lệch chuẩn) là 25 giờ. Với mức ý
nghĩa 5%, có thể nói độ phân tán của t ổ
u i thọ sản phẩm đã tăng lên?
(c) Phải chăng tỷ lệ sản phẩm tuổi thọ trên 400 giờ là dưới 10%. Kết luận với mức ý nghĩa 5%. Gi i ả :
Gọi X là “Tuổi thọ của sản phẩm”. Theo giả thiết X có phân phối Chuẩn, X ~ N(µ ; σ2) Trong đó µ là k
ỳ vọng của X và là tuổi thọ trung bình của sản phẩm; σ2 là phương sai, đo độ phân tán
của tuổi thọ sản phẩm.
Ở đây cả µ và σ2 đều chưa biết.
(a) Theo yêu cầu đề bài ta kiểm định xem tuổi thọ trung bình có nhỏ hơn 400 giờ hay không, với α =
0,05. Cặp giả thuyết là: H µ 0 : = 400 H µ 1 : < 400
Trong đó giả thuyết H1 thể hiệ ậ
n nh n định ở đề bài là đúng. ( − µ ) Tiêu chuẩn kiểm định 0 = X n ( 1) T ; miền bác ỏ b H0: = { T : − T < − n Wα t α } S (x − µ ) n (378, 4 − 400) 100 Với mẫu cụ thể trên, 0 T = = = 6, − 306 qs s 34,2515 Ta xác định gi ị á tr tới hạn: ( − n 1) 99 −t = −t ≈ −u = 1
− ,645 ⇒W = T : T < −1,645 α 0,05 0,05 α { }
Do đó Tqs < – 1,645: bác b
ỏ H0. Như vậy có thể nói tuổi th
ọ trung bình của sản phẩm là dưới 400 giờ.
(b) Độ phân tán của tuổi thọ sản phẩm tăng lên tức là phương sai của tuổi thọ sản phẩm lớn hơn so với trước. Câu ỏ
h i kiểm định giả thuyết σ2 lớn hơn 252, với α = 0,05 C . ặp giả thuyết là: 2 2 H : σ = 25 0 2 2 H : σ > 25 1
Trong đó giả thuyết H0 nghĩa là ý kiế
n sai, H1 là ý kiến đúng. 2 (n −1) Tiêu chuẩn kiểm định 2 χ = S
; Miền bác bỏ H W = χ χ > χ n α { 2 2 2( 1) : − 2 σ 0: α } 0 2 (n−1) s 99×1173,172
Với mẫu cụ thể trên ta tính được: 2 χ = = =185,83 qs 2 σ 625 0
Tìm được giá trị tới hạn: 2( n 1−) 2(99) χ = χ
=124,34 ⇒ W = χ χ > α α { 2 2 : 124,34 0,05 } Do đó 2 χ > 124,34: bác b
ỏ H0, có thể nói ý kiến cho rằng tuổi th
ọ sản phẩm có độ phân tán tăng qs
hơn trước đây là đúng.
(c) Đặt p là tỷ lệ sản phẩm tu i
ổ thọ trên 400 giờ. Đề bài yêu cầu kiểm định p có nhỏ hơn 0,1 hay
không, cặp giả thuyết là: H0 : p = 1 , 0 H1 : p< 1 , 0 Tiêu chuẩn �− 𝑝 𝑝 𝑝 𝑝 𝑍𝑍 0 𝑞𝑞𝑞𝑞 =
�𝑝𝑝0(1−𝑝𝑝0)/𝑛𝑛
Miền bác bỏ W = { Z : Z < − z α α } ∧ 8
Tỷ lệ sản phẩm tuổi thọ trên 400 giờ trong mẫu p = = 0,08 100
Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định: (0,08− 0,1) Z = = − 0,667 qs 0,1(1− 0,1) /100
Với mức ý nghĩa cụ thể: −z = −z
= −1,645⇒ W = Z : Z < −1,645 α 0,05 α { }
Do đó Zqs > –1,645 chưa đủ cơ sở bác bỏ H0 . Như vậy chưa thể nói tỷ lệ sản phẩm tuổi thọ trên 400 giờ là dưới 10%.
Bài 9. Điều tra thu nhập của 50 công nhân được chọ ẫ
n ng u nhiên ở khu công nghiệp A người ta tính
được thu nhập trung bình năm là 82,5 triệu, độ lệch chuẩn mẫu là 3,5 triệu. Ơ khu công nghiệp B,
điều tra ngẫu nhiên thu nhập c a 100 công nhân th ủ
ì thấy thu nhập trung bình năm là 95 triệu, độ lệch
chuẩn là 5,2 triệu. Biết rằng thu nhập c a
ủ công nhân tuân theo quy luật Chuẩn. Với mức ý nghĩa 5%,
có thể cho rằng thu nhập trung bình của công nhân ở khu công nghiệp B thự ự c s cao hơn ở khu công nghiệp A hay không? Giải
Đặt X1 là “Thu nhập trong năm của công nhân khu công nghiệp A”,
X2 là “Thu nhập trong năm của công nhân khu công nghiệp B”
Theo giả thiết X1 và X2 đều có phân phối chuẩn, 2 2
X N (µ , σ ), X N (µ ,σ ) , trong đó µ ,µ 1 1 1 2 2 2 1 2
tương ứng là thu nhập trung bình ở 2 khu công nghiệp H : µ = µ Theo yêu c
ầu đề bài ta kiểm định cặp giả thuyết: 0 1 2 µ < µ 1 H : 1 2 −
Tiêu chuẩn kiểm định là: 1 X X3 T = , miền bác b
ỏ W = T T < − . α { : α z } 2 2 S1 S3 + 1 n 3 n x − x 82,5 − 95
Với thông tin của mẫu cụ thể, ta có 1 2 ⇒ T = = = −17, 41 qs 2 2 2 2 s s 3,5 5, 2 1 2 + + n n 50 100 1 2
Ta có −z = −z = − ⇒T ∈W → α 1,645 0,05 bác bỏ H0 qs α
Vậy mới mức ý nghĩa 5% có thể cho thu nhập trung bình theo năm của công nhân khu công nghiệp
A thực sự thấp hơn so với khu công nghiệp B.
Bài 10. Điều tra ngẫu nhiên 200 h
ộ gia đình ở tỉnh A thì thấy có 185 hộ sử ụ
d ng truyền hình cáp. Ở
tỉnh B khi điều tra 300 hộ thì thấy có 275 hộ dùng truyền hình cáp. Với mức ý nghĩa 5% có thể cho
rằng tỷ lệ hộ dùng truyền hình cáp ở hai tỉnh này là thực sự khác nhau hay không? Gi i ả . Đặt p là “T l ỷ ệ h dùng truy ộ
ền hình cáp của tỉnh A” 1 p là “T l ỷ ệ h dùng truy ộ
ền hình cáp của tỉnh B” 2 Theo yêu cầu của ề
đ tài, chúng ta kiểm định cặp giả thuyết là: H = 0 : 1 p p2 H ≠ 1 : p1 p2 ∧ ∧ − Tiêu chuẩn 1 p p2 Z = 1 1 p(1− p ) + 1 n 2 n
Miền bác bỏ W = Z > α z α 2 ∧ 185 ∧ 275
Trong các mẫu ta tính được p = = 0,925; p = = 0,9166 1 2 200 300 185 + 275
n = 200; n =300; p = =0,92; 1 2 200 + 300
Từ đó ta tính được giá trị quan sát của tiêu chuẩn kiểm định:
( 0, 925 − 0, 9166) Z = = 0,339 qs 1 1
0,92(1 −0,92 )( + ) 200 300
Với mức ý nghĩa cụ thể: z = z = 1,96 ⇒ W = Z > 1, 96 / α 2 0,025 α { }
Z ∈W , chưa đủ cơ sở bác bỏ H0. Như vậy chưa thể nói rằng tỷ lệ hộ gia đình sử dụng truyền hình qs α
cáp ở 2 tỉnh A và B là th c ự sự khác nhau.
Bài 11. Thống kê về mức chi tiêu của 200 hộ gia đình ở một khu vực cho nhu cầu giáo dục trong một
năm người ta tính được hệ số ấ b t ố
đ i xứng trong mẫu là 0,88 và hệ số ọ
nh n là 3,15. Với mức ý nghĩa
5%, có thể nói mức chi cho giáo dục trong năm của hộ gia đình ở khu v c
ự này tuân theo quy luật
phân phối Chuẩn hay không? Giải
Ta kiểm định cặp giả thuyết thống kê:
H0: Chi cho giáo dục trong năm của hộ gia đình phân phối Chuẩn
H1: Chi cho giáo dục trong năm của hộ gia đình không có phân phối chuẩn 2 2 , 0 88 (3 ,15 −3 )
Giá trị quan sát: JB = 200. + = 26 qs 6 24 Miền bác bỏ: 2 2 2 2 2 2 2 W = χ > χ = χ > χ = χ > 5 99 α { ( ) α } { ( ) , , 0 05 } { } Do đó 2 χ ∈W qs
α nên đủ cơ sở bác bỏ H0. Vậy với mức ý nghĩa 5%, ta không thể cho rằng Chi cho
giáo dục trong năm của hộ gia đình có phân phối chuẩn