



















Preview text:
Tên thành viên Bài tập Đinh Thanh Hương B14/tr15; B13/tr223; B35/567 Nguyễn Khánh Linh
B37/tr46; B77,78/tr90; B34/tr567 Nguyễn Hà Giang B48/tr345; B21,22/tr272; B33/tr567 Phạm Đỗ Tố Uyên B23/272; B29/tr343; B47/426 Phạm Quỳnh Phương
B48/308; B70/310; B27,28,29/519; B10/505 Ngô Hồng Khoa B32/tr44; B23/481 Bài 1.
Bài 14/trang 15: Dựa vào dữ liệu công bố trên Statistical
Abstract of the United States hoặc của Forbes, hoặc bất
kỳ nguồn nào khác, lấy ví dụ về dữ liệu với các loại
thang đo: định danh, thứ bậc, khoảng, tỷ lệ. Bài làm
- Thang đo định danh: Quốc tịch của các tỷ phú trong danh
sách Forbes Billionaires List 2024: Mỹ, Trung Quốc, Ấn Độ, Đức, Việt Nam…
- Thang đo thứ bậc: Thứ hạng của các công ty trong danh sách
Forbes Global 2000: µApple xếp hạng 1, Microsoft hạng 2, JPMorgan Chase hạng 3…
- Thang đo khoảng : Nhiệt độ trung bình năm của các bang ở
Hoa Kỳ (dữ liệu trong Statistical Abstract of the United States):
California 18°C, New York 10°C, Alaska –5°C.
- Thang đo tỷ lệ: Doanh thu của các công ty trong danh sách
Forbes Global 2000: Apple 385 tỷ USD, Microsoft 211 tỷ USD, Amazon 574 tỷ USD. 1
Phân tổ thống kê: Bài 32/tr44: Bài làm
Dữ liệu ban đầu là thời gian David Wise nắm giữ 36 cổ phiếu
(tính từ lúc mua đến lúc bán), được sắp xếp lại như sau:
3, 4, 5, 5, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9,
9, 10, 11, 11, 11, 11, 11, 12, 12, 14, 15
- Giá trị lớn nhất của dãy số (max): 15
- Giá trị nhỏ nhất của dãy số (min): 3
- Số lượng quan sát (n): 36 a) Số tổ k = 6 vì 2k = 64 > 36. max−min −
b) Công thức tính khoảng cách tổ: i = = 15 3 = 2 k 6
Vậy chọn khoảng cách tổ là 2.
c) Giới hạn dưới của tổ đầu tiên nên là Giá trị nhỏ nhất của dãy
số (min) để bao quát hết các giá trị của dãy số. → Giới hạn dưới
của tổ đầu tiên có giá trị là 3. d) Tổ (Thời Lớp
Quan sát nằm trong Tần số Tần suất tương 2 đối gian) (năm) tổ (fi) p = pi (%) 36 1 [3,5) 3,4 2 5.60% 2 [5,7) 5,5,5,5,6,6,6 7 19.40% 3 [7,9) 7,7,8,8,8,8,8,8,8,8 10 27.80% 4 [9,11) 9,9,9,9,9,9,10 7 19.40% 11,11,11,11,11,12, 5 [11,13) 12 7 19.40% 6 [13,15] 14,15 3 8.30% Tổng cộng 36 100%
e) Nhận xét về hình dáng phân phối của dãy số:
Phân bố tập trung ở giữa (đỉnh quanh lớp [7,8] — nhiều cổ
phiếu được giữ khoảng 7–8 năm)
Phân phối có vẻ gần đối xứng (hình chuông) vì tần số cao nhất
là ở giữa (Tổ 3), sau đó giảm dần về hai phía. Tuy nhiên, nó có
xu hướng hơi lệch phải nhẹ do Tổ 5 vẫn giữ tần số khá cao (8
quan sát, 22.2%) so với Tổ 2 (7 quan sát, 19.4%), nghĩa là có
nhiều người nắm giữ cổ phiếu lâu hơn mức trung bình hơn là ngắn hơn mức trung bình. Bài 37/tr46: 3 a,
+) Số tổ k = 6 vì 26 = 64 > 44 −
+) Khoảng cách tổ: i = 265 82 6 = 30,5 -> 35 b,
+) Giới hạn dưới là 70, ta có bảng tần số phân phối: [70, [105, [140, [175, [210, [245,280 105) 140) 175) 210) 245) ) 4 17 14 2 6 1 c,
+) Lớp có tần số cao nhất: 105–140 (17 quan sát, ~41%) →
nhóm mua nhiều nhất nằm trong vùng 105–140 đô la.
+) Phân bố lệch phải: có ít giao dịch lớn (210–280) kéo dài phần đuôi phải. Mức độ Bài 77/tr90: 4
a, Đây là tổng thể (danh sách của tất cả 13 trường công lập được nêu).
b, Số lượng hồ sơ đăng ký trung bình:
x = (22,101 + 19,423 + 1,748 + 44,969 + 16,667 + 39,598 +
24,283 + 67,524 + 36,287 + 3,600 + 20,491 + 16,961 +
12,605) : 13 = 25,065,923 ~ 25,066 (hồ sơ) c, Trung vị
+) Sắp xếp dữ liệu tăng dần:
1,748; 3,600; 12,605; 16,667; 16,961; 19,423; 20,491; 22,101;
24,283; 36,287; 39,598; 44,969; 67,524
+) Trung vị ở vị trí thứ: (13 + 1) / 2 = 14 / 2 = 7
+) Trung vị có giá trị là: 20,491
d, Trong tập hợp này, mỗi con số chỉ xuất hiện một lần nên không có mốt.
e, Trung vị (20491) nằm rất gần với nơi tập trung chính của dữ
liệu. Hầu hết các số đều dao động quanh mức 16.000 đến
24.000. Trung bình (khoảng 25066) cao hơn đáng kể so với
trung vị, chủ yếu do ảnh hưởng của con số 67524. Nên dùng 5
trung vị vì có ngoại lệ rất lớn vì nó cung cấp một ước tính ổn
định hơn và thực tế hơn về giá trị "điển hình" hay "trung tâm"
của tập dữ liệu khi có sự hiện diện của một vài giá trị quá lớn hoặc quá nhỏ.
f. Khoảng biến thiên = max − min = 67,524 − 1,748 = 65,776.
g. Độ lệch chuẩn là căn bậc hai của phương sai:
s= √❑ ≈ 17,307.39 (≈ 17,307). Bài 78_tr90: +) Tính trung bình:
X = (3·14 + 9·42 + 15·58 + 21·28 + 27·8) : 150
= 2,094 : 150 ≈ 13.96 pounds
+) Tính độ lệch chuẩn:
σ2 ≈ [(3−13.96)²·14 + (9−13.96)²·42 + (15−13.96)²·58 +
(21−13.96)²·28 + (27−13.96)² ]: 150 ≈ 36.832 -> σ ≈ 6.07 pounds Xác suất
Bài 13/trang 223: Một phân phối chuẩn có trung bình là
20.0 và độ lệch chuẩn là 4.0.
a. Tính giá trị Z tương ứng với giá trị 25.0.
b. Tỷ lệ trong tổng thể có giá trị nằm trong khoảng từ
20.0 đến 25.0 là bao nhiêu? 6
c. Tỷ lệ trong tổng thể có giá trị nhỏ hơn 18.0 là bao nhiêu? Bài làm x−µ 25−20
a. Giá trị Z tương ứng với giá trị 25.0 là: Z = = = 1,25 σ 4 20−20
b. Giá trị Z tương ứng với x=20.0 là: Z = 4=0
Giá trị Z tương ứng với x=25.0 là: Z = 1,25
Tỷ lệ trong khoảng từ 20.0 đến 25.0 tương ứng với diện tích
dưới đường cong chuẩn từ Z=0 đến Z=1,25 là: 0,3944 . 100 = 39,44% 18−20
c. Giá trị Z tương ứng với x = 18.0 là: Z = 4=−0.5
Tỷ lệ trong tổng thể có giá trị nhỏ hơn 18.0 tương ứng với
diện tích dưới đường cong chuẩn ở bên trái của Z= -0,5
Tỷ lệ trong tổng thể có giá trị nhỏ hơn 18.0 là: 0.385 . 100 = 30,85% Mẫu
Bài 21/tr272: Một tổng thể gồm 3 đơn vị: 1, 2 và 3.
a. Sử dụng cách chọn hoàn lại, liệt kê tất cả các mẫu có
thể với cỡ mẫu bằng 2 và tính trung bình của tất cả các mẫu.
b. Tính trung bình của tổng thể và trung bình của các
trung bình mẫu. Hãy so sánh 2 giá trị này.
c. So sánh độ phân tán của phân phối của tổng thể và
phân phối của các trung bình mẫu.
d. Mô tả hình dạng của 2 phân phối trên. Lời giải:
a. Liệt kê các mẫu và tính trung bình:
Với N=3 và n=2, số lượng mẫu có thể có khi chọn có hoàn lại là Nn=32=9 mẫu Các mẫu Trung bình với cỡ 7 mẫu bằng mẫu 2 (1, 1) (1+1)/2 = 1 (1, 2) (1+2)/2 = 1.5 (1, 3) (1+3)/2 = 2 (2, 1) (2+1)/2 = 1.5 (2, 2) (2+2)/2 = 2 (2, 3) (2+3)/2 = 2.5 (3, 1) (3+1)/2 = 2 (3, 2) (3+2)/2 = 2.5 (3, 3) (3+3)/2 = 3
b. Trung bình của tổng thể và trung bình các trung bình mẫu: Trung bình tổng thể µ = (1 + 2 + 3)/3 = 2
Trung bình của các trung bình mẫu:
µx =¿ 1+ 1.5 + 2 + 1.5 + 2 + 2.5 + 2 + 2.5 + 3)\9 = 2
→ Hai giá trị này bằng nhau
⇒ Trung bình của trung bình mẫu là ước lượng không chệch của trung bình tổng thể.
c. So sánh độ phân tán: Phương sai tổng thể
σ² = [(1−2)² + (2−2)² + (3−2)²]/3 = 0.6667
Phương sai của các trung bình mẫu 8 σ²x =
σ² / n = 0.6667 / 2 = 0.3333
→ Độ phân tán của các trung bình mẫu nhỏ hơn tổng thể.
d. Mô tả hình dạng:
Hình dạng phân phối của tổng thể {1, 2, 3}
●Mỗi giá trị có xác suất xuất hiện như nhau (1/3).
●Đây là một phân phối đều
Hình dạng phân phối của các trung bình mẫu :
Phân phối này có dạng hình chuông, đối xứng, và tập trung dày
đặc ở giá trị trung tâm (2) Mặc dù tổng thể ban đầu có phân
phối đều, phân phối của các trung bình mẫu đã bắt đầu tiệm cận phân phối chuẩn Bài 22/tr272:
Theo thông tin lưu trữ của Đại học Camford, sinh viên
dành trung bình 5.5 giờ mỗi tuần để chơi các môn thể
thao. Độ lệch chuẩn của tổng thể là 2.2 giờ. Dựa trên
một mẫu gồm 121 sinh viên, Healthy Lifestyles Inc. (HLI)
muốn áp dụng Định lý giới hạn trung tâm để đưa ra các
ước lượng khác nhau:
a. Sai số trung bình chọn mẫu.
b. Xác suất để HLI lấy được một mẫu có giá trị trung
bình từ 5 đến 6 giờ.
c. Xác suất để lấy được một mẫu có giá trị trung bình từ
5.3 đến 5.7 giờ.
d. Xác suất để lấy được một mẫu có giá trị trung bình lớn hơn 6.5 giờ. Lời giải:
a. Sai số trung bình chọn mẫu: σ²x = σ/√n = 0.2
b. Xác suất để mẫu có trung bình từ 5 đến 6 giờ:
Z₁ = (5−5.5)/0.2 = −2.5, Z₂ = (6−5.5)/0.2 = 2.5
P(5 ≤ X ≤ 6) = P(−2.5 ≤ Z ≤ 2.5) = 0.9876 − 0.0062 = 0.9814 → 98.14% 9
c. Xác suất để mẫu có trung bình từ 5.3 đến 5.7 giờ:
Z₁ = (5.3−5.5)/0.2 = −1, Z₂ = (5.7−5.5)/0.2 = 1
P(−1 ≤ Z ≤ 1) = 0.8413 − 0.1587 = 0.6826 → 68.26%
d. Xác suất để mẫu có trung bình lớn hơn 6.5 giờ:
Z = (6.5−5.5)/0.2 = 5.0 → P(Z > 5) ≈ 0 → gần như không thể xảy ra.
Bài 23/tr272: Công ty eComputers Inc. vừa mới thiết kế
một mẫu máy tính xách tay mới. Quản lý của công ty
muốn định giá cho mẫu mới này. Hai công ty nghiên cứu
thị trường đã được liên hệ và yêu cầu chuẩn bị một chiến
lược định giá. Công ty nghiên cứu thị trường thứ nhất,
Marketing-Gets-Results đã thử nghiệm máy tính xách
tay bằng cách chọn ngẫu nhiên 50 khách hàng từ tổng
thể người tiêu dùng có kế hoạch mua máy tính mới này
trong năm tới. Công ty nghiên cứu thị trường thứ hai,
Marketing-Reaps-Profits, thử nghiệm máy tính mới với
200 khách hàng đã từng dùng máy tính xách tay. Kết
quả nghiên cứu của công ty nào hữu ích hơn? Giải thích tại sao? Lời giải:
Công ty nghiên cứu thị trường
Marketing-Gets-Results đã tiến
hành khảo sát 50 khách hàng được chọn ngẫu nhiên từ tổng thể
những người có kế hoạch mua máy tính trong năm tới. Công ty
Marketing-Reaps-Profits khảo sát 200 khách hàng đã từng sử dụng máy tính xách tay.
- Mặc dù mẫu khảo sát của Marketing-Reaps-Profits có quy mô
lớn hơn, giúp giảm sai số ngẫu nhiên và tăng độ tin cậy thống
kê, nhưng nhóm được chọn lại không phản ánh đúng đối tượng
mục tiêu của nghiên cứu là những người sẽ mua máy tính trong
tương lai. Những người đã từng sử dụng máy tính có thể có kỳ
vọng, kinh nghiệm hoặc thói quen khác biệt so với nhóm khách
hàng tiềm năng, dẫn đến sai lệch trong việc đánh giá mức giá chấp nhận được. 10