



















Preview text:
NỘI DUNG I. Phân tổ thống kê 1. Bài 17 trang 3 7
Bảng tần số phân phối dưới đây ghi lại quãng đường bay của các nhân viên ở
Brumley Statistical Consulting Inc. khi đi công tác trong quý gần đây (Đơn vị tính: nghìn mile). Quãng đường bay Số nhân viên (nghìn mile) (người) Từ 0 đến dưới 3 5 Từ 3 đến dưới 6 12 Từ 6 đến dưới 9 23 Từ 9 đến dưới 12 8 Từ 12 đến dưới 15 2 Tổng 50
a. Có bao nhiêu nhân viên đi công tác trong quý?
b. Trị số giữa của tổ đầu tiên là bao nhiêu?
c. Vẽ biểu đồ tần số phân phối.
d. Trong đa giác tần số, toạ độ của điểm đầu tiên là bao nhiêu ? e. Vẽ đa giác tần số.
f. Nhận xét về quãng đường bay dựa vào hai biểu đồ trên. Lời giải
a. Có bao nhiêu nhân viên đi công tác trong quý?
Có 50 người đi công tác trong quý
b. Trị số giữa của tổ đầu tiên là bao nhiêu?
Trị số giữa của tổ đầu tiên là: 0 + 3 = 1.5 (nghìn mile) 2
c. Vẽ biểu đồ tần số phân phối. 3
d. Trong đa giác tần số, toạ độ của điểm đầu tiên là bao nhiêu?
Trong đa giác tần số, tọa độ của điểm đầu tiên có:
- Hoành độ (quãng đường bay) là trị số giữa của tổ đầu tiên: 𝑥 = 1.5
- Tung độ (số nhân viên): 𝑦 = 5 e. Vẽ đa giác tần số.
Quãng đường bay (nghìn mile) Trị số giữa Số nhân viên (người) Từ 0 đến dưới 3 1.5 5 Từ 3 đến dưới 6 4.5 12 Từ 6 đến dưới 9 7.5 23 Từ 9 đến dưới 12 10.5 8 Từ 12 đến dưới 15 13.5 2 Tổng 50
f. Nhận xét về quãng đường bay dựa vào hai biểu đồ trên. 4
Khi đi công tác trong quý gần đây, trong 50 nhân viên ở Brumley Statistical
Consulting Inc. Có gần một nửa số nhân viên bay được quãng đường nằm trong khoảng
6,000 đến 9,000 miles. Có 5 nhân viên bay quãng đường ít hơn 3,000 miles và 2 nhân
viên bay quãng đường nhiều hơn 12,000 miles. 2. Bài 29 trang 44
Dưới đây là dữ liệu về thời gian đi làm từ nhà đến công ty của 25 nhân viên (Đơn vị tính: phút) 28 25 48 37 41 19 32 26 16 23 23 29 36 31 26 21 32 25 31 43 35 42 38 33 28
a. Khi xây dựng bảng tần số phân phối, nên lựa chọn số tổ là bao nhiêu?
b. Nên lựa chọn khoảng cách tổ bằng bao nhiêu?
c. Giới hạn dưới của tổ đầu tiên có giá trị bằng bao nhiêu?
d. Xây dựng bảng tần số phân phối.
e. Nhận xét về hình dáng phân phối của dãy số. Lời giải
a. Khi xây dựng bảng tần số phân phối, nên lựa chọn số tổ là bao nhiêu?
Ta có số quan sát n = 25, áp dụng quy tắc 2k > 𝑛, ta có: 2k>25
⇒ Số tổ k = 5 (vì 16 < 25 và 25 = 32 > 25)
b. Nên lựa chọn khoảng cách tổ bằng bao nhiêu? xmax − xmin 48 − 16 32 h = = = = 6.4 ≈ 7 k 5 5
c. Giới hạn dưới của tổ đầu tiên có giá trị bằng bao nhiêu? Đáp án: 15
d. Bảng tần số phân phối
Thời gian đi làm của nhân viên (đơn vị: phút) Tần số Từ 15 đến 22 3 Từ 22 đến 29 8 Từ 29 đến 36 7 Từ 36 đến 43 5 Từ 43 đến 50 2 5
e. Nhận xét về hình dáng phân phối của dãy số
Dựa trên đồ thị, ta có thể rút ra một số nhận xét sau:
- Hình dạng phân phối: Đồ thị cho thấy một phân phối lệch trái. Điều này có nghĩa là
phần lớn nhân viên có thời gian đi làm tương đối ngắn (dưới 30 phút), và chỉ có một số
ít nhân viên có thời gian đi làm dài hơn.
- Giá trị trung bình: Giá trị trung bình của thời gian đi làm có thể ước tính nằm ở khoảng
từ 22 đến 29 phút, dựa vào vị trí đỉnh của đồ thị.
II. Mức độ hiện tượng kinh tế - xã hội 1. Bài 68 trang 89
Trudy Green là nhân viên của True-Green Lawn Company, chịu trách nhiệm giới
thiệu dịch vụ chăm sóc cỏ qua điện thoại. Dữ liệu dưới đây là số cuộc hẹn mà cô ấy đã
thực hiện trong 25 giờ qua. Tính trung bình và trung vị về số cuộc hẹn mà cô ấy đã thực
hiện mỗi giờ. Viết một báo cáo tóm tắt những kết quả thu được từ phân tích trên. 9 5 2 6 5 6 4 4 7 2 3 6 3 4 4 7 8 4 4 5 5 4 8 3 3 Lời giải (1) Tính trung bình
Sử dụng công thức tính trung bìn , h ta có: 6 ∑ x 105 x = = = 4.2 n 25 (2) Tính trung vị Ta có bảng sắp xếp 2 2 3 3 3 3 4 4 4 4 4 4 4 5 5 5 5 6 6 6 7 7 8 8 9
Vì số đơn vị = 25, là số lẻ nên ta có:
Vị trí trung vị = n+1 = 13 ⇒ Me = 4 2
(3) Viết báo cáo tóm tắt kết quả trên
Tổng số cuộc hẹn: 105 cuộc hẹn
Trung bình mỗi giờ Trudy Green thực hiện 4.2 cuộc gọi 2. Bài 85 trang 9 2
Gần đây, Bidwell Electronics Inc. đã khảo sát một mẫu gồm các nhân viên về
quãng đường họ đi làm hàng ngày. Tính trung bình và độ lệch chuẩn dựa vào thông tin trong bảng dưới đây. Quãng đường (mile) Tần số M Từ 0 đến dưới 5 4 2.5 Từ 5 đến dưới 10 15 7.5 Từ 10 đến dưới 15 27 12.5 Từ 15 đến dưới 20 18 17.5 Từ 20 đến dưới 25 6 22.5 Lời giải Quãng đường Tần số M fM Từ 0 đến dưới 5 4 2.5 10 Từ 5 đến dưới 1 0 15 7.5 112.5 Từ 10 đến dưới 15 27 12.5 337.5 Từ 15 đến dưới 20 18 17.5 315 Từ 20 dến dưới 25 6 22.5 135 Tổng 70 910 7
Sử dụng công thức tính trung bình (3 – 11), ta có: ∑ fM 910 x = = = 13 n 70
Vậy trung bình một nhân viên đi làm là 13 miles. Quãng đường Tần số M fM M - 𝑥 (𝑀 − 𝑥 )2 𝑓(𝑀 − 𝑥 )2 Từ 0 đến dưới 5 4 2.5 10 -10.5 110.25 441 Từ 5 đến dưới 10 15 7.5 112.5 -5.5 30.25 453.75 Từ 10 đến dưới 15 27 12.5 337.5 -0.5 0.25 6.75 Từ 15 đến dưới 20 18 17.5 315 4.5 20.25 364.5 Từ 20 dến dưới 25 6 22.5 135 9.5 90.25 541.5 Tổng 70 910 -2.5 251.25 1807.5
Sử dụng công thức độ lệch chuẩn (3-12), ta có: ∑ f(M − x)2 1807.5 s = √ = √ = 5.12 n − 1 70 − 1 3. Bài 31 trang 122
Sau đây là số vụ trộm xe hơi trong 1 tuần ở một thành phố lớn. Hãy xác định hệ số
Skewness bằng hai phương pháp. 3 12 13 7 8 3 8 Lời giải n = 7 - Giá trị trung bình: ∑ x 54 x = = = 7.71 n 7 - Trung vị: Me = 8
- Độ lệch chuẩn của mẫu: ∑ ( x − x)2 s = √ = 3.9 n − 1 Từ đó, ta có:
- Hệ số Skewness của Pearson 3( x − Me) 3(7.71 − 8) sk = = = − 0.22 s 3.9 8
- Hệ số Skewness từ phần mềm E xcel: III. Điều tra chọn mẫu 1. Bài 31 trang 274
Công ty Power + Inc. sản xuất pin AA dùng cho điều khiển ô tô đồ chơi từ xa. Tuổi
thọ trung bình của loại pin này tuân theo quy luật phân phối chuẩn với giá trị trung bình
là 35.0 giờ và độ lệch chuẩn là 5.5 giờ. Để kiểm tra chất lượng sản phẩm, Power + Inc. đã lấy mẫu 25 pin.
a. Hãy cho biết hình dạng phân phối của các trung bình mẫu.
b. Tính sai số trung bình chọn mẫu.
c. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên.
d. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 giờ trở lên.
e. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 đến 36 giờ.
f. Tính xác suất để sai số chọn mẫu lớn hơn 1 giờ. Lời giải Tóm tắt n = 25 μ = 35 σ = 5.5
a. Hãy cho biết hình dạng phân phối của các trung bình mẫu.
Vì tuổi thọ trung bình của loại pin này tuân theo quy luật phân phối chuẩn nên các trung
bình mẫu (x ) cũng được phân phối chuẩn.
b. Tính sai số trung bình chọn mẫu.
Sử dụng công thức sai số trung bình chọn mẫu, ta có: σ 5.5 5.5 σx = = = = 1.1 √n √25 5
c. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên. 9
Sử dụng công thức tính giá trị z, ta có: x − μ 36 − 35 z = = = 0.91 σ/√n 1.1
Dựa vào bảng “Xác suất phân phối chuẩn hoá”, xác suất của giá trị z < 0.91 là 0.3186
⇒ Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên là:
p = 0.5000 − 0.3186 = 0.1814
d. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 giờ trở lên.
Sử dụng công thức tính giá trị z, ta có: x − μ 34.5 − 35 z = = = −0.45 σ/√n 1.1
Dựa vào bảng “Xác suất phân phối chuẩn hoá”, xác suất của giá trị z < 0.45 là 0.1736
⇒ Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 giờ trở lên là: p = 0.5000 + 0.1736 = 0.6736
e. Tính tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 đến 36 giờ.
Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34.5 đến 36 giờ là: p = 0.3186 + 0.1736 = 0.4922
f. Tính xác suất để sai số chọn mẫu lớn hơn 1 giờ.
Sai số chọn mẫu lớn hơn 1 giờ tương ứng vớ ituổi thọ trung bình của pin nhỏ hơn 34 giờ h oặc lớn hơn 36 giờ.
Sử dụng công thức tính giá trị z, ta có: x 36 − 35 z 1 − μ 1 = = = 0.91 σ/√n 1.1 x 34 − 35 z 2 − μ 2 = = = −0.91 σ/√n 1.1
Như phần (c) ta có: Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 36 giờ trở lên là: p1 = 0.1814
Tương tự, ta có: Tỷ lệ các mẫu có tuổi thọ trung bình của pin từ 34 giờ trở xuống là: p2 = 0.1814
⇒ Xác suất để sai số chọn mẫu lớn hơn 1 giờ là:
p1 + p2 = 0.1814 + 0.1814 = 0.3628 IV. Ước lượng 1. Bài 57 trang 309
Áp suất trong khoang máy bay ảnh hưởng đến sự thoải mái của khách hàng. Mức 10
áp suất cao hơn làm cho không khí trong khoang máy bay càng gần với môi trường tự
nhiên và khách hàng thoải mái hơn. Một nhóm khách hàng của hàng không đã ghi lại
mức áp suất trong 30 chuyến bay được chọn ngẫu nhiên và thấy rằng áp suất trong
khoang máy bay tương đương ở độ cao trung bình 8000 feet với độ lệch chuẩn là 300 feet.
a. Với độ tin cậy 99%, mức áp suất trung bình chung tương đương với độ cao trong khoảng giá trị nào?
b. Để xác định mức áp suất trung bình chung tương đương với độ cao nào, cần thu
thập thông tin ở bao nhiêu chuyến bay với phạm vi sai số là 25 feet và độ tin cậy là 95%? Lời giải Tóm tắt đề bài n = 30 X = 8000 σ = 300
a. Với độ tin cậy 99%, mức áp suất trung bình chung tương đương với độ cao trong khoảng giá trị nào Độ tin cậy = 99% = 1- α ⇒ α = 1% = 0.01
Có từ bảng phân phối chuẩn Zα/2 ≈ 2.576
Sử dụng công thức khoảng tin cậy ⇒ 7858.9 < M < 8141.1
Vậy mức áp suất trung bình tương đương độ cao trong khoảng (7858.9,8141.1)
b. Để xác định mức áp suất trung bình chung tương đương với độ cao nào, cần thu
thập thông tin ở bao nhiêu chuyến bay với phạm vi sai số là 25 feet và độ tin cậy là 95%?
Phạm vi sai số chọn mẫu là ε = 25. Với độ tin cậy 95% nên từ bảng phân phối có Zα/2 =
1.960 và độ lệch chuẩn s = 300. Thay số vào công thức n ≈ 553.1
Vậy để xác định mức áp suất trung bình chung tương đương với độ cao nào với phạm
vi sai số là 25 feet và độ tin cậy là 95%, cần thu thập thông tin ở khoảng 554 chuyến bay. 11 2. Bài 14 trang 294
The Buffalo, New York, Area Chamber of Commerce muốn ước lượng thời gian
trung bình di chuyển đến nhà máy của những nhân viên đang làm việc ở trung tâm thành
phố. Dữ liệu sau là thời gian đi làm (phút) của 15 nhân viên: 14 24 24 19 24 7 31 20 26 23 23 28 16 15 21
Xác định khoảng tin cậy 98% về thời gian trung bình di chuyển đến nhà máy của
nhân viên. Giải thích kết qu ? ả Lời giải
Giả định tổng thể có phân phối chuẩn và chưa biết độ lệch chuẩn của tổng thể.
Giá trị trung bình của mẫu ∑ x 14 + 24 + ⋯ + 15 + 21 315 x = = = = 21 n 15 15
Độ lệch chuẩn của mẫu Σ(x − x)2
(14 − 21)2 + (24 − 21)2 + ⋯ + (21 − 21)2 s = √ = √ ≈ 6.094 n − 1 14
Với bậc tự do n – 1 = 14 và độ tin cậy 98%, tra bảng “Phân phối Student” ta c ó: t = 2.624
Sử dụng công thức khoảng tin cậy cho giá trị trung bìn
h của tổng thể khi chưa biết σ: s 6.094 x ± t = 21 ± (2.624) = 21 ± 4.129 √n √15
Vậy khả năng để thời gian trung bình di chuyển đến nhà máy của nhân viên có giá trị
trong khoảng từ 16.871 phút đến 25.129 phút là 98%. V. Kiểm định 1. Bài 48 trang 345
Chủ sở hữu của Westfield Mal muốn nghiên cứu thói quen mua sắm của khách
hàng. Theo nghiên cứu trước đó, một người mua sắm thông thường dành 0.75 giờ tại
trung tâm thương mại, với độ lệch chuẩn là 0.10 giờ. Gần đây, trung tâm thương mại
mở thêm 1 số nhà hàng với mục đích giữ chân khách lâu hơn. Chủ sở hữu trung tâm
thương mại đã thuê Công ty tư vấn Brunner and Swanson đánh giá tác động của các nhà 12
hàng. Một mẫu gồm 45 khách hàng được hỏi cho thấy thời gian trung bình ở trung tâm
thương mại của họ là 0.80 giờ.
a. Với mức ý nghĩa 0.10, thời gian trung bình của khách hàng tại trung tâm thương mại có thay đổi không?
b. Giả sử thời gian mua sắm thực sự của khách hàng tăng từ 0.75 lên 0.79 giờ. Hãy
tính xác suất mắc sai lầm loại II.
c. Khi Brunner and Swanson báo cáo kết quả ở phần (b), chủ sở hữu Westfield
Mal nhận thấy xác suất mắc sai lầm loại II là quá lớn. Làm thế nào để giảm xác suất này? Lời giải
a. Với mức ý nghĩa 0.10, thời gian trung bình của khách hàng tại trung tâm thương mại có thay đổi không?
Sử dụng quy trình kiểm định 6 bước:
Bước 1: Nêu giả thuyết không và giả thuyết đối.
Với bài này, ta có giả thuyết không là “Trung bình tổng thể là 0.75 giờ” và giả thuyết
đối là “Trung bình tổng thể khác 0.75 giờ”. Đây là kiểm định 2 phía vì giả thuyết đối
không nêu lên chiều hướng. H0: µ=0.75 H1: µ≠0.75
Bước 2: Chọn mức ý nghĩa.
Quyết định sử dụng mức ý nghĩa α = 0.1.
Bước 3: Chọn tiêu chuẩn kiểm định.
Sử dụng tiêu chuẩn kiểm định z vì đã biết độ lệch chuẩn của tổng thể. Ta có: x − μ z = σ √n
Bước 4: Xác định quy tắc ra quyết định.
Sử dụng bảng phân phối chuẩn hóa, với mức ý nghĩa α = 0.1 và kiểm định 2 phía, ta có
giá trị tới hạn zα/2 = 1.645
⇒ Quy tắc ra quyết định: Bác bỏ giả thuyết không nếu giá trị tiêu chuẩn kiểm định:
|z| > zα/2 hay |z| > 1.645. 13
Bước 5: Ra quyết định. x 0.8 − 0.75 z = c − μ1 σ = = 3.354 0.1 √n √45 Bước 6: Nêu kết luận
Vì |z| > 1.645 (3.35 > 1.645) nên giả thuyết không bị bác bỏ.
Vậy thời gian trung bình của khách tại trung tâm thương mại sẽ thay đổi.
b. Giả sử thời gian mua sắm thực sự của khách hàng tăng từ 0.75 lên 0.79 giờ. Hãy
tính xác suất mắc sai lầm loại II.
Cần xác định xác suất để trung bình mẫu nằm trong khoảng từ 0.79 đến 0.80. Sau đó,
lấy 0.5 ( toàn bộ diện tích ở bên phải của giá trị trung bình 0.79) trừ đi giá trị xác suất
vừa tính được ta có kết quả xác suất mắc sai lầm loại II. x 0.8 − 0.79 z = c − μ1 σ = 0.1 = 0.67 √n √45
⟹ Xác suất mắc sai lầm loại II là: β = 0.2486
c. Khi Brunner and Swanson báo cáo kết quả ở phần (b), chủ sở hữu Westfield
Mal nhận thấy xác suất mắc sai lầm loại II là quá lớn. Làm thế nào để giảm xác suất này?
Để giảm xác suất loại II, ta nên giảm giá trị trung bình của mẫu. VI. Hồi quy tương quan 1. Bài 12 trang 39 6
Hội Sinh viên tại Đại học Middle Carolina muốn chứng minh mối liên hệ giữa số
lượng bia mà một sinh viên uống và nồng độ cồn trong máu của họ (BAC). Một mẫu
ngẫu nhiên gồm 18 sinh viên được chỉ định uống một số lượng ngẫu nhiên lon bia 12
ounce. 30 phút sau khi họ uống hết số bia được chỉ định, một thành viên của văn phòng
cảnh sát trưởng địa phương đã đo nồng độ cồn trong máu của họ. Thông tin từ mẫu như sau: Sinh viên Số lon bia BAC Sinh viên Số lon bia BAC Charles 6 0.10 Jalme 3 0.07 El is 7 0.09 Shannon 3 0.05 Harriet 7 0.09 Nel ie 7 0.08 14 Marlene 4 0.10 Jeanne 1 0,04 Tara 5 0.10 Michele 4 0.07 Kerry 3 0.07 Seth 2 0.06 Vera 3 0.10 Gilberto 7 0.12 Pat 6 0.12 Lil ian 2 0.05 Marjorie 6 0.09 Becky 1 0.02
a. Xây dựng biểu đồ phân tán cho số lon bia đã uống và BAC. Nhận xét về mức
độ chặt chẽ của mối liên hệ? Mối liên hệ thuận hay nghịch?
b. Xác định hệ số tương quan.
c. Với mức ý nghĩa 0.01, có mối liên hệ thuận trong tổng thể giữa số lon bia được
uống và BAC không? Xác định giá trị p-value. Lời giải
a. Xây dựng biểu đồ phân tán cho số lon bia đã uống và BAC. Nhận xét về mức độ
chặt chẽ của mối liên hệ? Mối liên hệ thuận hay nghịch?
⇒ Tương quan thuận và chặt chẽ giữa số lon bia đã uống và BAC
b. Xác định hệ số tương quan. Số lon
STT bia (x) BAC (y) (𝑥 − 𝑥)2
(𝑦 − 𝑦)2 (𝑥 − 𝑥) (𝑦 − 𝑦) (𝑥 − 𝑥)(𝑦 − 𝑦) 1 6 0.1 2.97 0.00044568 1.722 0.021 0.036 2 7 0.09 7.41 0.00012346 2.722 0.011 0.030 3 7 0.09 7.41 0.00012346 2.722 0.011 0.030 4 4 0.1 0.08 0.00044568 -0.278 0.021 -0.006 15 5 5 0.1 0.52 0.00044568 0.722 0.021 0.015 6 3 0.07 1.63 0.00007901 -1.278 -0.009 0.011 7 3 0.1 1.63 0.00044568 -1.278 0.021 -0.027 8 6 0.12 2.97 0.00169012 1.722 0.041 0.071 9 6 0.09 2.97 0.00012346 1.722 0.011 0.019 10 3 0.07 1.63 0.00007901 -1.278 -0.009 0.011 11 3 0.05 1.63 0.00083457 -1.278 -0.029 0.037 12 7 0.08 7.41 0.00000124 2.722 0.001 0.003 13 1 0.04
10.74 0.00151235 -3.278 -0.039 0.127 14 4 0.07 0.08 0.00007901 -0.278 -0.009 0.002 15 2 0.06 5.19 0.00035679 -2.278 -0.019 0.043 16 7 0.12 7.41 0.00169012 2.722 0.041 0.112 17 2 0.05 5.19 0.00083457 -2.278 -0.029 0.066 18 1 0.02
10.74 0.00346790 -3.278 -0.059 0.193 Tổng 77 1.42 77.61 0.0128 0.776 77 x = = 4.28 18 1.42 y = = 0.08 18 77.61 sx = √ = 2.14 18 − 1 0.0128 sy = √ = 0.027 17 ∑ ( x − x)(y − y) 0.776 r = = = 0.8 (n − 1)sxsy (18 − 1)(2.14)(0.027)
c. Với mức ý nghĩa 0.01, có mối liên hệ thuận trong tổng thể giữa số lon bia được
uống và BAC không? Xác định giá trị p-value. H0: p ≤ 0 H1: p > 0
Loại bỏ nếu t > 2.583 với df = 16 r√n − 2 0.8√18 − 2 t = = = 5.33 > 2.583 √1 − r2 √1 − 0.82
⇒ Loại bỏ H0 và có mối liên hệ thuận giữa số lon bia được uống và BAC. 16 ANOVA Significanc df SS MS F e F Regression 1
0.0077500040.00775 24.66302 0.00014 Residual 16 0.0050277740.000314 Total 17 0.012777778 Coefficient Standard Lower Upper s Error t Stat
P-value Lower 95%Upper 95% 95.0% 95.0% Intercept
0.036142 0.0095681263.777305 0.00165 0.015858 0.056425 0.015858 0.056425
X Variable 1 0.009993 0.0020121764.966187 0.00014 0.005727 0.014258 0.005727 0.014258 2. Bài 24 trang 482
Một nhà nghiên cứu thị trường đang nghiên cứu về các dịch vụ thuê bao trực tuyến.
Cô ấy đặc biệt quan tâm đến những biến liên quan đến số lượng đăng ký cho một dịch
vụ trực tuyến cụ thể. Thông tin mô tả về 25 dịch vụ đăng ký trực tuyến với các biến có ký hiệu như sau: Sub
= Số lượng đăng ký (nghìn)
Web page hits = Số lượt truy cập trung bình hằng tháng (nghìn) Adv Price
= Ngân sách quảng cáo của dịch vụ (trăm $) Price
= Ph íđăng ký trung bình hằng tháng ($) Web page Service Sub Adv Price hits 1 37.95 588.9 13.2 35.1 2 37.66 585.3 13.2 34.7 3 37.55 566.3 19.8 34.8 … … … … … 23 38.83 629.6 22.0 35.3 24 38.33 680.0 24.2 34.7 25 40.24 651.2 33.0 35.8
a. Xây dựng phương trình hồi quy.
b. Tiến hành kiểm định ý nghĩa của mô hình. Sử dụng mức ý nghĩa 0,05.
c. Tiến hành kiểm định ý nghĩa của từng hệ số hồi quy riêng phần. Sử dụng mức ý
nghĩa 0.05. Có cần loại bỏ biến nào không?
d. Xác định phần dư và vẽ đồ thị dựa trên các giá trị ước lượng. Nhận xét?
e. Xây dựng đồ thị phần dư. Giả thiết các phần dư tuân theo quy luật phân phối 17
chuẩn có được thỏa mãn không? Lời giải
a. Xây dựng phương trình hồi quy.
• Biến phụ thuộc (y): Số lượng đăng ký (nghìn) • Các biến độc lập:
- x1: Số lượt truy cập trung bình hằng tháng (nghìn)
- x2: Ngân sách quảng cáo của dịch vụ (trăm đô la)
- x3: Phí đăng ký trung bình hằng tháng ($)
⇒ Phương trình hồi quy có dạng:
Dùng Excel chạy bảng Regression tìm b0, b1, b2, b3, được kết quả như sau: b0 = 5.7328 b1 = 0.0075 b2 = 0.0509 b3 = 1.0974 ⇒
b. Tiến hành kiểm định ý nghĩa của mô hình. Sử dụng mức ý nghĩa 0.05.
Bước 1: Xét cặp giả thuyết.
H0: β1 = β2 = β3 = 0 (mô hình không có ý nghĩa)
H1: β1 ≠ 0; β2 ≠ 0; β3 ≠ 0 (mô hình có ý nghĩa)
Bước 2: So sánh Sig với α.
Điều kiện bác bỏ: Sig < α 18
Trong đó: Sig = 0.00000002; α = 0.05 ⇒ Sig < α
⇒ Bác bỏ H0 , chấp nhận H1
⇒ Mô hình có ý nghĩa với mức ý nghĩa 0.05.
c. Tiến hành kiểm định ý nghĩa của từng hệ số hồi quy riêng phần. Sử dụng mức
ý nghĩa 0.05. Có cần loại bỏ biến nào không? (1) Kiểm định β1
Bước 1: Xét cặp giả thuyết.
H0: β1 = 0 (hệ số không có ý nghĩa)
H1: β1 ≠ 0 ( hệ số có ý nghĩa)
Bước 2: Tính tiêu chuẩn kiểm định. 𝑇qs = t1 = 4.1575
Bước 3: Điều kiện bác bỏ H0. ⌊𝑇 (𝑛−𝑘−1) 𝑞𝑠⌋ > 𝑡𝛼 2
Mà n = 25; k = 3 ⇒ n - k - 1 = 21 α = 0.05 ⇒ |𝑇 (21) 𝑞𝑠| > 𝑡0.05 2 ⇒ 4.1575 > 2.080
⇒ Bác bỏ H0, chấp nhận H1 ⇒ β1 có ý nghĩa. (2) Kiểm định β2
Bước 1: Xét cặp giả thuyết.
H0: β2 = 0 (hệ số không có ý nghĩa)
H1: β2 ≠ 0 (hệ số có ý nghĩa)
Bước 2: Tính tiêu chuẩn kiểm định. 𝑇qs = t2 = 3.5987
Bước 3: Điều kiện bác bỏ H0 |𝑇 (𝑛−𝑘−1) 𝑞𝑠| > 𝑡𝛼 2
Mà n = 25; k = 3 ⇒ n - k - 1 = 21 α = 0.05 19 ⇒ |𝑇 (21) 𝑞𝑠| > 𝑡0.05 2 ⇒ 3.5987 > 2.080
⇒ Bác bỏ H0, chấp nhận H1 ⇒ β2 có ý nghĩa. (3) Kiểm định β3
Bước 1: Xét cặp giả thuyết.
H0: β3 = 0 (hệ số không có ý nghĩa)
H1: β3 ≠ 0 (hệ số có ý nghĩa)
Bước 2: Tính tiêu chuẩn kiểm định. 𝑇qs = t3 = 4.4786
Bước 3: Điều kiện bác bỏ H0 |𝑇 (𝑛−𝑘−1) 𝑞𝑠| > 𝑡𝛼 2
Mà n = 25; k = 3 ⇒ n - k - 1 = 21 α = 0.05 ⇒ |𝑇 (21) 𝑞𝑠| > 𝑡0.05 2 ⇒ 4.4786 > 2.080
⇒ Bác bỏ H0, chấp nhận H1 ⇒ β3 có ý nghĩa.
⇒ Tất cả hệ số hồi quy riêng từng phần đều có ý nghĩa, không loại bỏ biến nào.
d. Xác định phần dư và vẽ đồ thị dựa trên các giá trị ước lượng. Nhận xét?
Sử dụng công thức tính phần dư:
Phần dư = Số lượng đăng ký thực tế - Số lượng đăng ký ước lượng
Số lượng đăng ký thực tế được lấy từ bảng (cột Sub), Số lượng đăng ký ước
lượng được tính bằng cách thay giá trị các biến x1, x2, x3 từ bảng số liệu vào phương trình hồi quy.
Từ đó, ta có Bảng 5: Phần dư của phương trình hồi quy. 20
Bảng 5: Phần dư của phương trình hồi quy (đơn vị: nghìn)
Từ bảng số liệu trên, ta vẽ được Biểu đồ 3: Số lượng đăng ký dịch vụ ước lượng (đơn vị: nghìn)
Biểu đồ 3: Số lượng đăng ký dịch vụ ước lượng (đơn vị: nghìn) 21
e. Xây dựng đồ thị phần dư. Giả thiết các phần dư tuân theo quy luật phân phối
chuẩn có được thỏa mãn không?
Từ số liệu của Bảng 4: Phần dư của phương trình hồi quy, ta xây dựng được
Biểu đồ 4: Histogram của phần dư.
Biểu đồ 4: Histogram của phần dư
Từ đồ thị trên, ta thấy biểu đồ đang lệch phải, nghĩa là các phần dư đang phân
phối lệch sang phải. Do đó, giả thiết các phần dư tuân theo quy luật phân phối chuẩn không được thỏa mãn. VII. Chỉ số 1. Bài 12 trang 510
Bạn đang làm việc cho Văn phòng Phát triển kinh tế của tiểu bang. Văn phòng
muốn xây dựng một chỉ số kinh tế để đánh giá hoạt động kinh tế trong quá khứ và dự
đoán các xu hướng kinh tế trong tương lai của tiểu bang. Bạn cho rằng có một số yếu tố
chính nên được đưa vào chỉ số, gồm: số lượng doanh nghiệp mới thành lập trong năm,
số doanh nghiệp kinh doanh thất bại, thuế thu nhập của tiểu bang, số lượng sinh viên đại
học nhập học và thuế thương vụ của tiểu bang. Đây là dữ liệu của năm 2000 và 2018. 2000 2018 Số doanh nghiệp mới 1,088 1,162 22