Bài 22 Tr481: Một nhà máy quy hoạch khu vực đang nghiên cứu nhân
khẩu của 9 khu vực phía Đông của một bang ven biển Đại Tây Dương
ấy thu thập dữ liệu sau :
Quận Thu nhập trung bình($) Tuổi trungbình Ven
biển
A 48,157 57.7 1
B 48,568 60.7 1
C 46,816 47.9 1
D 32,876 38.4 0
E 35,478 42.8 0
F 34,465 35.4 0
G 35,026 39.5 0
H 38,599 65.6 0
J 33,315 27 0
a, mối liên hệ tuyến tính giữa thu thập trung bình tuổi trung
bình không?
b, Biến nào biến phụ thuộc?
c, Sử dụng phần mềm hệ thống để xác định phương trình hồi quy. Giả
thích giá trị cả hệ số t do trong phương trình hồi quy đơn.
d, Xem xét yếu tố quận nằm cạnh ven biển trong phân tích hồi qu
tuyến tính bội bằng cách sử dụng biến giả . Biến này ảnh hưởn
đáng kể tới thu nhập không? Sử dụng mức ý nghĩa 0.05.
e, Kiểm định ý nghĩa của từng hệ số hồi quy riêng phần. Sử dụng m
ý nghĩa 0.05
f, V đồ thị của các phần nhận xét các phần dư tuân theo q
luật phân phối chuẩn không.
g. Vẽ đồ thị phần các giá trị ước định, giả thiết phương sai sai
không bị vi phạm không?
Bài làm
a,Nhận xét :Có mối liên hệ tuyến tính giữa thu nhập trung bình tuổ
thọ
b, Biến phụ thuộc thu nhập trung bình
c,
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.721216
425
R Square 0.520153
132
Adjusted R Square 0.451603
579
Standard Error 4930.601
799
Observations 9
ANOVA
df SS MS F
Significa
nce F
Regression 1 18447029 9.5 1844703 00 7.58798 73 0.02831
43
Residual 7 17017583 8.7 2431083
4.1
Total 8 35464613
8.2
CoefÏcien
ts
Standard
Error t Stat P-value
Lower
95%
Upper
95%
Intercept 22045.43 133 6460.267 511 3.41246 416 0.01125 01 6769.32 61 37321.5
37
Tuổi trung bình 373.2316 097 135.4924 579 2.75463 015 0.02831 43 52.8428578 693.620
36
Lower
95.0%
Upper
95.0%
6769.3261 37321.
537
52.8428578 693.62
036
Y
=22,045+ 373.23
X
22,045 giá trị thu thập trung bình ước tính khi độ tuôi trung bình
bằng 0 . Về thực tế nghĩa , nên hệ số này chỉ ý nghĩa về m
toán học , dùng để xác định vị trí đường hồi quy.
373.23 khi tuổi trung bình của quận tăng lên 1 năm , thì thu nhập
trung bình của quận tăng trung bình khoảng 373.23$ .Tức tuổi tỉ lệ
thuận với thu nhập.
d,
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99534
78
R Square 0.99071
72
Adjusted R Square 0.98762
3
Standard Error 740.732
12
Observatio
ns 9
ANOVA
df SS MS F
Significa
nce F
Regression 2 3513540 33.8 175677016. 9320.178 816 7.99899E
-07
Residual 6 3292104. 439 548684.073
1
Total 8 3546461
38.2
CoefÏcie
nts
Standard
Error t Stat P-value
Lower
95%
Upper
95%
Intercept 29014.9 17 1049.591526 27.6440087 31.4818E- 07 26446.65936 31583.1
752
Tuổi trung bình 143.423 79 24.24812 03 5.91484151 10.00103 952 84.09077 558 202.756
801
Ven biển 10881.624 623.9472698 17.4399737 82.279E- 06 9354.880055 12408.3
68
Lower
95.0%
Upper
95.0%
26446.6594 31583.1
7524
84.0907756 202.756
8014
9354.88006 12408.3
6799
So sánh với mức ý nghĩa 0.05: P-value(ven biển ) 0.05= -0.05
Suy ra P ( ven biển)<
hưởng tới thu nhập mức ý nghĩa 0.05
e,Tương tự như ý d, ta đều P-value của các giá trị Intercept, Tuổi trung bình
đều giá trị nhỏ hơn so với 0.05 vậy đều ảnh hưởng tới thu nhập trung
bình với ý nghĩa 0.05
g,
RESIDUAL OUTPUT
Observati
on
Predicted Thu nhập trung
bình($) Residuals
Standard
Residuals
1 48172.09392 -15.09392062 -0.023529368
2 48602.36529 -34.36528614 -0.053570803
3 46766.54079 49.45920676 0.07710017
4 34522.39078 -1646.390778 -2.5664991
5 35153.45545 324.5445522 0.505920776
6 34092.11941 372.8805871 0.581270075
7 34680.15695 345.8430543 0.539122242
8 38423.51783 175.4821742 0.273552821
9 32887.35959 427.6404106 0.666633185
0 2 4 6 8 10 12
0
2
4
6
8
10
12
Chart Title
Tui trung bình Residuals
Các phần tuân theo quy luật chuẩn
g,Nhận xét
30000 35000 40000 45000 50000
-2000
-1500
-1000
-500
0
500
1000
Residuals
Giả thuyết phương sai sai s không bị vi phạm.
Bài 45 Tr426: Nhà sản xuất thiết bị tập thể dục Cardio Glide
muốn nghiên cứu mối quan hệ giữa số tháng kể từ khi máy tập
được mua thời gian thiết bị đã được sử dụng vào tuần trước
(tính bằng giờ):
a, Biểu diễn thông tin trên bảng trên bằng biểu đồ phân tán vớ
Số giờ rập thể dục biến phụ thuộc. Nhận xét mối quan hệ
giữa 2 biến ?
b, Xác định hệ số tương quan giải thích.
C, Với mức ý nghĩa 0.01 , mối liên hệ nghịch giữa các biế
không?
Bài làm
Người mua Số
tháng
Số
giờ
tập
Hall 2 10
Massa 2 8
Karl 4 8
Veights 5 5
Bennett 6 8
Phillips 7 5
Sass 8 3
Longnec
ker 9 5
Maroone
y 10 2
Rupple 12 4
a,
0 2 4 6 8 10 12 14
0
2
4
6
8
10
12
Số giờ tập
Nhận xét:
Số giờ tập xu hướng giảm theo số tháng mua
Do đó mối quan hệ nghịch biến giữa số giờ tập số tháng mua
b, Áp dụng công thức:
r -0.8269 do đó mối quan hệ nghịch chặt chẽ giữa 2 biến.
c,
= -0.8269
10 2
1−( )0.8269 2
= -4,17
Tra trong bảng ta t(0.005,7)=3.499
|t| = 4.17> 3.499
Do đó, mức ý nghĩa 0.01 thì mối quan hệ nghịch ý nghĩa
thống giữa số giờ tập số tháng mua.
Bài 69 Tr310:
Chọn ngẫu nhiên 20 căn nhà đã bán từ dữ liệu từ dữ liệu bất
động sản North Valley :
a, Hãy xác định khoảng tin cậy 95% cho giá bán trung bình
của các căn nhà
b,Hãy xác định khoảng tin cậy 95% cho thời gian trung bình
( ngày) rao bán trên thị trường của các ngôi nhà.
c, Hãy xác định khoảng tin cậy 95% cho tỷ lệ số ngôi nhà
bể bơi.
d,Giả sử North Valley thuê một số đại lí. Mỗi đại được giao
20 căn nhà để bán . Hoa hồng kiếm được đông tích cực
để các đại bán nhà. họ cũng quan tâm đến đặc điểm của
20 ngôi nhà họ được giao để bán . Hãy gửi cho các đại
một bản tả đặc điểm của các ngôi nhà họ được giao
dựa vào khoảng tin cậy đã c định.
e, Bạn kết luận xử thế nào nếu khoảng tin cậy
không bao gồm giá trị trung bình của 105 ngôi nhà.
Bài làm
Bảng giá trị của 20 căn nhà:
STT Giá
tiền($)
Diện
tích( sq ft) Bể
bơi
Thời gian
rao bán
( ngày)
Số
Phòng
ngủ
1 1,171,000 846 0 26 2
2 1,618,000 2,206 1 18 2
3 1,750,000 1,711 0 20 2
4 1,600,000 1,486 0 19 3
5 2,268,000 2,360 1 20 3
6 579,888 1,077 0 15 2
7 1,498,888 1,605 1 21 3
8 1,428,000 2,243 1 17 4
9 729,999 1,474 0 19 4
10 1,380,000 1,234 0 25 4
11 1,999,999 2,388 1 25 5
12 1,699,000 3,279 0 16 8
13 1,199,999 1,248 0 20 3
14 998,888 1,372 0 20 2
15 988,000 1,541 0 20 2
16 868,000 1,092 0 21 2
17 1,739,000 1,952 1 23 4
18 958,500 1,371 0 22 2
19 1,550,000 1,912 1 20 4
20 1,199,000 1,271 0 19 2
Ta
x
=
giátiềnnhà
n
= 1,361,208($)
s = 434925.514
1,361,208
±203,549.0669
($)
b,Tương tự như a, ta khoảng tin cậy của thời gian rao
bán :
20
±1.342 (ngày )
c,
p=
7
20
= 0.35
0.35±0.209( nhà)
d,
1. Giá bán trung bình ước tính: 1,361,208$, khoảng tin
cậy 95%: [1564757.07; 1157658.933] $
2. Diện tích trung bình: 1,683 sq.ft, khoảng tin cậy
95%: [1,099; 2,268] sq.ft.
3. Số phòng ngủ trung bình: 3 phòng, khoảng tin cậy
95%: [1.5; 4.5] phòng.
4. Tỷ lệ nhà bể bơi: 0.35 (35%), khoảng tin cậy
95%: [0.141; 0.559].
e, Nếu khoảng tin cậy của các đặc điểm (giá bán, di
tích, số phòng ngủ) không bao gồm giá trị trung bình của
toàn bộ 105 căn nhà thể kết luận, thì ta rằng mẫu 20 căn
này không đại diện cho toàn bộ khu vực North Valley.
Điều này nghĩa đại đang bán một nhóm nhà không
điển hình thể cao cấp n hoặc bình dân hơn trung bình
của khu vực.

Preview text:

Bài 22 Tr481: Một nhà máy quy hoạch khu vực đang nghiên cứu nhân
khẩu của 9 khu vực phía Đông của một bang ven biển Đại Tây Dương Cô ấy Quận thu thập Thu bình($) dữ nhập t liệu rung sau : Tuổi trung bình Ven biển A 48,157 57.7 1 B 48,568 60.7 1 C 46,816 47.9 1 D 32,876 38.4 0 E 35,478 42.8 0 F 34,465 35.4 0 G 35,026 39.5 0 H 38,599 65.6 0 J 33,315 27 0
a, Có mối liên hệ tuyến tính giữa thu thập trung bình và tuổi trung bình không?
b, Biến nào là biến phụ thuộc?
c, Sử dụng phần mềm hệ thống để xác định phương trình hồi quy. Giả
thích giá trị cả hệ số tự do trong phương trình hồi quy đơn.
d, Xem xét yếu tố quận nằm cạnh “ ven biển “ trong phân tích hồi qu
tuyến tính bội bằng cách sử dụng biến “ giả “ . Biến này có ảnh hưởn
đáng kể tới thu nhập không? Sử dụng mức ý nghĩa 0.05.
e, Kiểm định ý nghĩa của từng hệ số hồi quy riêng phần. Sử dụng m ý nghĩa 0.05
f, Vẽ đồ thị của các phần dư và nhận xét các phần dư có tuân theo q
luật phân phối chuẩn không.
g. Vẽ đồ thị phần dư và các giá trị ước định, giả thiết phương sai sai không bị vi phạm không? Bài làm
a,Nhận xét :Có mối liên hệ tuyến tính giữa thu nhập trung bình và tuổ thọ
b, Biến phụ thuộc là thu nhập trung bình c, SUMMARY OUTPUT Regression Statistics Multiple R 0.721216 425 R Square 0.520153132 Adjusted Square R 0.451603 579 Standard Error 4930.601 799 Observations 9 ANOVA Significa df SS MS F nce F Regression
1 18447029 9.5 1844703 00 7.58798 73 0.02831 43 Residual 7 17017583 8.7 2431083 4.1 Total 8 35464613 8.2 CoefÏcien Standard Lower Upper ts Error t Stat P-value 95% 95% Intercept 22045.43
133 6460.267 511 3.41246 416 0.01125 01 6769.32 61 37321.5 37 Tuổi bình trung 373.2316
097 135.4924 579 2.75463 015 0.02831 43 52.8428578 693.620 36 Lower Upper 95.0% 95.0% 6769.3261 37321. 537 52.8428 578 693.62 036 Y =22,045+ 373.23 X
22,045 là giá trị thu thập trung bình ước tính khi độ tuôi trung bình
bằng 0 . Về thực tế là vô nghĩa , nên hệ số này chỉ có ý nghĩa về m
toán học , dùng để xác định vị trí đường hồi quy.
373.23 là khi tuổi trung bình của quận tăng lên 1 năm , thì thu nhập
trung bình của quận tăng trung bình khoảng 373.23$ .Tức tuổi tỉ lệ thuận với thu nhập. d, SUMMARY OUTPUT Regression Statistics Multiple R 0.99534 78 R Square 0.99071 72 Adjusted Square R 0.98762 3 Standard Error 740.732 12 Observatio ns 9 ANOVA Significa df SS MS F nce F Regression 2 3513540 33.8 175677016. 9320.178 816 7.99899E -07 Residual 6 3292104. 439 548684.073 1 Total 8 3546461 38.2 CoefÏcie Standard Lower Upper nts Error t Stat P-value 95% 95% Intercept 29014.9 17 1049.591526 27.6440087
31.4818E- 07 26446.65936 31583.1 752 Tuổi bình trung 143.423 79 24.24812 03 5.91484151
10.00103 952 84.09077 558 202.756 801 Ven biển
10881.624 623.9472698 17.4399737 82.279E- 06 9354.880055 12408.3 68 Lower Upper 95.0% 95.0% 26446.6 594 31583.17524 84.0907 756 202.756 8014 9354.88 006 12408.3 6799
So sánh với mức ý nghĩa 0.05: P-value(ven biển ) – 0.05= -0.05 Suy ra P ( ven biển)<
hưởng tới thu nhập ở mức ý nghĩa 0.05
e,Tương tự như ý d, ta đều có P-value của các giá trị Intercept, Tuổi trung bình
đều có giá trị nhỏ hơn so với 0.05 vì vậy đều có ảnh hưởng tới thu nhập trung bình với ý nghĩa 0.05 g, RESIDUAL OUTPUT Observati
Predicted Thu nhập trung Standard on bình($) Residuals Residuals 1 48172.09392 -15.09392062 -0.023529368 2 48602.36529 -34.36528614 -0.053570803 3 46766.54079 49.45920676 0.07710017 4 34522.39078 -1646.390778 -2.5664991 5 35153.45545 324.5445522 0.505920776 6 34092.11941 372.8805871 0.581270075 7 34680.15695 345.8430543 0.539122242 8 38423.51783 175.4821742 0.273552821 9 32887.35959 427.6404106 0.666633185 Chart Title 12 10 8 6 4 2 0 Tuổi trung bình Residuals 0 2 4 6 8 10 12
Các phần dư có tuân theo quy luật chuẩn g,Nhận xét Residuals 1000 500 0 30000 35000 40000 45000 50000 -500 -1000 -1500 -2000
Giả thuyết phương sai sai số không bị vi phạm.
Bài 45 Tr426: Nhà sản xuất thiết bị tập thể dục Cardio Glide
muốn nghiên cứu mối quan hệ giữa số tháng kể từ khi máy tập
được mua và thời gian thiết bị đã được sử dụng vào tuần trước (tính bằng giờ):
a, Biểu diễn thông tin trên bảng trên bằng biểu đồ phân tán vớ
Số giờ rập thể dục là biến phụ thuộc. Nhận xét mối quan hệ giữa 2 biến ?
b, Xác định hệ số tương quan và giải thích.
C, Với mức ý nghĩa 0.01 , có mối liên hệ nghịch giữa các biế không? Bài làm Số Người mua Số giờ tháng tập Hall 2 10 Massa 2 8 Karl 4 8 Veights 5 5 Bennett 6 8 Phillips 7 5 Sass 8 3 Longnec ker 9 5 Maroone y 10 2 Rupple 12 4 a, Số giờ tập 12 10 8 6 4 2 0 0 2 4 6 8 10 12 14 Nhận xét:
Số giờ tập có xu hướng giảm theo số tháng mua
Do đó là mối quan hệ nghịch biến giữa số giờ tập và số tháng mua b, Áp dụng công thức:
r ≈ -0.8269 do đó mối quan hệ nghịch chặt chẽ giữa 2 biến. c, = -0.8269 √ 10−2 1−(−0.8269)2 = -4,17
Tra trong bảng ta có t(0.005,7)=3.499 Mà |t| = 4.17> 3.499
Do đó, ở mức ý nghĩa 0.01 thì mối quan hệ nghịch có ý nghĩa
thống kê giữa số giờ tập và số tháng mua. Bài 69 Tr310:
Chọn ngẫu nhiên 20 căn nhà đã bán từ dữ liệu từ dữ liệu bất động sản North Valley :
a, Hãy xác định khoảng tin cậy 95% cho giá bán trung bình của các căn nhà
b,Hãy xác định khoảng tin cậy 95% cho thời gian trung bình
( ngày) rao bán trên thị trường của các ngôi nhà.
c, Hãy xác định khoảng tin cậy 95% cho tỷ lệ số ngôi nhà có bể bơi.
d,Giả sử North Valley thuê một số đại lí. Mỗi đại lí được giao
20 căn nhà để bán . Hoa hồng kiếm được là đông cơ tích cực
để các đại lí bán nhà. Và họ cũng quan tâm đến đặc điểm của
20 ngôi nhà mà họ được giao để bán . Hãy gửi cho các đại lí
một bản mô tả đặc điểm của các ngôi nhà mà họ được giao
dựa vào khoảng tin cậy đã xác định.
e, Bạn có kết luận gì và xử lí thế nào nếu khoảng tin cậy
không bao gồm giá trị trung bình của 105 ngôi nhà. Bài làm
Bảng giá trị của 20 căn nhà: Diện Thời gian Số STT Giá ( tích sq ft) Bể rao bán Phòng tiền($) bơi ( ngày) ngủ 1 1,171,000 846 0 26 2 2 1,618,000 2,206 1 18 2 3 1,750,000 1,711 0 20 2 4 1,600,000 1,486 0 19 3 5 2,268,000 2,360 1 20 3 6 579,888 1,077 0 15 2 7 1,498,888 1,605 1 21 3 8 1,428,000 2,243 1 17 4 9 729,999 1,474 0 19 4 10 1,380,000 1,234 0 25 4 11 1,999,999 2,388 1 25 5 12 1,699,000 3,279 0 16 8 13 1,199,999 1,248 0 20 3 14 998,888 1,372 0 20 2 15 988,000 1,541 0 20 2 16 868,000 1,092 0 21 2 17 1,739,000 1,952 1 23 4 18 958,500 1,371 0 22 2 19 1,550,000 1,912 1 20 4 20 1,199,000 1,271 0 19 2 Ta có
x= ∑giátiềnnhà = 1,361,208($) n s = 434925.514 1,361,208±203,549.0669($)
b,Tương tự như a, ta có khoảng tin cậy của thời gian rao bán : 20±1.342 (ngày ) c, Có p=7 = 0.35 20 0.35±0.209( nhà) d,
1. Giá bán trung bình ước tính: 1,361,208$, khoảng tin
cậy 95%: [1564757.07; 1157658.933] $
2. Diện tích trung bình: 1,683 sq.ft, khoảng tin cậy 95%: [1,099; 2,268] sq.ft.
3. Số phòng ngủ trung bình: 3 phòng, khoảng tin cậy 95%: [1.5; 4.5] phòng.
4. Tỷ lệ nhà có bể bơi: 0.35 (35%), khoảng tin cậy 95%: [0.141; 0.559].
e, Nếu khoảng tin cậy của các đặc điểm (giá bán, di
tích, số phòng ngủ) không bao gồm giá trị trung bình của
toàn bộ 105 căn nhà, thì ta có thể kết luận rằng mẫu 20 căn
này không đại diện cho toàn bộ khu vực North Valley.
Điều này có nghĩa là đại lý đang bán một nhóm nhà không
điển hình — có thể cao cấp hơn hoặc bình dân hơn trung bình của khu vực.