




Preview text:
Câu 1:
wage : tiền lương theo giờ (USD/giờ)
exper: kinh nghiệm làm việc (năm) age : tuổi
educ : trình độ học vấn (số năm đi học)
Dùng R, ta có kết quả hồi quy (1) sau:
Call: lm(formula = log(wage) ~ educ + age, data = wage2) Residuals: Min 1Q Median 3Q Max
-1.85403 -0.23538 0.02986 0.26911 1.37285 CoefÏcients:
a. Hãy nêu ý nghĩa của hệ số của age, educ. Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.225153 0.159896 32.679 < 2e-16 *** educ
0.060228 0.005875 10.251 < 2e-16 *** age 0.022450 0.004153 5.406 8.18e-08 *** ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.3944 on 932 degrees of freedom Multiple R-squared: 0.1249, Adjusted R-squared: 0.123
F-statistic: 66.49 on 2 and 932 DF, p-value: < 2.2e-16
-age: Khi tăng thêm 1 tuôie thì tiền lương theo giờ sẽ tăng khoảng 2,24%, trong điều kiện
các yếu tố khác không đổi
-educ: Khi trình độ học vấn tăng thêm 1 năm thì tiền lương theo giờ sẽ tăng khoảng 6.022%
b. Biến age có ý nghĩa thống kê không với độ tin cậy 97%? H0: Bage=0 H1: B#0
Ta có: t=5,406 và pvalue=8,18x10^-8 <0,03 => bác bỏ giả thuyết H0 và kết luận biến age
có ý nghĩa thống kê với khoảng tin cậy 97%
c. Nếu tăng một năm học vấn trong điều kiện các yếu tố khác không đổi thì tiền lương
cótăng 8% không với mức ý nghĩa 1%? H0: Beduc=0,08 H1: #0,08
d. Hãy kiểm định nhận định: “ Học vấn tăng sẽ làm tiền lương tăng” với mức ý nghĩa 1%. H0: Beduc=0 H1: beduc>0
Ta có pvalue<0,01 bác bỏ H0 và kết luận rằng học vấn tăng sẽ làm tiền lương tăng
Câu 2: Vẫn với dữ liệu ở câu 1, sau khi đưa thêm hai biến exper và exper^2 vào mô hình, ta
được mô hình hồi quy (2):
Call: lm(formula = log(wage) ~ educ + age + exper + I(exper^2), data = wage2) Residuals: Min 1Q Median 3Q Max
-1.84172 -0.23541 0.03517 0.26133 1.34351 CoefÏcients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.1477604 0.1878415 27.405 < 2e-16 *** educ
0.0719752 0.0069886 10.299 < 2e-16 *** age 0.0138417
0.0052691 2.627 0.00876 ** exper 0.0228743 0.0137304 1.666 0.09606 .
I(exper^2) -0.0003962 0.0006025 -0.658 0.51099 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.392 on 930 degrees of freedom Multiple R-squared: 0.1373, Adjusted R-squared: 0.1336
F-statistic: 37.01 on 4 and 930 DF, p-value: < 2.2e-16
a. Biến exper và exper^2 có tác động riêng lẻ lên tiền lương hay không mức ý nghĩa
5%?Exper: H0: Bexper=0 H1: B#0 ta có pvalue =0,09 >0,05 nên exper không có tác
động riêng lẻ lên tiền luonhw
Exper^2: H0 Bexper=0 H1: B#0 ta có pvalue =0,51 >0,05 nên exper không có tác động
riêng lẻ lên tiền luonhw
b. Biến exper và exper^2 có tác động đồng thời tới tiền lương không với mức ý nghĩa 5%?
(dựa vào thông tin câu 1) H0: B3=b4=0 H1: H0 sai
F=37,01 > F0,05 (2;930)=3 bác bỏ H0 và kết luận 2 biến có tác động đồng thời tới tiền lương
c. Hãy kiểm định giả thiết cho rằng tất cả các biến độc lập không tác động đồng thời lên
tiềnlương với mức ý nghĩa 2%. H0: b1=b2=b3=b4=0 H1: bj#0
2.2e-1 <0,02 nên bác bỏ giả thuyết H0 và kết luận các biến độc lập tác động đồng thời tới tiền lương Câu 3: Cho: price: giá nhà
sqrft: diện tích nhà
lotsize : diện tích đất
bdrms : số phòng ngủ
Dùng R, ta có kết quả hồi quy mô hình (1) sau: Call:
lm(formula = log(price) ~ log(lotsize) + log(sqrft) + bdrms, data = hprice1) Residuals: Min 1Q Median 3Q Max
-0.68422 -0.09178 -0.01584 0.11213 0.66899 CoefÏcients:
Estimate Std. Error t value Pr(>|t|) (Intercept) -1.29704
0.65128 -1.992 0.0497 * log(lotsize) 0.16797 0.03828 4.388
3.31e-05 *** log(sqrft) 0.70023 0.09287 7.540 5.01e-11 ***
bdrms 0.03696 0.02753 1.342 0.1831 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.1846 on 90 degrees of freedom
Multiple R-squared: 0.643,Adjusted R-squared: 0.6302
log(price) ~ log(lotsize) + log(sqrft) + bdrms, data = hprice1)
a. Hãy nêu ý nghĩa của các hệ số hồi quy ước lượng được. -
log(lotsize): Khi diện tích đất tăng lên 1% thì giá nhà tăng lêm 0,16%, khi các yếu tố khác không đổi -
log(sqrft) : Khi diện tích nhà tăng lên 1% thì giá nhà tăng lêm 0,7%, khi các yếu tố
khác không đổi - bdrms : Khi số phòng ngủ tăng lên 1 phòng thì giá nhà tăng lên 3,7%, khi các yếu tố khác không đổi
b. Số phòng ngủ có tác động lên giá nhà không với độ tin cậy 90%? H0: B3=0 H1: B3#0
Ta có pvalue: 0.1831 >0,1 nên không bác bỏ giả thuyết H0
c. Kiểm định giả thuyết cho rằng diện tích nhà tăng 1% thì giá nhà tăng 0,8% với mức ýnghĩa 1%? H0: B1=0,8 H1:B1#0,8
d. Hãy kiểm định tất cả các biến có ý nghĩa đồng thời ( hay hàm hồi quy phù hợp ) với mứcý nghĩa 5%. B1=B2=B3=B4=0
F= R^2/k / (1-R^2)/(n-k-1)=51,6>Fa nên bác bỏ giả thuyết H0
Câu 4: Các phát biểu sau đúng hay sai, giải thích:
a. Khi biến x3 có đa cộng tuyến với các biến độc lập khác trong mô hình thì là ước lượng kém hiệu quả.
b. Khi mẫu càng lớn thì các ước lượng càng kém chính xác..
c. Các ước lượng OLS bị chệch nếu sai số ngẫu nhiên không phân phối chuẩn.
a>Đúng. Khi biến x3x3 có đa cộng tuyến với các biến độc lập khác, nghĩa là giữa các biến trong
mô hình tồn tại mối quan hệ tuyến tính mạnh. Điều này làm tăng phương sai của các hệ số ước
lượng OLS, dẫn đến ước lượng trở nên kém hiệu quả (không tối ưu về phương sai). Mặc dù OLS
vẫn cho ước lượng không chệch, nhưng độ chính xác của các hệ số giảm đi đáng kể Câu b: Sai Giải thích:
Khi kích thước mẫu càng lớn, định lý giới hạn trung tâm đảm bảo rằng các ước lượng OLS trở nên chính xác
hơn vì phương sai của ước lượng giảm (tỉ lệ nghịch với kích thước mẫu). Nói cách khác, khi n→∞, các ước
lượng OLS sẽ tiệm cận giá trị thực của tham số (tính chất vững).