TRC NGHIM
Câu 1: M t ph n k t qu th c hi n b c bi u di ế ằng Stata đư ễn như sau:
Da vào k a bết qu c ng trên, chúng ta có th k t lu ế ận: Đây là mô hình
A. Hồi quy đa biến
B. H n ồi quy đơn biế
C. Không xác định được
D. Hàm h i quy m u phù h p v i m c ý nghĩa 5%
Câu 2: M t ph n k t qu th c hi n b c bi u di ế ằng Stata đư ễn như sau:
Nếu bi t c m u 20 thì giá tr t i h n c n tra b ng khi tìm kho ng tin c y cho các h s c ế ướ
lượng là?
A. Phân ph i Student, b do 19 B. Phân ph i Student, b do 18 c t c t
C. Phân ph i Student, b do 17 D. Phân ph i chu n c t
Câu 3: M t ph n k t qu th c hi n b c bi u di ế ằng Stata đư ễn như sau:
Mt s kh b ng k t qu ẳng định được đọc t ế như sau:
i. T ch TSS = 723.975 ổng bình phương các sai lệ
ii. T n ổng bình phương các phầ dư ESS = 107.1512
iii. S bi p trong mô hình, k c h ng s là 3 ến độc l
iv. Giá tr ki nh trong bài toán ki phù h p là 0.0515 m đị m định độ
Có bao nhiêu kh nh : ẳng đị SAI
A. 1 B. 2 C. 3 D. 4
Câu 4: M t ph n k t qu th c hi n b c bi u di ế ằng Stata đư ễn như sau:
Ý nghĩa của vic thc hin ki nh này là: ểm đị
A. Ki nh th a bi n và mô hình không x y ra th n v i m ểm đị ế a biế ức ý nghĩa 5%.
B. Ki nh th a bi n và mô hình x y ra th n v i m ểm đị ế a biế ức ý nghĩa 5%.
C. Ki nh thi u bi n và mô hình không x y ra thi u bi n v i m ểm đị ế ế ế ế ức ý nghĩa 5%.
D. Ki nh thi u bi n và mô hình x y ra thi u bi n v i m . ểm đị ế ế ế ế ức ý nghĩa 5%
Câu 5: M t ph n k t qu th c hi n b c bi u di ế ằng Stata đư ễn như sau:
Bng ma tr n hi ệp phương sai trên là:
A. Hi p c p trong mô hình h i quy phương sai ca các giá tr a các biến độc l
B. Hi a các h s ng trong mô hình h i quy ệp phương sai c ước lượ
C. Phương sai củ ến độa các giá tr ca các bi c lp trong mô hình hi quy
D. Phương sai của các h s ước lượng trong mô hình hi quy
Câu 6: Phân tích h i quy m t công c th ng nh m xây d ng m t mô hình toán h c
mô t :
A. M t bi i m t ho u bi n ph thu c. ến độc lp có tương quan vớ c nhi ế
B. M t s bi i m t s bi n ph thu c. ến độc lập có tương quan vớ ế
C. M t ph thu c có i m t ho c nhi u bi p. tương quan vớ ến độc l
D. Các đáp án trên đều sai.
Câu 7: B sót m t bi n gi i thích quan tr ng khi ch y h ng ế ồi quy thư
A. Làm tăng phương sai của các h s ước lượng.
B. Làm gi s ng ảm phương sai của các h ư c lư
C. Không a các h s ng. ảnh hưởng đến phương sai c ướ c lư
D. Ước lư c lư ướng b ch a hệch và tăng phương sai c s ng.
Câu 8: Gi s mô hình h n: ồi quy đa biế
𝑌𝑖= 𝛽1+ 𝛽2.𝑋𝑖2 + 𝛽3.𝑋𝑖3 + 𝜀𝑖
trong đó cả hai biến 𝑋2 𝑋3 ng th t s n bi n ph thu c c tiên, ta h i ảnh hưở đế ế 𝑌. Trướ
quy mô hình (1): 𝑌𝑖= 𝛽1+ 𝛽2.𝑋𝑖2 + 𝜀𝑖nh n th y h s 𝛽2 ng kê. Tuy không ý nghĩa thố
nhiên khi h i quy mô hình (1): 𝑌𝑖= 𝛽1+ 𝛽2.𝑋𝑖2 + 𝛽3.𝑋𝑖3 +𝜀𝑖 h s ng ước lượ 𝛽2
thay đổi bi
một lượng l ớn và do đó tham số 𝛽2 tr nên u này cho th y r ng: có ý nghĩa thống kê. Điề
A. Mô hình (1) đúng vì vậy có th k t lu n ế 𝑋2 th t s không n ảnh hưởng đế 𝑌.
B. Mô hình (1) b ch ch do b sót bi n quan tr ng. ế
C. Mô hình (1) b th a bi n. ế
D. Mô hình (2) b th a bi n. ế
Câu 9: Giá tr ki nh trong bài toán ki phù h p c a bi n ph thu ểm đị ểm định độ ế c Y là:
A. 1.7695 và hàm h i quy m u phù h p v i m ức ý nghĩa 5%
B. 0.1285 và hàm h i quy m u phù h p v i m ức ý nghĩa 5%
C. 1.7695 và hàm h i quy m u KHÔNG phù h p v i m ức ý nghĩa 5%
D. 0.1285 và hàm h i quy m u KHÔNG phù h p v i m ức ý nghĩa 5%
Câu 10: Đồ ợu bia hàng tháng đư th thi gian ca d liu v doanh thu bán l c cho
như sau:
Đồ th trên cho thy d liu:
A. Có tính xu thế tăng theo thời gian B. Không có tính mùa v
C. Có trung bình k i theo th i gian D. Có xu th gi m d n theo th i gian hông thay đổ ế
Câu 11: K t qu ế ước lượng tiền lương (wage) theo kinh nghi m ( exp (đơn vị: năm) exp2),
gii tính (male state: = 1 đố ới nam, = 0 đối v i vi n), khu vc vic làm ( : = 1 đối vi nhng
người làm vi c trong khu v i vực công, = 0 đ i nh i làm viững ngườ c trong khu vực
nhân) được cho như sau:
𝑤𝑎𝑔𝑒 = 40.5 + 0.4𝑒𝑥𝑝 0. 𝑒𝑥𝑝 + 4.6𝑚𝑎𝑙𝑒 2.3𝑠𝑡𝑎𝑡𝑒 + 1.2𝑚𝑎𝑙𝑒 𝑠𝑡𝑎𝑡𝑒08 2
S khác bi t v ti a m t ph n m làm vi c trong n lương trung bình giữ 10 năm kinh nghiệ
khu v c công và m ột người đàn ông có cùng số năm kinh nghiệm nhưng làm việ c trong khu vc
tư nhân là:
A. 6.9 B. 2.3 C. 4.6 D. 1.2
Câu 12: Xét hình h i quy . D a trên 50 quan sát, ta tìm 𝒀 = 𝜷 +𝜷 𝑿 + 𝜷 𝑿 + 𝜺𝟎 𝟏 𝟏 𝟐 𝟐
được h s xác đị Xác đị m định 𝑹 = 𝟎. .𝟐 𝟖𝟓𝟐𝟔 nh giá tr ca thng F ki nh s phù
hp c a mô hình m t giá tr tra b ng Fisher là . ức ý nghĩa 5%. Cho biế 𝑭 = 𝟑.𝟎. ;𝟐;𝟎𝟓 𝟒𝟕 𝟏𝟗𝟓
A. F=135.93, mô hình không phù h p B. F=135.93, mô hình phù h p
C. F=138.82, mô hình không phù h p D. F=138.82, mô hình phù h p
Câu 13: K t qu h c cho trong b ng sau ế ồi quy đượ
Trong đó: wage (tiền lương); educ (số m đi họ m kinh ngh c); exper (s im)
Tìm t t c các phát bi u SAI:
i. Adj R-squared c a mô hình là x p x 22.22%
ii. Mô hình có ý nghĩa (phù hợ p) v i p_value có giá tr 0.049 ti mức ý nghĩa 1%.
iii. S ng tham s (h s ) c ng c a mô hình là 2 lượ ần ước lượ .
A. ii, iii B. ii C. i D. i, iii
Câu 14: K t qu h i quy d li u b ế ảng như sau
Tìm đáp án ĐÚNG, v ức ý nghĩa 5%. i m
A. Mô hình REM tốt hơn mô hình FEM
B. Mô hình REM t p (Pooled OLS) ốt hơn mô hình gộ
C. Mô hình FEM t ốt hơn mô hình REM
D. Mô hình gp (Pooled OLS) t t hơn mô hình FEM
Wald test: {𝐻0: 𝑢𝑖= 0 (𝑃𝐿𝑂𝑆)
𝐻1:∑𝑢𝑖2𝑛−1
𝑖=1 > 0 (𝐹𝐸𝑀)
LM test: {𝐻0: 𝜎𝑢2= 0 (𝑃𝐿𝑂𝑆)
𝐻1:𝜎𝑢
2> 0 (𝑅𝐸𝑀)
Hausman test: {𝐻0: 𝐶𝑜𝑣(𝑢𝑖,𝑥𝑖𝑡) = 0 (𝑅𝐸𝑀)
𝐻1:𝐶𝑜𝑣(𝑢𝑖,𝑥𝑖𝑡) 0 (𝐹𝐸𝑀)
𝑝 𝑣𝑎𝑙𝑢𝑒 < 𝛼 => Bác b H 0
Câu 15: S d ng d li u thu th p t c tính m i quan h gi a thu nh p 100 nhân viên để ướ
(X, tri ng) và chi tiêu (Y, tri ng) hàng tháng b ng hình h n ệu đồ ệu đồ ồi quy đơn biế 𝒀 =
𝜷𝟎+ 𝜷 𝑿 + 𝜺𝟏 𝒊 𝒊. Ta k t qu hế ồi quy như sau: 𝑌 𝑋 = 5.5 + 0.7 . Tìm kho ng d báo v i
độ tin c y 95% cho chi tiêu trung bình c a m i có thu nhột ngườ p 15 tri ng / tháng. ệu đồ
Cho bi t, t i ế 𝑋0=15 thì 𝑆𝑒(𝑌0
)= 0.57, và 𝑡0.025
98 = 1.98
A. (15.43, 16.57) B. (14.87, 17.13)
C. (14.02, 17.98) D. (14.50, 17.50)
Câu 16: Kết qu h i quy gi a ti thu h c v n (educ) th ền lương (wage) phụ ộc vào trình độ
hin trong bng sau:
Đế m s phát bi ểu ĐÚNG
i. educ gi c 16.48% s i c a wageải thích đượ thay đổ
ii. Bi mến educ có ý nghĩa ở ức ý nghĩa 1%.
iii. Mô hình đề xut phù h p v i mc ý nghĩa 5%.
A. 3 B. 1 C. 2 D. 0
Câu 17: K t qu h i quy d li u b ế ảng như sau
Tìm đáp án ĐÚNG, v ức ý nghĩa 5%. i m
A. Mô hình FEM tốt hơn mô hình gộp (Pooled OLS)
B. Mô hình REM t p (Pooled OLS) ốt hơn mô hình gộ
C. Mô hình g p (Pooled OLS) t t hơn FEM
D. Mô hình gp (Pooled OLS) t ốt hơn REM
Câu 18: M t nghiên c u nh m ki m tra xem th i gian di chuy n t ng nơi đến trườ
ảnh hưởng đến kết qu hc tp c a h c sinh hay không. D li u nghiên c u g m bài ồm: điể
kim tra ca h c sinh (y), s gi h c sinh dành cho vi c di chuy ng m ển trên đườ i ngày (d,
gi), x1, x2, x3 là m t s bi n ki m soát khác. ế
Vi m t m u g m 30 quan sát, k t qu ng mô hình h ế ước lượ ồi quy thu được như sau (trong dấu
ngoặc đơn là độ lch chun ca h s ước lượng):
ln(𝑦 = 5.0 5.7𝑥) 1−10𝑥2+ 0. 𝑥03 3 0.3𝑑, v i 𝑅2= 0.78
Ý nghĩa củ ước lượng đứng trướ ải thích d là: trong điềa h s c biến gi u kin tt c các yếu t
khác không đổi, khi thi gian hc sinh di chuyển trên đườ ỗi ngày tăng thêm 1 giờ, điểng m m thi
trung bình c m a học sinh đó giả
A. 0.3% B. 3% D. 30% C. 0.3 đơn vị
Câu 19: M t b ng k t qu ế thu được t Stata như sau:
Ý nghĩa của vic thc hin ki nh này là: ểm đị
A. Đây kế ểm địt qu ca ki nh tha biến hình không xy ra th a bi n v i m ế ức ý nghĩa
5%.
B. Đây là kết qu ca ki nh thi u bi n và mô hình có x y ra thi u bi n v i mểm đ ế ế ế ế ức ý nghĩa 5%.
C. Đây là kết qu c a ki ểm định đa cộng tuyến mô hình xảy ra đa cộng tuy n v i mế ức ý nghĩa
5%.
D. Đây kế m định phương sai sai số thay đổ ện tượt qu ca ki i hình xy ra hi ng
phương sai sai số ay đổ ức ý nghĩa 5% th i m .
Câu 20: hình h i quy b c s d ng c a các bi n X1, X2, X3 ội đượ ụng để đánh giá tác độ ế
lên Y. Sau khi th c hi n h i quy, chúng ta nh c các h s ận đượ phóng đại phương sai trên
STATA như sau:
Tìm đáp án ĐÚNG
A. Mô hình không có hi ng t ện tượ tương quan
B. Mô hình có hi ng tuy n n tượng đa cộ ế
C. Mô hình không có hi ng tuy n ện tượng đa cộ ế
D. Mô hình có hi i n tượng phương sai thay đổ
Câu 21: Xét m t hình h i xu th c a logarit doanh s bán l ế ợu bia hàng năm
(ln_liquor=log(liquor), tính b ằng đô la) như sau:
Trong các kh nh sau, có bao nhiêu kh ẳng đị ẳng định ĐÚNG?
i. Hàm xu th b c nh t là phù h p v i chu i th i gian này mế ức ý nghĩa 5%.
ii. Khi t tăng 1 năm thì doanh số bán l rượu bia tăng trưng vi t c trung bình là 0.34% độ .
iii. Hàm xu th b c nh t gi ng 90.28% cho t ng bi n thiên c a doanh s bán ế ải thích được kho ế
l rượu bia hàng năm.
A. 0 B. 3 C. 2 D. 1
Câu 22: Dùng d li u thu th p t c tính m i quan h gi a thu nh p (X, 42 nhân viên để ướ
triệu đồng) và chi tiêu (Y, tri ng) hàng tháng b ng mô hình h n ệu đồ ồi quy đơn biế 𝒀 =
𝜷𝟏+ 𝜷 + 𝜺𝟐𝑿𝟐 . Ta có k t qua h ế ồi quy như sau:
Vi k t qu ng trên, xét các kh nh sau: ế ướ c lư ẳng đị
(i) Sai s chu n c a mô hình h i quy m u (S.E. of regression), ký hi u 𝜎 b ng 0.1699
(ii) Tr th ng F-Statistics dùng ki phù h p c a hình v i c p gi thuy ểm định độ ết
{𝐻0:𝑅2= 0
𝐻1:𝑅2 0 𝐹 = 281.853
(iii) Mô hình phù h p m t ức ý nghĩa 5%, biế 𝐹0. ;1;05 40 = 4.0847
Trong các khẳng đị ng định đúng?nh trên có bao nhiêu kh
A. 0 B. 1 C. 2 D. 3
(i) tính sai s chu a h i quy (S.E. of regression), ta lĐể n c y căn bậc hai ca Mean Squared
Error (MSE). MSE c tính b ng cách chia Sum squared resid cho degrees of freedom (b c đượ
t do).
𝑀𝑆𝐸 = 1.155147
40 = 0.028879
𝜎 = 0. = 0.√𝑀𝑆𝐸 = 028879 169938
Câu 23: Xét mô hình h i quy gi a bi n ph thu p X, d a trên b d li u ế c Y và bi c lến độ
mu, ta có:
∑𝑋
𝑛
𝑖=1 =90; 𝑌
𝑛
𝑖=1 =340 104;𝑛 = 4;𝐸𝑆𝑆 =
∑(𝑌 𝑌
)(𝑋 𝑋)
𝑛
𝑖=1 = 𝑋 𝑋156; ∑(
)2
𝑛
𝑖=1 =234; ∑(𝑌 𝑌
)2
𝑛
𝑖=1 =1974
H s góc c a mô hình h i quy m u là:
A. -0.667 B. 0.667 C. 100 D. -100
H s góc c a mô hình h i quy m u (ký hi c tính b ng công th c: ệu là b) đượ
𝛽2=∑(𝑌 𝑌
)(𝑋 𝑋)
𝑛
𝑖=1
∑(𝑋 𝑋
)2
𝑛
𝑖=1 =−156
234 = −0.667
Tổng bình phương toàn phần (TSS): 𝑇𝑆𝑆 = (𝑌 𝑌
)2
𝑛
𝑖=1 =1974
H s nh (R-squared): xác đị 𝑅2=𝐸𝑆𝑆𝑇𝑆𝑆 =104
1974 = 0.0527
H s ch n: 𝛽1= 𝑌
− 𝛽2𝑋=∑𝑌
𝑛
𝑖=1
𝑛 𝑏∑𝑋
𝑛
𝑖=1
𝑛=340 4−(−0.667)90
4=100 0075.
Phương trình hồi quy: 𝑌 = . 0.100 0075 667𝑋
Độ l ch chu n c a sai s chu n (Standard Error of Regression - SER): 𝑆𝐸𝑅 = 𝑅𝑆𝑆𝑛−2 =√1870
4−2 =
30 578.
Kiểm định t vi 𝑆𝑒(𝛽1)=𝑆𝐸𝑅
√ ∑ (𝑋−𝑋
)2
𝑛
𝑖=1 =30.578
√234 = 1.9989
Câu 24: Trong h i quy tuy n tính n u , thì h s nh ế ế 𝑻𝑺𝑺 = 𝟒𝟓𝟎𝟎 𝑹𝑺𝑺 =𝟏𝟓𝟕𝟓 xác đị 𝑹𝟐
là:
A. 0.45 B. 2.85 C. 0.35 D. 0.65
Câu 25: N u k t qu ng OLS t m t t p d li u thì ế ế ước lượ 𝑬𝑺𝑺 = 𝟒𝟎𝟎 𝑹𝑺𝑺 =𝟏𝟎𝟎
h s nh là: xác đị 𝑹𝟐
A. 0.80 B. 0.25 C. 0.10 D. 0.40
Câu 26: K t qu ng chi tiêu (Y, tri ng) theo thu nh p (X, tri ng) có d ng ế ước lượ ệu đồ ệu đồ
𝒀 = 𝜷 + 𝜷 𝑿 + 𝑼𝟏 𝟐 t m t m u d li c cho trong b ng sau: ệu đượ
Thu nh p trung bình h s ng c a tham s ước lượ 𝛽2 c a hình h i quy m u trên l t ần
là:
A. 14.2 và 0.6715 B. 15 và 0.7095
C. 12.6 và 0.8264 D. 15 và 0.4369
Ta có: 𝑡𝑠𝑡𝑎𝑡 =𝛽2
𝑆𝑒(𝛽2
) => 𝛽2
= 𝑡𝑠𝑡𝑎𝑡 ∗𝑆𝑒(𝛽2)=30 79635 02304 7095. 0. = 0.
𝑌
= 𝛽1+ 𝛽2𝑋 => 𝑋=𝑌
−𝛽1
𝛽2=11.7−1.056618
0.7095 =15 001.
Câu 25: Trong mô hình h i quy: k v 𝒀 = 𝜷 + 𝜷 𝑿+ 𝜺𝟏 𝟐 ọng có điều kin c a Y, là: 𝑬(𝒀|𝑿)
A. Trung bình ca t các giá trt c c a Y trong m u kh o sát
B. 𝛽1+ 𝛽2𝑋 + 𝜀
C. 𝛽1+ 𝛽2𝑋
D. Trung bình ca t các giá trt c c a X trong m u kh o sát
Câu 26: Trong hình h i quy tuy n d ng , phát ến tính đơn biế 𝒀𝒊= 𝜷 + 𝜷 + 𝑼𝟏 𝟐𝑿𝒊 𝒊
biểu nào sau đây không ph ủa phương pháp bình phương ci gi định c c tiu OLS v
các sai s ng u nhiên ? 𝑼𝒊
A. Phương sai của các sai s ngu nhiên 𝑈𝑖 là gi ng nhau cho t t c các giá tr c a bi c l p ến độ
B. Các sai s ng u nhiên 𝑈𝑖 tuân theo phân ph i chu n.
C. K v ng c a các sai s ng u nhiên 𝐸(𝑈𝑖)= 1 (=0)
D. Các sai s ng u nhiên 𝑈𝑖 là độc lp vi nhau
Câu 27: Xét mô hình , k t qu kh o sát m𝑾𝑨𝑮𝑬 = 𝜷 + 𝜷 𝑨𝑮𝑬 + 𝑼𝟏 𝟐 ế t mu g m 100 quan
sát có các giá tr trung bình c a ti ền lượng (WAGE) và tu i (AGE) l ần t là 70 và 30. Mô
hình h i quy m c có h s g t cá nhân 20 tu i v i ẫu thu đư ốc 2. Khi đó, xét mộ ổi. Đ
nhân này, m c d mô hình h i quy là: ức lương trung bình đượ đoán từ
A. Không th d c B. 60 C. 50 D. 70 đoán đượ
Câu 28: Xét hình h i quy tuy n . G a s giá tr ến tính đơn biế 𝒀𝒊= 𝜷 + 𝜷 + 𝑼𝟏 𝟐𝑿𝒊 𝒊 𝑹𝟐
ca mô hình h ồi quy ướ ợng đúng bằng 1. Điều nào sau đây là đúng?c lư
(i) Tt c m d li u ph i n m h ng th ng. các điể ết trên 1 đườ
(ii) T t c các sai s u ph i b ng 0. ước lượng đề
(iii) Tt c s bi ng so v i trung bình c c gi i thích b ng mô hình. ến độ ủa Y đều đượ
(iv) Đường h ng thồi quy ướ ợng là đườc lư ng nm ngang.
A. Không th nh t c cung c p được xác đị thông tin đượ
B. Ch có (i) và (iii) đúng
C. Ch có (ii) và (iv) đúng
D. Ch có (i), (ii) và (iii) đúng
Câu 29: K t qu ng c a m t quy trang c a quy n ế ước lượ ển sách (Y, đơn vị đôla) theo số
sách đó (X, trang) như sau:
Trong s các kh nh sau, có bao nhiêu kh ẳng đị ẳng định đúng?
(i) S trang sách trung bình c a quy ển sách đó xấp x 601 trang.
(ii) T b ng 4.903075 ổng bình phương phần dư, RSS, có giá trị
(iii) Hai bi ch bi n. ến X và Y có tương quan nghị ế
(iv) S trang sách gi c 56.3% cho t ng bi n thiên trong giá bán c a m t quy n sáchi thích đượ ế .
A. 1 B. 2 C. 3 D. 4
Câu 30: K t qu ng c a m t quy trang c a quy n ế ước lượ ển sách (Y, đơn vị đôla) theo số
sách đó (X, trang) như sau:
Trong các khẳng đị ẳng định đúng?nh sau, có bao nhiêu kh
(i) Trung bình ca X b ng 500
(ii) Khoảng ước lượng với độ tin cy 95% cho h s góc là (-0.0001; 0.0199)
(iii) Hai bi ng biến X và Y có tương quan đồ ến
A. 0 B. 1 C. 2 D. 3
T LU N
Câu 1: M t bài toán có k t qu h ế ồi quy như sau:
price: Giá tr c tính (tri u VND) ướ
total_area: T ng di n tích sàn (m2)
duration: Th i gian sinh s ống (năm)
no_of_bedroom: S ng phòng ng lượ
no_of_bathroom: S ng phòng t m lượ
travel_time: Th ời gian đi làm (phút)
distance: Kho ng cách t n trung tâm thành ph - CBD (km) nhà đế
popu_density: M dân s khu v c i/km2) ật độ (ngườ
Giá tr tra b ng 𝑡0.025102 = 1. 𝐹983; 0. ;7;05 102 = 2. 𝐹100; 0. ;4;05 102 = 2.460
a) V i m n hãy ki a t ng bi n gi i thích. ức ý nghĩa 5% bạ ểm định tính có ý nghĩa củ ế
Cp gi thuy t: ế 𝐻0:𝛽𝑖= 0 𝐻; 1:𝛽𝑖 0
- Bi n total_area: ế 𝑡𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎 =𝛽𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎
𝑆𝑒(𝛽𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎
)=26.992
5.765 = 4.682
|𝑡𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎|> 𝑡0.025
102 => Bác b gi thuy t H => Bi ng kê. ế 0 ến total_area có ý nghĩa thố
- Bi n duration: ế 𝑡𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛 =𝛽𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛
𝑆𝑒(𝛽𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛
)=129.802
38.455 = 3.375
|𝑡 > 𝑡𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛| 0.025
102 => Bác b gi thuy t H => Bi n duration ng kê. ế 0 ế có ý nghĩa th
- Bi n no_of_bedroom: ế 𝑡𝑛𝑜_𝑜𝑓_𝑏𝑒𝑑𝑟𝑜𝑜𝑚 =𝛽𝑛𝑜_ _𝑏𝑒𝑑𝑟𝑜𝑜𝑚𝑜𝑓
𝑆𝑒(𝛽𝑛𝑜_ _𝑏𝑒𝑑𝑟𝑜𝑜𝑚𝑜𝑓
)=723.504
368.484 = 1.963
|𝑡𝑛𝑜_𝑜𝑓_𝑏𝑒𝑑𝑟𝑜𝑜𝑚|< 𝑡0.025
102 => Ch p nh n gi thuy ết H => Bi n no_of_bedroom không 0 ế ý nghĩa
thng kê.
- Bi n no_of_bathroom: ế 𝑡𝑛𝑜_ _𝑜𝑓 𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚 =𝛽𝑛𝑜_ _𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚𝑜𝑓
𝑆𝑒(𝛽𝑛𝑜_ _𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚𝑜𝑓
)=166.382
381.748 = 0.436
|𝑡𝑛𝑜_ _𝑜𝑓 𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚|< 𝑡0.025
102 => Ch p nh n gi thuy t H => Bi n no_of_bathroom không ý ế 0 ế
nghĩa thống kê.
- Bi n travel_time: ế 𝑡𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒 =𝛽𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒
𝑆𝑒(𝛽𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒
)=−26 065.
23.992 = −1.0864
|𝑡𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒|< 𝑡0.025
102 => Ch p nh n gi thuy ết H => Bi0 ến travel_time ng không có ý nghĩa thố
kê.
- Bi n distance: ế 𝑡𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 =𝛽𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒
𝑆𝑒(𝛽𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒
)=−55.944
44.047 = −1.2701
|𝑡𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒|< 𝑡0.025
102 => Ch p nh n gi thuy t H => Bi n distance ng kê. ế 0 ế không có ý nghĩa thố
- Bi n popu_density: ế 𝑡𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦 =𝛽𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦
𝑆𝑒(𝛽𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦
)=0.008
0.015 = 0.533
|𝑡𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦|< 𝑡0.025
102 => Ch p nh n gi thuy t H => Bi ế 0 ến popu_density không ý nghĩa
thng kê.
- Bi n t do (_cons): ế 𝑡_𝑐𝑜𝑛𝑠 =𝛽_𝑐𝑜𝑛𝑠
𝑆𝑒(𝛽_𝑐𝑜𝑛𝑠
)=−1438.496
1294.727 = −1.111
|𝑡_𝑐𝑜𝑛𝑠|< 𝑡0.025
102 => Ch p nh n gi thuy t H => Bi n t do ng kê. ế 0 ế không có ý nghĩa thố
b) Hãy ki nh s phù h p c a mô hình v i m m đị ức ý nghĩa 5%
Cp gi thuy t: ế 𝐻0:𝑅2= 0 𝐻; 1:𝑅2 0
𝐹(7,182)< 𝐹0. ;7;05 102 => Bác b gi thuy t H ế 0
Vy, t i m i quy không phù h p. ức ý nghĩa 5%, hàm hồ
c) ý ki n cho r ng các bi n No_of_bathroom; Travel_time; Distance; Popu_density ế ế
th b lo i kh i hình v i m n hãy xây d ng gi thi t ki nh ý ức ý nghĩa 5%. B ế ểm đị
kiến này.
Cp gi thuy t: ế
H0: Các bi n no_of_bathroom, travel_time, distance, popu_density không ng ế ảnh hưở đáng kể
đến mô hình.
H1: Có ít nh t m t bi n có n bi n ph thu c. ế ảnh hưởng đáng kể đế ế
Kiểm định:
Chy h i quy b ng Stata v i hình rút g n (lo i b các bi n no_of_bathroom, travel_time, ế
distance, popu_density). c các giá tr , Ta có đư 𝑅2 𝑅2
m i. Ta có th so sánh hai mô hình b ng
cách so sánh giá tr 𝑅2
:
+ N u ế 𝑅2
tăng, mô hình m i gi i thích bi ng c a bi n ph thu c t t ến độ ế hơn mô hình cũ. Ta
th lo i b đồng thi các bi n no_of_bathroom, travel_time, distance, popu_density. ế
+ N u ế 𝑅2
gi m, hình m i gi ải thích kém hơn mô hình cũ. Ta không nên loi b đồng th i các
biến no_of_bathroom, travel_time, distance, popu_density.
d) Gi a R-squared. ải thích ý nghĩa củ
Ch s R-squared cho bi t ph ng c a bi n ph thu c gi i thích b ế ần trăm biến độ ế ộc đượ i các bi n ế
độc lp trong mô hình.
ESS: t c gi i thích bổng bình phương đượ i hình, ch ra m biức độ ến thiên ca biến ph
thuộc được mô hình gi i thích.
RSS: t ch còn l n ng c a các bi c l p, ng bình phương sai lệ ại sau khi đã tính đế ảnh ến độ
ch ra mức độ bi c gi i thích b i mô hình. ến thiên không đư
TSS: Tổng bình phương sai lch toàn b , bao g m c ph ần được gi i thích ph ần không đưc
gii thích.
df (Degrees of freedom): B do. c t
Model df: S bi c l p trong mô hình (không tính h ng s ). ến độ
Residual df: n - k - 1, v i n là s quan sát và k là s bi p. ến độc l
Total df: n - 1.
MS ng SS chia cho df. (Mean Square): Bình phương trung bình. Được tính b
Model MS: Đo lường s bi c gi i thích trên m i b do c a mô hình. ến thiên đượ c t
Residual MS: Đo lư ến thiên không đượ ần dư.ng s bi c gii thích trên mi bc t do ca ph
F(df1, df2): Th a mô hình v a ph c ống F. So sánh phương sai củ ới phương sai củ ần dư. Đư
dùng để ịnh ý nghĩa t kiểm đ ng th ca mô hình.
Prob > F: Giá tr p (p- ng v i th ng F. N u p-value nh value) tương ế hơn mức ý nghĩa
(thường là 0.05), ta bác b gi thuy t không r ng t t c các h s h ế ồi quy đều bng 0 (mô hình
có ý nghĩa thống kê).
Coefficient: H s h ng. Ch ồi quy ước lư ra ng cảnh hư a bi n biến độc lập đế ến ph thuc.
Nếu h s p có m i quan h thu n v i bi n ph thu i. dương, biến độc l ế ộc, và ngược l
Std. Err.: Sai s chu n c a h s h i quy. chính xác c ng h s . Sai s Đo lường độ ủa ước lượ
chun càng nh ng càng chính xác. ỏ, ước lư
t: Th ki ng cống t. Được dùng để ểm định ý nghĩa thố a tng h s h c tính ồi quy. Đượ
bng . Coefficient / Std. Err.
P>|t|: Giá tr p (p- ng vvalue) tương ứ i th ng kê t. Nếu p-value nh hơn mức ý nghĩa (thưng
0.05), ta bác b gi thuy t không r ng h s h i quy b ng 0 (bi ế ến độc l p có ảnh hưởng đáng
k n bi n phđế ế thuc).
[95% Conf. Interval]: Kho ng tin c y 95% cho h s h i quy. Kho ng này cho bi t kho ng ế
giá tr mà h s h i quy th có th n i xác su t 95%. c s ằm trong đó v
Câu 2: M t nhóm sinh viên t ng A mu n tìm hi u v nh ng y u t ng ại trườ ế có th ảnh hư
đế n kh i điểm khi ra trườ ởng đếng. Tuy nhiên nếu ch lit kê các biến có th ảnh hư n mc
lương, điề ết mình ĐÚNG hay SAI, u này s gây ra mt s tranh cãi ln s không ai bi
theo b này b n s làm gì? ạn đề
Đầu tiên, mô hình đượ ải là mô hình đảc chn ph m bo tính tiết kim, tính đồng nht, tính thích
hp (có R2 ho c R2 cao), tính v ng v m t lý thuy t và có kh d báo. ế ng
Để gii quyết các tranh cãi đúng hay sai giữa nhóm sinh viên, ta có th chy h i quy hình
trên b ng ph n m ki nh các gi thuy ềm Stata để ểm đị ết đánh giá mô hình.
+ Ki phù h p c a các h s h i quy (ki nh t): xem xét các bi c l p trong mô ểm định độ ểm đị ến độ
hình ý nghĩa thống hay không. T i thích t ng c a bi c l n bi n ph đó gi ác độ ến độ ập đế ế
thu lộc đố ến ý nghĩa thố đưa ra i vi các bi ng kê, i khuyên b ho c b ng th i các bi n đồ ế
không có ý nghĩa thng kê.
+ Ki nh phù h p c a mô hình (ki nh F, xem xét giá tr R-squared, Adj R-squared): ểm đị độ ểm đị
xem xét ng t ng th , phù h ng phhình này có ý nghĩa th ợp hay không; đo lườ ần trăm
biến động ca biến ph thuộc được gii thích bi mô hình.
Tránh đểhình mc phi các loi sai lm ch định, vi phm gi thuyết OLS như:
+ B sót bi n thích h p (thi u bi n) ng bi n không thích h p (th a bi n): s ế ế ế hay đưa vào nhữ ế ế
dng ki nh Ramsey v i s h tr c a ph n m m Stata. ểm đị
+ Ki ng tuy n, i, sai s ng u nhiên không tuân theo phân m định đa cộ ế phương sai sai số thay đổ
phi chu n.
Câu 3: S d ng s li u c a 190 doanh nghi ệp thương mại năm 2016 được k t qu ế ước lượng
sau:
NS = 8.47 + 0.02K - 12.40L + e
Se (7.32) (0.001) (1.96)
R² = 0.817; F - statistic = 425.5; n = 190
Trong đó NS năng suất lao đ lao động trung bình, K tài sn vn, L s ng ca doanh
nghip.
a) Nêu ý nghĩa ca các h s ước lượng được
- Bi , các y u t i . ến K: Khi K tăng 1 đơn vị ế khác không đổ thì NS tăng 0.02 đơn vị
- Bi , các y u t i thì NS gi . ến L: Khi L tăng 1 đơn vị ế khác không đổ ảm 12.4 đơn vị
- Khi các bi n khác b ng 0, NS b ng 8.47 . ế đơn vị
b) Tìm kho ng tin c y 90% cho các tham s c a mô hình h i quy
Giá tr 𝑡0.05187 = 𝑍 0. = 1.( 05) 645
- Kho ng tin c y 90% c a bi n K: ế (𝛽𝐾
± 𝑡𝛼
2
𝑛−𝑘 ∗𝑆𝑒(𝛽𝐾
)) =(0.02 ± 1.645 0.001)
(0. ;0.018 022)
- Kho ng tin c y 90% c a bi n L: ế (𝛽𝐿
± 𝑡𝛼
2
𝑛−𝑘 ∗𝑆𝑒(𝛽𝐿
)) =(−12 645 96.4 ± 1. 1. )
(− . ;9.15 624 176)
- Kho ng tin c y 90% c a bi n t do: ế (𝛽𝑐𝑜𝑛𝑠
± 𝑡𝛼
2
𝑛−𝑘 ∗𝑆𝑒(𝛽𝑐𝑜𝑛𝑠
)) =(8.47 ± 1.645 7.32)
(−3. .571 20; 511)
c) V i m ức ý nghĩa 5%, hãy cho biết: S lao động có tác động đến năng suất trung bình c a
doanh nghi p hay không?
Để biết s lao động tác động đến năng suất trung bình ca doanh nghip không, ta tiến hành
kiểm định tính có ý nghĩa thống kê ca biến L.
Cp gi thuy t: ế 𝐻0:𝛽𝐿= 0 𝐻; 1:𝛽𝐿0
𝑡𝐿=𝛽𝐿
𝑆𝑒(𝛽𝐿
)=−12.4
1.96 = −6.327
|𝑡 > 𝑡𝐿| 0.025187 = 1.96 => Bác b gi thuy t H => Bi n L ng kê. ế 0 ế có ý nghĩa thố
Vy s t trung bình c a doanh nghi p (không có b ng ch ng lao động có tác động đến năng suấ
cho rng s t trung bình c a doanh nghi p). lao động không tác động đến năng suấ
d) V i m t: Hàm h i quy m u có phù h p hay không? ức ý nghĩa 5%, hãy cho biế
Cp gi thuy t: ế 𝐻0:𝑅2= 0 𝐻; 1:𝑅2 0
𝐹𝛼𝑘−1;𝑛−𝑘 = 𝐹0.052;187 = 3.493
𝐹𝑠𝑡𝑎𝑡 =𝑅2(𝑛 𝑘)
(1 𝑅 )(𝑘 1)2 =425.5
𝐹𝑠𝑡𝑎𝑡 > 𝐹𝛼
𝑘−1;𝑛−𝑘 => Bác b gi thuy t H => Hàm h i quy m u phù h ế 0 p.
e) V i m t: Khi v ức ý nghĩa 5%, hãy cho biế ốn lao động cùng tăng một đơn vị thì năng
suất lao đ ệp phương sai giững gim hay không? Biết rng hi a các h s ca K L bng
-0.003?
Giá tr 𝑡0.025
187 = 𝑍 0. = 1.( 025) 960
Cp gi thuy t: ế 𝐻0:𝐾+ 𝐿 0 𝐻; 1:𝐾 + 𝐿 > 0
𝑆𝑒(𝛽𝐾
+ 𝛽𝐿)=√𝑉𝑎𝑟(𝛽𝐾)+𝑉𝑎𝑟(𝛽𝐿)+ 2𝐶𝑜𝑣(𝛽𝐾,𝛽𝐿)=√0.001 + 1.96+ 2 (−0.003)
= 1.398
𝑡 = 𝛽𝐾
+ 𝛽𝐿
𝑆𝑒(𝛽𝐾
+ 𝛽𝐿
)=0.001 + 1.96
1.398 = 1.403
|𝑡|< 𝑡0.025
187 => Ch p nh n gi thuy ết H => b0 ng chng cho thy khi v ng cùng ốn lao độ
tăng một đơn vị thì năng suấ t lao động gim.
f) Có ý ki n cho r ng còn ph thu ng làm vi c có thân ế ằng: Năng suất lao độ ộc vào môi trườ
thiện hay không? Để đem biến môi trườ ng làm vic vào mô hình, chúng ta có các cách nào
để đem biến đó vào mô hình?
Nếu năng suất lao đng ph thu ộc vào môi trường làm vi c, ta có thêm bi n này b ng nhi u cách ế
dưới dng:
+ Bi n gi : N ng làm vi c phân lo i (ví d : thân thi n/không thân thi n), ta ế ếu môi trư ệc đượ
th t o bi n gi (= 1 n ng thân thi n, = 0 n ng không thân thi n). ế ếu môi trườ ếu môi trườ
+ Bi n liên t c: Nế ếu môi trường làm việc được đo lườ ằng thang điểng b m, ta có th s d ng bi n ế
liên t c.
To mô hình m i bao g m bi ng làm vi cch y h i quy b ng ph n m m Stata. Ta ến môi trườ
thu đượ c giá tr F-stat, R-squared, Adj R-squared m i.
Ta có th so sánh giá tr Adj R-squared gi a m ch n mô hình phù h p: ô hình cũ và mới để
+ N u Adj R- mô hình m i gi i thích biế squared tăng, ến động c a bi ến ph thu c t t hơn mô hình
cũ. Có thể đưa ra kế ằng môi trườ ệc có tác động đến năng suất lao độ t lun r ng làm vi ng.
+ N u Adj R-squared gi m, mô hình m i gi t lu n ế ải thích kém hơn mô hình cũ. Có thể đưa ra kế
rng ng làm vi ng. môi trườ ệc không có tác động đáng kể đến năng suất lao độ
Câu 4: Câu h i v các y u t ế ảnh hưởng đến quy nh mua hàng mết đị ột trang thương mại
điệ ến t thì bi n ph thu c và các bi c l c lến độ ập đượ a chn là gì? Mô hình kinh tế ng
được s d ng? Các bài toán kinh t ế lượng và ki nh phù h p v i môn Kinh t ng là ểm đị ế lượ
gì?
Biến ph thu c: purchase_decision: quy nh mua hàng, là bi n nh phân, = 1 n i dùng ết đị ế ếu ngườ
quyết định mua, = 0 n i dùng không mua. ếu ngườ
Biến độc lp có th là:
+ Income: Thu nh p c i dùng (USD/tháng). ủa ngườ
+ Age: Tu i c i dùng. a ngư
+ Gender: Gi i tính c i dùng (= 1 n u là nam, = 0 n u là n ). ủa ngườ ế ế
+ Price: Giá c n ph m (USD). a s
+ Review: S ng và ch m t n 5). lượ ất lượng đánh giá của khách hàng (thang điể 1 đế
𝑝𝑢𝑟𝑐ℎ 𝑒 =𝑓(𝑖𝑛𝑐𝑜𝑚𝑒, ,𝑔𝑒𝑛𝑑𝑒𝑟,𝑝𝑟𝑖𝑐𝑒,𝑟𝑒𝑣𝑖𝑒𝑤)𝑎𝑠 𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛 𝑎𝑔𝑒

Preview text:

TRC NGHIM
Câu 1: Mt phn kết qu thc hin bằng Stata được biu diễn như sau:
Dựa vào kết quả của bảng trên, chúng ta có thể kết luận: Đây là mô hình A. Hồi quy đa biến B. Hồi quy đơn biến
C. Không xác định được
D. Hàm hồi quy mẫu phù hợp với mức ý nghĩa 5%
Câu 2: Mt phn kết qu thc hin bằng Stata được biu diễn như sau:
Nếu biết cỡ mẫu là 20 thì giá trị tới hạn cần tra bảng khi tìm khoảng tin cậy cho các hệ số ước lượng là?
A. Phân phối Student, bậc tự do 19
B. Phân phối Student, bậc tự do 18
C. Phân phối Student, bậc tự do 17 D. Phân phối chuẩn
Câu 3: Mt phn kết qu thc hin bằng Stata được biu diễn như sau:
Một số khẳng định được đọc từ bảng kết quả như sau:
i. Tổng bình phương các sai lệch TSS = 723.975
ii. Tổng bình phương các phần dư ESS = 107.1512
iii. Số biến độc lập trong mô hình, kể cả hằng số là 3
iv. Giá trị kiểm định trong bài toán kiểm định độ phù hợp là 0.0515
Có bao nhiêu khẳng định SAI: A. 1 B. 2 C. 3 D. 4
Câu 4: Mt phn kết qu thc hin bằng Stata được biu diễn như sau:
Ý nghĩa của việc thực hiện kiểm định này là:
A. Kiểm định thừa biến và mô hình không xảy ra thừa biến với mức ý nghĩa 5%.
B. Kiểm định thừa biến và mô hình xảy ra thừa biến với mức ý nghĩa 5%.
C. Kiểm định thiếu biến và mô hình không xảy ra thiếu biến với mức ý nghĩa 5%.
D. Kiểm định thiếu biến và mô hình xảy ra thiếu biến với mức ý nghĩa 5%.
Câu 5: Mt phn kết qu thc hin bằng Stata được biu diễn như sau:
Bảng ma trận hiệp phương sai trên là:
A. Hiệp phương sai của các giá trị của các biến độc lập trong mô hình hồi quy
B. Hiệp phương sai của các hệ số ước lượng trong mô hình hồi quy
C. Phương sai của các giá trị của các biến độc lập trong mô hình hồi quy
D. Phương sai của các hệ số ước lượng trong mô hình hồi quy
Câu 6: Phân tích hi quy là mt công c thng kê nhm xây dng mt mô hình toán hc mô t:
A. Một biến độc lập có tương quan với một hoặc nhiều biến phụ thuộc.
B. Một số biến độc lập có tương quan với một số biến phụ thuộc.
C. Một phụ thuộc có tương quan với một hoặc nhiều biến độc lập.
D. Các đáp án trên đều sai.
Câu 7: B sót mt biến gii thích quan trng khi chy hồi quy thường
A. Làm tăng phương sai của các hệ số ước lượng.
B. Làm giảm phương sai của các hệ số ước lượng
C. Không ảnh hưởng đến phương sai của các hệ số ước lượng.
D. Ước lượng bị chệch và tăng phương sai của hệ số ước lượng.
Câu 8: Gi s mô hình hồi quy đa biến:
𝑌𝑖= 𝛽1+ 𝛽2. 𝑋𝑖2 + 𝛽3. 𝑋𝑖3 + 𝜀𝑖
trong đó cả hai biến 𝑋2 và 𝑋3 là có ảnh hưởng thật sự đến biến phụ thuộc 𝑌. Trước tiên, ta hồi
quy mô hình (1): 𝑌𝑖= 𝛽1+ 𝛽2. 𝑋𝑖2 + 𝜀𝑖 và nhận thấy hệ số 𝛽2 không có ý nghĩa thống kê. Tuy
nhiên khi hồi quy mô hình (1): 𝑌𝑖= 𝛽1+ 𝛽2. 𝑋𝑖2 + 𝛽3. 𝑋𝑖3 + 𝜀𝑖 hệ số ước lượng 𝛽2  thay đổi bởi
một lượng lớn và do đó tham số 𝛽2 trở nên có ý nghĩa thống kê. Điều này cho thấy rằng:
A. Mô hình (1) đúng vì vậy có thể kết luận 𝑋2 thật sự không ảnh hưởng đến 𝑌.
B. Mô hình (1) bị chệch do bỏ sót biến quan trọng.
C. Mô hình (1) bị thừa biến.
D. Mô hình (2) bị thừa biến.
Câu 9: Giá tr kiểm định trong bài toán kiểm định độ phù hp ca biến ph thuc Y là:
A. 1.7695 và hàm hồi quy mẫu phù hợp với mức ý nghĩa 5%
B. 0.1285 và hàm hồi quy mẫu phù hợp với mức ý nghĩa 5%
C. 1.7695 và hàm hồi quy mẫu KHÔNG phù hợp với mức ý nghĩa 5%
D. 0.1285 và hàm hồi quy mẫu KHÔNG phù hợp với mức ý nghĩa 5%
Câu 10: Đồ th thi gian ca d liu v doanh thu bán l rượu bia hàng tháng được cho như sau:
Đồ thị trên cho thấy dữ liệu:
A. Có tính xu thế tăng theo thời gian B. Không có tính mùa vụ
C. Có trung bình không thay đổi theo thời gian
D. Có xu thế giảm dần theo thời gian
Câu 11: Kết qu ước lượng tiền lương (wage) theo kinh nghim (exp (đơn vị: năm) và exp2),
gi
i tính (male: = 1 đối với nam, = 0 đối vi n), khu vc vic làm (state: = 1 đối vi nhng
người làm vic trong khu vực công, = 0 đối vi những người làm vic trong khu vực tư
nhân) được cho như sau: 𝑤𝑎𝑔 𝑒
 = 40.5 + 0.4𝑒𝑥𝑝 − 0.08𝑒𝑥𝑝2+ 4.6𝑚𝑎𝑙𝑒 − 2.3𝑠𝑡𝑎𝑡𝑒 + 1.2𝑚𝑎𝑙𝑒 ∗ 𝑠𝑡𝑎𝑡𝑒
Sự khác biệt về tiền lương trung bình giữa một phụ nữ có 10 năm kinh nghiệm làm việc trong
khu vực công và một người đàn ông có cùng số năm kinh nghiệm nhưng làm việc trong khu vực tư nhân là: A. 6.9 B. 2.3 C. 4.6 D. 1.2
Câu 12: Xét mô hình hi quy 𝒀 = 𝜷𝟎+ 𝜷𝟏∗ 𝑿𝟏+ 𝜷𝟐∗ 𝑿𝟐+ 𝜺. Da trên 50 quan sát, ta tìm
được h s xác định 𝑹𝟐= 𝟎. 𝟖𝟓𝟐𝟔. Xác định giá tr ca thng kê F và kiểm định s phù
h
p ca mô hình mức ý nghĩa 5%. Cho biết giá tr tra bng Fisher là 𝑭𝟎.𝟎𝟓;𝟐;𝟒𝟕 = 𝟑. 𝟏𝟗𝟓.
A. F=135.93, mô hình không phù hợp
B. F=135.93, mô hình phù hợp
C. F=138.82, mô hình không phù hợp
D. F=138.82, mô hình phù hợp
Câu 13: Kết qu hồi quy được cho trong bng sau
Trong đó: wage (tiền lương); educ (số năm đi học); exper (số năm kinh nghiệm)
Tìm tất cả các phát biểu SAI:
i. Adj R-squared của mô hình là xấp xỉ 22.22%
ii. Mô hình có ý nghĩa (phù hợp) với p_value có giá trị là 0.049 tại mức ý nghĩa 1%.
iii. Số lượng tham số (hệ số) cần ước lượng của mô hình là 2. A. ii, iii B. ii C. i D. i, iii
Câu 14: Kết qu hi quy d liu bảng như sau
Tìm đáp án ĐÚNG, với mức ý nghĩa 5%.
A. Mô hình REM tốt hơn mô hình FEM
B. Mô hình REM tốt hơn mô hình gộp (Pooled OLS)
C. Mô hình FEM tốt hơn mô hình REM
D. Mô hình gộp (Pooled OLS) tốt hơn mô hình FEM
Wald test: {𝐻0: 𝑢𝑖= 0 → (𝑃𝐿𝑂𝑆) 𝐻1:∑
𝑛−1 𝑢𝑖𝑖2=1 > 0 → (𝐹𝐸𝑀)
LM test: {𝐻0: 𝜎𝑢2= 0 → (𝑃𝐿𝑂𝑆)
𝐻1: 𝜎𝑢2> 0 → (𝑅𝐸𝑀)
Hausman test: {𝐻0: 𝐶𝑜𝑣(𝑢𝑖, 𝑥𝑖𝑡) = 0 → (𝑅𝐸𝑀)
𝐻1: 𝐶𝑜𝑣(𝑢𝑖, 𝑥𝑖𝑡) ≠ 0 → (𝐹𝐸𝑀)
𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼 => Bác bỏ H0
Câu 15: S dng d liu thu thp t 100 nhân viên để ước tính mi quan h gia thu nhp
(X, tri
ệu đồng) và chi tiêu (Y, triệu đồng) hàng tháng bng mô hình hồi quy đơn biến 𝒀 =
𝜷𝟎+ 𝜷𝟏∗ 𝑿𝒊+ 𝜺𝒊. Ta có kết qu hồi quy như sau: 𝑌 = 5.5 + 0.7𝑋. Tìm khong d báo vi
độ tin cy 95% cho chi tiêu trung bình ca một người có thu nhp 15 triệu đồng / tháng.
Cho biết, tại 𝑋0=15 thì 𝑆𝑒(𝑌0)= 0.57, và 𝑡0. 025 98 = 1.98 A. (15.43, 16.57) B. (14.87, 17.13) C. (14.02, 17.98) D. (14.50, 17.50)
Câu 16: Kết qu hi quy gia tiền lương (wage) phụ thuộc vào trình độ hc vn (educ) th
hi
n trong bng sau:
Đếm số phát biểu ĐÚNG
i. educ giải thích được 16.48% sự thay đổi của wage
ii. Biến educ có ý nghĩa ở mức ý nghĩa 1%.
iii. Mô hình đề xuất phù hợp với mức ý nghĩa 5%. A. 3 B. 1 C. 2 D. 0
Câu 17: Kết qu hi quy d liu bảng như sau
Tìm đáp án ĐÚNG, với mức ý nghĩa 5%.
A. Mô hình FEM tốt hơn mô hình gộp (Pooled OLS)
B. Mô hình REM tốt hơn mô hình gộp (Pooled OLS)
C. Mô hình gộp (Pooled OLS) tốt hơn FEM
D. Mô hình gộp (Pooled OLS) tốt hơn REM
Câu 18: Mt nghiên cu nhm kim tra xem thi gian di chuyn t nơi ở đến trường có
ảnh hưởng đến kết qu hc tp ca hc sinh hay không. D liu nghiên cu gồm: điểm bài
ki
m tra ca hc sinh (y), s gi hc sinh dành cho vic di chuyển trên đường mi ngày (d,
gi
), x1, x2, x3 là mt s biến kim soát khác.
Với một mẫu gồm 30 quan sát, kết quả ước lượng mô hình hồi quy thu được như sau (trong dấu
ngoặc đơn là độ lệch chuẩn của hệ số ước lượng):
ln(𝑦)= 5.0 − 5.7𝑥1−10𝑥2+ 0.03𝑥3− 0.3𝑑, với 𝑅2= 0.78
Ý nghĩa của hệ số ước lượng đứng trước biến giải thích d là: trong điều kiện tất cả các yếu tố
khác không đổi, khi thời gian học sinh di chuyển trên đường mỗi ngày tăng thêm 1 giờ, điểm thi
trung bình của học sinh đó giảm A. 0.3% B. 3% C. 0.3 đơn vị D. 30%
Câu 19: Mt bng kết qu thu được t Stata như sau:
Ý nghĩa của việc thực hiện kiểm định này là:
A. Đây là kết quả của kiểm định thừa biến và mô hình không xảy ra thừa biến với mức ý nghĩa 5%.
B. Đây là kết quả của kiểm định thiếu biến và mô hình có xảy ra thiếu biến với mức ý nghĩa 5%.
C. Đây là kết quả của kiểm định đa cộng tuyến và mô hình xảy ra đa cộng tuyến với mức ý nghĩa 5%.
D. Đây là kết quả của kiểm định phương sai sai số thay đổi và mô hình có xảy ra hiện tượng
phương sai sai số thay đổi ở mức ý nghĩa 5%.
Câu 20: Mô hình hi quy bội được s dụng để đánh giá tác động ca các biến X1, X2, X3
lên Y. Sau khi th
c hin hi quy, chúng ta nhận được các h s phóng đại phương sai trên STATA như sau: Tìm đáp án ĐÚNG
A. Mô hình không có hiện tượng tự tương quan
B. Mô hình có hiện tượng đa cộng tuyến
C. Mô hình không có hiện tượng đa cộng tuyến
D. Mô hình có hiện tượng phương sai thay đổi
Câu 21: Xét mt mô hình hi xu thế ca logarit doanh s bán l rượu bia hàng năm
(ln_liquor=log(liquor), tính bằng đô la) như sau:
Trong các khẳng định sau, có bao nhiêu khẳng định ĐÚNG?
i. Hàm xu thế bậc nhất là phù hợp với chuỗi thời gian này ở mức ý nghĩa 5%.
ii. Khi t tăng 1 năm thì doanh số bán lẻ rượu bia tăng trưởng với tốc độ trung bình là 0.34% .
iii. Hàm xu thế bậc nhất giải thích được khoảng 90.28% cho tổng biến thiên của doanh số bán lẻ rượu bia hàng năm. A. 0 B. 3 C. 2 D. 1
Câu 22: Dùng d liu thu thp t 42 nhân viên để ước tính mi quan h gia thu nhp (X,
tri
ệu đồng) và chi tiêu (Y, triệu đồng) hàng tháng bng mô hình hồi quy đơn biến 𝒀 =
𝜷𝟏+ 𝜷𝟐𝑿𝟐+ 𝜺. Ta có kết qua hồi quy như sau:
Với kết quả ước lượng trên, xét các khẳng định sau:
(i) Sai số chuẩn của mô hình hồi quy mẫu (S.E. of regression), ký hiệu 𝜎 bằng 0.1699
(ii) Trị thống kê F-Statistics dùng kiểm định độ phù hợp của mô hình với cặp giả thuyết {𝐻0: 𝑅2= 0
𝐻1: 𝑅2≠ 0 là 𝐹 = 281.853
(iii) Mô hình phù hợp ở mức ý nghĩa 5%, biết 𝐹0.05;1;40 = 4.0847
Trong các khẳng định trên có bao nhiêu khẳng định đúng? A. 0 B. 1 C. 2 D. 3
(i) Để tính sai số chuẩn của hồi quy (S.E. of regression), ta lấy căn bậc hai của Mean Squared
Error (MSE). MSE được tính bằng cách chia Sum squared resid cho degrees of freedom (bậc tự do). 𝑀𝑆𝐸 = 1.155147 40 = 0.028879
𝜎 = √𝑀𝑆𝐸 = √0.028879 = 0.169938
Câu 23: Xét mô hình hi quy gia biến ph thuc Y và biến độc lp X, da trên b d liu mu, ta có: 𝑛 𝑛
∑𝑖=1 𝑋=90; ∑𝑌 𝑖=1 =340; 𝑛 = 4; 𝐸𝑆𝑆 = 104 𝑛 𝑛 𝑛 ∑𝑖=1 (𝑌 − = 𝑌 −1) 5 ( 6;𝑋 − ∑( 𝑋 𝑋 )− 𝑋 𝑖=1 =234;)
2∑(𝑌 − 𝑌 𝑖=1 =19  7 ) 4 2
Hệ số góc của mô hình hồi quy mẫu là: A. -0.667 B. 0.667 C. 100 D. -100
Hệ số góc của mô hình hồi quy mẫu (ký hiệu là b) được tính bằng công thức: 𝛽2=∑(𝑌𝑛𝑖 − =1 𝑌 𝑖=1 =) − (1𝑋5 − 6 𝑋) 𝑛 234 ∑(𝑋 − 𝑋 ) = −0.667 2
Tổng bình phương toàn phần (TSS): 𝑇𝑆𝑆 = ∑(𝑛𝑌 𝑖=1 − = 𝑌 19  7 ) 4 2
Hệ số xác định (R-squared): 𝑅2=𝐸𝑆𝑆𝑇𝑆𝑆 =1041974 = 0.0527 H 𝑛 𝑛
ệ số chặn: 𝛽1= 𝑌− 𝛽2𝑋=∑𝑌 𝑖=1𝑛− 𝑏 ∑𝑋 𝑖=1𝑛=340 4−(−0.667)90 4=100.0075
Phương trình hồi quy: 𝑌 = 100.0075 − 0.667𝑋
Độ lệch chuẩn của sai số chuẩn (Standard Error of Regression - SER): 𝑆𝐸𝑅 = √𝑅𝑆𝑆 𝑛−2 =√1870 4−2 = 30.578
Kiểm định t với 𝑆𝑒(𝛽1)=𝑆𝐸𝑅 𝑖=1 =30.578 √234 = 1.9989 √ ∑ (𝑛𝑋−𝑋 )2
Câu 24: Trong hi quy tuyến tính nếu 𝑻𝑺𝑺 = 𝟒𝟓𝟎𝟎𝑹𝑺𝑺 =𝟏𝟓𝟕𝟓, thì h s xác định 𝑹𝟐 là: A. 0.45 B. 2.85 C. 0.35 D. 0.65
Câu 25: Nếu kết qu ước lượng OLS t mt tp d liu có 𝑬𝑺𝑺 = 𝟒𝟎𝟎𝑹𝑺𝑺 =𝟏𝟎𝟎 thì
h
s xác định 𝑹𝟐 là: A. 0.80 B. 0.25 C. 0.10 D. 0.40
Câu 26: Kết qu ước lượng chi tiêu (Y, triệu đồng) theo thu nhp (X, triệu đồng) có dng
𝒀 = 𝜷𝟏+ 𝜷𝟐𝑿 + 𝑼 t mt mu d liệu được cho trong bng sau:
Thu nhập trung bình và hệ số ước lượng của tham số 𝛽2 của mô hình hồi quy mẫu trên lần lượt là: A. 14.2 và 0.6715 B. 15 và 0.7095 C. 12.6 và 0.8264 D. 15 và 0.4369 Ta có: 𝑡  𝑠𝑡𝑎𝑡 =𝛽2 . ∗ 0. = 0. 𝑆𝑒(𝛽) => 𝛽2
= 𝑡𝑠𝑡𝑎𝑡 ∗𝑆𝑒(𝛽2)=30 79635 02304 7095 2 𝑌= 𝛽 −𝛽1
1+ 𝛽2𝑋  => 𝑋=𝑌 𝛽2=11.7−1.056 618 0.7095 =15.001
Câu 25: Trong mô hình hi quy: 𝒀 = 𝜷𝟏+ 𝜷𝟐𝑿 + 𝜺 k vọng có điều kin ca Y, 𝑬(𝒀|𝑿) là:
A. Trung bình của tất cả các giá trị của Y trong mẫu khảo sát B. 𝛽1+ 𝛽2𝑋 + 𝜀 C. 𝛽1+ 𝛽2𝑋
D. Trung bình của tất cả các giá trị của X trong mẫu khảo sát
Câu 26: Trong mô hình hi quy tuyến tính đơn biến có dng 𝒀𝒊= 𝜷𝟏+ 𝜷𝟐𝑿𝒊+ 𝑼𝒊, phát
bi
ểu nào sau đây không phải là gi định của phương pháp bình phương cực tiu OLS v
các sai s
ngu nhiên 𝑼𝒊?
A. Phương sai của các sai số ngẫu nhiên 𝑈𝑖 là giống nhau cho tất cả các giá trị của biến độc lập
B. Các sai số ngẫu nhiên 𝑈𝑖 tuân theo phân phối chuẩn.
C. Kỳ vọng của các sai số ngẫu nhiên 𝐸(𝑈𝑖)= 1 (=0)
D. Các sai số ngẫu nhiên 𝑈𝑖 là độc lập với nhau
Câu 27: Xét mô hình 𝑾𝑨𝑮𝑬 = 𝜷𝟏+ 𝜷𝟐𝑨𝑮𝑬 + 𝑼, kết qu kho sát mt mu gm 100 quan
sát có các giá tr
trung bình ca tiền lượng (WAGE) và tui (AGE) lần lượt là 70 và 30. Mô
hình h
i quy mẫu thu được có h s gốc là 2. Khi đó, xét một cá nhân 20 tuổi. Đối vi cá
nhân này, m
ức lương trung bình được d đoán từ mô hình hi quy là:
A. Không thể dự đoán được B. 60 C. 50 D. 70
Câu 28: Xét mô hình hi quy tuyến tính đơn biến 𝒀𝒊= 𝜷𝟏+ 𝜷𝟐𝑿𝒊+ 𝑼𝒊. Ga s giá tr 𝑹𝟐
c
a mô hình hồi quy ước lượng đúng bằng 1. Điều nào sau đây là đúng?
(i) Tất cả các điểm dữ liệu phải nằm hết trên 1 đường thẳng.
(ii) Tất cả các sai số ước lượng đều phải bằng 0.
(iii) Tất cả sự biến động so với trung bình của Y đều được giải thích bằng mô hình.
(iv) Đường hồi quy ước lượng là đường thẳng nằm ngang.
A. Không thể được xác định từ thông tin được cung cấp
B. Chỉ có (i) và (iii) đúng
C. Chỉ có (ii) và (iv) đúng
D. Chỉ có (i), (ii) và (iii) đúng
Câu 29: Kết qu ước lượng ca mt quyển sách (Y, đơn vị đôla) theo số trang ca quyn
sách đó (X, trang) như sau:
Trong số các khẳng định sau, có bao nhiêu khẳng định đúng?
(i) Số trang sách trung bình của quyển sách đó xấp xỉ 601 trang.
(ii) Tổng bình phương phần dư, RSS, có giá trị bằng 4.903075
(iii) Hai biến X và Y có tương quan nghịch biến.
(iv) Số trang sách giải thích được 56.3% cho tổng biến thiên trong giá bán của một quyển sách. A. 1 B. 2 C. 3 D. 4
Câu 30: Kết qu ước lượng ca mt quyển sách (Y, đơn vị đôla) theo số trang ca quyn
sách đó (X, trang) như sau:
Trong các khẳng định sau, có bao nhiêu khẳng định đúng?
(i) Trung bình của X bằng 500
(ii) Khoảng ước lượng với độ tin cậy 95% cho hệ số góc là (-0.0001; 0.0199)
(iii) Hai biến X và Y có tương quan đồng biến A. 0 B. 1 C. 2 D. 3
T LUN
Câu 1: Mt bài toán có kết qu hồi quy như sau: price:
Giá trị ước tính (triệu VND) total_area: Tổng diện tích sàn (m2) duration:
Thời gian sinh sống (năm)
no_of_bedroom: Số lượng phòng ngủ
no_of_bathroom: Số lượng phòng tắm travel_time: Thời gian đi làm (phút) distance:
Khoảng cách từ nhà đến trung tâm thành phố - CBD (km) popu_density:
Mật độ dân số khu vực (người/km2) Giá trị tra bảng 𝑡0. 025
102 = 1.983; 𝐹0.05;7;102 = 2.100; 𝐹0.05;4;102 = 2.460
a) Vi mức ý nghĩa 5% bạn hãy kiểm định tính có ý nghĩa của tng biến gii thích.
Cặp giả thuyết: 𝐻0: 𝛽𝑖= 0; 𝐻1: 𝛽𝑖≠ 0 - Bi 
ến total_area: 𝑡𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎 =𝛽𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎)=26.9925.765 = 4.682
𝑆𝑒(𝛽𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎 |𝑡 ỏ ả ế
ến total_area có ý nghĩa thố
𝑡𝑜𝑡𝑎𝑙_𝑎𝑟𝑒𝑎|> 𝑡0.025
102 => Bác b gi thuy t H0 => Bi ng kê. - Bi 
ến duration: 𝑡𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛 =𝛽𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛 )=129.802 38.455 = 3.375
𝑆𝑒(𝛽𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛
|𝑡𝑑𝑢𝑟𝑎𝑡𝑖𝑜𝑛|> 𝑡0.025
102 => Bác bỏ giả thuyết H0 => Biến duration có ý nghĩa thống kê. - Bi 
ến no_of_bedroom: 𝑡𝑛𝑜_𝑜𝑓_𝑏𝑒𝑑𝑟𝑜𝑜𝑚 =𝛽𝑛𝑜_𝑜𝑓_𝑏𝑒𝑑𝑟𝑜𝑜𝑚)=723.504368.484 = 1.963
𝑆𝑒(𝛽𝑛𝑜_𝑜𝑓_𝑏𝑒𝑑𝑟𝑜𝑜𝑚 |𝑡 ấ ậ ả
ết H0 => Biến no_of_bedroom không có ý nghĩa
𝑛𝑜_𝑜𝑓_𝑏𝑒𝑑𝑟𝑜𝑜𝑚|< 𝑡0.025 102 => Ch p nh n gi thuy thống kê. - Bi 
ến no_of_bathroom: 𝑡𝑛𝑜_𝑜𝑓_𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚 =𝛽𝑛𝑜_𝑜𝑓_𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚)=166.382 381.748 = 0.436
𝑆𝑒(𝛽𝑛𝑜_𝑜𝑓_𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚
|𝑡𝑛𝑜_𝑜𝑓_𝑏𝑎𝑡ℎ𝑟𝑜𝑜𝑚|< 𝑡0.025
102 => Chấp nhận giả thuyết H0 => Biến no_of_bathroom không có ý nghĩa thống kê. - Bi 
ến travel_time: 𝑡𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒 =𝛽𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒)=−26.06523.992 𝑆𝑒(𝛽 = −1.0864
𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒 |𝑡 ấ ậ ả
ết H0 => Biến travel_time không có ý nghĩa thống
𝑡𝑟𝑎𝑣𝑒𝑙_𝑡𝑖𝑚𝑒|< 𝑡0.025 102 => Ch p nh n gi thuy kê. - Bi 
ến distance: 𝑡𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 =𝛽𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒 )=−55.944 44.047 = −1.2701
𝑆𝑒(𝛽𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒
|𝑡𝑑𝑖𝑠𝑡𝑎𝑛𝑐𝑒|< 𝑡0.025
102 => Chấp nhận giả thuyết H0 => Biến distance không có ý nghĩa thống kê. - Bi 
ến popu_density: 𝑡𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦 =𝛽𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦)=0.008 0.015 = 0.533
𝑆𝑒(𝛽𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦 |𝑡 ấ ậ ả ế
ến popu_density không có ý nghĩa
𝑝𝑜𝑝𝑢_𝑑𝑒𝑛𝑠𝑖𝑡𝑦|< 𝑡0.025
102 => Ch p nh n gi thuy t H0 => Bi thống kê. - Bi 
ến tự do (_cons): 𝑡_𝑐𝑜𝑛𝑠 =𝛽_𝑐𝑜𝑛𝑠 )=−1438.496 1294.727 = −1.111 𝑆𝑒(𝛽_𝑐𝑜𝑛𝑠
|𝑡_𝑐𝑜𝑛𝑠|< 𝑡0.025
102 => Chấp nhận giả thuyết H0 => Biến tự do không có ý nghĩa thống kê.
b) Hãy kiểm định s phù hp ca mô hình vi mức ý nghĩa 5%
Cặp giả thuyết: 𝐻0: 𝑅2= 0; 𝐻1:𝑅2≠ 0
𝐹(7,182)< 𝐹0.05;7;102 => Bác bỏ giả thuyết H0
Vậy, tại mức ý nghĩa 5%, hàm hồi quy không phù hợp.
c) Có ý kiến cho rng các biến No_of_bathroom; Travel_time; Distance; Popu_density có
th
b loi khi mô hình vi mức ý nghĩa 5%. Bạn hãy xây dng gi thiết và kiểm định ý kiến này. Cặp giả thuyết:
H0: Các biến no_of_bathroom, travel_time, distance, popu_density không ảnh hưởng đáng kể đến mô hình.
H1: Có ít nhất một biến có ảnh hưởng đáng kể đến biến phụ thuộc. Kiểm định:
Chạy hồi quy bằng Stata với mô hình rút gọn (loại bỏ các biến no_of_bathroom, travel_time,
distance, popu_density). Ta có được các giá trị 𝑅2, 𝑅2 mới. Ta có thể so sánh hai mô hình bằng
cách so sánh giá trị 𝑅2: + Nếu 𝑅2
 tăng, mô hình mới giải thích biến động của biến phụ thuộc tốt hơn mô hình cũ. Ta có
thể loại bỏ đồng thời các biến no_of_bathroom, travel_time, distance, popu_density.
+ Nếu 𝑅2 giảm, mô hình mới giải thích kém hơn mô hình cũ. Ta không nên loại bỏ đồng thời các
biến no_of_bathroom, travel_time, distance, popu_density.
d) Giải thích ý nghĩa của R-squared.
Chỉ số R-squared cho biết phần trăm biến động của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
ESS: tổng bình phương được giải thích bởi mô hình, chỉ ra mức độ biến thiên của biến phụ
thuộc được mô hình giải thích.
RSS: tổng bình phương sai lệch còn lại sau khi đã tính đến ảnh hưởng của các biến độc lập,
chỉ ra mức độ biến thiên không được giải thích bởi mô hình.
TSS: Tổng bình phương sai lệch toàn bộ, bao gồm cả phần được giải thích và phần không được giải thích.
df (Degrees of freedom): Bậc tự do.
Model df: Số biến độc lập trong mô hình (không tính hằng số).
Residual df: n - k - 1, với n là số quan sát và k là số biến độc lập.
Total df: n - 1.
MS (Mean Square): Bình phương trung bình. Được tính bằng SS chia cho df.
Model MS: Đo lường sự biến thiên được giải thích trên mỗi bậc tự do của mô hình.
Residual MS: Đo lường sự biến thiên không được giải thích trên mỗi bậc tự do của phần dư.
F(df1, df2): Thống kê F. So sánh phương sai của mô hình với phương sai của phần dư. Được
dùng để kiểm định ý nghĩa tổng thể của mô hình.
Prob > F: Giá trị p (p-value) tương ứng với thống kê F. Nếu p-value nhỏ hơn mức ý nghĩa
(thường là 0.05), ta bác bỏ giả thuyết không rằng tất cả các hệ số hồi quy đều bằng 0 (mô hình có ý nghĩa thống kê).
Coefficient: Hệ số hồi quy ước lượng. Chỉ ra ảnh hưởng của biến độc lập đến biến phụ thuộc.
Nếu hệ số dương, biến độc lập có mối quan hệ thuận với biến phụ thuộc, và ngược lại.
Std. Err.: Sai số chuẩn của hệ số hồi quy. Đo lường độ chính xác của ước lượng hệ số. Sai số
chuẩn càng nhỏ, ước lượng càng chính xác.
t: Thống kê t. Được dùng để kiểm định ý nghĩa thống kê của từng hệ số hồi quy. Được tính
bằng Coefficient / Std. Err..
P>|t|: Giá trị p (p-value) tương ứng với thống kê t. Nếu p-value nhỏ hơn mức ý nghĩa (thường
là 0.05), ta bác bỏ giả thuyết không rằng hệ số hồi quy bằng 0 (biến độc lập có ảnh hưởng đáng
kể đến biến phụ thuộc).
[95% Conf. Interval]: Khoảng tin cậy 95% cho hệ số hồi quy. Khoảng này cho biết khoảng
giá trị mà hệ số hồi quy thực sự có thể nằm trong đó với xác suất 95%.
Câu 2: Mt nhóm sinh viên tại trường A mun tìm hiu v nhng yếu t có th ảnh hưởng
đến khối điểm khi ra trường. Tuy nhiên nếu ch lit kê các biến có th ảnh hưởng đến mc
lương, điều này s gây ra mt s tranh cãi ln vì s không ai biết mình ĐÚNG hay SAI,
theo bạn đề này bn s làm gì?
Đầu tiên, mô hình được chọn phải là mô hình đảm bảo tính tiết kiệm, tính đồng nhất, tính thích
hợp (có R2 hoặc R2 cao), tính vững về mặt lý thuyết và có khả năng dự báo.
Để giải quyết các tranh cãi đúng hay sai giữa nhóm sinh viên, ta có thể chạy hồi quy mô hình
trên bằng phần mềm Stata để kiểm định các giả thuyết đánh giá mô hình.
+ Kiểm định độ phù hợp của các hệ số hồi quy (kiểm định t): xem xét các biến độc lập trong mô
hình có ý nghĩa thống kê hay không. Từ đó giải thích tác động của biến độc lập đến biến phụ
thuộc đối với các biến có ý nghĩa thống kê, và đưa ra lời khuyên bỏ hoặc bỏ đồng thời các biến
không có ý nghĩa thống kê.
+ Kiểm định độ phù hợp của mô hình (kiểm định F, xem xét giá trị R-squared, Adj R-squared):
xem xét mô hình này có ý nghĩa thống kê tổng thể, có phù hợp hay không; đo lường phần trăm
biến động của biến phụ thuộc được giải thích bởi mô hình.
Tránh để mô hình mắc phải các loại sai lầm chỉ định, vi phạm giả thuyết OLS như:
+ Bỏ sót biến thích hợp (thiếu biến) hay đưa vào những biến không thích hợp (thừa biến): sử
dụng kiểm định Ramsey với sự hỗ trợ của phần mềm Stata.
+ Kiểm định đa cộng tuyến, phương sai sai số thay đổi, sai số ngẫu nhiên không tuân theo phân phối chuẩn.
Câu 3: S dng s liu ca 190 doanh nghiệp thương mại năm 2016 được kết qu ước lượng sau:
NS = 8.47 + 0.02K - 12.40L + e Se (7.32) (0.001) (1.96)
R² = 0.817; F - statistic = 425.5; n = 190
Trong đó NS là năng suất lao động trung bình, K là tài sản vốn, L là số lao động của doanh nghiệp.
a) Nêu ý nghĩa của các h s ước lượng được
- Biến K: Khi K tăng 1 đơn vị, các yếu tố khác không đổi thì NS tăng 0.02 đơn vị.
- Biến L: Khi L tăng 1 đơn vị, các yếu tố khác không đổi thì NS giảm 12.4 đơn vị.
- Khi các biến khác bằng 0, NS bằng 8.47 đơn vị.
b) Tìm khong tin cy 90% cho các tham s ca mô hình hi quy Giá trị 𝑡0. 05 187 = 𝑍(0.05)= 1.645
- Khoảng tin cậy 90% của biến K: (𝛽𝐾
± 𝑡𝛼𝑛−𝑘 ∗𝑆𝑒(𝛽𝐾)) =(0.02 ± 1.645 ∗ 0.001) 2 ⇒ (0.018; 0.022)
- Khoảng tin cậy 90% của biến L: (𝛽𝐿± 𝑡𝛼𝑛−𝑘 ∗𝑆𝑒(𝛽𝐿)) =(−12.4 ± 1.645 ∗ 1.96) 2 ⇒ (−15.624; −9.176)
- Khoảng tin cậy 90% của biến tự do: (𝛽𝑐𝑜𝑛𝑠
± 𝑡𝛼𝑛−𝑘 ∗𝑆𝑒(𝛽𝑐𝑜𝑛𝑠
)) =(8.47 ± 1.645 ∗ 7.32) 2 ⇒ (−3.571;20.511)
c) Vi mức ý nghĩa 5%, hãy cho biết: S lao động có tác động đến năng suất trung bình ca
doanh nghi
p hay không?
Để biết số lao động có tác động đến năng suất trung bình của doanh nghiệp không, ta tiến hành
kiểm định tính có ý nghĩa thống kê của biến L.
Cặp giả thuyết: 𝐻0: 𝛽𝐿= 0; 𝐻1: 𝛽𝐿≠ 0 𝑡  𝐿=𝛽𝐿 )=−12.4 1.96 𝑆𝑒(𝛽 = −6.327 𝐿 |𝑡𝐿|> 𝑡0. 025
187 = 1.96 => Bác bỏ giả thuyết H0 => Biến L có ý nghĩa thống kê.
Vậy số lao động có tác động đến năng suất trung bình của doanh nghiệp (không có bằng chứng
cho rằng số lao động không tác động đến năng suất trung bình của doanh nghiệp).
d) Vi mức ý nghĩa 5%, hãy cho biết: Hàm hi quy mu có phù hp hay không?
Cặp giả thuyết: 𝐻0: 𝑅2= 0; 𝐻1:𝑅2≠ 0
𝐹𝛼𝑘−1;𝑛−𝑘 = 𝐹0.05 2;187 = 3.493
𝐹𝑠𝑡𝑎𝑡 =𝑅2(𝑛 − 𝑘)
(1 − 𝑅2)(𝑘 − 1) =425.5 𝐹
𝑘−1;𝑛−𝑘 => Bác bỏ giả thuyết H0 => Hàm hồi quy mẫu phù hợp. 𝑠𝑡𝑎𝑡 > 𝐹𝛼
e) Vi mức ý nghĩa 5%, hãy cho biết: Khi vốn và lao động cùng tăng một đơn vị thì năng
suất lao động gim hay không? Biết rng hiệp phương sai giữa các h s ca K và L bng -0.003? Giá trị 𝑡0. 025 187 = 𝑍(0.025)= 1.960
Cặp giả thuyết: 𝐻0: 𝐾 + 𝐿 ≤ 0; 𝐻1:𝐾 + 𝐿 > 0 𝑆𝑒(𝛽𝐾
+ 𝛽𝐿)=√𝑉𝑎𝑟(𝛽𝐾)+ 𝑉𝑎𝑟(𝛽𝐿)+ 2𝐶𝑜𝑣(𝛽𝐾 , 𝛽𝐿
)=√0.001 + 1.96 + 2 ∗ (−0.003) = 1.398
𝑡 = 𝛽𝐾+ 𝛽𝐿)=0.001 + 1.96 1.398 = 1.403 𝑆𝑒(𝛽𝐾 + 𝛽𝐿 |𝑡|< 𝑡0.025
187 => Chấp nhận giả thuyết H0 => Có bằng chứng cho thấy khi vốn và lao động cùng
tăng một đơn vị thì năng suất lao động giảm.
f) Có ý kiến cho rằng: Năng suất lao động còn ph thuộc vào môi trường làm vic có thân
thi
ện hay không? Để đem biến môi trường làm vic vào mô hình, chúng ta có các cách nào
để đem biến đó vào mô hình?
Nếu năng suất lao động phụ thuộc vào môi trường làm việc, ta có thêm biến này bằng nhiều cách dưới dạng:
+ Biến giả: Nếu môi trường làm việc được phân loại (ví dụ: thân thiện/không thân thiện), ta có
thể tạo biến giả (= 1 nếu môi trường thân thiện, = 0 nếu môi trường không thân thiện).
+ Biến liên tục: Nếu môi trường làm việc được đo lường bằng thang điểm, ta có thể sử dụng biến liên tục.
Tạo mô hình mới bao gồm biến môi trường làm việc và chạy hồi quy bằng phần mềm Stata. Ta
thu được giá trị F-stat, R-squared, Adj R-squared mới.
Ta có thể so sánh giá trị Adj R-squared giữa mô hình cũ và mới để chọn mô hình phù hợp:
+ Nếu Adj R-squared tăng, mô hình mới giải thích biến động của biến phụ thuộc tốt hơn mô hình
cũ. Có thể đưa ra kết luận rằng môi trường làm việc có tác động đến năng suất lao động.
+ Nếu Adj R-squared giảm, mô hình mới giải thích kém hơn mô hình cũ. Có thể đưa ra kết luận
rằng môi trường làm việc không có tác động đáng kể đến năng suất lao động.
Câu 4: Câu hi v các yếu t ảnh hưởng đến quyết định mua hàng một trang thương mại
điện t thì biến ph thuc và các biến độc lập được la chn là gì? Mô hình kinh tế lượng
được s dng? Các bài toán kinh tế lượng và kiểm định phù hp vi môn Kinh tế lượng là gì?
Biến phụ thuộc: purchase_decision: quyết định mua hàng, là biến nhị phân, = 1 nếu người dùng
quyết định mua, = 0 nếu người dùng không mua.
Biến độc lập có thể là:
+ Income: Thu nhập của người dùng (USD/tháng).
+ Age: Tuổi của người dùng.
+ Gender: Giới tính của người dùng (= 1 nếu là nam, = 0 nếu là nữ).
+ Price: Giá của sản phẩm (USD).
+ Review: Số lượng và chất lượng đánh giá của khách hàng (thang điểm từ 1 đến 5).
𝑝𝑢𝑟𝑐ℎ𝑎𝑠𝑒𝑑𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑓(𝑖𝑛𝑐𝑜𝑚𝑒, 𝑎𝑔𝑒, 𝑔𝑒𝑛𝑑𝑒𝑟, 𝑝𝑟𝑖𝑐𝑒, 𝑟𝑒𝑣𝑖𝑒𝑤)