Tổng hợp lý thuyết phần 3,4: Hồi quy phi tuyến môn Kinh tế lượng | Đại học Thăng Long
Tổng hợp lý thuyết phần 3,4: Hồi quy phi tuyến môn Kinh tế lượng | Đại học Thăng Long được chia sẻ dưới dạng file PDF sẽ giúp bạn đọc tham khảo , củng cố kiến thức ,ôn tập và đạt điểm cao. Mời bạn đọc đón xem!
Preview text:
lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
PHẦN 3. MỘT SỐ DẠNG MÔ HÌNH HỒI QUY PHI TUYẾN
1) Mô hình log – tuyến tính Xét mô hình: Y B i = AXi eUi
Nhận thấy mô hình trên không tuyến tính với Y và X. Ta biến đổi mô hình trên bằng cách logarit
cơ số tự nhiên của cả 2 vế được: Mà log B
a(bc) = logab + logac ln(Yi) = ln(AXi eUi) = ln(A) + ln(X B
i ) + ln(eUi) (Mà loga(bc) = logab + logac)
=> ln(Yi) = ln(A) + B ln(Xi) + Ui ln(e) (Mà logab = logab)
=> ln(Yi) = ln(A) + B ln(Xi) + Ui (*) (Mà ln(e) = 1)
Đặt ln(A) =B1 và B = B2 thì mô hình (*) trở thành: ln(Yi) = B1 + B2 ln(Xi) + Ui (1)
Mô hình (1) được gọi là mô hình log – tuyến tính hay mô hình log – log (log kép). (1) là mô hình
tuyến tính với biến ln(Y) và ln(X)
Ý nghĩa của hệ số hồi quy trong mô hình log – tuyến tính:
Xét mô hình hồi quy log – tuyến tính tổng thể sau: ln(Yi) = B1 + B2 ln(Xi) + Ui
B : không có ý nghĩa 1
B : được gọi là hệ số co giãn của Y theo X. 2
Ý nghĩa của B : Khi X tăng lên 1% thì Y thay đổi xấp xỉ là B 2 2%.
Khi đó mô hình hồi quy log – tuyến tính mẫu như sau: ln(Yi) = b1 + b2 ln(Xi)
ln(Yi) = b1 + b2 ln(Xi) + ei = ln(Yi) + ei
b : không có ý nghĩa 1
b : là 1 ước lượng điểm cho B 2
2. Ý nghĩa: Khi X tăng lên 1% thì Y thay đổi xấp xỉ là b2%.
Câu lệnh tìm các ước lượng điểm cho B1 và B2 cho mô hình log – tuyến tính bằng phương pháp
phương cực tiểu thông thường (OLS) trong phần mềm như sau: lm(log(Y)~log(X)) VD1: Dựa vào
File “CvaGCaFe.csv” hãy:
a. Vẽ biểu đồ tán xạ của cầu cà phê (Y) theo giá cà phê (X). Nhận xét
b. Viết mô hình hồi quy log – tuyến tính tổng thể của Y theo X
c. Viết phương trình hồi quy log – tuyến tính mẫu của Y theo X (ý là ước lượng các hệ số B1 và
B2 theo phương pháp bình phương cực tiểu thông thường (OLS)). Nêu ý nghĩa
d. Tìm hệ số xác định R2. Nêu ý nghĩa của giá trị đó. Câu lệnh tìm phần dư (ei) là:
e=resid(lm(log(Y)~log(X))) Câu lệnh tìm Yi thì như sau:
Đầu tiên ta phải biến đổi: ln(Yi) = b1 + b2 ln(Xi) <=> = (Mà elnA = A) <=> Yi =
Do đó trên phần mềm muốn tìm được Yi ta phải làm thành 2 bước như sau:
Bước 1: Tìm ln(Y ). Làm như sau trên phần mềm: i
lnYmu=fitted(lm(log(Y)~log(X)))
Bước 2: Tính Y . Làm như sau trên phần mềm: i Ymu=exp(lnYmu) VD2:
Dựa vào File “CvaGCaFe.csv” hãy tính phần dư ei và Yi.
Câu lệnh tìm ước lượng điểm cho sai số chuẩn b1 và b2 (tìm se(b1), se(b2)) là:
summary(lm(log(Y)~log(X))) (Nhìn vào chỗ ghi Std. Error rồi chép kết quả ra) 1 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Câu lệnh tìm khoảng tin cậy cho các hệ số B1 và B2 là: confint(lm(log(Y)~log(X),level=0. ))
Và tất cả các bài toán kiểm định hệ số B1 và B2 thì vẫn đưa ra quyết định bác bỏ hay chấp nhận H0
giống như mô hình hồi quy tuyến tính 2 biến. Và dựa chủ yếu trên kết quả của câu lệnh:
summary(lm(log(Y)~log(X))) cho các bài toán kiểm định ý nghĩa thống kê và câu lệnh:
summary(glht(mh,A,B *,alt=“”)) cho các bài toán kiểm định không phải i
là bài toán hai bên và hệ số Bi* 0
VD3: File CI.csv chứa số liệu về tiêu dùng (C) và thu nhập khả dụng (Y). Xét mô hình: lnC = B1 + B2 lnY +U
1. Viết mô hình hồi quy mẫu. Nêu ý nghĩa của hệ số của lnY trong mô hình hồi quy mẫu
2. Kiểm định giả thuyết: “Khi thu nhập tăng 1% thì tiêu dùng tăng nhiều hơn 1%”. Tại = 5%.
2) Mô hình hồi quy log – tuyến tính bội
Xét mô hình: Yi = AX2iB2 X3iB3 … XkiBk eiUi
Nhận thấy mô hình trên không tuyến tính với Y và các biến độc lập X ,…, X 2, X3 k. Ta logarit cơ
số tự nhiên 2 vế của mô hình trên thì được: ln(Y ) +…+ B
i) = ln(A) + B2 ln(X2i) + B3 ln(X3i k ln(X ) (*) Đặt ln(A) = B ki) + Ui ln(ei
1 thì mô hình (*) trở thành: ln(Y ) +…+ B
i) =B1 + B2 ln(X2i) + B3 ln(X3i k ln(Xki) + Ui (1)
Mô hình (1) không tuyến tính với Y và các biến độc lập X
,…, X . Nhưng (1) lại tuyến tính với 2, X3 k
biến ln(Y) và các biến ln(X
),…, ln(X ). Mô hình (1) được gọi là mô hình hồi quy log – 2), ln(X3 k
tuyến tính bội hay mô hình hồi quy log – log bội (log kép bội)
Ý nghĩa của hệ số hồi quy trong mô hình log – tuyến tính bội: Xét mô hình hồi quy log – tuyến
tính bội tổng thể sau: ln(Y ) +…+ B
i) =B1 + B2 ln(X2i) + B3 ln(X3i
k ln(Xki) + Ui B1: không có ý nghĩa
Bi (với i = 2, 3,…, k): được gọi là hệ số co giãn riêng của Y theo Xi. Ý nghĩa: Khi Xi (với i =
2, 3,…, k) tăng lên 1%, các biến còn lại không đổi thì Y thay đổi xấp xỉ là Bi%.
Khi đó mô hình hồi quy log – tuyến tính bội mẫu như sau: ln(Y ) +…+ B
i) = b1 + b2 ln(Xi) + B3 ln(X3i k ln(Xki) ln(Yi) = b1 + b ) +…+ B 2 ln(Xi) + B3 ln(X3i
k ln(Xki)+ ei = ln(Yi) + ei b1: không có ý nghĩa
bi (với i = 2, 3,…, k): là 1 ước lượng điểm cho Bi. Ý nghĩa: Khi Xi (với i = 2, 3,…, k) tăng
lên 1%, các biến còn lại không đổi thì Y thay đổi xấp xỉ là bi%.
Câu lệnh tìm các ước lượng điểm cho B
(với i = 2, 3,…, k) cho mô hình log – 1 và Bi tuyến tính
bằng phương pháp phương cực tiểu thông thường (OLS) trong phần mềm như sau: lm(log(Y)~log(X )+…+log(X 2)+log(X3 k))
(Trong đó: Y là biến biến phụ thuộc; còn X ,…, X 2, X3
k là tên các biến phụ thuộc)
VD4: Cho hàm sản xuất dạng Cobb – Douglas: Y = AK L , trong đó Y: sản lượng, K: Vốn, L: lao
động. Trong đó: A, , là các hằng số. Viết mô hình kinh tế lượng phù hợp dùng để ước lượng các
hệ số A, , . Viết phương trình hồi quy mẫu và nêu ý nghĩa của các hệ số co giãn riêng (hệ số hồi
quy riêng trong phương trình hồi quy mẫu) . Số liệu có trong file CobbDouglas.csv 2 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Câu lệnh tìm phần dư (e )+…+log(X
i) là: e=resid(lm(log(X2)+log(X3 k)))
Câu lệnh tìm Yi thì cũng làm gần giống mô hình hồi quy log – tuyến tính như sau: Đầu tiên ta phải biến đổi: ln(Y ) +…+ B
i ) = b1 + b2 ln(Xi) + B3 ln(X3i k ln(Xki) <=> = (Mà elnA = A) <=> Yi =
Do đó trên phần mềm muốn tìm được Yi ta phải làm thành 2 bước như sau:
Bước 1: Tìm ln(Y ). Làm như sau trên phần mềm: i
lnYmu=fitted(lm(log(Y)~ log(X )+…+log(X 2)+log(X3 k))) Bước 2: Tính
Y . Làm như sau trên phần mềm: i Ymu=exp(lnYmu)
Câu lệnh tìm ước lượng điểm cho sai số chuẩn b1 và bi (với i = 2, 3,…, k) (tìm se(b1), se(bi)) là:
summary(lm(log(Y)~ log(X )+…+log(X 2)+log(X3
k))) (Nhìn vào chỗ ghi Std. Error rồi chép kết quả ra)
Câu lệnh tìm khoảng tin cậy cho các hệ số B1 và Bi (với i = 2, 3,…, k) là:
confint(lm(log(Y)~ log(X )+…+log(X 2)+log(X3 k),level=0. ))
Và tất cả các bài toán kiểm định hệ số B1 và Bi (với i = 2, 3,…, k) thì vẫn đưa ra quyết định bác bỏ
hay chấp nhận H0 giống như mô hình hồi quy tuyến tính k biến. Và dựa chủ yếu trên kết quả của câu
lệnh: summary(lm(log(Y)~ log(X )+…+log(X 2)+log(X3
k))) cho các bài toán kiểm định ý nghĩa thống
kê và câu lệnh: summary(glht(mh,A,B *,alt=“”)) cho các bài toán kiểm định không phải là bài toán i
hai bên và hệ số Bi* 0
VD5: Cho hàm sản xuất dạng Cobb – Douglas: Y = AK L , trong đó Y: sản lượng, K: Vốn, L: lao
động. Trong đó: A, , là các hằng số. Số liệu có trong file CobbDouglas.csv. Hãy:
1. Kiểm định ý nghĩa thống kê của mô hình, dùng mức ý nghĩa 5%.
2. Kiểm định ý nghĩa thống kê của từng biến độc lập trong mô hình, dùng mức ý nghĩa 5%.
3. Kiểm định ý nghĩa kinh tế (Kiểm định xem các hệ số , có thỏa mãn điều kiện 0 < , < 1 hay
không), dùng mức ý nghĩa 5%.
4. Kiểm định giả thuyết hàm sản xuất có lợi suất theo quy mô không đổi (hay + =1). Dùng mức ý nghĩa 5%.
VD6: File CauThitLon.csv cho biết lượng cầu về thịt lợn (Q – đơn vị tính 10kg/đầu người), thu nhập
trên đầu người (Y – đơn vị tính USD), giá thịt lợn (P đơn vị tính USD/kg).
1. Viết mô hình hồi quy tổng thể log tuyến tính bội của Q theo P,Y.
2. Ước lượng mô hình trên (viết mô hình hồi quy mẫu). Nêu ý nghĩa của các hệ số hồi quy riêngtrong mô hình hồi quy mẫu.
3. Kiểm định giả thuyết: Hệ số co giãn của cầu theo giá bằng 1.
4. Kiểm định giả thuyết: Hệ số co giãn của cầu theo thu nhập bằng 1.
3) Mô hình log – lin
Xét mô hình hồi quy dạng: Yi = ABXi eUi
Ta logarit cơ số tự nhiên 2 vế của mô hình trên thì được ln(Yi) = ln(ABXi eUi) <=>
ln(Yi) = ln(A) + Xi ln(B) + Ui ln(e) (Mà ln(e) = 1)
Đặt ln(A) = B1, ln(B) = B2 <=> ln(Yi) = B1 + B2Xi + Ui (1)
Mô hình (1) tuyến tính với Y và ln(X). Mô hình (1) được gọi là mô hình hồi quy log –
lin Ý nghĩa của các hệ số hồi quy trong mô hình hồi quy log – lin B : không có ý nghĩa 1
B : Khi X tăng thêm 1 đơn vị thì Y thay đổi xấp xỉ là B 2
2 100% (B2 có thể được gọi là tốc độ thay đổi tức thời của Y) 3 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Câu lệnh tìm ước lượng điểm cho các hệ số hồi quy bằng phương pháp bình phương cực tiểu thông
thường OLS trên phần mềm từ đó viết mô hình log – lin mẫu là: lm(log(Y)~X) Xét mô hình tính tốc
độ thay đổi: Yt= Y0 (1+r)t (*) Trong đó:
t là biến chỉ thời gian. Yt là giá trị của Y tại thời điểm t. Y0 là giá trị của Y tại thời điểm t = 0.
r là tốc độ thay đổi trung bình trong giai đoạn đang xét (r > 0 là tăng trưởng; r < 0 là suy
thoái) Với mục đích là ước lượng r thì ta Ta logarit cơ số tự nhiên 2 vế của mô hình (*) được: ln(Yt) = ln(Y0) + t ln(1+r)
Đặt ln(Y0) = B1, ln(1+r) = B2 => (*) trở thành: ln(Yt) = B1 + B2t + Ut (1)
Mô hình (1) tuyến tính với Y và t. Muốn ước lượng được r thì ta phải dùng công thức: r = – 1 Vậy
muốn tìm được r thì đầu tiên là phải tìm được b2 thông qua câu lệnh ước lượng điểm các hệ số hồi
quy mẫu là: lm(log(Y)~t)
VD7: Cho Y – Vốn đầu tư. Phương trình vốn đầu tư theo nhịp có dạng Yt= Y0 (1+r)t
Trong đó: Y0 là năm gốc, r là tham số. Số liệu có trong File DauTu.csv
1. Để ước lượng cho tốc độ tăng trưởng hàng năm của vốn đầu tư (ước lượng r), bạn sẽ sử dụngmô
hình hồi quy tổng thể nào?
2. Ước lượng mô hình trên? Nêu ý nghĩa của hệ số góc trong mô hình.
3. Ước lượng cho r và ý nghĩa của con số đó.
4. Vẽ biểu đồ tán xạ của Vốn đầu tư theo thời gian.
VD8: Cho tập dữ liệu MOBILE.txt trong đó Y là số lượng máy điện thoại (đơn vị 1000 cái), X là GDP
trên đầu người (tính theo đô la Singapore năm 1968).
1. Viết mô hình hồi quy tổng thể log-lin của Y theo X.
2. Viết phương trình hồi quy mẫu, nêu ý nghĩa của hệ số góc trong phương trình hồi quy mẫu.
Câu lệnh tìm phần dư (ei) là: e=resid(lm(log(Y)~X)) Câu lệnh tìm Yi thì như sau:
Đầu tiên ta phải biến đổi: ln(Yi) = b1 + b2 Xi <=> = (Mà elnA = A) <=> Yi =
Do đó trên phần mềm muốn tìm được Yi ta phải làm thành 2 bước như sau:
Bước 1: Tìm ln(Y ). Làm như sau trên phần mềm: i
lnYmu=fitted(lm(log(Y)~ X))
Bước 2: Tính Y . Làm như sau trên phần mềm: i Ymu=exp(lnYmu)
Tất cả các bài toán kiểm định thì thiết lập cặp giả thuyết thống kê và cũng đưa ra quyết định bác bỏ
hay chấp nhận H0 giống như các mô hình đã học. Kết quả được dùng để kiểm định được lấy trong câu
lệnh summary(lm(log(Y)~X)) cho các bài toán kiểm định ý nghĩa thống kê và câu lệnh:
summary(glht(mh,A,B *,alt=“”)) cho các bài toán kiểm định không phải là bài toán hai bên và hệ i số Bi* 0
VD9: File WEET.rda chứa dữ liệu về lương (Wage), số năm đào tạo (Educ), số năm đi làm (Exper),
và số năm đảm nhận công việc hiện tại (Tenure) của một mẫu gồm 526 công nhân. Xét mô hình sau:
log(Wage) = B1 +B2 * Educ + B3 * Exper + B4 * Tenure + U
1. Viết mô hình hồi quy mẫu. Nêu ý nghĩa của các giá trị ước lượng cho B2, B3, B4.
2. Kiểm định giả thuyết sau ở mức ý nghĩa 5%: Về mặt trung bình, khi có cùng số năm kinhnghiệm
và số năm đảm nhận công việc hiện tại, nếu số năm đào tạo của một người nhiều hơn người khác
1 năm thì tiền lương nhiều hơn ít nhất 10%. 4 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
3. Kiểm định giả thuyết: số năm đào tạo ảnh hưởng đến lương nhiều hơn số năm kinh nghiệm (tứclà
công nhân được đào tạo nhiều hơn 1 năm thì lương cao hơn công nhân có nhiều hơn 1 năm kinh
nghiệm). Dùng mức ý nghĩa 5%.
4) Mô hình lin – log
Mô hình hồi quy lin – log có dạng: Yi = B1 + B2 ln(Xi) + Ui Ý nghĩa của các hệ số:
B : không có ý nghĩa còn : Khi X tăng lên 1% thì Y sẽ thay đổi xấp xỉ là đơn vị. 1 B2
Câu lệnh tìm phần dư (ei) là: e=resid(lm(Y~log(X)))
Câu lệnh tìm Yi thì như sau: Ymu=fitted(lm(Y~log(X)))
Tất cả các bài toán kiểm định thì thiết lập cặp giả thuyết thống kê và cũng đưa ra quyết định bác bỏ
hay chấp nhận H0 giống như các mô hình đã học. Kết quả được dùng để kiểm định được lấy trong câu
lệnh summary(lm(Y~log(X))) cho các bài toán kiểm định ý nghĩa thống kê và câu lệnh:
summary(glht(mh,A,B *,alt=“”)) i
cho các bài toán kiểm định không phải là bài toán hai bên và hệ số Bi* 0
VD10: Cho số liệu về tổng thu nhập quốc dân GDP và lượng cung tiền tệ M2 của một nền kinh tế (số
liệu trong file GDPVaM2.csv). Người ta cần biết nếu tăng số lượng cung tiền tệ M2 lên 1% thì GDP
sẽ thay đổi thế nào (bao nhiêu đơn vị). Thực hiện bằng cách ước lượng mô hình dạng lin log sau: GDP = B1 + B2 log M2 + U
1. Lập phương trình hồi quy mẫu. Trả lời câu hỏi trên
2. Kiểm định ý nghĩa thống kê và kiểm định về dấu của hệ số B2.
5) Mô hình hồi quy nghịch đảo
Xét mô hình hồi quy dạng: Yi = B1 + B2 +Ui (1)
Ý nghĩa của các hệ số trong mô hình hồi quy nghịch đảo: B1, B2 không có ý nghĩa. Nếu B2 < 0 thì
(1) có X và Y là có mối quan hệ đồng biến. Nếu B2 > 0 thì (1) có X và Y là có mối quan hệ nghịch biến.
Câu lệnh tìm các ước lượng cho hệ số B1 và B2 của mô hình (1) trên phần mềm là lm(Y~I(1/X))
Có một số mô hình hồi quy nghịch đảo sau:
Xét mô hình hồi quy dạng: Yi = B1 + B2 +Ui (Với B1 > 0 và B2 > 0)
VD: Mối quan hệ giữa chi phí sản xuất cố định trung Y bình AFC (Y) v
à sản lượng Q (X). Khi sản lượng (Q) tăng thì c hi phí sản xuấ t cố định trung bình AFC g iảm B 1
nhưng không giảm quá một mức giá trị tối thiểu là B 0 1 . X
Xét mô hình hồi quy dạng: Yi = B1 + B2 +Ui (Với B1 < 0 và B2 > 0) (Đường cong Phillips) 5 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865 Y
VD: Mối quan hệ giữa tỷ lệ thay đổi tiền lương (Y) và tỷ lệ thất nghiệp (X)
được biểu diễn bằng đường cong Phillips:
Khi tỷ lệ thất nghiệp tăng nhưng ở dưới mức thất nghiệp tự nhiên ( ) thì tiền
lương tăng (ứng với giá trị Y > 0) nhưng mức tăng lương có xu hướng giảm
dần (biểu thị bằng đường cong có hướng dốc xuống tiến về giá trị 0) Khi tỷ lệ 0 X
thất nghiệp tăng vượt quá mức thất nghiệp tự nhiên ( ) thì tiền lương giảm
(ứng với giá trị Y < 0) nhưng mức giảm lương có xu hướng tăng dần (biểu thị B 1
bằng đường cong có hướng ngày càng xa giá trị 0) Đây gọi là đường
Khi tỷ lệ thất nghiệp tăng vô hạn thì tỷ lệ tiền lương giảm nhưng không giảm cong Phillips
quá một mức giá trị tối thiểu là B1. (B1 được gọi là giới hạn thấp nhất của tỷ lệ VD11: File thay đổi tiền lương) WageUnemJapan.txt
cho số liệu về tỉ lệ thay
đổi tiền lương (W) và tỉ lệ thất nghiệp của Nhật (UNEM) trong thời kì 1950-1960. Xét mô hình đường cong Phillips: W = B1 + B2 +U
1. Hãy ước lượng mô hình
2. Hãy tìm giới hạn thấp nhất của tỉ lệ tiền lương.
3. Hãy cho biết tỉ lệ thất nghiệp tự nhiên của Nhật bằng bao nhiêu?
Xét mô hình hồi quy dạng: Yi = B1 + B2 +Ui (Với B1 > 0 và B2 < 0) (Đường cong Engel) Y
VD: Mối quan hệ giữa lượng chi tiêu của người tiêu dùng đối với một
hàng hóa (Y) với thu nhập (X) được biểu diễn bằng Đường cong Engel.
Khi thu nhập tăng thì chi tiêu đối với 1 loại hàng hóa cũng tăng. Tuy nhiên B 1
đối với một loại hàng hóa thì thu nhập của người tiêu dùng phải đạt mức
tối thiểu ( ) thì người tiêu dùng mới sử dụng loại hàng hóa này. ( )
được gọi là thu nhập tới hạn hay ngưỡng thu nhập
Khi thu nhập tăng vô hạn thì chi tiêu đối với loại hàng hóa này tăng nhưng
không tăng quá mức B1. (B1 được gọi là mức tiêu dùng bão hòa) 0 X
VD12: Cho Y – Thu nhập,
C – Tiêu dùng về một mặt
hàng. Số liệu trong File TieuDungND.rda
1. Ước lượng mô hình nghịch đảo: C = B1 + B2 +U. Hãy tính mức tiêu dùng bão hòa của mặt hàng đó.
2. Kiểm định giả thuyết: Khi thu nhập tăng thì tiêu dùng tăng, dùng mức ý nghĩa = 5%.
6) Mô hình hồi quy đa thức
Một mô hình hồi quy đa thức thường được dùng trong trường hợp đánh giá mối quan hệ giữa chi
phí C và mức sản lượng Q. Giả sử doanh nghiệp có hàm sản xuất bậc 3:
C = B1 + B2Q + B3Q2 + B4Q3 + U (Trong đó thì B1, B2, B4 > 0; B3 < 0)
Muốn ước lượng cho các hệ số B1, B2, B3 và B4 thì dùng lm(C~Q+I(Q^2)+I(Q^3)) VD13:
Cho Y – chi phí toàn phần, X – mức sản xuất. (Số liệu có trong 昀椀 le ChiPhi.csv) 6 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
1. Vẽ biểu đồ tán xạ (X là trục hoành, Y là trục tung). Nhận xét.
2. Ước lượng cho mô hình hồi quy dạng đa thức: Y = C0 + C1X + C2X2 + C3X3 + U.
3. Thực hiện các bài toán kiểm định sự có ý nghĩa trong mô hình của X2, X3.
4. Kiểm định xem dấu của các hệ số của đường chi phí bậc ba có phù hợp không? (C0, C1, C3 > 0, C2 < 0)
7) So sánh các mô hình hồi quy
Để phân tích sự biến động của một biến ngẫu nhiên Y và các yếu tố tác động lên sự biến động của
biến Y đó người ta có thể lựa chọn nhiều mô hình hồi quy khác nhau. Muốn đánh giá xem mô hình
nào phù hợp hơn mô hình nào ta có thể dựa trên tiêu chi hệ số xác định R2. Khi đó các mô hình
phải thỏa mãn 3 điều sau:
1. Các mẫu phải cùng cỡ
2. Các mô hình phải có cùng số lượng biến (Nếu vi phạm điều kiện 2 này thì ta có thể chọn mô
hình nào cho hệ số xác định hiệu chỉnh R2 cao hơn)
3. Các biến phụ thuộc phải có cùng dạng với nhau, các biến độc lạp có thể khác dạng cũng được.(Tức
là ta chỉ có thể chọn R2 để so sánh và chọn ra mô hình nào hợp với dữ liệu mẫu hơn cho các loại mô
hình cùng dạng biến phụ thuộc như là: tuyến tính, lin – log và nghịch đảo. Hoặc hai dạng khác có
cùng dạng biến phụ thuộc để xem mô hình nào hợp hơn là log – log và log – lin)
Nếu vi phạm điều kiện 3 tức là đề yêu cầu so sánh xem mô hình tuyến tính và mô hình log – log xem mô
hình nào phù hợp hơn (hay mô hình tuyến tính và mô hình log – lin) thì 2 mô hình này có biến phụ thuộc
là không cùng dạng nên ta phải tính ra R2 quy đổi cho 2 mô hình log – log hoặc log – lin để so sánh với
R2 của mô hình tuyến tính. (Giá trị nào cao hơn thì mô hình đó phù hợp với dữ liệu mẫu hơn).
Cách tính ra R2 quy đổi cho mô hình log – log hoặc log – lin là: R2qd = [r(Y,Y)]2
Trong đó: r(Y,Y) là hệ số tương quan tuyến tính giữa Y và Y.
Trên phần mềm muốn tìm được Yi cho mô hình log – log ta phải làm thành 2 bước Bước
1: Tìm ln(Y ). Làm như sau trên phần mềm: i
lnYmu=fitted(lm(log(Y)~log(X)))
Bước 2: Tính Y . Làm như sau trên phần mềm: i Ymu=exp(lnYmu)
Trên phần mềm muốn tìm được Yi mô hình log – lin ta phải làm thành 2 bước Bước 1:
Tìm ln(Y ). Làm như sau trên phần mềm: i
lnYmu=fitted(lm(log(Y)~ X))
Bước 2: Tính Y . Làm như sau trên phần mềm: i Ymu=exp(lnYmu)
Sau đó ta tính R2qd trên phần mềm như sau: cor(Y,Ymu)^2
VD14: Dùng file CvaGCaFe.csv. So sánh xem mô hình nghịch đảo hay mô hình tuyến tính phù
hợp hơn trong trường hợp xét hồi quy lượng cầu cà phê (Y) theo giá cà phê (X).
VD15: Dùng file CvaGCaFe.csv. So sánh xem mô hình log – log hay mô hình tuyến tính phù hợp
hơn trong trường hợp xét hồi quy lượng cầu cà phê (Y) theo giá cà phê (X). PHẦN 4. BIẾN GIẢ
Câu hỏi đặt ra là khi nào dùng biến giả để phân tích hồi quy?
Đó là khi chúng ta muốn đánh giá sự ảnh hưởng của một hay nhiều biến định tính đến một biến
định lượng. Vậy thế nào là biến định tính? Thế nào là biến định lượng?
Biến định tính là: các tính chất, chữ (Giới tính, Nơi ở, Học lực,…) và không thể cộng trừ nhân chia được.
Biến định lượng là: các con số (Tuổi, Tiền lương, giá cả,…) và ta có thể cộng trừ nhân chia được.
VD: Muốn nghiên cứu sự ảnh hưởng của Giới tính đến tiền lương. 7 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Muốn nghiên cứu sự ảnh hưởng của Trình độ lao động đến tiền lương…..
1) Cách tạo biến giả
Bước 1: Đọc xem biến định tính có bao nhiêu thuộc tính.
VD: Giới tính có 2 loại là Nam và Nữ => Giới tính có 2 thuộc tính
Trình độ giảng viên có 3 loại là Cử nhân, Thạc sĩ, Tiến sĩ => Trình độ có 3 thuộc tính.
Bước 2: Đếm số lượng biến giả cần lập. Biến định tính có n thuộc tính thì cần tạo ra n – 1 biến giả.
Bước 3: Tạo biến giả
VD: Giới tính có 2 thuộc tính là Nam và Nữ nên ta có thể tạo ra 1 biến giả D như sau: 1 nếu là Nam D = 0
nếu là Nữ (Khi đó thuộc tính nữ được gọi là thuộc tính nền hay thuộc tính cơ
sở)VD: Trình độ giảng viên có 3 loại là Cử nhân, Thạc sĩ, Tiến sĩ nên ta có thể tạo ra 2 biến giả như sau: 1 nếu là Thạc sĩD1 =
0 nếu là các trường hợp còn lại
Khi đó thuộc tính Cử nhân được gọi là 1 nếu là Tiến sĩ
thuộc tính nền hay thuộc tính cơ sở D2 =
0 nếu là các trường hợp còn lại
Vậy thuộc tính ứng với tất cả các trường hợp biến giả đều = 0 gọi là thuộc tính nền hay thuộc tính cơ sở.
2) Cách làm 1 bài toán phân tích hồi quy với biến giả (đánh giá sự ảnh hưởng của 1 biến định tính
đến 1 biến định lượng)
VD1: Người ta muốn nghiên cứu sự phụ thuộc của tiền lương (Y) của các công nhân ở một công ty
vào đặc điểm giới tính.
Giải: Giới tính là biến định tính có 2 thuộc tính là Nam và Nữ. Khi đó ta có thể tạo một một biến
giả D như sau: 1 nếu là Nam 0 nếu là Nữ D =
Muốn đánh giá sự ảnh hưởng của Giới tính (D) đến tiền lương (Y), ta có thể thiết lập mô hình hồi quy
sau: Yi = B1 + B2Di + Ui (1). Tách mô hình (1) theo từng thuộc tính:
Nếu Giới tính là Nam thì (1) trở thành: Yi = B1 +B2 + Ui
Nếu Giới tính là Nữ thì (1) trở thành: Yi = B1 +Ui
Ý nghĩa của các hệ số hồi quy trong mô hình (1) B : là tiền lương trung 1 bình của Nữ giới.
B : là chênh lệch tiền lương trung bình của Nam giới so với Nữ giới. 2
Nếu B2 > 0 ta nói là tiền lương trung bình của Nam giới nhiều hơn tiền lương trung bình của
Nữ giới là B2 đơn vị.
Nếu B2 < 0 ta nói là tiền lương trung bình của Nam giới ít hơn tiền lương trung bình của Nữ giới là B2 đơn vị
Muốn đánh giá xem Giới tính có ảnh hưởng đến tiền lương hay không
người ta sẽ kiểm định xem B2 0 hay không?
Vậy phân tích mô hình hồi quy có biến giả cũng tương tự như các mô hình tuyến tính hay phi tuyến tính
đã học (các câu lệnh ước lượng điểm cho hệ số hồi quy; cách bác bỏ hay chấp nhận H0 vẫn vậy. Chỉ
khác ở chỗ là ta phải tự lập ra được biến giả để phân tích) 8 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
VD2: Người ta muốn nghiên cứu sự phụ thuộc của tiền lương (TienLuong) của các công nhân ở một
công ty vào đặc điểm giới tính. Số liệu được lưu trong File LVaGT.csv
1. Nêu cách xác định biến giả nếu coi thuộc tính Nữ là thuộc tính cơ sở
2. Ước lượng mô hình hồi quy: Y
. Nêu ý nghĩa của các hệ số trong phương trình i = B1 + B2Di + Ui
hồi quy mẫu. Có sự khác biệt của giới tính đến tiền lương hay không (tại =5%)
3. Kiểm định giả thuyết: Lương của Nam giới cao hơn lương Nữ giới (tại =5%)
4. Kiểm định giả thuyết: Lương của Nam giới cao hơn lương Nữ giới 100 (tại =5%)
5. Kiểm định giả thuyết: Lương của Nam giới cao hơn lương Nữ giới ít nhất 100 (tại =5%)
6. Kiểm định giả thuyết: Lương của Nam giới cao hơn lương Nữ giới không quá 100 (tại =5%)
VD3: Người ta muốn nghiên cứu sự phụ thuộc của tiền lương (TienLuong) của người lao động
ở một Tỉnh vào đặc điểm nghề nghiệp công việc: nhân viên kế toán, nhân viên ngân hàng và kiến
trúc sư. Số liệu được lưu trong File LVaNN.csv
1. Nêu cách xác định biến giả nếu coi kiến trúc sư là thuộc tính cơ sở
2. Ước lượng mô hình hồi quy: Y
. Nêu ý nghĩa của các hệ số trong phương i = B0 + B1D1i + B2D2i + Ui
trình hồi quy mẫu. Có sự khác biệt của nghề nghiệp đến tiền lương hay không (tại =5%). Xác
định phương trình hồi quy mẫu cho từng thuộc tính.
3. Kiểm định giả thuyết: tiền lương của kiến trúc sư cao hơn của nhân viên kế toán tại =5%
4. Kiểm định giả thuyết: lương của nhân viên ngân hàng lớn hơn của kiến trúc sư tại =5% Giải:
(chỉ làm phần xác định biến giả)
1 nếu là nhân viên kế toán D1 = 0
nếu là các trường hợp còn lại
Ở đây thì: D1 là biến giả cho nhân viên kế toán 1
nếu là nhân viên ngân hàngD2 =
D2 là biến giả cho nhân viên ngân hàng
0 nếu là các trường hợp còn lại
Muốn đánh giá sự ảnh hưởng của nghề nghiệp đến tiền lương ta có thể thiết lập mô hình hồi quy sau:
Yi = B0 + B1D1i + B2D2i + Ui (1). Tách (1) theo từng thuộc tính ta có:
Nếu nghề nghiệp là nhân viên kế toán (tức là D1 = 1; D2 =0) thì (1) trở thành: Yi = B0 + B1+ Ui
Nếu nghề nghiệp là nhân viên ngân hàng (tức là D1 = 0; D2 =1) thì (1) trở thành: Yi = B0 + B2+ Ui
Nếu nghề nghiệp là kiến trúc sư (tức là D1 = 0; D2 =0) thì (1) trở thành: Yi = B0 + Ui
VD4: Người ta muốn nghiên cứu sự phụ thuộc của tiền lương (Y) của giảng viên ở một trường đại học
vào bằng cấp của giảng viên: cử nhân, thạc sĩ, tiến sĩ, giáo sư. Hãy lập mô hình hồi quy và nêu ý nghĩa
của các hệ số hồi quy. Biết các biến giả thạc sĩ, tiến sĩ và giáo sư tương ứng là D2, D3 và D4.
3) Mô hình đánh giá sự ảnh hưởng của 1 biến định tính và 1 biến định lượng đến 1 biến định lượng
Mô hình hồi quy đánh giá sự ảnh hưởng của 1 biến định tính và 1 biến định lượng đến 1 biến định
lượng có thể thiết lập thành 3 dạng sau:
Dạng 1: Biến định tính chỉ ảnh hưởng đến hệ số chặn của biến phụ thuộc
Dạng 2: Biến định tính chỉ ảnh hưởng đến hệ số góc của biến phụ thuộc
Dạng 3: Biến định tính ảnh hưởng đến cả hệ số chặn và hệ số góc của biến phụ thuộc
Dạng 1: Biến giả chỉ ảnh hưởng đến hệ số chặn
VD4: Người ta muốn đánh giá ảnh hưởng của giới tính (D) và kinh nghiệm (X) (số năm làm việc tại
công ty) tới tiền lương (Y). Hãy lập phương trình hồi quy để diễn tả mối quan hệ biết rằng giới tính chỉ
ảnh hưởng đến mức lương khởi điểm của người lao động.
Giải: 1 nếu là Nam D = 0 nếu là Nữ 9 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Xét sự phụ thuộc của tiền lương (Y) vào giới tính (D) và kinh nghiệm (X). Nếu chỉ xét sự ảnh hưởng
của kinh nghiệm đến tiền lương thì ta có mô hình hồi quy sau: Yi = + Xi + Ui (1)
Trong đó: đóng vai trò là lương khởi điểm; đóng vai trò là mức tăng lương hàng năm.
Đề bài cho giới tính chỉ ảnh hưởng đến mức lương khởi điểm tức là biến giả chỉ ảnh hưởng đến hệ số
chặn của mô hình (1). Ta có thể viết: = B1 + B2Di.
Thay vào mô hình (1) ta có: Y . Đặt i = B1 + B2Di + Xi + Ui = B3
Khi đặt = B3 thì mô hình (1) trở thành: Yi = B1 + B2Di + B3Xi + Ui (2) Tách
mô hình (2) theo từng thuộc tính của biến giả:
Nếu Giới tính là Nam thì (2) trở thành: Yi = B1 + B2 + B3Xi + Ui
Nếu Giới tính là Nữ thì (2) trở thành: Yi = B1 + B3Xi + Ui
Ý nghĩa của các hệ số hồi quy trong mô hình (2)
B : Khi số năm kinh nghiệm bằng 0 thì tiền lương trung bình của nữ giới là B . Hay có thể nói 1 1
kiểu khác là: Tiền lương khởi điểm trung bình của nữ giới là B1.
B : Chênh lệch tiền lương trung bình của nam giới so với tiền lương trung bình của nữ giới khi 2
số năm kinh nghiệm bằng 0 là B . Hay có thể nói kiểu khác là: Chênh lệch tiền lương khởi điểm 2
trung bình của nam giới so với nữ giới là B2.
Nếu B2 > 0 thì nói tiền lương khởi điểm trung bình của Nam giới nhiều hơn tiền lương khởi
điểm trung bình của nữ giới là B2 đơn vị.
Nếu B2 < 0 thì nói tiền lương khởi điểm trung bình của Nam giới ít hơn tiền lương khởi điểm
trung bình của nữ giới là B2 đơn vị.
B : Khi số năm kinh nghiệm tăng thêm 1 đơn vị thì tiền lương trung bình của cả hai giới đều thay 3
đổi là B3 đơn vị. Hay có thể nói kiểu khác là: Sau mỗi một năm làm việc tại công ty thì tiền
lương trung bình của cả hai giới đều thay đổi là B3 đơn vị.
VD5: Người ta muốn đánh giá ảnh hưởng của giới tính (D) và kinh nghiệm (X) (số năm làm việc tại
công ty) tới tiền lương (Y). Số liệu được cho trong File GTKNTL.csv
a. Hãy ước lượng mô hình hồi quy mẫu và nêu ý nghĩa của các hệ số hồi quy để diễn tả mối quanhệ
biết rằng giới tính chỉ ảnh hưởng đến mức lương khởi điểm của người lao động. Xác định phương
trình hồi quy mẫu cho từng thuộc tính.
b. Kiểm định giả thuyết: giới tính ảnh hưởng đến tiền lương tại = 5%.
VD6: Người ta muốn đánh giá ảnh hưởng của nghề nghiệp và kinh nghiệm (X) (số năm làm việc tại công
ty) tới tiền lương (Y). Số liệu được cho trong File NNKNTL.csv. 2 biến giả cho nghề nghiệp như sau:
1 nếu là nhân viên kế toán 1 nếu là nhân viên ngân hàng D1 =D2 =
0 nếu là các trường hợp còn lại 0 nếu là các trường hợp còn lại
a. Hãy ước lượng mô hình hồi quy mẫu và nêu ý nghĩa của các hệ số hồi quy để diễn tả mối quanhệ
biết rằng nghề nghiệp chỉ ảnh hưởng đến mức lương khởi điểm của người lao động.
b. Kiểm định giả thuyết: nghề nghiệp ảnh hưởng đến tiền lương tại = 5%.
Dạng 2: Biến giả chỉ ảnh hưởng đến hệ số góc
VD7: Người ta muốn đánh giá ảnh hưởng của giới tính (D) và kinh nghiệm (X) (số năm làm việc tại
công ty) tới tiền lương (Y). Hãy lập phương trình hồi quy để diễn tả mối quan hệ biết rằng giới tính chỉ
ảnh hưởng đến mức tăng lương hàng năm của người lao động.
Giải: 1 nếu là Nam 0 nếu là Nữ D = 10 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Xét sự phụ thuộc của tiền lương (Y) vào giới tính (D) và kinh nghiệm (X). Nếu chỉ xét sự ảnh hưởng
của kinh nghiệm đến tiền lương thì ta có mô hình hồi quy sau: Yi = + Xi + Ui (1)
Trong đó: đóng vai trò là lương khởi điểm; đóng vai trò là mức tăng lương hàng năm.
Đề bài cho giới tính chỉ ảnh hưởng đến mức tăng lương hàng năm tức là biến giả chỉ ảnh hưởng đến hệ
số góc của mô hình (1). Ta có thể viết: = B2 + B3Di.
Thay vào mô hình (1) ta có: Y . Đặt i = + (B2 + B3Di) Xi + Ui = B1
Khi đặt = B1 thì mô hình (1) trở thành: Yi = B1 + B2Xi + B3DiXi + Ui (2) Tách
mô hình (2) theo từng thuộc tính:
Nếu Giới tính là Nam thì mô hình (2) trở thành: Yi = B1 + B2Xi + B3Xi + Ui
Nếu Giới tính là Nữ thì mô hình (2) trở thành: Yi = B1 + B2Xi + Ui
Ý nghĩa của các hệ số hồi quy trong mô hình (2)
B : Khi số năm kinh nghiệm bằng 0 thì tiền lương trung bình của cả nam giới và nữ giới đều là B 1 1.
Hay có thể nói kiểu khác là: Tiền lương khởi điểm trung bình của cả nam giới và nữ giới đều là B1.
B : Khi năm kinh nghiệm tăng thêm 1 đơn vị thì tiền lương trung bình của nữ giới tăng lên là B đơn 2 2
vị. Hay có thể nói kiểu khác là: Mức tăng lương hàng năm của nữ giới là B : Chênh lệch 2 đơn vị B3
mức tăng lương hàng năm của nam giới so với nữ giới.
Nếu B3 > 0 thì ta nói mức tăng lương hàng năm của nam giới nhiều hơn B3 đơn vị so với mức
tăng lương hàng năm của nữ giới.
Nếu B3 < 0 thì ta nói mức tăng lương hàng năm của nam giới ít hơn B3 đơn vị so với mức tăng
lương hàng năm của nữ giới.
VD8: Người ta muốn đánh giá ảnh hưởng của giới tính (D) và kinh nghiệm (X) (số năm làm việc tại
công ty) tới tiền lương (Y). Số liệu được cho trong File GTKNTL.csv
a. Hãy ước lượng mô hình hồi quy mẫu và nêu ý nghĩa của các hệ số hồi quy để diễn tả mối quanhệ
biết rằng giới tính chỉ ảnh hưởng đến mức tăng lương hàng năm của người lao động. Xác định
phương trình cho từng thuộc tính.
b. Kiểm định giả thuyết: giới tính ảnh hưởng đến tiền lương tại = 5%.
VD9: Người ta muốn đánh giá ảnh hưởng của nghề nghiệp và kinh nghiệm (X) (số năm làm việc
tại công ty) tới tiền lương (Y). Số liệu được cho trong File NNKNTL.csv Biết 2 biến giả cho nghề nghiệp như sau:
1 nếu là nhân viên kế toán D1 = 0
nếu là các trường hợp còn lại 1
nếu là nhân viên ngân hàngD2 =
0 nếu là các trường hợp còn lại
a. Hãy ước lượng mô hình hồi quy mẫu và nêu ý nghĩa của các hệ số hồi quy để diễn tả mối quanhệ
biết rằng nghề nghiệp chỉ ảnh hưởng đến mức tăng lương hàng năm của người lao động.
b. Kiểm định giả thuyết: nghề nghiệp ảnh hưởng đến tiền lương tại = 5%.
Dạng 3: Biến định tính ảnh hưởng đến cả hệ số chặn và hệ số góc
VD10: Người ta muốn đánh giá ảnh hưởng của giới tính (D) và kinh nghiệm (X) (số năm làm việc
tại công ty) tới tiền lương (Y). Hãy lập phương trình hồi quy để diễn tả mối quan hệ biết rằng giới
tính ảnh hưởng đến cả mức lương khởi điểm và mức tăng lương hàng năm của người lao động. 11 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Giải: Giới tính là biến định tính có 2 thuộc tính là Nam và Nữ. Khi đó ta có thể tạo một một biến
giả D như sau: 1 nếu là Nam D = 0 nếu là Nữ
Xét sự phụ thuộc của tiền lương (Y) vào giới tính (D) và kinh nghiệm (X). Nếu chỉ xét sự ảnh
hưởng của kinh nghiệm đến tiền lương thì ta có mô hình hồi quy sau: Yi = + Xi + Ui (1)
Trong đó: đóng vai trò là lương khởi điểm; đóng vai trò là mức tăng lương hàng năm.
Đề bài cho giới tính ảnh hưởng đến cả mức lương khởi điểm và mức tăng lương hàng năm tức là
biến giả ảnh hưởng đến cả hệ số chặn và hệ số góc của mô hình (1).
Ta có thể viết: = B1 + B2Di , = B3 + B4Di
Thay vào mô hình (1) ta có: Yi = B1 + B2Di + (B3 + B4Di) Xi + Ui.
<=> Yi = B1 + B2Di + B3Xi + B4DiXi + Ui (2) Tách
mô hình 2 theo từng thuộc tính:
Nếu giới tính là Nam thì (2) trở thành: Yi = B1 + B2 + B3Xi + B4Xi + Ui
Nếu giới tính là Nữ thì (2) trở thành: Yi = B1 + B3Xi + Ui
Ý nghĩa của các hệ số hồi quy trong mô hình (2)
B : Tiền lương khởi điểm trung bình của nữ giới là B 1 1
B : Chênh lệch tiền lương khởi điểm trung bình của nam giới so với nữ giới. : Mức tăng 2 B3
lương hàng năm của nữ giới.
B : Chênh lệch mức tăng lương hàng năm của nam giới so với nữ giới. 4
VD11: Người ta muốn đánh giá ảnh hưởng của giới tính (D) và kinh nghiệm (X) (số năm làm việc
tại công ty) tới tiền lương (Y). Số liệu được cho trong File GTKNTL.csv
a. Hãy ước lượng mô hình hồi quy mẫu và nêu ý nghĩa của các hệ số hồi quy để diễn tả mốiquan
hệ biết rằng giới tính ảnh hưởng đến cả mức lương khởi điểm và mức tăng lương hàng năm của người lao động.
b. Kiểm định giả thuyết: giới tính ảnh hưởng đến tiền lương tại = 5%.
VD12: Người ta muốn đánh giá ảnh hưởng của nghề nghiệp và kinh nghiệm (X) (số năm làm việc
tại công ty) tới tiền lương (Y). Số liệu được cho trong File NNKNTL.csv.
2 biến giả cho nghề nghiệp như sau:
1 nếu là nhân viên kế toán 1 nếu là nhân viên ngân hàng D1 = D2 =
0 nếu là các trường hợp còn lại 0 nếu là các trường hợp còn lại
a. Hãy ước lượng mô hình hồi quy mẫu và nêu ý nghĩa của các hệ số hồi quy để diễn tả mốiquan
hệ biết rằng nghề nghiệp ảnh hưởng đến cả mức lương khởi điểm và mức tăng lương hàng
năm của người lao động.
b. Kiểm định giả thuyết: nghề nghiệp ảnh hưởng đến tiền lương tại = 5%.
4) Phân tích hồi quy với biến giả nhưng file dữ liệu không có sẵn cột biến giả Khi đó chúng ta phải
tự tạo ra tên cột chứa biến giả để phân tích hồi quy. 12 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
VD13: File SavInc.rda chứa dữ liệu về tiết kiệm (Y) và thu nhập (X) của một nước. Người ta muốn
xem có sự thay đổi trong mối quan hệ phụ thuộc của tiết kiệm theo thu nhập trong hai giai đoạn: giai
đoạn 1 (1970 – 1981) và giai đoạn 2 (1982 – 1995)
1. Hãy định nghĩa một biến giả D phù hợp.
2. Xét mô hình Y = B1 + B2D + B3X + B4 (D*X) + U
a. Viết mô hình hồi quy mẫu. Nêu ý nghĩa của các hệ số hồi quy.
b. Viết phương tình hồi quy mẫu cho từng giai đoạn
3. Tại =5%, kiểm định ý nghĩa thống kê của biến D*X trong mô hình.
4. Tại =5%, khi thu nhập của một nước như nhau, kiểm định xem tiết kiệm của giai đoạn 2
nhiều hơn tiết kiệm của giai đoạn 1.
5. Tại =5%, kiểm định xem khi thu nhập của một nước tăng lên 1 đơn vị thì mức tăng tiết kiệm
của giai đoạn 2 tăng lên nhiều hơn mức tăng tiết kiệm của giai đoạn 1.
VD14: File TiLeLDNu.csv cho biết tỉ lệ nữ tham gia vào lực lượng lao động tính trong số nữ từ 16
tuổi trở lên (Y – % ), tỉ lệ thất nghiệp (X – %) trong hai năm 1980, 1990 của 50 bang ở Mỹ.
1. Người ta muốn xem có sự thay đổi trong mối quan hệ phụ thuộc của Y vào X trong 2 năm1990
và 1980 hay không. Hãy định nghĩa một biến giả D để thực hiện mục đích này.
2. Với biến giả D vừa định nghĩa, xét mô hình sau: Y = B1 + B2D + B3X + U
Viết mô hình hồi quy mẫu. Nêu ý nghĩa của giá trị ước lượng cho các hệ số hồi quy.
3. Kiểm định xem khi có cùng tỉ lệ thất nghiệp thì tỉ lệ nữ tham gia vào lực lượng lao động
trongnăm 1990 có cao hơn năm 1980 hay không? Nêu H
, thực hiện kiểm định và đưa ra 0, H1 kết luận tại = 5%.
VD15: File Luong.rda chứa dữ liệu về lương (Y), số năm kinh nghiệm (X) và giới tính (GioiTinh)
của một mẫu 49 người.
1. Định nghĩa biến giả D để mã hóa cho giới tính.
2. Ước lượng mô hình hồi quy: Y = B1 + B2D + U.
a. Viết phương trình hồi quy mẫu và giải thích ý nghĩa của các hệ số của phương tình hồi quymẫu đó.
b. Tại = 5%, kiểm định xem có phải lương trung bình của nam giới cao hơn lương trung bình của nữ giới.
3. Ước lượng mô hình hồi quy: Y = B1 + B2X + B3 (D*X) + U.
a. Viết phương trình hồi quy mẫu và giải thích ý nghĩa của các hệ số của phương tình hồi quymẫu đó.
b. Tại = 5%. Hãy kiểm định xem có đúng là sau mỗi 1 năm làm việc tại công ty thì mức tăng
lương của nam giới ít hơn mức tăng lương của nữ giới.
VD16: File LGVDH.csv chứa dữ liệu lương (TienLuong – triệu/tháng), số năm kinh nghiệm
(KinhNghiem – năm) và trình độ bằng cấp của giảng viên đại học (TrinhDo).
1. Lập các biến giả D1 và D2 biết giảng viên có trình độ Cử nhân là thuộc tính nền.
2. Ước lượng mô hình hồi quy: Y = B0 + B1D1 + B2D2 + B3X +U.
a. Nêu ý nghĩa của các hệ số trong mô hình hồi quy mẫu. 13 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
b. Kiểm định giả thuyết: Khi số năm kinh nghiệm như nhau thì tiền lương trung bình củagiảng
viên có trình độ thạc sĩ cao hơn giảng viên có trình độ cử nhân. Tại = 5%.
3. Ước lượng mô hình hồi quy: Y = B1 + B2X+ B3 (D1*X) + B4 (D2*X) +U
a. Nêu ý nghĩa của các hệ số trong mô hình hồi quy mẫu.
b. Kiểm định giả thuyết: Sau mỗi một năm giảng dạy ở trường thì mức tăng lương của
giảngviên có trình độ tiến sĩ nhiều hơn mức tăng lương của giảng viên có trình độ cử nhân hay không? tại = 5%.
5) Ứng dụng biến giả trong phân tích mùa
VD17: Khảo sát số lượng tủ lạnh bán được tại một siêu thị điện máy (Y) từ quý 1 năm 2009 đến
quý 4 năm 2016. Dựa vào số liệu trong File SoLuongTuLanh.csv hãy thực hiện các yêu cầu sau:
1. Vẽ biểu đồ tán xạ của Y theo thời gian. Nhận xét
2. Lập các biến giả quý 1, 2, 3 tương ứng với D2, D3, D4.
3. Ước lượng mô hình: Yi = B1+ B2D2 + B3D3 + B4D4 + U. Nêu ý nghĩa của các hệ số hồi quy trong mô hình đó.
4. Xác định phương trình hồi quy mẫu cho từng quý.
5. Kiểm định giả thuyết: Số lượng tủ lạnh bán được vào quý 2 nhiều hơn quý 4. Tại = 5%.
VD18: Cho Y: doanh thu bán hàng, X: thu nhập trung bình của dân cư, các biến giả quý 2, 3 và 4 tương ứng là D
. Dựa vào số liệu trong File 2, D3, D4
DoanhThu.csv hãy thực hiện các yêu cầu sau:
1. Vẽ biểu đồ của Y theo thời gian, nhận xét biểu đồ.
2. Lập các biến giả D2, D3, D4.
3. Ước lượng mô hình hồi quy: Y = B1 + B
X + U. Nêu ý nghĩa của các 2D2 + B3D3 + B4D4 + B5
hệ số hồi quy trong mô hình đó.
4. Xác định phương trình hồi quy mẫu cho từng quý.
5. Kiểm định giả thuyết: Khi thu nhập của dân cư không đổi thì doanh thu trung bình của quý 4 cao hơn quý 1 tại = 5%.
6) Một số mô hình hồi quy nhiều biến giả đến 1 biến định lượng
(MỞ RỘNG THÊM: tự đọc ở nhà. Không thi. Giáo viên giờ lý thuyết có hỏi thì còn biết trả lời)
Mô hình hồi quy 2 biến định tính đến 1 biến định lượng
VD19: Đánh giá sự ảnh hưởng của Giới tính (D) và nghề nghiệp (D1 và D2) đến tiền lương (Y).
1 nếu là Nam 1 nếu là nhân viên kế toán 1 nếu là nhân viên ngân hàng D =D1 =D2 =
0 nếu là Nữ 0 nếu là các TH còn lại 0 nếu là các TH còn lại
Muốn đánh giá sự ảnh hưởng của giới tính, nghề nghiệp đến tiền lương thì ta thiết lập mô hình hồi
quy sau: Y= B1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2) + U Muốn ước lượng và kiểm định
cho các hệ số hồi quy thì dùng lệnh:
summary(lm(Y~D+D1+D2+I(D*D1)+I(D*D2))) 14 lOMoARcPSD| 40615597
ĐẶNG ANH QUÂN – A20115 Số điện thoại: 0969 887 865
Mô hình hồi quy 2 biến định tính 1 biến định lượng và 1 đến 1 biến định lượng
VD20: Đánh giá sự ảnh hưởng của Giới tính (D) và nghề nghiệp (D1 và D2) và kinh nghiệm (X) đến tiền lương (Y).
Trong đó: D và D1 D2 như VD19. Xét sự ảnh hưởng của giới tính, nghề nghiệp và kinh nghiệm
đến tiền lương. Giả sử chỉ có kinh nghiệm (X) ảnh hưởng đến tiền lương (Y) thì ta thiết lập mô
hình hồi quy sau: Y = + X +U (1)
TH1: Nếu giới tính, nghề nghiệp chỉ ảnh hưởng đến mức lương khởi điểm (chỉ ảnh hưởng đến hệ số
chặn). Khi đó ta có thể viết: = B ) và đặt
1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2 =
B7 thì (1) trở thành: Y = B1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2) + B7X +U
TH2: Nếu giới tính, nghề nghiệp chỉ ảnh hưởng đến mức tăng lương (chỉ ảnh hưởng đến hệ số góc). Thì khi đó ta viết = B ) và đặt
1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2 = B0 thì (1) trở
thành: Y = B0 + [B1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2)]X +U
<=> Y= B0 + B1X + B2DX + B3D1X + B4D2X + B5(D*D1)X + B6(D*D2)X +U TH3:
Nếu giới tính, nghề nghiệp ảnh hưởng đến cả hệ số chặn và hệ số góc.
Khi đó ta có thể viết: = B1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2)
Và = A1 + A2D + A3D1 + A4D2 + A5(D*D1) + A6(D*D2). Thay và vào (1) được:
Y= B1 + B2D + B3D1 + B4D2 + B5(D*D1) + B6(D*D2) + [A1 + A2D + A3D1 + A4D2 + A5(D*D1) + A6(D*D2)]X + U
Mô hình 2 biến định tính và 2 biến định lượng ảnh hưởng đến 1 biến định lượng
Thì đầu tiên là cứ giả sử chỉ có 2 biến định lượng là X và Z ảnh hưởng đến biến định lượng phụ
thuộc Y. Khi đó ta có mô hình hồi quy: Y = + X + Z + U
TH1: 2 biến định tính ảnh hưởng đến hệ số chặn của mô hình (chỉ ảnh hưởng đến ): ….
TH2: 2 biến định tính ảnh hưởng đến hệ số hồi quy riêng của mô hình (ảnh hưởng đến và ): …
TH3: 2 biến định tính ảnh hưởng đến hệ số chặn và cả hệ số hồi quy riêng của mô hình (ảnh hưởng đến cả , , ): …
… Và còn rất nhiều mô hình khác về các biến định tính tác động đến 1 biến định lượng 15