P5-KTL - Kiến thfíc tng quát v kinh tế ng part 5
nhập môn kinh tế học (Trường Đại học Thăng Long)
PHẦN 5. ĐA CỘNG TUYẾN
Các giả thuyết của mô hình hồi quy tuyến tính bội cổ điển:
1. X xác định, không ngẫu nhiên
2. Sai số U trung bình bằng 0: E(U) = 0 (Tức là E(Ui) = 0, i)
3. Phương sai của Ui không đổi bằng nhau (phương sai thuần nhất)
2
ui
=
2
4. Các sai số Ui, Uj là không ơng quan: cov(Ui,Uj) = 0
5. Các biến độc lập không quan hệ tuyến tính với nhau
Nếu vi phạm giả thuyết thứ 5 thì người ta nói hình đa cộng tuyến.
1) Khái niệm
Đa cộng tuyến là hiện tượng khi các biến độc lập trong mô hình hồi quy bội có tương quan tuyến
tính với nhau.
=> hình hồi quy chỉ 2 biến (1 biến độc lập và 1 biến phụ thuộc) thì không đa cộng tuyến.
2) Một số cách phổ biến được dùng để phát hiện ra một hình hồi quy bội hiện tượng đa
cộng tuyến
Cách 1: Hệ số xác định R
2
cao nhưng tỷ số t tới hạn thấp (hoặc p-giá trị cao)
Xét một hình hồi quy bội sau: Y
i
= B
1
+ B
2
X
2i
+ B
3
X
3i
+…+ B
k
X
ki
+ U
i
(*)
Hệ số xác định bội R
2
cho biến bao nhiêu % sự biến thiên (biến động) của Y được giải thích
thông qua hình hồi quy. R
2
từ 0.8 trở lên thì hình giải thích tốt cho sự biến thiên của
biến phụ thuộc Y.
Với các bài toán kim định ý nghĩa thống về cặp gi thuyết của các hệ số hồi quy riêng:
H
0
: Bi = 0
(Với i = 2, 3,…,k)
(Biến X
i
không ảnh hưởng đến sự biến thiến của Y)
H
1
: Bi 0 (Biến X
i
có ảnh hưởng đến sự biến thiến ca Y)
Thì nếu tỷ số t tới hạn thấp (hoặc p-giá trị cao) thì xu hướng chấp nhận H
0
. Tức các Xi (Với
i = 2, 3,…,k) không vai trò giải thích cho sự biến thiên của Y.
-
Trong trường hợp ta chấp nhận H
0
của tất cả các bài toán kiểm định hệ số hồi quy riêng thì
tức là khôngbất kỳ biến độc lập nào ảnh hưởng đến biến phụ thuộc Y. (Tức không
biến độc lập nào có vai trò giải tch cho sự biến thiên của Y) (1)
-
nếu ta lại nhìn thấy hệ số xác định R
2
cao (từ 0.8 trở lên) tức hình giải thích tốt
cho sự biến thiên của Y (2)
Từ (1) và (2) => Mâu thuẫn => hiện tượng đa cộng tuyến trong hình (*)
LƯU Ý: Trong cách 1 thì không cần nhất thiết đòi hỏi tất cả các bài toán kiểm định hệ số hồi quy
riêng đều phải chấp nhận H
0
. Chỉ cần hệ số của biến độc lập quan trọng chấp nhận H
0
đủ để
kết luận có hiện tượng đa cộng tuyến.
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X
2
) và Giá thịt(X
3
). Thì nếu
biến thịt không ảnh hưởng đến ợng cầu thịt (tức H
0
: B
3
=0 H
1
: B
3
0; Chấp
nhận H
0
) thì có thể kết luận mô hình đa cộng tuyến vì biến độc quan trọng lại không có ý
nghĩa trong mô hình.
VD1: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X
2
),
thu nhập thêm tchơi chứng khoán (X
3
), thu nhập thêm từ đầu vàng ngoại tệ (X
4
). Số liệu
được cho trong File TDVTN.csv. Hãy ước lượng cho mô hình Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U.
Sau đó xét xem mô hình có hiện tượng đa cộng tuyến không bằng R
2
và α = 5%?
1
Cách 2: Dấu của hệ số trong hình hồi quy mẫu không đúng
Khi dấu các hệ số trong hình hồi quy mẫu không đúng thì cũng hiện tượng đa cộng tuyến.
VD: Xét sự phụ thuộc của lượng cầu thịt (Y) vào Thu Nhập (X
2
) Giá thịt (X
3
) trong
hình: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U (1)
nếu ước lượng điểm ra b
3
> 0 trái với thuyết kinh tế (Giá tăng thì cầu giảm, bởi trong
hình (1) không mặt hàng cạnh tranh thay thế nào như giá heo hay giá vịt). Khi đó ta cũng
có thể kết luận là có đa cộng tuyến trong mô hình (1).
VD2: Cho tập số liệu TieuDung.txt trong đó: Y mức tiêu dùng của hộ gia đình; X
2
thu nhập X
3
tài sản khả năng chuyển đổi cao. Xét hình hồi quy: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U. Hãy ước lượng cho
hình hồi quy mẫu. Sau đó xét xem mô hình hiện tượng đa cộng tuyến không? Nêu cách phát hiện
theo dấu của hệ số hồi quy.
Cách 3: Hệ số tương quan tuyến cặp giữa các biến độc lập cao
Xét hình: Y
i
= B
1
+ B
2
X
2i
+ B
3
X
3i
+…+ B
k
X
ki
+ U
i
(*)
Dùng câu lệnh sau để kiểm tra hệ số tương quan tuyến tính cặp giữa các biến độc lập trong
hình hồi quy bội trên: cor(data.frame(X
2
,X
3
,…,X
k
)) (dùng câu lệnh này nếu hình từ 3
biến độc lập tr lên)
Chỉ cần 1 cặp biến độc lập hệ số tương quan tuyến tính cao (tầm từ 0.8 trở lên) thì thể
kết luận là hình (*) có hiện tượng đa cộng tuyến.
VD3: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X
2
thu nhập
X
3
tài sản có khả năng chuyển đổi cao. Xét hình hồi quy: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U. Xét xem
hình hiện tượng đa cộng tuyến hay không bằng cách tính ra hệ số tương quan tuyến tính giữa
các biến độc lập?
VD4: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X
2
), thu
nhập thêm từ chơi chứng khoán (X
3
), thu nhập thêm từ đầu vàng và ngoại tệ (X
4
). Số liệu được cho
trong File TDVTN.csv. Cho hình Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U. Xét xem hình hiện
tượng đa cộng tuyến hay không bằng cách tính ra hệ số tương quan tuyến tính giữa các biến độc lập?
Cách 4: Thiết lập hình hồi quy phụ của một biến độc lập thông qua các biến độc lập còn lại
trong hình hồi quy bội
Nếu đề bài không nói cụ thể phát hiện đa cộng tuyến theo cách nào thì mặc định phải dùng cách 4
mới được điểm tối đa.
Xét hình: Y
i
= B
1
+ B
2
X
2i
+ B
3
X
3i
+…+ B
k
X
ki
+ U
i
(*)
LƯU Ý: bao nhiêu biến độc lập thì bấy nhiêu hình hồi quy phụ (Ví dụ 2 biến độc lập thì
có 2 mô hình hồi quy phụ. Có 3 biến độc lập thì có 3 mô hình hồi quy phụ)
Để cho dễ nói thì ta hóa hình (*) thành một hình chỉ 3 biến độc lập như sau:
Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U (1)
(1) có 3 biến độc lập là X
2
, X
3
, X
4
nên ta có thể thiết lập 3 hình hồi quy phụ
sau: X
2
= A
1
+ A
2
X
3
+A
3
X
4
+ V
X
3
= A
1
+ A
2
X
2
+A
3
X
4
+ V
X
4
= A
1
+ A
2
X
2
+A
3
X
3
+ V
Sau đó, thiết lập các cặp giả thuyết thống kê sau:
H
0
: A
2
= A
3
= 0 (không mối quan hệ tuyến tính giữa các biến độc lập)
H
1
: Ai 0, với i = 2, 3 (A
2
0 hoặc A
3
0) (có mối quan hệ tuyến tính giữa các biến độc lập)
Chỉ cần một hình hồi quy phụ bác bỏ H
0
hiện tượng đa cộng tuyến.
2
Ta thể mở rộng thêm cho hình (*): nếu (*) 4 biến độc lập như sau:
Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ B
5
X
5
+ U (2)
(2) 4 biến độc lập X
2
, X
3
, X
4
, X
5
nên ta thể thiết lập 4 hình hồi quy phụ sau:
X
2
= A
1
+ A
2
X
3
+A
3
X
4
+ A
4
X
5
+ V
X
3
= A
1
+ A
2
X
2
+A
3
X
4
+ A
4
X
5
+ V
X
4
= A
1
+ A
2
X
2
+A
3
X
3
+ A
4
X
5
+ V
X
5
= A
1
+ A
2
X
2
+A
3
X
3
+ A
4
X
4
+ V
Sau đó, thiết lập các cặp giả thuyết thống sau:
H
0
: A
2
= A
3
= A
4
= 0 (không mối quan hệ tuyến tính giữa c biến độc lập)
H
1
: Ai 0, với i = 2, 3, 4
( mối quan hệ tuyến tính giữa các biến độc lập)
Chỉ cần một hình hồi quy phụ bác bỏ H
0
hiện tượng đa cộng tuyến.
VD5: Cho tập số liệu TieuDung.txt trong đó: Y mức tiêu dùng của hộ gia đình; X
2
là thu nhập
X
3
tài sản khả năng chuyển đổi cao. Xét hình hồi quy: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U. Dùng các
mô hình hồi quy phụ hãy kiểm định giả thuyết về đa cộng tuyến trong mô hình trên tại α = 5%.
VD6: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X
2
),
thu nhập thêm từ chơi chứng khoán (X
3
), thu nhập thêm từ đầu vàng ngoại tệ (X
4
). Số liệu
được cho trong File TDVTN.csv. Cho hình Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U. Dùng hình
hồi quy phụ hãy kiểm định giả thuyết về đa cộng tuyến trong mô hình trên tại α = 5%.
3) Khắc phục đa cộng tuyến
Cách 1: Sử dụng thông tin tiên nghiệm (đề bài cho sn)
VD: Xét sự phụ thuộc của lượng cầu thịt (Y) vào Thu Nhập (X
2
) Giá thịt (X
3
) trong
hình: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U (1)
Giả sử (1) hiện tượng đa cộng tuyến. Và y giờ đề bài yêu cầu bạn hãy khắc phục đa
cộng tuyến với thông tin như sau: Một nghiên cứu trước đây cho rằng B
2
= 10B
3
.
Khi đó, ta sẽ sử dụng hình thay thế là:
Y = B
1
+ 10B
3
X
2
+ B
3
X
3
+ U = B
1
+ B
3
(10X
2
+ X
3
) + U
Đặt X* = 10X
2
+ X
3
thì hình (1) trở thành Y= B
1
+ B
3
X* + U (2)
Mô hình (2) trở thành một mô hình hồi quy với chỉ duy nhất một biến độc lập nên sẽ không
còn đa cộng tuyến => Dùng thông tin tiên nghiệm sẽ làm khắc phục được đa cộng tuyến.
VD: Nếu thông tin tiên nghiệm B
3
= 2. Hãy biến đổi hình (1): Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U trở
về mô hình không còn đa cộng tuyến.
Thay B
3
= 2 vào (1) thì khi đó ta sẽ sử dụng hình thay thế là:
Y = B
1
+ B
2
X
2
+ 2X
3
+ U <=> Y 2X
3
= B
1
+ B
2
X
2
+ U
Đặt Y* = Y 2X
3
thì nh (1) trở thành: Y* = B
1
+ B
2
X
2
+ U (2)
Mô hình (2) trở thành một mô hình hồi quy với chỉ duy nhất một biến độc lập nên sẽ không
còn đa cộng tuyến => Dùng thông tin tiên nghiệm sẽ làm khắc phục được đa cộng tuyến.
VD7: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X
2
là thu nhập
X
3
là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U.
Một nghiên cứu trước đây cho rằng B
2
= 4B
3
. Bạn hãy dùng thông tin này để ước lưng lại cho B
1
,
B
2
, B
3
. Trong mô hình bạn dùng để ước lượng có còn hiện tượng đa cộng tuyến không?
3
VD8: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X
2
),
thu nhập thêm từ chơi chứng khoán (X
3
), thu nhập thêm từ đầu vàng ngoại tệ (X
4
). Số liệu
được cho trong File TDVTN.csv. Cho hình Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U. Một nghiên
cứu trước đây cho rằng B
3
= 5B
2
. Sau khi dùng thông tin tiên nghiệm này thì hình thay thế
bạn dùng để ước lượng có còn hiện tượng đa cộng tuyến không?
Cách 2: Thu thập thêm số liệu hoặc lấy thêm mẫu mới (cách này trong bài tập kng cần học)
Cách 3: Bỏ bớt biến độc lập
Sau đây một số gợi ý cho việc bỏ bớt biến độc lập để khắc phục đa cộng tuyến (hay còn gọi
làm giảm đa cộng tuyến)
-
Giữ lại biến độc lập quan trọng
VD: Xét sự phụ thuộc của lượng cầu thịt (Y) vào Thu Nhập (X
2
) Giá thịt (X
3
) trong
hình: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U (1). Nếu đề bài yêu cầu khắc phục đa cộng tuyến trong
hình (1) bằng cách bỏ bớt biến thì ta nên giữ lại biến Giá thịt gà (X
3
) và bỏ biến Thu nhập (X
2
)
đi biến Giá thịt (X
3
) quan trọng trọng hơn biến Thu nhập (X
2
) trong hình hồi quy với
lượng cầu thịt (Y). sau khi bỏ biến X
2
đi thì hình (1) sẽ không còn đa cộng tuyến khi
đó mô hình chỉ còn lại một biến độc lập duy nhất là X
3
nên không còn đa cộng tuyến nữa.
-
Bỏ bớt biến độc lập mối quan hệ tuyến tính mạnh với các biến độc lập còn lại (tức
bỏ bớt biến hệ số tương quan tuyến tính cặp cao với các biến độc lập còn lại)
VD: Xét sự phụ thuộc của lượng cầu thịt (Y) vào Thu Nhập (X
2
), Giá thịt gà (X
3
) và Giá
thịt heo (X
4
) trong hình: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U (1). Nhận thấy thì biến X
3
vai trò quan trọng hơn trong việc đánh giá sự biến động của Y so với hai biến X
2
X
4
nên
ta sẽ gilại biến X
3
và xem xét bỏ biến X
2
hay biến X
4
Giả sử ta hệ số tương quan tuyến tính cặp gia 3 biến độc lập như sau:
> cor(data.frame(X2,X3,X4))
X3
X4
0.8317967
0.8493137
1.0000000
0.5255913
0.5255913
1.0000000
Nếu bỏ biến X
4
ra khỏi hình thì hình mới sẽ là: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ U. Lúc
này hệ số tương quan tuyến tính giữa 2 biến X
2
X
3
0.8317967 vẫn lớn nên hình
mới vẫn còn đa cộng tuyến mạnh.
Nếu bỏ biến X
2
ra khỏi hình thì hình mới sẽ là: Y = B
1
+ B
3
X
3
+ B
4
X
4
+ U. Lúc
này hệ số tương quan tuyến tính giữa 2 biến X
3
X
4
0.5255913 khá thấp nên hình
mới đã làm giảm được đa cộng tuyến.
Kết luận: Vậy ta nên bỏ biến X
2
giữ lại biến X
3
X
4
thì sẽ làm giảm đa cộng tuyến trong hình (1)
Nhưng đôi khi lại sẽ chẳng cách bỏ biến độc lập nào làm giảm đa cộng tuyến các biến độc
lập còn li vẫn có hệ số tương quan tuyến tính cao
VD:
> cor(data.frame(X2,X3,X4))
X2 X3
X4
X2 1.0000000 0.9517967
0.9631374
X3 0.9517967 1.0000000
0.9255913
X4 0.9631374 0.9255913
1.0000000
Nhận thấy với VD trên thì ta thấy dù bỏ biến nào đi chăng nữa thì những mô hình mới sẽ vẫn còn
đa cộng tuyến mạnh thì ta kết luận là không tìm được cách bỏ biến nào triệt để nhất để làm giảm
được hiện tượng đa cộng tuyến trong mô hình (1)
4
VD9: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X
2
),
thu nhập thêm từ chơi chứng khoán (X
3
), thu nhập thêm từ đầu vàng ngoại tệ (X
4
). Số liệu
được cho trong File TDVTN.csv. Cho hình Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U. Hãy khắc phục
đa cộng tuyến trong mô hình trên bằng cách bỏ bớt biến độc lập.
Nhận thấy trong hình trên thì các biến độc lập vai trò như nhau thì ta cứ dùng lệnh
cor(data.frame(X2,X3,X4)) và xét xemch bỏ biến nào làm giảm đa cộng tuyến nhất thì chọn.
Cách 4: Khắc phục đa cộng tuyến bằng phương pháp sai phân cấp 1
Xét hình hồi quy bội sau: Y
t
= B
1
+ B
2
X
2t
+B
3
X
3t
+…+ B
k
X
kt
+ U
t
(1)
Nếu hình (1) đúng tại thời điểm t tcũng đúng tại thời đim t 1 nên ta có:
Y
t-1
= B
1
+ B
2
X
2t-1
+B
3
X
3t-1
+…+ B
k
X
kt-1
+ U
t-1
(2)
Lấy (1) (2) ta được:
Y
t
Y
t-1
= B
1
B
1
+ B
2
X
2t
B
2
X
2t-1
+ B
3
X
3t
B
3
X
3t-1
+…+ B
k
X
kt
B
k
X
kt-1
+ U
t
U
t-1
<=> Y
t
Y
t-1
= B
2
(X
2t
X
2t-1
) + B
3
(X
3t
X
3t-1
) +…+ B
k
(X
kt
X
kt-1
) + U
t
U
t-1
Đặt: Y* = Y
t
Y
t-1
, X
2
* = X
2t
X
2t-1
, X
3
* = X
3t
X
3t-1
, X
k
* = X
kt
X
kt-1
V= U
t
U
t-1
thì mô hình (1) trở thành: Y* = B
2
X
2
* +B
3
X
3
* +…+ B
k
X
k
* + V (2)
hình (2) được gọi hình sai phân cấp 1. Nhận thấy hình sai phân cấp 1
hình hồi quy không hệ số chặn. Sau đó, chúng ta lại dùng lại một trong bốn cách phát hiện
cũ để xem mô hình sai phân cấp 1 này khắc phục được đa cộng tuyến hay không (không nói
cụ thể phát hiện đa cộng tuyến trong hình sai phân cấp 1 theo ch nào thì mặc định m
theo mô hình hồi quy phụ mới được điểm tối đa)?
Cách tạo ra các sai phân cấp 1: Y* X
2
* X
3
*,…, X
k
* như sau:
Ysao=diff(Y)
X2sao=diff(X2)
X3sao=diff(X3)
Xksao=diff(Xk)
Sau đó muốn ước lượng hay kiểm định các hệ số trong mô hình sai phân cấp 1 (Một mô hình
không có hệ số chặn) thì ta dùng câu lệnh sau: lm(Ysao~X2sao+X3sao++ Xksao+0)
VD10: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương
(X
2
), thu nhập thêm từ chơi chứng khoán (X
3
), thu nhập thêm từ đầu tư vàngngoại tệ (X
4
). S
liệu được cho trong File TDVTN.csv. Cho nh Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U. Sử dụng
phương pháp sai phân xemlàm giảm đa cộng tuyến hay không?
VD11: File NhuCauXeBus.csv cho biết dữ liệu về mức độ giao thông bằng xe bus (Y nghìn
lượt khách/giờ), thu nhập bình quân đầu người (X
2
USD), dân số (X
3
nghìn người), mật đ
dân số (X
4
người/dặm vuông). Xét hình: Y = B
1
+ B
2
X
2
+ B
3
X
3
+ B
4
X
4
+ U. Đưa ra kết luận
có hiện tượng đa cộng tuyến trong mô hình trên hay không?
5
Trong đó: Y, X2, X3,…, Xk là tên của
các biến trong mô hình hồi quy bội
VD12: File TiLeNgheo.csv chứa dữ liệu về tỉ lệ nghèo (Y), phần trăm dân số (25 tuổi trở
lên) có trình độ học vấn bậc trung học (X
2
), phần trăm dân số (25 tuổi trlên) đã hoàn tất chương
trình cao đẳng hoặc đại học trở lên (X
3
), trung vị của thu nhập của các hộ gia đình (X
4
)
1. Viết hình hồi quy tuyến tính tổng thể của Y phụ thuộc X
2
, X
3
, X
4
.
2. Xét xem hiện tượng đa cộng tuyến trong hình đó không? Nêu cách phát hiện của bạn.
3. Nếu hiện tượng đa cộng tuyến thì khắc phục bằng cách bỏ biến: Bạn bỏ biến nào? Loại bỏ
biến đó khỏi hình làm giảm mức độ đa cộng tuyến hay không? Lựa chọn một dấu hiệu
mà bạn cho là rõ ràng nhất để giải thích cho câu trả lời của bạn.
4. Biết thông tin tiên nghiệm B
4
= −0.5, hãy dùng thông tin này để ước lượng lại cho các hệ số
hồi quy. Trong mô hình bạn dùng để ước lượng còn đa cộng tuyến không?
VD13: Trong File DCT.rda Invest đầu tư, GNP tổng thu nhập quốc nội, Interest tỉ lệ lãi
suất, CPI là chỉ số giá tiêu dùng. Xét mô hình: Invest = B1 + B2*GNP + B3*CPI + B4*Interest + U
1. tồn tại hiện tượng đa cộng tuyến trong nh trên không?
2. Sử dụng phương pháp sai phân xem giảm được đa cộng tuyến hay không?
3. Thử biến đổi hình về dạng log tuyến tính bội xem khắc phục được đa cộng tuyến
không? (Viết hình hồi quy log tuyến tính bội tổng thể, chỉ ra mức độ đa cộng tuyến
trong hình giảm nếu khắc phục được hoặc không giảm nếu không khắc phục được so
với mô hình tuyến nh
4. Thử biến đổi hình bằng cách chia cả hai vế của hình cho biến Interest xem khắc
phục được đa cộng tuyến không?
VD14:
Cho tập số liệu
OTO.txt
trong đó:
Y: lượng xe ô mới bán được (đơn vị: nghìn chiếc)
X
2
: chỉ số giá tiêu dùng cho xe mới (1967=100)
X
3
: chỉ số giá tiêu dùng (CPI), tất cả mt hàng, tất cả người tiêu dùng thành phố.
X
4
: thu nhập nhân sau thuế
X
5
: lãi suất (%)
X
6
: Lực lượng lao động việc làm (đơn vị: nghìn người).
Xét hình: lnY = B
1
+ B
2
lnX
2
+ B
3
lnX
3
+ B
4
lnX
4
+ B
5
lnX
5
+ B
6
lnX
6
+ U.
1. Bạnvọngvề dấu của B
2
? Kết quả ước lượng phù hợp với điều bạnvọng không?
2. Theo bạn đa cộng tuyến trong nh trên không? Giải thích?
3. Nếu đa cộng tuyến, thử khắc phục bằng phương pháp sai phân.
VD15: Cho hàm sản xuất Y = f(K, L). Với số liệu trong file CobbDouglas.csv, trong đó: Y, K, L lần
lượt là đầu ra, vốn và lao động.
1. Hãy ước lượng hàm Cobb-Douglas: Y = AK
α
L
β
. Có dấu hiệu của đa cộng tuyến trong mô hình
bạn dùng để ước lượng không?
2. Hãy sử dụng thông tin: Hàm sản xuất tính chất hiệu suất không đổi theo quy để khắc
phục đa cộng tuyến và ước lượng lại hàm sản xuất.
3. Thử sử dụng phương pháp sai phân xem làm giảm hiện tượng đa cộng tuyến hay không?
6

Preview text:


P5-KTL - Kiến thfíc tổng quát về kinh tế lượng part 5
nhập môn kinh tế học (Trường Đại học Thăng Long)
PHẦN 5. ĐA CỘNG TUYẾN
Các giả thuyết của mô hình hồi quy tuyến tính bội cổ điển:
1. X là xác định, không ngẫu nhiên
2. Sai số U có trung bình bằng 0: E(U) = 0 (Tức là E(Ui) = 0,  i)
3. Phương sai của Ui là không đổi và bằng nhau (phương sai thuần nhất)  2ui =  2
4. Các sai số Ui, Uj là không tương quan: cov(Ui,Uj) = 0
5. Các biến độc lập không quan hệ tuyến tính với nhau
Nếu vi phạm giả thuyết thứ 5 thì người ta nói mô hình có đa cộng tuyến. 1) Khái niệm
Đa cộng tuyến là hiện tượng khi các biến độc lập trong mô hình hồi quy bội có tương quan tuyến tính với nhau.
=> Mô hình hồi quy mà chỉ có 2 biến (1 biến độc lập và 1 biến phụ thuộc) thì không có đa cộng tuyến.
2) Một số cách phổ biến được dùng để phát hiện ra một hình hồi quy bội hiện tượng đa cộng tuyến
Cách 1: Hệ số xác định R2 cao nhưng tỷ số t tới hạn thấp (hoặc p-giá trị cao)
Xét một mô hình hồi quy bội sau: Yi = B1 + B2X2i + B3X3i +…+ BkXki + Ui (*)
Hệ số xác định bội R2 cho biến bao nhiêu % sự biến thiên (biến động) của Y được giải thích
thông qua mô hình hồi quy. R2 từ 0.8 trở lên thì mô hình giải thích tốt cho sự biến thiên của biến phụ thuộc Y.
Với các bài toán kiểm định ý nghĩa thống kê về cặp giả thuyết của các hệ số hồi quy riêng:
H0: Bi = 0 (Với i = 2, 3,…,k) (Biến Xi không ảnh hưởng đến sự biến thiến của Y) H1: Bi  0
(Biến Xi có ảnh hưởng đến sự biến thiến của Y)
Thì nếu tỷ số t tới hạn thấp (hoặc p-giá trị cao) thì có xu hướng chấp nhận H0. Tức là các Xi (Với
i = 2, 3,…,k) không có vai trò giải thích cho sự biến thiên của Y.
- Trong trường hợp ta chấp nhận H0 của tất cả các bài toán kiểm định hệ số hồi quy riêng thì
tức là không có bất kỳ biến độc lập nào ảnh hưởng đến biến phụ thuộc Y. (Tức là không có
biến độc lập nào có vai trò giải thích cho sự biến thiên của Y) (1)
- Mà nếu ta lại nhìn thấy hệ số xác định R2 cao (từ 0.8 trở lên) tức là mô hình giải thích tốt
cho sự biến thiên của Y (2)
Từ (1) và (2) => Mâu thuẫn => Có hiện tượng đa cộng tuyến trong mô hình (*)
LƯU Ý: Trong cách 1 thì không cần nhất thiết đòi hỏi tất cả các bài toán kiểm định hệ số hồi quy
riêng đều phải chấp nhận H0. Chỉ cần hệ số của biến độc lập quan trọng mà chấp nhận H0 là đủ để
kết luận có hiện tượng đa cộng tuyến.
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X2) và Giá thịt gà (X3). Thì nếu
biến thịt gà không ảnh hưởng đến lượng cầu thịt gà (tức là H0: B3 =0 và H1: B3  0; Chấp
nhận H0) thì có thể kết luận là mô hình có đa cộng tuyến vì biến độc quan trọng lại không có ý nghĩa trong mô hình.
VD1: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X3), thu nhập thêm từ đầu tư vàng và ngoại tệ (X4). Số liệu
được cho trong File TDVTN.csv. Hãy ước lượng cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U.
Sau đó xét xem mô hình có hiện tượng đa cộng tuyến không bằng R2 và α = 5%? 1
Cách 2: Dấu của hệ số trong hình hồi quy mẫu không đúng
Khi dấu các hệ số trong mô hình hồi quy mẫu không đúng thì cũng có hiện tượng đa cộng tuyến.
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X2) và Giá thịt gà (X3) trong mô
hình: Y = B1 + B2X2 + B3X3 + U (1)
Mà nếu ước lượng điểm ra b3 > 0 là trái với lý thuyết kinh tế (Giá tăng thì cầu giảm, bởi trong
mô hình (1) không có mặt hàng cạnh tranh thay thế nào như giá heo hay giá vịt). Khi đó ta cũng
có thể kết luận là có đa cộng tuyến trong mô hình (1).
VD2: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và X3
tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Hãy ước lượng cho
mô hình hồi quy mẫu. Sau đó xét xem mô hình có hiện tượng đa cộng tuyến không? Nêu cách phát hiện
theo dấu của hệ số hồi quy.
Cách 3: Hệ số tương quan tuyến cặp giữa các biến độc lập cao
Xét mô hình: Yi = B1 + B2X2i + B3X3i +…+ BkXki + Ui (*)
Dùng câu lệnh sau để kiểm tra hệ số tương quan tuyến tính cặp giữa các biến độc lập trong mô
hình hồi quy bội trên: cor(data.frame(X2,X3,…,Xk)) (dùng câu lệnh này nếu hình từ 3
biến độc lập trở lên)
Chỉ cần có 1 cặp biến độc lập có hệ số tương quan tuyến tính cao (tầm từ 0.8 trở lên) thì có thể
kết luận là mô hình (*) có hiện tượng đa cộng tuyến.
VD3: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và
X3 là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Xét xem
mô hình có hiện tượng đa cộng tuyến hay không bằng cách tính ra hệ số tương quan tuyến tính giữa các biến độc lập?
VD4: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2), thu
nhập thêm từ chơi chứng khoán (X3), thu nhập thêm từ đầu tư vàng và ngoại tệ (X4). Số liệu được cho
trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Xét xem mô hình có hiện
tượng đa cộng tuyến hay không bằng cách tính ra hệ số tương quan tuyến tính giữa các biến độc lập?
Cách 4: Thiết lập hình hồi quy phụ của một biến độc lập thông qua các biến độc lập còn lại
trong hình hồi quy bội
Nếu đề bài không nói cụ thể phát hiện đa cộng tuyến theo cách nào thì mặc định phải dùng cách 4
mới được điểm tối đa.
Xét mô hình: Yi = B1 + B2X2i + B3X3i +…+ BkXki + Ui (*)
LƯU Ý: Có bao nhiêu biến độc lập thì có bấy nhiêu mô hình hồi quy phụ (Ví dụ có 2 biến độc lập thì
có 2 mô hình hồi quy phụ. Có 3 biến độc lập thì có 3 mô hình hồi quy phụ)
Để cho dễ nói thì ta mã hóa mô hình (*) thành một mô hình chỉ có 3 biến độc lập như sau:
Y = B1 + B2X2 + B3X3 + B4X4 + U (1)
(1) có 3 biến độc lập là X2, X3, X4 nên ta có thể thiết lập 3 mô hình hồi quy phụ sau: X2 = A1 + A2X3 +A3X4 + V X3 = A1 + A2X2 +A3X4 + V X4 = A1 + A2X2 +A3X3 + V
Sau đó, thiết lập các cặp giả thuyết thống kê sau: H0: A2 = A3 = 0
(không có mối quan hệ tuyến tính giữa các biến độc lập)
H1:  Ai  0, với i = 2, 3 (A2  0 hoặc A3  0) (có mối quan hệ tuyến tính giữa các biến độc lập)
Chỉ cần một hình hồi quy phụ bác bỏ H0 hiện tượng đa cộng tuyến. 2
Ta có thể mở rộng thêm cho mô hình (*): nếu (*) có 4 biến độc lập như sau:
Y = B1 + B2X2 + B3X3 + B4X4+ B5X5 + U (2)
(2) có 4 biến độc lập là X2, X3, X4, X5 nên ta có thể thiết lập 4 mô hình hồi quy phụ sau:
X2 = A1 + A2X3 +A3X4 + A4X5 + V
X3 = A1 + A2X2 +A3X4 + A4X5 + V
X4 = A1 + A2X2 +A3X3 + A4X5 + V
X5 = A1 + A2X2 +A3X3 + A4X4 + V
Sau đó, thiết lập các cặp giả thuyết thống kê sau: H0: A2 = A3 = A4 = 0
(không có mối quan hệ tuyến tính giữa các biến độc lập)
H1:  Ai  0, với i = 2, 3, 4 (có mối quan hệ tuyến tính giữa các biến độc lập)
Chỉ cần một hình hồi quy phụ bác bỏ H0 hiện tượng đa cộng tuyến.
VD5: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và
X3 là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Dùng các
mô hình hồi quy phụ hãy kiểm định giả thuyết về đa cộng tuyến trong mô hình trên tại α = 5%.
VD6: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X3), thu nhập thêm từ đầu tư vàng và ngoại tệ (X4). Số liệu
được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Dùng mô hình
hồi quy phụ hãy kiểm định giả thuyết về đa cộng tuyến trong mô hình trên tại α = 5%.
3) Khắc phục đa cộng tuyến
Cách 1: Sử dụng thông tin tiên nghiệm (đề bài cho sẵn)
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X2) và Giá thịt gà (X3) trong mô
hình: Y = B1 + B2X2 + B3X3 + U (1)
Giả sử (1) có hiện tượng đa cộng tuyến. Và bây giờ đề bài yêu cầu bạn hãy khắc phục đa
cộng tuyến với thông tin như sau: Một nghiên cứu trước đây cho rằng B2 = 10B3.
Khi đó, ta sẽ sử dụng mô hình thay thế là:
Y = B1 + 10B3X2 + B3X3 + U = B1 + B3(10X2 + X3) + U
Đặt X* = 10X2 + X3 thì mô hình (1) trở thành Y= B1 + B3X* + U (2)
Mô hình (2) trở thành một mô hình hồi quy với chỉ duy nhất một biến độc lập nên sẽ không
còn đa cộng tuyến => Dùng thông tin tiên nghiệm sẽ làm khắc phục được đa cộng tuyến.
VD: Nếu có thông tin tiên nghiệm là B3 = 2. Hãy biến đổi mô hình (1): Y = B1 + B2X2 + B3X3 + U trở
về mô hình không còn đa cộng tuyến.
Thay B3 = 2 vào (1) thì khi đó ta sẽ sử dụng mô hình thay thế là:
Y = B1 + B2X2 + 2X3 + U <=> Y – 2X3 = B1 + B2X2 + U
Đặt Y* = Y – 2X3 thì mô hình (1) trở thành: Y* = B1 + B2X2 + U (2)
Mô hình (2) trở thành một mô hình hồi quy với chỉ duy nhất một biến độc lập nên sẽ không
còn đa cộng tuyến => Dùng thông tin tiên nghiệm sẽ làm khắc phục được đa cộng tuyến.
VD7: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập
X3 là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U.
Một nghiên cứu trước đây cho rằng B2 = 4B3. Bạn hãy dùng thông tin này để ước lượng lại cho B1,
B2, B3. Trong mô hình bạn dùng để ước lượng có còn hiện tượng đa cộng tuyến không? 3
VD8: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X3), thu nhập thêm từ đầu tư vàng và ngoại tệ (X4). Số liệu
được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Một nghiên
cứu trước đây cho rằng B3 = 5B2. Sau khi dùng thông tin tiên nghiệm này thì mô hình thay thế
bạn dùng để ước lượng có còn hiện tượng đa cộng tuyến không?
Cách 2: Thu thập thêm số liệu hoặc lấy thêm mẫu mới (cách này trong bài tập không cần học)
Cách 3: Bỏ bớt biến độc lập
Sau đây là một số gợi ý cho việc bỏ bớt biến độc lập để khắc phục đa cộng tuyến (hay còn gọi là
làm giảm đa cộng tuyến)
- Giữ lại biến độc lập quan trọng
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X2) và Giá thịt gà (X3) trong
mô hình: Y = B1 + B2X2 + B3X3 + U (1). Nếu đề bài yêu cầu khắc phục đa cộng tuyến trong mô
hình (1) bằng cách bỏ bớt biến thì ta nên giữ lại biến Giá thịt gà (X3) và bỏ biến Thu nhập (X2)
đi vì biến Giá thịt gà (X3) quan trọng trọng hơn biến Thu nhập (X2) trong mô hình hồi quy với
lượng cầu thịt gà (Y). Và sau khi bỏ biến X2 đi thì mô hình (1) sẽ không còn đa cộng tuyến vì khi
đó mô hình chỉ còn lại một biến độc lập duy nhất là X3 nên không còn đa cộng tuyến nữa.
- Bỏ bớt biến độc lập mối quan hệ tuyến tính mạnh với các biến độc lập còn lại (tức
bỏ bớt biến hệ số tương quan tuyến tính cặp cao với các biến độc lập còn lại)
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X2), Giá thịt gà (X3) và Giá
thịt heo (X4) trong mô hình: Y = B1 + B2X2 + B3X3 + B4X4 + U (1). Nhận thấy thì biến X3 có
vai trò quan trọng hơn trong việc đánh giá sự biến động của Y so với hai biến X2 và X4 nên
ta sẽ giữ lại biến X3 và xem xét bỏ biến X2 hay biến X4
Giả sử ta có hệ số tương quan tuyến tính cặp giữa 3 biến độc lập như sau:
> cor(data.frame(X2,X3,X4)) X2 X3 X4 X2 1.0000000 0.8317967 0.8493137 X3 0.8317967 1.0000000 0.5255913 X4 0.8493137 0.5255913 1.0000000
Nếu bỏ biến X4 ra khỏi mô hình thì mô hình mới sẽ là: Y = B1 + B2X2 + B3X3 + U. Lúc
này hệ số tương quan tuyến tính giữa 2 biến X2và X3 là 0.8317967 vẫn lớn nên mô hình
mới vẫn còn đa cộng tuyến mạnh.
Nếu bỏ biến X2 ra khỏi mô hình thì mô hình mới sẽ là: Y = B1 + B3X3 + B4X4 + U. Lúc
này hệ số tương quan tuyến tính giữa 2 biến X3và X4 là 0.5255913 khá thấp nên mô hình
mới đã làm giảm được đa cộng tuyến.
Kết luận: Vậy ta nên bỏ biến X2 và giữ lại biến X3 và X4 thì sẽ làm giảm đa cộng tuyến trong mô hình (1)
Nhưng đôi khi lại sẽ chẳng có cách bỏ biến độc lập nào làm giảm đa cộng tuyến vì các biến độc
lập còn lại vẫn có hệ số tương quan tuyến tính cao VD:
> cor(data.frame(X2,X3,X4)) X2 X3 X4 X2 1.0000000 0.9517967 0.9631374 X3 0.9517967 1.0000000 0.9255913 X4 0.9631374 0.9255913 1.0000000
Nhận thấy với VD trên thì ta thấy dù bỏ biến nào đi chăng nữa thì những mô hình mới sẽ vẫn còn
đa cộng tuyến mạnh thì ta kết luận là không tìm được cách bỏ biến nào triệt để nhất để làm giảm
được hiện tượng đa cộng tuyến trong mô hình (1) 4
VD9: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X3), thu nhập thêm từ đầu tư vàng và ngoại tệ (X4). Số liệu
được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Hãy khắc phục
đa cộng tuyến trong mô hình trên bằng cách bỏ bớt biến độc lập.
Nhận thấy trong mô hình trên thì các biến độc lập có vai trò là như nhau thì ta cứ dùng lệnh
cor(data.frame(X2,X3,X4)) và xét xem cách bỏ biến nào làm giảm đa cộng tuyến nhất thì chọn.
Cách 4: Khắc phục đa cộng tuyến bằng phương pháp sai phân cấp 1
Xét mô hình hồi quy bội sau: Yt = B1 + B2X2t +B3X3t +…+ BkXkt + Ut (1)
Nếu mô hình (1) đúng tại thời điểm t thì cũng đúng tại thời điểm t – 1 nên ta có:
Yt-1 = B1 + B2X2t-1 +B3X3t-1 +…+ BkXkt-1 + Ut-1 (2)
Lấy (1) – (2) ta được:
Yt – Yt-1 = B1 – B1 + B2X2t – B2X2t-1 + B3X3t – B3X3t-1 +…+ BkXkt – BkXkt-1 + Ut – Ut-1
<=> Yt – Yt-1 = B2(X2t – X2t-1) + B3(X3t – X3t-1) +…+ Bk(Xkt – Xkt-1) + Ut – Ut-1
Đặt: Y* = Yt – Yt-1 , X2* = X2t – X2t-1 , X3* = X3t – X3t-1 , Xk* = Xkt – Xkt-1 và V= Ut – Ut-1
thì mô hình (1) trở thành: Y* = B2X2* +B3X3* +…+ BkXk* + V (2)
Mô hình (2) được gọi là mô hình sai phân cấp 1. Nhận thấy hình sai phân cấp 1
hình
hồi quy không hệ số chặn. Sau đó, chúng ta lại dùng lại một trong bốn cách phát hiện
cũ để xem mô hình sai phân cấp 1 này có khắc phục được đa cộng tuyến hay không (không nói
cụ thể phát hiện đa cộng tuyến trong mô hình sai phân cấp 1 theo cách nào thì mặc định làm
theo mô hình hồi quy phụ mới được điểm tối đa)?
➢ Cách tạo ra các sai phân cấp 1: Y* X2* X3*,…, Xk* như sau: Ysao=diff(Y) X2sao=diff(X2)
Trong đó: Y, X2, X3,…, Xk là tên của X3sao=diff(X3)
các biến trong mô hình hồi quy bội Xksao=diff(Xk)
Sau đó muốn ước lượng hay kiểm định các hệ số trong mô hình sai phân cấp 1 (Một mô hình
không có hệ số chặn) thì ta dùng câu lệnh sau: lm(Ysao~X2sao+X3sao+…+ Xksao+0)
VD10: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương
(X2), thu nhập thêm từ chơi chứng khoán (X3), thu nhập thêm từ đầu tư vàng và ngoại tệ (X4). Số
liệu được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Sử dụng
phương pháp sai phân xem có làm giảm đa cộng tuyến hay không?
VD11: File NhuCauXeBus.csv cho biết dữ liệu về mức độ giao thông bằng xe bus (Y – nghìn
lượt khách/giờ), thu nhập bình quân đầu người (X2 – USD), dân số (X3 – nghìn người), mật độ
dân số (X4 – người/dặm vuông). Xét mô hình: Y = B1 + B2X2 + B3X3 + B4X4 + U. Đưa ra kết luận
có hiện tượng đa cộng tuyến trong mô hình trên hay không? 5
VD12: File TiLeNgheo.csv chứa dữ liệu về tỉ lệ nghèo (Y), phần trăm dân số (25 tuổi trở
lên) có trình độ học vấn bậc trung học (X2), phần trăm dân số (25 tuổi trở lên) đã hoàn tất chương
trình cao đẳng hoặc đại học trở lên (X3), trung vị của thu nhập của các hộ gia đình (X4)
1. Viết mô hình hồi quy tuyến tính tổng thể của Y phụ thuộc X2, X3, X4.
2. Xét xem có hiện tượng đa cộng tuyến trong mô hình đó không? Nêu rõ cách phát hiện của bạn.
3. Nếu có hiện tượng đa cộng tuyến thì khắc phục bằng cách bỏ biến: Bạn bỏ biến nào? Loại bỏ
biến đó khỏi mô hình có làm giảm mức độ đa cộng tuyến hay không? Lựa chọn một dấu hiệu
mà bạn cho là rõ ràng nhất để giải thích cho câu trả lời của bạn.
4. Biết thông tin tiên nghiệm B4 = −0.5, hãy dùng thông tin này để ước lượng lại cho các hệ số
hồi quy. Trong mô hình bạn dùng để ước lượng còn đa cộng tuyến không?
VD13: Trong File DCT.rda có Invest là đầu tư, GNP là tổng thu nhập quốc nội, Interest là tỉ lệ lãi
suất, CPI là chỉ số giá tiêu dùng. Xét mô hình: Invest = B1 + B2*GNP + B3*CPI + B4*Interest + U
1. Có tồn tại hiện tượng đa cộng tuyến trong mô hình trên không?
2. Sử dụng phương pháp sai phân xem có giảm được đa cộng tuyến hay không?
3. Thử biến đổi mô hình về dạng log – tuyến tính bội xem có khắc phục được đa cộng tuyến
không? (Viết mô hình hồi quy log – tuyến tính bội tổng thể, chỉ ra mức độ đa cộng tuyến
trong mô hình giảm nếu khắc phục được hoặc không giảm nếu không khắc phục được so với mô hình tuyến tính
4. Thử biến đổi mô hình bằng cách chia cả hai vế của mô hình cho biến Interest xem có khắc
phục được đa cộng tuyến không?
VD14: Cho tập số liệu OTO.txt trong đó:
Y: lượng xe ô tô mới bán được (đơn vị: nghìn chiếc)
X2: chỉ số giá tiêu dùng cho xe mới (1967=100)
X3: chỉ số giá tiêu dùng (CPI), tất cả mặt hàng, tất cả người tiêu dùng ở thành phố.
X4: thu nhập cá nhân sau thuế X5: lãi suất (%)
X6: Lực lượng lao động có việc làm (đơn vị: nghìn người).
Xét mô hình: lnY = B1 + B2 lnX2 + B3lnX3 + B4lnX4 + B5lnX5 + B6lnX6 + U.
1. Bạn kì vọng gì về dấu của B2? Kết quả ước lượng có phù hợp với điều bạn kì vọng không?
2. Theo bạn có đa cộng tuyến trong mô hình trên không? Giải thích?
3. Nếu có đa cộng tuyến, thử khắc phục bằng phương pháp sai phân.
VD15: Cho hàm sản xuất Y = f(K, L). Với số liệu trong file CobbDouglas.csv, trong đó: Y, K, L lần
lượt là đầu ra, vốn và lao động.
1. Hãy ước lượng hàm Cobb-Douglas: Y = AKαLβ. Có dấu hiệu của đa cộng tuyến trong mô hình
bạn dùng để ước lượng không?
2. Hãy sử dụng thông tin: Hàm sản xuất có tính chất hiệu suất không đổi theo quy mô để khắc
phục đa cộng tuyến và ước lượng lại hàm sản xuất.
3. Thử sử dụng phương pháp sai phân xem có làm giảm hiện tượng đa cộng tuyến hay không? 6
Document Outline

  • PHẦN 5. ĐA CỘNG TUYẾN
  • 1) Khái niệm
  • 3) Khắc phục đa cộng tuyến
  • - Giữ lại biến độc lập quan trọng
  • Ysao=diff(Y) X2sao=diff(X2) X3sao=diff(X3) Xksao=diff(Xk)