-
Thông tin
-
Hỏi đáp
Phần 5 : Đa công tuyến môn Kinh tế lượng | Đại học Thăng Long
Phần 5 : Đa cộng tuyến môn Kinh tế lượng | Đại học Thăng Long được chia sẻ dưới dạng file PDF sẽ giúp bạn đọc tham khảo , củng cố kiến thức ,ôn tập và đạt điểm cao. Mời bạn đọc đón xem!
Kinh tế lượng (E01) 7 tài liệu
Đại học Thăng Long 267 tài liệu
Phần 5 : Đa công tuyến môn Kinh tế lượng | Đại học Thăng Long
Phần 5 : Đa cộng tuyến môn Kinh tế lượng | Đại học Thăng Long được chia sẻ dưới dạng file PDF sẽ giúp bạn đọc tham khảo , củng cố kiến thức ,ôn tập và đạt điểm cao. Mời bạn đọc đón xem!
Môn: Kinh tế lượng (E01) 7 tài liệu
Trường: Đại học Thăng Long 267 tài liệu
Thông tin:
Tác giả:
Tài liệu khác của Đại học Thăng Long
Preview text:
lOMoARcPSD| 40615933
PHẦN 5. ĐA CỘNG TUYẾN
Các giả thuyết của mô hình hồi quy tuyến tính bội cổ điển:
1. X là xác định, không ngẫu nhiên
2. Sai số U có trung bình bằng 0: E(U) = 0 (Tức là E(Ui) = 0, i)
3. Phương sai của Ui là không đổi và bằng nhau (phương sai thuần nhất) 2ui = 2
4. Các sai số Ui, Uj là không tương quan: cov(Ui,Uj) = 0
5. Các biến độc lập không có quan hệ tuyến tính với nhau
Nếu vi phạm giả thuyết thứ 5 thì người ta nói mô hình có đa cộng tuyến. 1) Khái niệm
Đa cộng tuyến là hiện tượng khi các biến độc lập trong mô hình hồi quy bội có tương quan tuyến tính với nhau.
=> Mô hình hồi quy mà chỉ có 2 biến (1 biến độc lập và 1 biến phụ thuộc) thì không có đa cộng tuyến.
2) Một số cách phổ biến được dùng để phát hiện ra một mô hình hồi quy bội có hiện tượng đacộng tuyến
Cách 1: Hệ số xác định R2 cao nhưng tỷ số t tới hạn thấp (hoặc p giá trị cao)
Xét một mô hình hồi quy bội sau: Yi = B1 + B2X2i + B3X3i +…+ BkXki + Ui (*)
Hệ số xác định bội R2 cho biến bao nhiêu % sự biến thiên (biến động) của Y được giải thích
thông qua mô hình hồi quy. R2 từ 0.8 trở lên thì mô hình giải thích tốt cho sự biến thiên của biến phụ thuộc Y.
Với các bài toán kiểm định ý nghĩa thống kê về cặp giả thuyết của các hệ số hồi quy riêng:
H : Bi = 0 (Với i = 2, 3,…,k) (Biến X 0
i không ảnh hưởng đến sự biến thiến của Y)
H1: Bi 0 (Biến Xi có ảnh hưởng đến sự biến thiến của Y)
Thì nếu tỷ số t tới hạn thấp (hoặc p giá trị cao) thì có xu hướng chấp nhận H . Tức là các Xi (Với 0
i = 2, 3,…,k) không có vai trò giải thích cho sự biến thiên của Y.
Trong trường hợp ta chấp nhận H0 của tất cả các bài toán kiểm định hệ số hồi quy riêng thì
tức là không có bất kỳ biến độc lập nào ảnh hưởng đến biến phụ thuộc Y. (Tức là không có
biến độc lập nào có vai trò giải thích cho sự biến thiên của Y) (1)
Mà nếu ta lại nhìn thấy hệ số xác định R2 cao (từ 0.8 trở lên) tức là mô hình giải thích tốt cho
sự biến thiên của Y (2)
Từ (1) và (2) => Mâu thuẫn => Có hiện tượng đa cộng tuyến trong mô hình (*)
LƯU Ý: Trong cách 1 thì không cần nhất thiết đòi hỏi tất cả các bài toán kiểm định hệ số hồi quy
riêng đều phải chấp nhận H0. Chỉ cần hệ số của biến độc lập quan trọng mà chấp nhận H0 là đủ để
kết luận có hiện tượng đa cộng tuyến.
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X ) và Giá thịt gà (X ). Thì nếu 2 3
biến thịt gà không ảnh hưởng đến lượng cầu thịt gà (tức là H0: B3 =0 và H1: B3 0; Chấp nhận
H ) thì có thể kết luận là mô hình có đa cộng tuyến vì biến độc quan trọng lại không có ý nghĩa 0 trong mô hình.
VD1: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X ), thu nhập thêm từ đầu tư vàng và ngoại tệ ( ). Số liệu 3 X4
được cho trong File TDVTN.csv. Hãy ước lượng cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U.
Sau đó xét xem mô hình có hiện tượng đa cộng tuyến không bằng R2 và α = 5%?
Cách 2: Dấu của hệ số trong mô hình hồi quy mẫu không đúng 1 lOMoARcPSD| 40615933
Khi dấu các hệ số trong mô hình hồi quy mẫu không đúng thì cũng có hiện tượng đa cộng tuyến. VD:
Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X ) và Giá thịt gà (X 2 3) trong mô hình: Y = B1 + B2X2 + B3X3 + U (1)
Mà nếu ước lượng điểm ra b3 > 0 là trái với lý thuyết kinh tế (Giá tăng thì cầu giảm, bởi trong mô
hình (1) không có mặt hàng cạnh tranh thay thế nào như giá heo hay giá vịt). Khi đó ta cũng có
thể kết luận là có đa cộng tuyến trong mô hình (1).
VD2: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và X3
là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Hãy ước lượng
cho mô hình hồi quy mẫu. Sau đó xét xem mô hình có hiện tượng đa cộng tuyến không? Nêu cách phát
hiện theo dấu của hệ số hồi quy.
Cách 3: Hệ số tương quan tuyến cặp giữa các biến độc lập cao
Xét mô hình: Yi = B1 + B2X2i + B3X3i +…+ BkXki + Ui (*)
Dùng câu lệnh sau để kiểm tra hệ số tương quan tuyến tính cặp giữa các biến độc lập trong mô
hình hồi quy bội trên: cor(data.frame(X
,…,X )) (dùng câu lệnh này nếu mô hình có từ 3 2,X3 k
biến độc lập trở lên)
Chỉ cần có 1 cặp biến độc lập có hệ số tương quan tuyến tính cao (tầm từ 0.8 trở lên) thì có thể
kết luận là mô hình (*) có hiện tượng đa cộng tuyến.
VD3: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và
X3 là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Xét xem
mô hình có hiện tượng đa cộng tuyến hay không bằng cách tính ra hệ số tương quan tuyến tính giữa các biến độc lập?
VD4: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2), thu
nhập thêm từ chơi chứng khoán (X ), thu nhập thêm từ đầu tư vàng và ngoại tệ ( ). Số liệu được cho 3 X4
trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Xét xem mô hình có hiện
tượng đa cộng tuyến hay không bằng cách tính ra hệ số tương quan tuyến tính giữa các biến độc lập?
Cách 4: Thiết lập mô hình hồi quy phụ của một biến độc lập thông qua các biến độc lập còn lại trong
mô hình hồi quy bội
Nếu đề bài không nói cụ thể phát hiện đa cộng tuyến theo cách nào thì mặc định phải dùng cách 4 mới được điểm tối đa.
Xét mô hình: Yi = B1 + B2X2i + B3X3i +…+ BkXki + Ui (*)
LƯU Ý: Có bao nhiêu biến độc lập thì có bấy nhiêu mô hình hồi quy phụ (Ví dụ có 2 biến độc lập thì có
2 mô hình hồi quy phụ. Có 3 biến độc lập thì có 3 mô hình hồi quy phụ)
Để cho dễ nói thì ta mã hóa mô hình (*) thành một mô hình chỉ có 3 biến độc lập như sau: Y
= B1 + B2X2 + B3X3 + B4X4 + U (1)
(1) có 3 biến độc lập là X2, X3, X4 nên ta có thể thiết lập 3 mô hình hồi quy phụ sau: X2 = A1 + A2X3 +A3X4 + V X3 = A1 + A2X2 +A3X4 + V X4 = A1 + A2X2 +A3X3 + V
Sau đó, thiết lập các cặp giả thuyết thống kê sau:
H0: A2 = A3 = 0 (không có mối quan hệ tuyến tính giữa các biến độc
lập) H1: Ai 0, với i = 2, 3 (A2 0 hoặc A3 0) (có mối quan hệ tuyến tính giữa các biến độc lập)
Chỉ cần một mô hình hồi quy phụ bác bỏ H0 là có hiện tượng đa cộng tuyến. 2 lOMoARcPSD| 40615933
Ta có thể mở rộng thêm cho mô hình (*): nếu (*) có 4 biến độc lập như sau:
Y = B1 + B2X2 + B3X3 + B4X4+ B5X5 + U (2)
(2) có 4 biến độc lập là X2, X3, X4, X5 nên ta có thể thiết lập 4 mô hình hồi quy phụ sau:
X2 = A1 + A2X3 +A3X4 + A4X5 + V
X3 = A1 + A2X2 +A3X4 + A4X5 + V
X4 = A1 + A2X2 +A3X3 + A4X5 + V
X5 = A1 + A2X2 +A3X3 + A4X4 + V
Sau đó, thiết lập các cặp giả thuyết thống kê sau:
H0: A2 = A3 = A4 = 0 (không có mối quan hệ tuyến tính giữa các biến độc lập)
H1: Ai 0, với i = 2, 3, 4 (có mối quan hệ tuyến tính giữa các biến độc lập) Chỉ
cần một mô hình hồi quy phụ bác bỏ H0 là có hiện tượng đa cộng tuyến.
VD5: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và
X3 là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Dùng các
mô hình hồi quy phụ hãy kiểm định giả thuyết về đa cộng tuyến trong mô hình trên tại = 5%.
VD6: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2), thu
nhập thêm từ chơi chứng khoán (X ), thu nhập thêm ). Số liệu được cho 3
từ đầu tư vàng và ngoại tệ (X4
trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Dùng mô hình hồi quy phụ
hãy kiểm định giả thuyết về đa cộng tuyến trong mô hình trên tại = 5%.
3) Khắc phục đa cộng tuyến
Cách 1: Sử dụng thông tin tiên nghiệm (đề bài cho sẵn)
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X ) và Giá thịt gà (X 2 3) trong mô
hình: Y = B1 + B2X2 + B3X3 + U (1)
Giả sử (1) có hiện tượng đa cộng tuyến. Và bây giờ đề bài yêu cầu bạn hãy khắc phục đa cộng
tuyến với thông tin như sau: Một nghiên cứu trước đây cho rằng B2 = 10B3.
Khi đó, ta sẽ sử dụng mô hình thay thế là:
Y = B1 + 10B3X2 + B3X3 + U = B1 + B3(10X2 + X3) + U
Đặt X* = 10X2 + X3 thì mô hình (1) trở thành Y= B1 + B3X* + U (2)
Mô hình (2) trở thành một mô hình hồi quy với chỉ duy nhất một biến độc lập nên sẽ không
còn đa cộng tuyến => Dùng thông tin tiên nghiệm sẽ làm khắc phục được đa cộng tuyến.
VD: Nếu có thông tin tiên nghiệm là B3 = 2. Hãy biến đổi mô hình (1): Y = B1 + B2X2 + B3X3 + U trở về
mô hình không còn đa cộng tuyến.
Thay B3 = 2 vào (1) thì khi đó ta sẽ sử dụng mô hình thay thế là:
Y = B1 + B2X2 + 2X3 + U <=> Y – 2X3 = B1 + B2X2 + U
Đặt Y* = Y – 2X3 thì mô hình (1) trở thành: Y* = B1 + B2X2 + U (2)
Mô hình (2) trở thành một mô hình hồi quy với chỉ duy nhất một biến độc lập nên sẽ không
còn đa cộng tuyến => Dùng thông tin tiên nghiệm sẽ làm khắc phục được đa cộng tuyến.
VD7: Cho tập số liệu TieuDung.txt trong đó: Y là mức tiêu dùng của hộ gia đình; X2 là thu nhập và
X3 là tài sản có khả năng chuyển đổi cao. Xét mô hình hồi quy: Y = B1 + B2X2 + B3X3 + U. Một
nghiên cứu trước đây cho rằng B
. Bạn hãy dùng thông tin này để ước lượng lại cho B 2 = 4B3 1, B2,
B . Trong mô hình bạn dùng để ước lượng có còn hiện tượng đa cộng tuyến không? 3 3 lOMoARcPSD| 40615933
VD8: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X ), thu nhập thêm từ đầu tư vàng và ngoại tệ ( ). Số liệu 3 X4
được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Một nghiên cứu trước đây cho rằng B
. Sau khi dùng thông tin tiên nghiệm này thì mô hình thay thế bạn dùng 3 = 5B2
để ước lượng có còn hiện tượng đa cộng tuyến không?
Cách 2: Thu thập thêm số liệu hoặc lấy thêm mẫu mới (cách này trong bài tập không cần học)
Cách 3: Bỏ bớt biến độc lập
Sau đây là một số gợi ý cho việc bỏ bớt biến độc lập để khắc phục đa cộng tuyến (hay còn gọi là
làm giảm đa cộng tuyến)
Giữ lại biến độc lập quan trọng
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X ) và Giá thịt gà (X 2 3) trong mô
hình: Y = B1 + B2X2 + B3X3 + U (1). Nếu đề bài yêu cầu khắc phục đa cộng tuyến trong mô hình
(1) bằng cách bỏ bớt biến thì ta nên giữ lại biến Giá thịt gà (X ) và bỏ biến Thu nhập (X ) đi vì 3 2
biến Giá thịt gà (X ) quan trọng trọng hơn biến Thu nhập (X ) trong mô hình hồi quy với lượng 3 2
cầu thịt gà (Y). Và sau khi bỏ biến X2 đi thì mô hình (1) sẽ không còn đa cộng tuyến vì khi đó mô
hình chỉ còn lại một biến độc lập duy nhất là X3 nên không còn đa cộng tuyến nữa.
Bỏ bớt biến độc lập có mối quan hệ tuyến tính mạnh với các biến độc lập còn lại (tức là bỏ
bớt biến có hệ số tương quan tuyến tính cặp cao với các biến độc lập còn lại)
VD: Xét sự phụ thuộc của lượng cầu thịt gà (Y) vào Thu Nhập (X ), Giá thịt gà (X 2 3) và Giá
thịt heo (X4) trong mô hình: Y = B1 + B2X2 + B3X3 + B4X4 + U (1). Nhận thấy thì biến X3 có
vai trò quan trọng hơn trong việc đánh giá sự biến động của Y so với hai biến X2 và X4 nên
ta sẽ giữ lại biến X3 và xem xét bỏ biến X2 hay biến X4
Giả sử ta có hệ số tương quan tuyến tính cặp giữa 3 biến độc lập như sau:
> cor(data.frame(X2,X3,X4)) X2 X3 X4
X2 1.0000000 0.8317967 0.8493137
X3 0.8317967 1.0000000 0.5255913
X4 0.8493137 0.5255913 1.0000000
Nếu bỏ biến X4 ra khỏi mô hình thì mô hình mới sẽ là: Y = B1 + B2X2 + B3X3 + U. Lúc này
hệ số tương quan tuyến tính giữa 2 biến X2và X3 là 0.8317967 vẫn lớn nên mô hình mới
vẫn còn đa cộng tuyến mạnh.
Nếu bỏ biến X2 ra khỏi mô hình thì mô hình mới sẽ là: Y = B1 + B3X3 + B4X4 + U. Lúc này
hệ số tương quan tuyến tính giữa 2 biến X3và X4 là 0.5255913 khá thấp nên mô hình mới
đã làm giảm được đa cộng tuyến.
Kết luận: Vậy ta nên bỏ biến X2 và giữ lại biến X3 và X4 thì sẽ làm giảm đa cộng tuyến trong mô hình (1)
Nhưng đôi khi lại sẽ chẳng có cách bỏ biến độc lập nào làm giảm đa cộng tuyến vì các biến độc lập
còn lại vẫn có hệ số tương quan tuyến tính cao
VD: > cor(data.frame(X2,X3,X4)) X2 X3 X4
X2 1.0000000 0.9517967 0.9631374
X3 0.9517967 1.0000000 0.9255913
X4 0.9631374 0.9255913 1.0000000 4 lOMoARcPSD| 40615933
Nhận thấy với VD trên thì ta thấy dù bỏ biến nào đi chăng nữa thì những mô hình mới sẽ vẫn còn
đa cộng tuyến mạnh thì ta kết luận là không tìm được cách bỏ biến nào triệt để nhất để làm giảm
được hiện tượng đa cộng tuyến trong mô hình (1)
VD9: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X ), thu nhập thêm từ đầu tư vàng và ngoại tệ ( ). Số liệu 3 X4
được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Hãy khắc phục
đa cộng tuyến trong mô hình trên bằng cách bỏ bớt biến độc lập.
Nhận thấy trong mô hình trên thì các biến độc lập có vai trò là như nhau thì ta cứ dùng lệnh
cor(data.frame(X2,X3,X4)) và xét xem cách bỏ biến nào làm giảm đa cộng tuyến nhất thì chọn.
Cách 4: Khắc phục đa cộng tuyến bằng phương pháp sai phân cấp 1
Xét mô hình hồi quy bội sau: Yt = B1 + B2X2t +B3X3t +…+ BkXkt + Ut (1)
Nếu mô hình (1) đúng tại thời điểm t thì cũng đúng tại thời điểm t – 1 nên ta có:
Yt-1 = B1 + B2X2t-1 +B3X3t-1 +…+ BkXkt-1 + Ut-1 (2) Lấy (1) – (2) ta được:
Yt – Yt-1 = B1 – B1 + B2X2t – B2X2t-1 + B3X3t – B3X3t-1 +…+ BkXkt – BkXkt-1 + Ut – Ut-1 <=>
Yt – Yt-1 = B2(X2t – X2t-1) + B3(X3t – X3t-1) +…+ Bk(Xkt – Xkt-1) + Ut – Ut-1
Đặt: Y* = Yt – Yt-1 , X2* = X2t – X2t-1 , X3* = X3t – X3t-1 , Xk* = Xkt – Xkt-1 và V= Ut – Ut-1 thì
mô hình (1) trở thành: Y* = B * +…+ B 2X2* +B3X3 kXk* + V (2)
Mô hình (2) được gọi là mô hình sai phân cấp 1. Nhận thấy mô hình sai phân cấp 1 là mô hình
hồi quy không có hệ số chặn. Sau đó, chúng ta lại dùng lại một trong bốn cách phát hiện cũ để
xem mô hình sai phân cấp 1 này có khắc phục được đa cộng tuyến hay không (không nói cụ thể
phát hiện đa cộng tuyến trong mô hình sai phân cấp 1 theo cách nào thì mặc định làm theo mô
hình hồi quy phụ mới được điểm tối đa)?
Cách tạo ra các sai phân cấp 1: Y* X *,…, X 2* X3 k* như sau: Ysao=diff(Y) X2sao=diff(X2)
Trong đó: Y, X2, X3,…, Xk là tên của
các biến trong mô hình hồi quy bội X3sao=diff(X3) Xksao=diff(Xk)
Sau đó muốn ước lượng hay kiểm định các hệ số trong mô hình sai phân cấp 1 (Một mô hình
không có hệ số chặn) thì ta dùng câu lệnh sau: lm(Ysao~X2sao+X3sao+…+ Xksao+0)
VD10: Người ta muốn đánh giá sự phụ thuộc của tiêu dùng nội địa (Y) vào thu nhập từ lương (X2),
thu nhập thêm từ chơi chứng khoán (X ), thu nhập thêm từ đầu tư vàng và ngoại tệ ( ). Số liệu 3 X4
được cho trong File TDVTN.csv. Cho mô hình Y = B1 + B2X2 + B3X3 + B4X4 + U. Sử dụng phương
pháp sai phân xem có làm giảm đa cộng tuyến hay không?
VD11: File NhuCauXeBus.csv cho biết dữ liệu về mức độ giao thông bằng xe bus (Y – nghìn lượt
khách/giờ), thu nhập bình quân đầu người (X2 – USD), dân số (X3 – nghìn người), mật độ dân số 5 lOMoARcPSD| 40615933
(X4 – người/dặm vuông). Xét mô hình: Y = B1 + B2X2 + B3X3 + B4X4 + U. Đưa ra kết luận có hiện
tượng đa cộng tuyến trong mô hình trên hay không?
VD12: File TiLeNgheo.csv chứa dữ liệu về tỉ lệ nghèo (Y), phần trăm dân số (25 tuổi trở lên) có
trình độ học vấn bậc trung học (X ), phần trăm dân số (25 tuổi trở lên) đã hoàn tất chương trình 2
cao đẳng hoặc đại học trở lên (X ), trung vị của thu nhập của các hộ gia đình ( 3 X4)
1. Viết mô hình hồi quy tuyến tính tổng thể của Y phụ thuộc X2, X3, X4.
2. Xét xem có hiện tượng đa cộng tuyến trong mô hình đó không? Nêu rõ cách phát hiện của bạn.
3. Nếu có hiện tượng đa cộng tuyến thì khắc phục bằng cách bỏ biến: Bạn bỏ biến nào? Loại bỏbiến
đó khỏi mô hình có làm giảm mức độ đa cộng tuyến hay không? Lựa chọn một dấu hiệu mà bạn
cho là rõ ràng nhất để giải thích cho câu trả lời của bạn.
4. Biết thông tin tiên nghiệm B4 = −0.5, hãy dùng thông tin này để ước lượng lại cho các hệ số hồi
quy. Trong mô hình bạn dùng để ước lượng còn đa cộng tuyến không?
VD13: Trong File DCT.rda có Invest là đầu tư, GNP là tổng thu nhập quốc nội, Interest là tỉ lệ lãi suất,
CPI là chỉ số giá tiêu dùng. Xét mô hình: Invest = B1 + B2*GNP + B3*CPI + B4*Interest + U
1. Có tồn tại hiện tượng đa cộng tuyến trong mô hình trên không?
2. Sử dụng phương pháp sai phân xem có giảm được đa cộng tuyến hay không?
3. Thử biến đổi mô hình về dạng log – tuyến tính bội xem có khắc phục được đa cộng
tuyếnkhông? (Viết mô hình hồi quy log – tuyến tính bội tổng thể, chỉ ra mức độ đa cộng tuyến
trong mô hình giảm nếu khắc phục được hoặc không giảm nếu không khắc phục được so với mô hình tuyến tính
4. Thử biến đổi mô hình bằng cách chia cả hai vế của mô hình cho biến Interest xem có khắcphục
được đa cộng tuyến không?
VD14: Cho tập số liệu OTO.txt trong đó:
Y: lượng xe ô tô mới bán được (đơn vị: nghìn chiếc)
X : chỉ số giá tiêu dùng cho xe mới (1967=100) 2
X : chỉ số giá tiêu dùng (CPI), tất cả mặt hàng, tất cả người tiêu dùng ở thành phố. 3
X : thu nhập cá nhân sau thuế 4 X : lãi suất (%) 5 X : Lực 6
lượng lao động có việc làm (đơn vị: nghìn người).
Xét mô hình: lnY = B1 + B2 lnX2 + B3lnX3 + B4lnX4 + B5lnX5 + B6lnX6 + U.
1. Bạn kì vọng gì về dấu của B ? Kết quả ước lượng có phù hợp với điều bạn kì vọng 2 không?
2. Theo bạn có đa cộng tuyến trong mô hình trên không? Giải thích?3. Nếu có đa
cộng tuyến, thử khắc phục bằng phương pháp sai phân.
VD15: Cho hàm sản xuất Y = f(K, L). Với số liệu trong file CobbDouglas.csv, trong đó: Y, K, L lần
lượt là đầu ra, vốn và lao động.
1. Hãy ước lượng hàm Cobb-Douglas: Y = AKαLβ. Có dấu hiệu của đa cộng tuyến trong mô hình
bạn dùng để ước lượng không? 6 lOMoARcPSD| 40615933
2. Hãy sử dụng thông tin: Hàm sản xuất có tính chất hiệu suất không đổi theo quy mô để khắcphục
đa cộng tuyến và ước lượng lại hàm sản xuất.
3. Thử sử dụng phương pháp sai phân xem có làm giảm hiện tượng đa cộng tuyến hay không? 7