


















Preview text:
TỔNG QUAN VỀ MÔ HÌNH VỚI SỐ LIỆU MẢNG
1. Mô hình với số liệu mảng
1.1. Số liệu mảng (Panel data)
Là số liệu được quan sát theo các đơn vị chéo và mỗi đơn vị chéo lại
được quan sát theo thời gian.
Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo từng biến
Ví dụ : Giả sử ta có số liệu của 5 tỉnh (Hải Dương, Thái Bình, Nam Định,
Hà Nam, Ninh Bình) với các biến
Y = Tổng sản phẩm trong tỉnh
X1 = Tổng giá trị sản phẩm nông nghiệp của tỉnh
X2 = Tổng giá trị sản phẩm công nghiệp của tỉnh
Với mỗi tỉnh ta quan sát 3 biến trên từ năm 2000 đến năm 2009 (số liệu
năm). Khi đó ta trình bày số liệu như sau Tỉnh Hải Dương Năm Y X1 X2 2000 Y1 X11 X21 2001 Y2 X12 X22
………………………………………. 2009 Y10 X1,10 X2,10
………………………………………………………. Tỉnh Ninh Bình Năm Y X1 X2 2000 Y1 X11 X21 2001 Y2 X12 X22
……………………………………… 2009 Y10 X1,10 X2,10
Như vậy với số liệu được khảo sát ta có
+) Số đơn vị chéo (số tỉnh được khảo sát) n = 5
+) Số đoạn thời gian quan sát các biến cho mỗi đơn vị chéo (số năm) là T = 10
Khi đó ta có số liệu mẫu kết hợp với nT 510 50 quan sát
1.2. Mô hình hồi quy với số liệu mảng
Ý tưởng cơ bản về mô hình với số liệu mảng
) Một số trường hợp có thể xảy ra đối với các đơn vị chéo trong mô hình số liệu mảng như sau
+) Các đơn vị chéo có đặc thù giống nhau
+) Các đơn vị chéo có đặc thù không giống nhau
+) Các đơn vị chéo có sự khác biệt về tác động biên của các nhân tố ảnh hưởng
+) Các đơn vị chéo vừa có sự khác biệt về điều kiện đặc thù vừa khác biệt
về tác động biên của các nhân tố ảnh hưởng
+) Các đơn vị chéo không có sự khác biệt về điều kiện đặc thù và tác
động biên của các nhân tố đang xét.
) Mô hình với số liệu mảng hầu như ta không thực hiện hồi quy bằng
phương pháp OLS thông thường (như mô hình với số liệu chéo hay mô
hình với số liệu thời gian) vì các cá thể gần như không có tính thuần nhất.
Tất nhiên trong trường hợp rất đặc biệt ta có thể sử dụng OLS thông
thường để ước lượng các tham số của mô hình, đó là trường hợp mô hình
hồi quy gộp được xét ở phần sau.
Ta xét mô hình mà các đơn vị chéo không có sự khác biệt về tác động
biên của các nhân tố ảnh hưởng
Yit = X’itβ + Z’iα + εit
i 1; n t 1; T Trong đó
Y là biến phụ thuộc
X’ = (X1, X2,…, Xk) là vec tơ các biến giải thích (các biến hồi quy)
εit là sai số ngẫu nhiên
Giả thiết: it ~ N(0; 2)
β’ = (β1, β2,…, βk) là vec tơ hệ số (hay vec tơ tham số) tương ứng với các biến giải thích.
Z’iα gọi là tác động cá thể, hay tính không thuần nhất giữa các đơn vị chéo
Zi có chứa hằng số (thường ký hiệu là C hay INPT) ngoài ra là các biến
đặc trưng cho đơn vị chéo thứ i (hay nhóm i). Các biến đặc trưng trong Zi
có thể quan sát được như (giới tính, dân tộc, vùng – miền…) và cũng có
thể không quan sát được như (kỹ năng – kỹ sảo, khả năng, tính đặc trưng
của hộ gia đình,yếu tố đặc thù của ngành … ).
Tùy theo giả thiết (cùng với số liệu đã được khảo sát) mà ta xây dựng mô
hình sao cho phù hợp với một phương pháp ước lượng, rồi từ kết quả ước
lượng ta có thể đưa ra các phân tích và đánh giá phù hợp.
a) Mô hình hồi quy gộp (Pooled Regression)
Nếu Zi chỉ chứa một số hạng hằng số và tất cả các hệ số ( bao gồm hệ số
chặn và tất cả các hệ số của các biến giải thích) đều không đổi theo thời
gian và đơn vị chéo thì mô hình phù hợp là mô hình hồi quy gộp có dạng sau
Yit = α + X’itβ + εit (PR)
Trường hợp này là trường hợp các đơn vị chéo không có sự khác biệt về
điều kiện đặc thù và cũng không có sự khác biệt về tác động biên của các
nhân tố ảnh hưởng (biến giải thích).
b) Mô hình tác động cố định (Fixed Effects)
Nếu Zi không quan sát được nhưng tương quan với các biến giải thích X
thì ta không dùng phương pháp OLS thông thường để ước lượng các hệ
số β, bởi vì dùng phương pháp OLS trong trường hợp này (được xem như
mô hình bị bỏ sót biến) sẽ cho ước lượng chệch và không hiệu quả.
Tuy vậy mô hình cho trường hợp này có dạng
Yit = αi + X’itβ + εit (FE)
Với αi = Z’iα
-) Mỗi αi là số hạng đặc trưng nhóm, không đổi theo thời gian đối với mỗi
đơn vị chéo trong mô hình (có thể hiểu là hệ số chặn trong mỗi nhóm) -) αi không ngẫu nhiên
c) Mô hình tác động ngẫu nhiên (Random Effects)
Nếu Zi không quan sát được nhưng không tương quan với tất cả các biến
giải thích X thì mô hình cho trường hợp này có dạng
Yit = (α + ui) + X’itβ + εit (RE)
Hay Yit = α + X’itβ + ui + εit
Giả thiết ui ~ N(0; 2 ) u
Nếu đặt wit = ui + εit thì wit được gọi là sai số ngẫu nhiên hỗn hợp (hay
sai số ghép) và mô hình RE còn gọi là mô hình có sai số hỗn hợp
(Error Component Model – ECM ).
Trong mô hình RE chỉ có một Intercept duy nhất cho tất cả các đơn vị
chéo mà hệ số của INPT là α, phần khác biệt của các đơn vị chéo là ui
d) Mô hình với tất cả các hệ số là ngẫu nhiên
Như trên đã nêu, trường hợp các đơn vị chéo vừa có sự khác biệt về điều
kiện đặc thù vừa khác biệt về tác động biên của các nhân tố ảnh hưởng.
Hay nói khác đi mô hình có tất cả các hệ số biến đổi theo thời gian và đơn
vị chéo, khi đó mô hình cho trường hợp này có dạng
Yit = X’it(β + vi) + α + ui + t + εit
Với vi là một véc tơ ngẫu nhiên
2. Ước lượng mô hình với số liệu mảng
2.1. Ước lượng mô hình hồi quy gộp
Nếu mô hình hồi quy có tất cả các hệ số đều không đổi theo thời gian và
đơn vị chéo, đồng thời các giả thiết của phương pháp OLS được thỏa mãn
thì ta dùng phương pháp OLS thông thường để ước lượng các hệ số α và
β của mô hình hồi quy với nT quan sát. Khi đó ta gọi là dùng phương
pháp OLS cho mô hình hồi quy gộp (Pooled OLS – POLS).
2.2. Ước lượng mô hình tác động cố định
Mô hình tác động cố định giả thiết các hệ số chặn của mỗi đơn vị chéo
khác nhau còn hệ số của các biến giải thích (hệ số góc) không đổi theo
thời gian và đơn vị chéo. Mỗi αi được xem như một tham số cần ước lượng.
a) Kỹ thuật dùng biến giả (Dummy)
Để đơn giản khi trình bày ta không viết chỉ số t mà ta để ý rằng với mỗi i
thì Yi và Xi có T quan sát. Gọi i là véc tơ T dòng 1 cột, với tất cả các
phần tử của véc tơ i là số 1 và εi liên kết với véc tơ T 1 thành phần nhiễu
ngẫu nhiên. Khi đó mô hình Yit = αi + X’itβ + εit có dạng
Yi = X’iβ + i α + εi Y1 X1 i 0 0 1 1 Y X 0 i 0 Hoặc
2 2 2 2
Yn Xn 0 0 i
n n Hay
Y = [ X d1 d2
dn] + ε
Với di là biến giả thứ i ( i 1; n ), di nhận giá trị bằng 1 ( t 1; T ) với
những quan sát rơi vào đơn vị chéo thứ i và bằng 0 với những quan sát rơi
vào đơn vị chéo khác i. Đặt D = [d1 d2
dn] thì D là ma trận nT n và ta có dạng ma trận của mô hình là
Y = Xβ + Dα + ε
Mô hình này gọi là mô hình hồi quy tuyến tính có sử dụng biến giả, và
với mô hình này có thể áp dụng phương pháp OLS để ước lượng, vì vậy
mô hình này còn gọi là Least Squares Dummy Variable Model – LSDV.
Để tìm các ước lượng cho các tham số của mô hình LSDV ta có một số lưu ý
-) Trong mô hình có k biến giải thích (X1, X2, . . . , Xk) do vậy ma trận
X’ có nT dòng k cột và D có n cột nên ma trận D có nT dòng n cột
-) Gọi b’ = (b1, b2, . . . ,bk) là ước lượng của β’ = (β1, β2, . . . ,βk)
Và a’ = (a1, a2, . . . ,an) là ước lượng của α’ = (α1, α2, . . . ,αn).
Khi đó ta có công thức sau
b = [X’MDX]-1[X’MDY]
Với MD = I – D(D’D)-1D’ và I là ma trận đơn vị cấp nT
Để tìm a ta thay b cho β trong mô hình và nhân 2 vế với D’ ta có D’Y = D’Da + D’Xb
hay a = [D’D]-1D’(Y – Xb)
Ta có ma trận Covariance của b là
Cov(b) = s2[X’MDX]-1
với s2 là ước lượng của 2 và công thức tính s2 là n T
(Y X/ b a )2 it it i 2 (Y M Xb)/ (Y M Xb)
s i1 t1 D D
nT n k
nT n k 1 T 1 T Đặt
X X ,Y Y khi ấy các phần dư e i T it i it it là các ước t1 T t1
lượng điểm của εit được tính bởi công thức
eit = Yit – X’itb – ai = Yit – X’itb – (Y X/ b) = (Yit – Y ) – (Xit – X )’b i i i i
với ai = iY X/i b (i = 1; n )
Ma trận Covariance của a được tính bởi công thức s2 / Cov(a) = X Cov(b)X T i i
Có thể sử dụng thống kê T (Student statistic) để kiểm định giả thuyết αi =
0 (i = 1; n ) đó cũng là kiểm định hệ số chặn ứng với đơn vị chéo thứ i có
ý nghĩa thống kê hay không ?. Tuy nhiên việc lựa chọn POLS hay LSDV
để ước lượng thì ta kiểm định cặp giả thuyết
H0 : Dùng POLS để ước lượng
H1 : Dùng LSDV để ước lượng
Tiêu chuẩn kiểm định được lựa chọn là R2 R2 LSDV Pooled F n 1
~ F(n 1; nT n k) 1 R2LSDV
nT n k
Chú ý : Trong thực hành ta đặt (n – 1) biến giả với 1 D
Nếu quan sát thuộc vào đơn vị chéo i i 0
Nếu quan sát thuộc vào đơn vị chéo khác Với i 2; n
b) Ước lượng giữa các đơn vị chéo và ước lượng trong mỗi đơn vị chéo (Between and Within Estimator)
Viết lại mô hình tác động cố định
Yit = αi + X’itβ + εit (FE) 1 T 1 T 1 T
Đặt X X ,Y Y , ta có mô hình sau i T it i it i it t1 T t1 T t1 Y i + X/ i i i (BE)
Ước lượng mô hình (BE) bằng phương pháp OLS gọi là ước lượng giữa
các đơn vị chéo hay ước lượng giữa các nhóm.
Nếu lấy (FE) trừ (BE) vế với vế ta có mô hình
Yit – Yi = (Xit – Xi )’β + εit – i (WE)
Ước lượng mô hình (WE) bằng phương pháp OLS gọi là ước lượng trong các đơn vị chéo.
Để tìm công thức cho véc tơ b là ước lượng của véc tơ hệ số β trong các
mô hình (FE), (BE) và (WE) ta có thể sử dụng ma trận tổng bình phương
của các biến giải thích và ma trận tích chéo giữa các biến giải thích và biến phụ thuộc. 1 n T 1 n T Đặt X
X , Y Y it it nT nT i1 t1 i1 t1
Với mô hình (FE) ta ký hiệu n T n T total
SXX (X it X)(X X)/ , Stotal (X Y ) it X Y it X)(Yit i1 t1 i1 t1
Với mô hình (BE) ta ký hiệu n T n T between
SXX T (Xi X)(X X)/, Sbetween T (X Y ) i X Y i X)(Yi i1 t1 i1 t1
Với mô hình (WE) ta ký hiệu n T n T
Swihin (X X )(X X )/, Swithin (X X )(Y Y ) X X it i it i X Y it i it i i1 t1 i1 t1
Ta dễ kiểm tra lại được
Stotal Swithin Sbetween ,
Stotal Swithin Sbetween X X X X X X X Y X Y X Y Chú ý :
X là 1 véc tơ k dòng 1 cột và Y là 1 điểm, tức là /
X (X1,X2, , Xk), với số liệu mẫu cụ thể thì Y là một giá trị Stotal ,Sbetween , Swithin XX XX XX
là các ma trận k dòng k cột
Stotal,Sbetween, Swithin là các véc tơ k dòng 1 cột XY XY XY
Do vậy các công thức của véc tơ b là ước lượng của véc tơ β lần lượt đối
với các mô hình (FE), (WE) và (BE) là btotal = [Stotal XX ]-1Stotal XY [Swithin XX + Sbetween XX ]-1[Swithin XY + Sbetween XY ]
bbetween [Sbetween]-1Sbetween XX XY
bwithin [Swithin]-1Swithin XX XY
c) Ước lượng mô hình tác động cố định theo cả thời gian và đơn vị chéo Xét mô hình có dạng
Yit = αi + t + X’itβ + εit
Để ước lượng mô hình dạng này ta tiếp tục sử dụng kỹ thuật biến giả cho
cả đơn vị chéo và thời gian. Tuy nhiên với số đơn vị chéo n và số chu kỳ
thời gian T khá lớn thì kỹ thuật biến giả không còn phù hợp, bởi vì số
biến giả cần sử dụng trong mô hình sẽ rất lớn dẫn đến giảm bậc tự do của
số liệu đi rất nhiều, nguy cơ đa cộng tuyến cao vì có quá nhiều biến giả,
giả thiết cổ điển về εit ~ N(0; 2 ) không chắc thỏa mãn, công thức ước
lượng rất phức tạp và kết quả ước lượng cũng không hiệu quả. Trong
trường hợp n và T khá lớn thì ta có thể áp dụng phương pháp ước lượng
mô phỏng hợp lý tối đa, hoặc phương pháp ước lượng Bayes.
2.3. Ước lượng mô hình tác động ngẫu nhiên
Ta viết lại mô hình tác động ngẫu nhiên
Yit = (α + ui) + X’itβ + εit (RE)
Hay Yit = α + X’itβ + ui + εit
Với ui là yếu tố ngẫu nhiên đặc trưng tương ứng với đơn vị chéo thứ i và
ui không biến động theo thời gian trong đơn vị chéo thứ i. Còn εit là yếu
tố ngẫu nhiên biến động theo cả i và t.
a) Một số giả thiết đối với mô hình tác động ngẫu nhiên
+) εit ~ N(0; 2 ) , ui ~ N(0; 2 ) u
+) E(εit / X) = E(ui / X) = 0 , E(ε2it / X) = 2 , E(u2i / X) = 2u
+) E(εit uj / X) = 0 i,t, j , E(εit εjs / X) = 0 nếu t s hoặc i j
+) E(ui uj / X) = 0 nếu i j .
Với wit = ui + εit và wi = (wi1, wi2, . . . ,wiT) thì
+) E( w2 / X) = 2 = 2 2 , E(wit wis / X) = 2 với t s it u u
+) E(wit wis / X) = 0 t,s nếu i j
Ứng với mỗi đơn vị chéo i ta có T quan sát theo các biến
Đặt Σ = E(wiw’i / X) thì Σ là một ma trận T dòng T cột có dạng như sau 22 2 2 2 u u u u 2 2 2 2 2 u u u u Σ = 2 ’
IT + 2 iTi u T 2 2 2 2 2 u u u u
Bởi vì các quan sát chéo i và j là các quan sát độc lập nên ma trận hiệp
phương sai (Covariance) của các nhiễu ngẫu nhiên wit với đầy đủ cho nT quan sát là 0 0 0 0 0 0 = I n Σ 0 0 0
b) Ước lượng mô hình (RE)
Nếu dùng phương pháp OLS để ước lượng mô hình (RE) thì kết quả ước
lượng sẽ không hiệu quả do sai số ngẫu nhiên wit trong mô hình (RE) là
sai số ghép (có Var(wit) = 2 2 2 ) nên phương pháp ước lượng u
thích hợp nhất cho mô hình (RE) là phương pháp bình phương nhỏ nhất
tổng quát (Generalized Least Squares – GLS). Từ mô hình của (RE)
Yit = α + X’itβ + ui + εit ta dẫn đến các mô hình sau
Y + X/ u i i i i
Y Y (1 ) + (X X )/ (1 )u (*) it i it i i it i Với 1 , 0 1 2 2 T u
Lưu ý: nếu 0 thì mô hình (*) trở thành mô hình (PR – hồi quy gộp),
còn nếu 1 thì mô hình (*) trở thành mô hình (WE – Within Estimator) ˆ
Để ước lượng (*) bằng phương pháp OLS thì ta cần tìm ˆ ˆ 2 ˆ 2 T u
là ước lượng điểm của và ước lượng mô hình (*) khi thay bằng ˆ
Y ˆY (1ˆ) + (X ˆX )/ (1ˆ)u ˆ (**) it i it i i it i
Để tìm ˆ ta tìm ˆ2 và ˆ2 . u
Từ mô hình Yit – Yi = (Xit – Xi )’β + εit – i (WE) ta có
E T ( )2 (T 1) 2 it i t=1
Nếu β được quan sát thì một ước lượng không chệch của 2 dựa trên T
quan sát trong nhóm i là T ( )2 it i
ˆ2(i) t1 T 1
Bởi vì β được ước lượng từ mô hình (WE) ngụ ý ước lượng mô hình
LSDV là phù hợp, lúc đó ta sử dụng các phần dư khi ước lượng mô hình
LSDV với bậc tự do hiệu chỉnh T n T (e e )2 (e e )2 it i 1 n it i 2 2 2
s (i) t1 s
s (i) i1 t1 e e e T k 1 n i1
nT nk n s 2
Bậc tự do hiệu chỉnh trong e là thừa bởi vì giả thiết α và β được ước
lượng lặp lại với mỗi i . Các tham số được ước lượng là n trung bình Yi
và k hệ số góc. Bởi vậy ta đưa ra ước lượng không chệch của 2 là n T (e e )2 ˆ2 s2 it i i1 t1 LSDV
nT k n
Tiếp theo ta tìm ước lượng cho 2 . Trở lại mô hình (RE), nếu ta dùng u
phương pháp OLS gộp (Pooled OLS) thì các phần dư thu được 2 s là Pooled
ước lượng của Var(wit) = 2 2 với u 2 e/e 2 2 2 2 s
ˆ ˆ s ˆ Pooled nT k 1 u LSDV u ˆ2 s2 2 u Pooled sLSDV ˆ
Từ đó tìm được ˆ
và ước lượng được (**) bằng phương ˆ 2 ˆ 2 T u
pháp OLS tìm được véc tơ ˆ là ước lượng của β.
) Kiểm định xem một mô hình có phải là mô hình tác động ngẫu nhiên hay không ?
Breusch và Pagan (1980) đã đề xuất kiểm định bằng nhân tử Lagrange
với mô hình tác động ngẫu nhiên dựa trên các phần dư khi ước lượng mô
hình bằng phương pháp OLS gộp.
Ta kiểm định cặp giả thuyết H : ,w ) 0 0 Corr(w u : 2 0 H0 it is
H : 2 0 H : Corr(w , w ) 0 1 it is 1 u Tiêu chuẩn kiểm định n T 2 n 2 2 2 nT (e ) it nT (T ei) LM i1 t1 1 i1 1 n T n T
2(T 1) e2 2(T 1) it e2 it i1 t1
i1 t1
Nếu giả thuyết H0 là đúng thì LM ~ 2(1)
) Kiểm định Hausman chỉ rõ một mô hình là mô hình tác động cố định hay tác động ngẫu nhiên
+) Nếu ta giả thiết mô hình là mô hình tác động cố định và ước lượng mô
hình LSDV thì ta tìm được véc tơ b là ước lượng của véc tơ β
+) Nếu ta giả thiết mô hình là mô hình tác động ngẫu nhiên và ước lượng
mô hình bằng phương pháp GLS thì ta tìm được véc tơ ˆ là ước lượng của véc tơ β
Xét véc tơ [b – ˆ ] ta có Var[b – ˆ ] = Var[ b] + Var[ˆ ] – 2Cov[ b, ˆ ]
Hausman đã chứng minh được
Cov[ (b –ˆ ), ˆ ] = Cov[ b, ˆ ] – Var[ˆ ] = 0 Đặt
Hˆ = Var[b – ˆ ] = Var[ b] – Var[ˆ ]
Ta cần kiểm định cặp giả thuyết
H0 : Mô hình phù hợp là mô hình tác động ngẫu nhiên
H1 : Mô hình phù hợp là mô hình tác động cố định
Wald đã chứng minh được, thống kê
2 = [b – ˆ ]’ Hˆ-1[b – ˆ ] ~ 2(k 1)
Khi đó với số liệu mẫu cụ thể và với mức ý nghĩa α cho trước mà 2
2 (k 1) thì ta bác bỏ H qs 0
3. Hiện tượng phương sai của sai số thay đổi và hiện tượng tự tương
quan trong mô hình với số liệu mảng
3.1. Hiện tượng phương sai sai số (PSSS) thay đổi
+) Đối với mô hình tác động cố định thì chỉ có εit là các sai số ngẫu nhiên,
nên dù áp dụng phương pháp nào để ước lượng mô hình này đều thu được
các phần dư eit. Dựa vào các phần dư eit ta có thể đưa ra các chuẩn đoán
về hiện tượng PSSS thay đổi tương tự như Chương VI trong bài giảng
KTL của tác giả PGS.TS Nguyễn Quang Dong.
+) Đối với mô hình tác động ngẫu nhiên thì ta có sai số ngẫu nhiên hỗn
hợp wit = ui + εit với Var(wit) = 2 2 . Việc nghiên cứu cho việc chuẩn u
đoán 2 có thay đổi hay không (dựa trên số liệu) thật sự là một việc u
không dễ. Trong rất nhiều bài báo đã công bố [như của Mazodier và
Trognon (1978), Baltagi và Griffin (1988), đặc biệt công trình nghiên
cứu gần đây của Baltagi (1995)] đều có những đề xuất nghiên cứu
phương sai của ui thay đổi như thế nào ? Nhưng trong thực nghiệm thì đó
là vấn đề không khắc phục được, tuy nhiên trong phân tích cuối cùng của
mình, một số tác giả đã lấy uˆ 2 là ước lượng cho 2 (với uˆ là ước lượng i u i
của ui) nhưng ước lượng này dường như không chắc đúng.
Đối với thành phần εit thì Var(εit) = 2 , do vậy để chuẩn đoán Var(εit) có
thay đổi hay không ? ta có thể dựa vào các phần dư eit khi ước lượng mô
hình có sử dụng biến giả (LSDV), bởi vì phương pháp này khử được tác
động cá thể đặc trưng ui ứng với mỗi đơn vị chéo i.
Như vậy ta có các bước thực hành sau
Bước 1 : Sử dụng phương pháp OLS cho mô hình (RE) ta thu được phần e ,ol i es ols dư trong nhóm i là i là ước lượng của 2 i u2 T i
Bước 2 : Sử dụng phương pháp LSDV cho mô hình (RE) ta thu được ước e,lsdv elsdv
lượng của 2 là ˆ2 và từ đó ta tìm được i i i i T n 2 1 e,olseols
e,lsdvelsdv 1 n 2 ˆ u i i i i uˆi n i1 T T n i1
Bước 3 : Sử dụng ˆ 2 và ˆ2 để đưa ra chuẩn đoán về phương sai của sai i u
số trong mô hình tác động ngẫu nhiên có thay đổi hay không ?
3.2. Hiện tượng tự tương quan (TTQ)
Để chuẩn đoán về hiện tượng tự tương quan của mô hình với số liệu
mảng thì cũng tương tự như mô hình với số liệu chéo và mô hình với số
liệu thời gian, chủ yếu ta cũng dựa vào thông tin từ các phần dư thu được
khi ước lượng mô hình. Cochrane – Orcutt đã đưa ra phương pháp ước
lượng phù hợp cho mô hình có hiện tượng tự tương quan bậc cao. Tuy
nhiên ở đây ta chỉ trình bày phương pháp ước lượng cho mô hình có hiện tượng TTQ bậc 1
Ta xét hiện tượng tự tương quan trong mô hình tác động ngẫu nhiên. Viết lại mô hình (RE)
Yit = α + X’itβ + ui + εit
Nếu εit được đưa ra bởi quá trình AR(1) theo thời gian
εit = ρεi,t - 1 + vit
Khi đó ta ước lượng mô hình sai phân tổng quát có dạng như sau
Yit – ρ Yi,t - 1 = α(1 – ρ) + (Xit – ρ Xi,t – 1)’β + εit – ρεi,t - 1 + ui(1 – ρ)
Yit – ρ Yi,t - 1 = α(1 – ρ) + (Xit – ρ Xi,t – 1)’β + vit + ui(1 – ρ)
4. Mô hình với hệ số biến động ngẫu nhiên
4.1. Giới thiệu mô hình Xét mô hình có dạng
Yit = X’itβi + α + ui + εit hay
Yit = X’it(β + vi) + α + ui + εit
Với βi = β + vi và vi là một véc tơ ngẫu nhiên thỏa mãn
E[vi / Xi] = 0
E[vi v’i / Xi] = Γ
Chú ý : nếu mô hình chỉ có hệ số chặn biến động ngẫu nhiên và các hệ số
khác là không biến động ngẫu nhiên thì đó là trường hợp của mô hình tác
động ngẫu nhiên mà ta đã xét ở trên.
Trường hợp tất cả các hệ số đều ngẫu nhiên nhưng ta giả thiết các tham
số không tự tương quan hay không tương quan chéo với nhau. Ta cần tìm
ma trận đường chéo hình khối Ω có dạng 0 0 0 ii 0 0 0 Ω = ii 0 0 0 ii Với
Ωii = E[(Yi – Xiβ)(Yi – Xiβ)’ / Xi] = 2 iT + Xi Γ X’i
Ta có thể viết công thức ước lượng bằng phương pháp bình phương nhỏ
nhất tổng quát có dạng sau n
ˆ = (X’Ω-1X)-1X’Ω-1Y = W b i i i1 1 n Với
W ( 2(X/X )1)1 ( 2(X/X )1)1 i i i i i1 i i i
Trong thực hành chúng ta cần đến một ước lượng của Γ, nhưng tìm được
một ước lượng của Γ là một việc khó khăn.
Một số nghiên cứu gần đây về lĩnh vực này đã cho những kết quả rõ rệt
[như McFadden và Train (2000) hay Greene (2001)] các nghiên cứu đã
đưa ra cách tiếp cận ước lượng dựa theo mô phỏng, đồng thời mở rộng
sang lĩnh vực mô hình có tham số biến động ngẫu nhiên, chẳng hạn như
mô hình nhiều mức hay mô hình hồi quy có thứ bậc. Nghĩa là các hệ số
biến động ngẫu nhiên βi được biểu diễn dưới dạng
βi = β + Δzi + vi
Với zi là một tập các biến person – specific (đặc trưng ….) có thể quan sát
được và Δ là ma trận các tham số ước lượng được.
Phương pháp ước lượng mô hình có hệ số biến động ngẫu nhiên mà tác
giả Greene đã tiếp cận đó là phương pháp ước lượng mô phỏng hợp lý
tối đa hay phương pháp ước lượng Bayes.
4.2. Phương pháp ước lượng hợp lý tối đa
a) Phương pháp ước lượng hợp lý tối đa với mô hình hồi quy tuyến tính Xét mô hình
Yi = X’iβ + εi
Do giả thiết εi ~ N(0; σ2) nên (Yi – X’iβ) ~ N(0; σ2)
Với mẫu gồm n quan sát độc lập ta có hàm hợp lý
n (YX )/ (YX )
L (2 2) 2 e 2 2
Từ đó ta tìm được loga hàm hợp lý có dạng
ln L n ln 2 n ln 2 (Y X)/(Y X) 2 2 2 2
Điều kiện cần để lnL đạt cực đại là ln L 0 ln L và 0 2 Hay X/(YX) (Y X )/ (Y X) 0 0 2 và n 2 2 2 4
Giải hệ phương trình trên ta tìm được nghiệm ˆ ˆ
ML (X’X)-1X’Y = b và 2 e/e ML n Lưu ý: ˆ2 e/e
Với phương pháp OLS thì OLS
là ước lượng không chệch của n-k
2 do vậy ˆ2ML cho ước lượng chệch 2
b) Phương pháp ước lượng hợp lý tối đa với mô hình hồi quy phi tuyến
Giả sử mô hình tổng quát có dạng
g(Yi , θ) = h(Xi , β) + εi
hay εi = g(Yi , θ) – h(Xi , β)
Một trong những phương pháp tiếp cận để ước lượng các tham số, đó là tìm các tham số sao cho n
S(θ, β) = i 2 min i1
Ta giả thiết εi ~ N(0, σ2) và đặt i J g(Y i = J(Yi , θ) i , ) Yi Yi
Là Jacobian của phép biến đổi
Thì hàm mật độ xác suất của Yi là 2 2 1 i i f (Y 1 i ) i
e 2 2 = J(Yi , θ) e 22 Y 2 2 i
Từ đó ta tìm được loga hàm hợp lý có dạng n n 2i n 1 2
ln L [ln2 +ln ]+lnJ(Yi,) i1 i1 2 i=1 2 2 n n 1 n
[g(Yi,) h(Xi,)]2 [ln2+ln 2 2 ]+lnJ(Y i1 i , ) 2 2 i1 i=1
Để tìm ˆ2,ˆ,ˆ là các ước lượng của 2, , ta giải hệ phương trình sau ln L h(X = 1 n i , ) = 0 2 i i1 ln L n 1 Ji 1 n g(Yi,) = ( ) Ji 2 i = 0 i1 i1 ln L n 1 n 2 = 2 2 2 2 4 i = 0 i1
Với ˆ 2 được tính bởi
ˆ2 1 n [g(Y,ˆ)h(X ,ˆ 2 1 n 2 n i i )] e n i i1 i1
c) Ước lượng mô phỏng hợp lý tối đa
Trở lại với mô hình có hệ số biến động ngẫu nhiên, ta gọi hàm mật độ xác
suất của Yit là f(Yit│Xit , βi ) với véc tơ tham số βi là ngẫu nhiên theo các cá thể
βi = β + Δzi + vi
với β + Δzi là trung bình của phân phối, phụ thuộc thời gian, không thay
đổi theo các đặc trưng cá thể, là các tham số cần ước lượng. Biến động
ngẫu nhiên là vi do các cá thể không thuần nhất. Đây là véc tơ ngẫu nhiên
được giả thiết có trung bình bằng 0 và ma trận Covariance là Σ.
Hàm mật độ xác suất có điều kiện của các tham số ký hiệu là
g(βi│zi , β , Δ , Σ) = g(vi + β + Δzi , Σ)
Với T quan sát ứng với đơn vị chéo i thì hàm mật độ có điều kiện của Yi T là
f (Yi│Xi , βi ) = f (Yit X , it i ) t1
Hàm mật độ không điều kiện của Yi thu được bởi tích phân theo βi f (Y [
i│Xi , zi , β , Δ , Σ ) = E f (Yi│Xi , βi )] i = f (Y
i Xi , i )g(βi│zi , β , Δ , Σ)dβi i
Thực hiện phép biến đổi từ vi sang βi với n T
ln L ln f (Y v
it Xit , zi vi ) g(vi )dvi i1 i t1 n ln X v f (Yi
i , zi vi )g(vi )dvi i1 i
Kết quả cuối cùng của tích phân là một hàm của (β , Δ , Σ) và sau đó với
số liệu mẫu ta tìm ước lượng các tham số để hàm này đạt cực đại.
5. Cấu trúc hiệp phương sai của các sai số ngẫu nhiên trong mô hình số liệu mảng
5.1. Ma trận hiệp phương sai của các sai số ngẫu nhiên đối với mô
hình số liệu mảng
Xét mô hình hồi quy Yit=X’itβ+εit
Một điểm đặc trưng chủ yếu là ta giả thiết 1 2 n. Ứng với
đơn vị chéo thứ i (i = 1n) có T quan sát nên ta có thể viết mô hình dưới dạng
Yi = Xiβ + εi i = 1n Hay dưới dạng ma trận Y1 X1 1 Y 2 X 2 2 Yn Xn n Ta cần chỉ rõ E[εi│X] = 0
E[i /j │X] = ijΩij Với mỗi đơn vị chéo
Trường hợp với tất cả các đơn vị chéo và mỗi đơn vị chéo có T quan sát ta có
E[ε│X] = 0 Và 11 11 12 12 1n 1n
E[εε’│X] = Ω = 21 21 22 22 2n 2n n1 n1 n2 n2 nn nn
5.2. Ước lượng các tham số của mô hình bằng phương pháp bình
phương nhỏ nhất tổng quát (Generalized Least Squares – GLS)
Ta giả thiết không có hiện tượng tương quan giữa các chu kỳ chéo, điều
này ngụ ý rằng Ωij = I I I I 11 12 1n I I I 21 22 2n Ω = I I n 2 I n1 nn
Khi đó ước lượng của β bằng phương pháp bình phương nhỏ nhất tổng
quát dựa trên giả thiết đã biết ma trận Ω là
ˆ = [X’Ω-1X]-1[X’Ω-1Y]
Ma trận Ω có thể được viết dưới dạng Ω = ΣI 11 12 1 n Với ma trận Σ = 21 22 2n thì n1 n2 nn 11I 12I 1nI 21 22 2n I
Ω-1 = Σ-1I = I I
n1I n2I nnI
Với ij là ký hiệu phần tử thứ (i j) của ma trận Σ-1 . Khi đó ta có thể viết
lại công thức của ˆ như sau n n 1 n n
ˆ ijX/X ijX/Y i j i j i1 j1
i1 j1
Ta nhận thấy các phần tử ij và ij chưa biết và do vậy các ma trận Ω và Σ chưa biết. 1
Trong ứng dụng ta có thể lấy ˆ e/e , tuy nhiên trong một số ij T i j
nghiên cứu lại lấy ˆ 1 e/ ij ie j thay cho e T k ij . Ở đây /i là véc tơ 1
dòng T cột các phần dư của đơn vị chéo thứ i và ej là véc tơ T dòng 1
cột các phần dư của đơn vị chéo thứ j.
Với ma trận Σ ta có thể thay bằng ma trận ước lượng ˆ với 1 T / 1
ˆ e E’E T tet t1 T
Với e / là véc tơ 1 dòng n cột với n phần dư ứng với n đơn vị chéo tại t
thời điểm t . E là ma trận T dòng n cột các phần dư, lưu ý rằng ma trận
này có hạng không lớn hơn T. Trường hợp n T thì ma trận cấp n có
hạng bằng T nhỏ hơn n nên trường hợp này ma trận các phần dư là ma
trận suy biến và ước lượng các hệ số bằng phương pháp bình phương nhỏ
nhất tổng quát không thể tính toán được.
Phương pháp bình phương nhỏ nhất tổng quát có thể dùng để ước lượng
mô hình có phương sai của sai số thay đổi.
Một số nhận xét và kết luận
Những ưu điểm của số liệu mảng
+) Tăng độ chính xác của các ước lượng do số quan sát được điều tra theo
cả đơn vị chéo và theo thời gian
+) Nghiên cứu được sự khác biệt giữa các đơn vị chéo mà trước đây ta sử dụng biến giả.
+) Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến.
+) Chứa đựng nhiều thông tin hơn các loại số liệu khác
+) Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian
Những ưu điểm và hạn chế khi ước lượng mô hình với số liệu mảng
+) Với mô hình hồi quy gộp
- Ưu điểm: Các ước lượng nhận được bằng phương pháp POLS là
các ước lượng phù hợp và hiệu quả.
- Hạn chế : Mô hình dễ gặp phải hiện tượng tự tương quan (thể hiện
ở thống kê DW) vì mỗi đơn vị chéo lại được quan sát theo thời
gian. Với giả thiết tất cả các hệ số không đổi theo thời gian và đơn
vị chéo dường như quá chặt, và điều này khó xảy ra trong thực tế
+) Với mô hình tác động cố định Kỹ thuật biến giả
- Ưu điểm : Cho ước lượng hệ số chặn ứng với từng đơn vị chéo, hoặc
từng đơn vị chéo và thời gian. Các ước lượng nhận được là phù hợp và hiệu quả
- Hạn chế : Không hiệu quả khi số đơn vị chéo và thời gian khá lớn, vì
khi đó ta phải sử dụng quá nhiều biến giả, điều này làm giảm bậc tự
do của số liệu đi rất nhiều, nguy cơ đa cộng tuyến cao vì có quá nhiều
biến, giả thiết về tính chuẩn của các sai số ngẫu nhiên khó được thỏa mãn.
Kỹ thuật loại bỏ hệ số chặn αi ứng với mỗi đơn vị chéo i, tức là ta ước lượng mô hình (WE)
- Ưu điểm : Cho ước lượng phù hợp, hiệu quả và vững đối với các hệ số β
- Hạn chế : Không cho ước lượng các hệ số chặn αi.
+) Với mô hình tác động ngẫu nhiên
- Ưu điểm : Phù hợp với phương pháp ước lượng GLS
- Hạn chế : Khó kiểm định hiện tượng TTQ và PSSS thay đổi trong mô
hình này vì mô hình có chứa sai số ngẫu nhiên hỗn hợp.
Những vấn đề khác được đặt ra với mô hình số liệu mảng và tiếp tục
được nghiên cứu đó là :
+) Kiểm định giả thuyết với mô hình số liệu mảng
+) Phương sai của sai số thay đổi và tự tương quan trong mô hình sai số ghép
+) Số liệu mảng không cân xứng
+) Mô hình số liệu mảng với biến phụ thuộc trễ là biến giải thích
+) Mô hình phương trình đồng thời với số liệu mảng
+) Mô hình mà biến phụ thuộc là biến chất lượng (hay biến nhị phân) với số liệu mảng …….
Tài liệu tham khảo
Gujarati D. N – Basic Econometric (Fourth Edition)
William H. Greence – Econometric Analysis (Fifth Edition)
Wooldridge J. M. – Econometric Analysis of Cross Section and Panel data. ……
Document Outline
- TỔNG QUAN VỀ MÔ HÌNH VỚI SỐ LIỆU MẢNG
- 1.1.Số liệu mảng (Panel data)
- 1.2.Mô hình hồi quy với số liệu mảng
- 2.Ước lượng mô hình với số liệu mảng
- 2.1.Ước lượng mô hình hồi quy gộp
- 2.2.Ước lượng mô hình tác động cố định
- 0i0
- b = [X’MDX]-1[X’MDY]
- D’Y = D’Da + D’Xb
- (Y M Xb)/ (Y M Xb)
- nTnT
- i X)(Xi
- Swihin (X X )(X X )/ , Swithin (
- 2.3.Ước lượng mô hình tác động ngẫu nhiên
- Σ =
- 000
- 000
- 2e/e
- LM
- 3.Hiện tượng phương sai của sai số thay đổi và hiện
- 3.1.Hiện tượng phương sai sai số (PSSS) thay đổi
- T
- T
- 3.2.Hiện tượng tự tương quan (TTQ)
- 4.Mô hình với hệ số biến động ngẫu nhiên
- 4.1.Giới thiệu mô hình
- 000 ii
- 4.2.Phương pháp ước lượng hợp lý tối đa
- 22
- X/ (Y X ) 0
- 0
- 2e/e
- n - k
- min
- 1 [ln2 +ln
- ln L
- ln L
- ln L
- ˆ2 1
- [g(Y ,ˆ) h(X , ˆ
- ii)]
- ln
- 5.Cấu trúc hiệp phương sai của các sai số ngẫu nhiên
- 5.1.Ma trận hiệp phương sai của các sai số ngẫu nhiên
- 5.2.Ước lượng các tham số của mô hình bằng phương pháp
- ˆ
- T
- T
- Một số nhận xét và kết luận
- Tài liệu tham khảo