TỔNG QUAN VỀ HÌNH VỚI SỐ LIỆU MẢNG
1. hình với số liệu mảng
1.1. Số liệu mảng (Panel data)
số liệu được quan sát theo các đơn vị chéo mỗi đơn vị chéo lại
được quan sát theo thời gian.
Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo
từng biến
dụ : Giả sử ta số liệu của 5 tỉnh (Hải Dương, Thái Bình, Nam Định,
Nam, Ninh Bình) với các biến
Y = Tổng sản phẩm trong tỉnh
X
1
= Tổng g trị sản phẩm nông nghiệp của tỉnh
X
2
= Tổng giá trị sản phẩm công nghiệp của tỉnh
Với mỗi tỉnh ta quan sát 3 biến trên từ năm 2000 đến năm 2009 (số liệu
năm). Khi đó ta trình bày số liệu như sau
Tỉnh Hải Dương
Năm Y X
1
X
2
2000 Y
1
X
11
X
21
2001 Y
2
X
12
X
22
…………………………………….
2009 Y
10
X
1,10
X
2,10
…………………………………………………….
Tỉnh Ninh Bình
Năm Y X
1
X
2
2000 Y
1
X
11
X
21
2001 Y
2
X
12
X
22
………………………………………
2009 Y
10
X
1,10
X
2,10
Như vậy với số liệu được khảo sát ta
+) Số đơn vị chéo (số tỉnh được khảo sát) n = 5
+) Số đoạn thời gian quan sát các biến cho mỗi đơn vị chéo (số năm) là
T = 10
Khi đó ta số liệu mẫu kết hợp với nT 510 50 quan sát
1.2. hình hồi quy với số liệu mảng
Ý tưởng bản về hình với số liệu mảng
) Một số trường hợp thể xảy ra đối với các đơn vị chéo trong hình
số liệu mảng như sau
+) Các đơn vị chéo đặc thù giống nhau
+) Các đơn vị chéo đặc thù không giống nhau
+) Các đơn vị chéo sự khác biệt về tác động biên của các nhân tố ảnh
hưởng
+) Các đơn vị chéo vừa sự khác biệt về điều kiện đặc thù vừa khác biệt
về tác động biên của các nhân tố nh hưởng
+) Các đơn vị chéo không sự khác biệt về điều kiện đặc t tác
động biên của các nhân tố đang xét.
) hình với số liệu mảng hầu như ta không thực hiện hồi quy bằng
phương pháp OLS thông thường (như hình với số liệu chéo hay
hình với số liệu thời gian) các thể gần như không tính thuần nhất.
Tất nhiên trong trường hợp rất đặc biệt ta thể sử dụng OLS thông
thường để ước lượng các tham s của hình, đó trường hợp mô hình
hồi quy gộp được xét phần sau.
Ta xét hình c đơn vị chéo không sự khác biệt về tác động
biên của c nhân tố ảnh hưởng
Y
it
= X
it
β + Z’
i
α + ε
it
i 1; n t 1; T
Trong đó
Y biến phụ thuộc
X’ = (X
1
, X
2
,…, X
k
) vec các biến giải thích (các biến hồi quy)
ε
it
sai số ngẫu nhn
Giả thiết:
it
~ N(0;
2
)
β’ = (β
1
, β
2
,…, β
k
) vec hệ số (hay vec tham số) tương ứng với
các biến giải thích.
Z’
i
α gọi tác động thể, hay tính không thuần nhất giữa các đơn vị
chéo
Z
i
chứa hằng số (thường hiệu C hay INPT) ngoài ra các biến
đặc trưng cho đơn vị chéo thứ i (hay nhóm i). Các biến đặc trưng trong Z
i
thể quan sát được n (giới tính, dân tộc, vùng miền…) cũng
thể không quan sát được như (kỹ ng kỹ sảo, khả năng, tính đặc trưng
của hộ gia đình,yếu tố đặc thù của ngành ).
Tùy theo giả thiết (cùng với số liệu đã được khảo sát) ta xây dựng
hình sao cho phù hợp với một phương pháp ước lượng, rồi từ kết quả ước
lượng ta thể đưa ra các phân tích đánh giá phù hợp.
a) hình hồi quy gộp (Pooled Regression)
Nếu Z
i
chỉ chứa một s hạng hằng số tất cả các hệ số ( bao gồm hệ số
chặn tất cả các hệ số của các biến giải thích) đều không đổi theo thời
gian đơn vị chéo thì hình phù hợp hình hồi quy gộp dạng
sau
Y
it
= α + X
it
β + ε
it
(PR)
Trường hợp này trường hợp các đơn v chéo không sự khác biệt về
điều kiện đặc t và cũng không sự khác biệt về tác động biên của các
nhân tố ảnh hưởng (biến giải thích).
u
b) hình tác động cố định (Fixed Effects)
Nếu Z
i
không quan sát được nhưng tương quan với các biến giải thích X
thì ta không dùng phương pháp OLS thông thường để ước lượng các hệ
số β, bởi dùng phương pháp OLS trong trường hợp này (được xem như
hình bị bỏ sót biến) sẽ cho ước lượng chệch không hiệu quả.
Tuy vậy hình cho trường hợp này dạng
Y
it
= α
i
+ X
it
β + ε
it
(FE)
Với α
i
= Z’
i
α
-) Mỗi α
i
số hạng đặc trưng nhóm, không đổi theo thời gian đối với mỗi
đơn vị chéo trong hình (có thể hiểu hệ số chặn trong mỗi nhóm)
-) α
i
không ngẫu nhn
c) hình tác động ngẫu nhiên (Random Effects)
Nếu Z
i
không quan sát được nhưng không tương quan với tất cả các biến
giải thích X thì hình cho trường hợp này dạng
Y
it
= + u
i
) + X
it
β + ε
it
(RE)
Hay Y
it
= α + X
it
β + u
i
+ ε
it
Giả thiết u
i
~ N(0;
2
)
Nếu đặt w
it
= u
i
+ ε
it
thì w
it
được gọi sai số ngẫu nhiên hỗn hợp (hay
sai số ghép) hình RE còn gọi hình sai số hỗn hợp
(Error Component Model ECM ).
Trong hình RE chỉ một Intercept duy nhất cho tất cả các đơn vị
chéo hệ số của INPT α, phần khác biệt của các đơn vị chéo là u
i
d) hình với tất cả các hệ số ngẫu nhiên
Như trên đã nêu, trường hợp các đơn vị chéo vừa sự khác biệt về điều
kiện đặc thù vừa khác biệt về tác động biên của các nhân tố ảnh hưởng.
Hay nói khác đi hình tất cả các hệ số biến đổi theo thời gian đơn
vị chéo, khi đó hình cho trường hợp này dạng
Y
it
= X
it
(β + v
i
) + α + u
i
+
t
+ ε
it
Với v
i
một véc ngẫu nhiên
2. Ước lượng hình với số liệu mảng
2.1. Ước lượng hình hồi quy gp
Nếu hình hồi quy tất cả các h số đều không đổi theo thời gian
đơn vị chéo, đồng thời các giả thiết của phương pháp OLS được thỏa mãn
thì ta dùng phương pháp OLS thông thường để ước lượng các h s α
β của hình hồi quy với nT quan sát. Khi đó ta gọi dùng phương
pháp OLS cho hình hồi quy gộp (Pooled OLS POLS).
2.2. Ước lượng nh tác động cố định
hình tác động cố định giả thiết các hệ s chặn của mỗi đơn vị chéo
khác nhau còn hệ số của các biến giải thích (hệ số góc) không đổi theo
0 0 i
thời gian đơn v chéo. Mỗi α
i
được xem n một tham số cần ước
lượng.
a) Kỹ thuật dùng biến giả (Dummy)
Để đơn giản khi trình bày ta không viết chỉ số t ta để ý rằng với mỗi i
thì Y
i
X
i
T quan sát. Gọi i véc T dòng 1 cột, với tất cả các
phần t của véc i số 1 ε
i
liên kết với véc T 1 thành phần nhiễu
ngẫu nhiên. Khi đó hình Y
it
= α
i
+ X
it
β + ε
it
dạng
Y
i
= X
i
β + i α + ε
i
Y
1
X
1
i 0 0
1
1
Y
X
0 i 0
2
2
2
2
Y
n
X
n
n n
Hay Y = [ X d
1
d
2
d
n
]
+ ε
Với d
i
biến giả thứ i ( i 1; n ), d
i
nhận giá trị bằng 1 ( t 1; T ) với
những quan sát rơi vào đơn vị chéo thứ i bằng 0 với những quan sát rơi
vào đơn vị chéo khác i.
Đặt D = [d
1
d
2
d
n
] thì D ma trận nT n ta dạng ma trận của
hình
Y = + + ε
hình này gọi hình hồi quy tuyến tính s dụng biến giả,
với hình này thể áp dụng phương pháp OLS để ước lượng, vậy
hình này còn gọi Least Squares Dummy Variable Model LSDV.
Để tìm các ước lượng cho các tham số của hình LSDV ta một số
lưu ý
-) Trong hình k biến giải thích (X
1
, X
2
, . . . , X
k
) do vậy ma trận
X’ nT dòng k cột D n cột nên ma trận D nT dòng n cột
-) Gọi b’ = (b
1
, b
2
, . . . ,b
k
) ước lượng của β’ = (β
1
, β
2
, . . .
k
)
a’ = (a
1
, a
2
, . . . ,a
n
) ước lượng của α’ =
1
, α
2
, . . .
n
).
Khi đó ta công thức sau
b = [X’M
D
X]
-1
[X’M
D
Y]
Với M
D
= I D(D’D)
-1
D’ I là ma trận đơn vị cấp nT
Để tìm a ta thay b cho β trong hình nhân 2 vế với D’ ta có
D’Y = D’Da + D’Xb
hay a = [D’D]
-1
D’(Y Xb)
Ta ma trận Covariance của b
Cov(b) = s
2
[X’M
D
X]
-1
với s
2
ước lượng của
2
công thức nh s
2
là
n T
T
T
i i
1 R
2
T
T
T
i
(Y X
/
b a )
2
it it i
2
(Y M Xb)
/
(Y M Xb)
s
i1 t1
D D
nT n k nT n k
1
T
1
T
Đặt
X
i
X
it
,Y
i
t
1
Y
it
t
1
khi y các phần dư e
it
các ước
lượng điểm của ε
it
được tính bởi công thức
e
it
= Y
it
X
it
b a
i
= Y
it
X
it
b (Y
X
/
b) = (Y
it
Y ) (X
it
X )’b
i i
i i
với a
i
= Y X
/
b (i = 1; n )
Ma trận Covariance của a được tính bởi công thức
s
2
/
Cov(a) = X Cov(b)X
T
i i
thể sử dụng thống T (Student statistic) để kiểm định giả thuyết α
i
=
0 (i = 1; n ) đó cũng kiểm định hệ số chặn ứng với đơn vị chéo thứ i
ý nghĩa thống hay không ?. Tuy nhiên việc lựa chọn POLS hay LSDV
để ước lượng thì ta kiểm định cặp giả thuyết
H
0
: Dùng POLS để ước ợng
H
1
: Dùng LSDV để ước lượng
Tiêu chuẩn kiểm định được lựa chọn
R
2
R
2
LSDV P
ooled
F
n
1
~ F(n
1; nT
n
k)
LSDV
nT n k
Chú ý : Trong thực hành ta đặt (n 1) biến giả với
D
1
i
0
Nếu quan sát thuộc vào đơn vị chéo i
Nếu quan sát thuộc vào đơn vị chéo khác
Với
i 2; n
b) Ước lượng giữa các đơn vị chéo ước lượng trong mỗi đơn vị chéo
(Between and Within Estimator)
Viết lại hình tác động cố định
Y
it
= α
i
+ X
it
β + ε
it
(FE)
1
T
1
T
1
T
Đặt
X
i
X
it
, Y
i
t
1
Y
it
,
i
t1
it
t
1
ta hình sau
Y
i
i
+ X
/
(BE)
Ước lượng hình (BE) bằng phương pháp OLS gọi ước lượng giữa
các đơn vị chéo hay ước lượng giữa các nhóm.
i
X Y
X Y
S ,S , S
XX XY
XX XY
/
Nếu lấy (FE) trừ (BE) vế với vế ta nh
Y
it
Y
i
= (X
it
X
i
)’β + ε
it
i
(WE)
Ước lượng hình (WE) bằng phương pháp OLS gọi ước lượng
trong các đơn vị chéo.
Để tìm công thức cho véc b ước lượng của véc hệ số β trong các
hình (FE), (BE) (WE) ta thể sử dụng ma trận tổng bình phương
của các biến giải thích ma trận tích chéo giữa các biến giải thích
biến phụ thuộc.
1
n T
1
n T
Đặt X
X
it
, Y

Y
it
nT nT
i
1
t
1
i
1
t
1
Với hình (FE) ta hiệu
n T n T
total
X X

(X
it
X)(X
it
X)
/
, S
total

(X
it
X)(Y
it
Y )
i
1
t
1
i
1
t
1
Với hình (BE) ta hiệu
n T n T
between
X X
T (X
i
X)(X
i
X)
/
, S
between
T (X
i
X)(Y
i
Y )
i
1
t
1
i
1
t
1
Với hình (WE) ta hiệu
n T n T
S
wihin
(X
X )(X
X )
/
, S
within
(X
X )(Y
Y )
X X
i
1
t
1
it i it i
X Y
i
1
t
1
it i it i
Ta dễ kiểm tra lại được
S
total
S
within
S
between
, S
total
S
within
S
between
XX XX X X X Y XY X Y
Chú ý :
X
1 véc k dòng 1 cột
Y
1 điểm, tức
X (X
1
,X
2
, , X
k
), với số liệu mẫu cụ thể thì Y một giá tr
total between within
XX XX XX
S
total
,S
between
, S
within
các ma trận k dòng k cột
các véc k dòng 1 cột
XY XY XY
Do vậy các công thức của véc b ước lượng của véc β lần lượt đối
với các hình (FE), (WE) (BE)
b
total
= [S
total
]
-1
S
total
[S
within
+ S
between
]
-1
[S
within
+ S
between
]
b
between
b
within
XX XY XX XX XY XY
[S
between
]
-1
S
between
[S
within
]
-1
S
within
S
S
2
u
2
u
u
u
u
2
i
u
u
i
c) Ước lượng hình tác động cố định theo cả thời gian đơn vị chéo
Xét hình dạng
Y
it
= α
i
+
t
+ X
it
β + ε
it
Để ước lượng hình dạng này ta tiếp tục sử dụng kỹ thuật biến giả cho
cả đơn vị chéo thời gian. Tuy nhiên với s đơn vị chéo n số chu kỳ
thời gian T khá lớn t kỹ thuật biến giả không còn phù hợp, bởi số
biến giả cần sử dụng trong hình sẽ rất lớn dẫn đến giảm bậc tự do của
số liệu đi rất nhiều, nguy đa cộng tuyến cao quá nhiều biến giả,
giả thiết cổ điển về ε
it
~ N(0;
2
) không chắc thỏa mãn, công thức ước
lượng rất phức tạp kết quả ước lượng cũng không hiệu quả. Trong
trường hợp n T khá lớn thì ta thể áp dụng phương pháp ước lượng
phỏng hợp tối đa, hoặc phương pháp ước lượng Bayes.
2.3. Ước lượng nh tác động ngẫu nhiên
Ta viết lại hình tác động ngẫu nhn
Y
it
= + u
i
) + X
it
β + ε
it
(RE)
Hay Y
it
= α + X
it
β + u
i
+ ε
it
Với u
i
yếu tố ngẫu nhiên đặc trưng tương ứng với đơn vị chéo thứ i
u
i
không biến động theo thời gian trong đơn vị chéo thứ i. n ε
it
yếu
tố ngẫu nhiên biến động theo cả i t.
a) Một số giả thiết đối với hình tác động ngẫu nhiên
+) ε
it
~ N(0;
2
) , u
i
~ N(0;
2
)
u
+) E(ε
it
/ X) = E(u
i
/ X) = 0 , E(ε
2
it
/ X) =
2
, E(u
2
/ X) =
2
+) E(ε
it
u
j
/ X) = 0
i,t, j
, E(ε
it
ε
js
/ X) = 0 nếu t
s hoặc
i j
+) E(u
i
u
j
/ X) = 0 nếu i j .
Với w
it
= u
i
+ ε
it
w
i
= (w
i1
, w
i2
, . . . ,w
iT
) thì
+) E(
w
2
/ X) =
2
=
2
2
, E(w
it
w
is
/ X) =
2
với t
s
it u u
+) E(w
it
w
is
/ X) = 0 t,s nếu i j
Ứng với mỗi đơn vị chéo i ta T quan sát theo c biến
Đặt Σ = E(w
i
w
i
/ X) thì Σ là một ma trận T dòng T cột dạng như
sau
2
2
2
2
u u u
2
Σ =
2
2
2
2
2
2
2
2
I
T
+
2
i
T
u u u u
T
T
2
2
u
u
T
Bởi các quan sát chéo i j các quan sát độc lập nên ma trận hiệp
phương sai (Covariance) của các nhiễu ngẫu nhiên w
it
với đầy đủ cho nT
quan sát
0 0 0
0
0 0
= I
n
Σ
0 0 0
b) Ước lượng hình (RE)
Nếu dùng phương pháp OLS để ước lượng hình (RE) thì kết quả ước
lượng sẽ không hiệu quả do sai số ngẫu nhiên w
it
trong hình (RE) là
sai số ghép (có Var(w
it
) =
2
2
2
) nên phương pháp ước lượng
u
thích hợp nhất cho hình (RE) là phương pháp bình phương nhỏ nhất
tổng quát (Generalized Least Squares GLS).
Từ hình của (RE) Y
it
= α + X
it
β + u
i
+ ε
it
ta dẫn đến các hình
sau
Y + X
/
u
i i i i
Y Y (1 ) + (X X )
/
(1 )u
(*)
it i it i i it i
Với
1
, 0
1
Lưu ý: nếu
0 thì hình (*) trở thành hình (PR hồi quy gộp),
còn nếu 1 t hình (*) trở thành hình (WE Within Estimator)
Để ước lượng (*) bằng phương pháp OLS thì ta cần tìm
ˆ
ˆ
ước lượng điểm của ước lượng hình (*) khi thay bằng
ˆ
Y
ˆ
Y
(1
ˆ
)
+ (X
ˆ
X )
/
(1
ˆ
)u
ˆ
(**)
it i it i i it i
Để tìm
ˆ
ta tìm
ˆ
2
và
ˆ
2
.
Từ nh Y
it
Y
i
= (X
it
X
i
)’β + ε
it
i
(WE)
ta có
E
T
(
)
2
(T 1)
2
it i
t=1
Nếu β được quan sát thì một ước lượng không chệch của
2
dựa trên T
quan sát trong nhóm i là
(
it
i
)
ˆ
2
(i)
t
1
T 1
T
ˆ
2
ˆ
2
u
2
s
n T
u
ˆ
s
u
n T
(T e )
n
T
n
T
1
e
2
it
Bởi β được ước lượng từ hình (WE) ngụ ý ước lượng hình
LSDV phù hợp, lúc đó ta sử dụng các phần khi ước lượng hình
LSDV với bậc tự do hiệu chỉnh
T n T
(e e )
2
(e e )
2
it i
n
2 2 2
it i
s
e
(i)
t1
s
e
s
e
(i)
i1 t1
T k 1
n
i1
nT nk n
Bậc tự do hiệu chỉnh trong
2
thừa bởi vì giả thiết α β được ước
lượng lặp lại với mỗi i . Các tham số được ước lượng n trung bình Y
i
k hệ số góc. Bởi vậy ta đưa ra ước lượng không chệch của
2
là
(e
e )
2
ˆ
2
s
2
it i
i1 t1
LSDV
nT
k
n
Tiếp theo ta tìm ước lượng cho
2
. Trở lại hình (RE), nếu ta ng
phương pháp OLS gộp (Pooled OLS) thì các phần thu đưc
2
Pooled
ước lượng của Var(w
it
) =
2
2
với
u
2
e
/
e
2 2 2 2
s
Pooled
nT k 1
ˆ
ˆ
u
s
LSDV
ˆ
u
2 2
u Pooled
2
LSDV
Từ đó tìm được
ˆ
ˆ
ước lượng được (**) bằng phương
pháp OLS tìm được véc
ˆ
ước lượng của β.
) Kiểm định xem một hình phải hình tác động ngẫu nhiên
hay không ?
Breusch Pagan (1980) đã đề xuất kiểm định bằng nhân tử Lagrange
với hình tác động ngẫu nhiên dựa trên các phần khi ước lượng
hình bằng phương pháp OLS gộp.
Ta kiểm định cặp giả thuyết
H
0
:
2
0
H
0
:Corr(w
it
,w
is
) 0
H :
2
0
H
1
: Corr(w
it
,w
is
)
0
1 u
Tiêu chuẩn kiểm định
nT
2
(
e
it
)
n
2
nT
i
LM
i1 t1
1
i1
1
2(T 1)
e
2
2(T 1)
e
2
i1
it
t
1
i
1
t1
T
ˆ
2
ˆ
2
u
s
s
là
2
i
u
qs
u
Nếu giả thuyết H
0
đúng thì LM ~
2
(1)
) Kiểm định Hausman chỉ một hình hình tác động cố định
hay tác động ngẫu nhiên
+) Nếu ta giả thiết hình hình tác động cố định ước lượng
hình LSDV thì ta tìm được véc b ước lượng của véc β
+) Nếu ta giả thiết hình hình tác động ngẫu nhiên ước lượng
hình bằng phương pháp GLS thì ta tìm được véc tơ
ˆ
ước lượng
của véc β
Xét véc [b
ˆ
] ta Var[b
ˆ
] = Var[ b] + Var[
ˆ
] 2Cov[ b,
ˆ
]
Hausman đã chứng minh được
Cov[ (b
ˆ
),
ˆ
] = Cov[ b,
ˆ
] Var[
ˆ
] = 0
Đặt
H
ˆ
= Var[b
ˆ
] = Var[ b] Var[
ˆ
]
Ta cần kiểm định cặp giả thuyết
H
0
: hình phù hợp hình tác động ngẫu nhiên
H
1
: hình phù hợp hình tác động cố định
Wald đã chứng minh được, thống kê
2
= [b
ˆ
]’ H
ˆ
-1
[b
ˆ
] ~
2
(k 1)
Khi đó với số liệu mẫu cụ thể với mức ý nghĩa α cho trước mà
2
2
(k 1) thì ta bác bỏ H
0
3. Hiện tượng phương sai của sai số thay đổi hiện tượng tự tương
quan trong hình với số liệu mảng
3.1. Hiện tượng phương sai sai s (PSSS) thay đổi
+) Đối với hình tác động cố định t chỉ ε
it
các sai số ngẫu nhiên,
nên áp dụng phương pháp nào để ước lượng hình này đều thu được
các phần e
it
. Dựa vào các phần e
it
ta thể đưa ra các chuẩn đoán
về hiện tượng PSSS thay đổi tương tự như Chương VI trong bài giảng
KTL của tác giả PGS.TS Nguyễn Quang Dong.
+) Đối với hình tác động ngẫu nhiên thì ta sai số ngẫu nhiên hỗn
hợp w
it
= u
i
+ ε
it
với Var(w
it
) =
2
2
. Việc nghiên cứu cho việc chuẩn
u
đoán
2
thay đổi hay không (dựa trên số liệu) thật sự một việc
không dễ. Trong rất nhiều bài báo đã công bố [như của Mazodier
Trognon (1978), Baltagi Griffin (1988), đặc biệt công trình nghiên
cứu gần đây của Baltagi (1995)] đều có những đề xuất nghiên cứu
phương sai của u
i
thay đổi n thế nào ? Nhưng trong thực nghiệm thì đó
vấn đề không khắc phục được, tuy nhiên trong phân tích cuối cùng của
mình, một số tác giả đã lấy
u
ˆ
2
ước lượng cho
2
(với u
ˆ
ước lượng
i
của u
i
) nhưng ước lượng này dường như không chắc đúng.
e e
u
i
i
i
u
1
Đối với thành phần ε
it
thì Var(ε
it
) =
2
, do vậy để chuẩn đoán Var(ε
it
)
thay đổi hay không ? ta thể dựa vào các phần e
it
khi ước lượng
hình sử dụng biến giả (LSDV), bởi phương pháp này khử được tác
động thể đặc trưng u
i
ứng với mỗi đơn vị chéo i.
Như vậy ta các bước thực hành sau
Bước 1 : Sử dụng phương pháp OLS cho hình (RE) ta thu được phần
trong nhóm i
,
ols ols
i i
T
ước lượng của
2 2
i i
Bước 2 : Sử dụng phương pháp LSDV cho hình (RE) ta thu được ước
lượng của
2
là
ˆ
2
e
,lsdv
e
lsdv
i i
T
từ đó ta tìm được
2
n
e
, ols
e
ols
e
, lsdv
e
lsdv
1
n
2
ˆ
u
i i
i i
u
ˆ
i
n
i1
T T
n
i
1
Bước 3 : Sử dụng
ˆ
2
ˆ
2
để đưa ra chuẩn đoán về phương sai của sai
số trong hình tác động ngẫu nhiên thay đổi hay không ?
3.2. Hiện tượng tự tương quan (TTQ)
Để chuẩn đoán về hiện tượng t tương quan của hình với số liệu
mảng thì cũng tương tự như hình với số liệu chéo hình với s
liệu thời gian, ch yếu ta ng dựa vào thông tin từ các phần thu được
khi ước lượng hình. Cochrane Orcutt đã đưa ra phương pháp ước
lượng phù hợp cho hình hiện tượng tự tương quan bậc cao. Tuy
nhiên đây ta chỉ trình bày phương pháp ước lượng cho hình hiện
tượng TTQ bậc 1
Ta xét hiện tượng tự tương quan trong hình tác động ngẫu nhiên. Viết
lại hình (RE)
Y
it
= α + X
it
β + u
i
+ ε
it
Nếu ε
it
được đưa ra bởi quá trình AR(1) theo thời gian
ε
it
= ρε
i,t - 1
+ v
it
Khi đó ta ước lượng hình sai phân tổng quát dạng như sau
Y
it
ρ Y
i,t - 1
= α(1 ρ) + (X
it
ρ X
i,t 1
)’β + ε
it
ρε
i,t - 1
+ u
i
(1 ρ)
Y
it
ρ Y
i,t - 1
= α(1 ρ) + (X
it
ρ X
i,t 1
)’β + v
it
+ u
i
(1 ρ)
4. hình với hệ số biến động ngẫu nhn
4.1. Giới thiệu hình
Xét hình có dạng
Y
it
= X
it
β
i
+ α + u
i
+ ε
it
hay Y
it
= X
it
(β + v
i
) + α + u
i
+ ε
it
Với β
i
= β + v
i
v
i
một véc ngẫu nhiên thỏa mãn
n
E[v
i
/ X
i
] = 0
E[v
i
v
i
/ X
i
] = Γ
Chú ý : nếu hình chỉ hệ số chặn biến động ngẫu nhiên các hệ số
khác là không biến động ngẫu nhiên thì đó trường hợp của hình tác
động ngẫu nhiên ta đã xét trên.
Trường hợp tất cả các hệ số đều ngẫu nhiên nhưng ta giả thiết các tham
số không tự tương quan hay không tương quan chéo với nhau. Ta cần tìm
ma trận đường chéo hình khối Ω dạng
ii
0 0 0
Ω =
ii
0 0
0 0 0
ii
Với Ω
ii
= E[(Y
i
X
i
β)(Y
i
X
i
β)
/ X
i
] =
2
i
T
+ X
i
Γ X
i
Ta thể viết công thức ước lượng bằng phương pháp bình phương nhỏ
nhất tổng quát dạng sau
ˆ
= (X
Ω
-1
X)
-1
X
Ω
-1
Y =
n
W
i
b
i
i
1
1
Với W
(
2
(X
/
X )
1
)
1
(
2
(X
/
X )
1
)
1
i
1
i
i i
i
i i
Trong thực hành chúng ta cần đến một ước lượng của Γ, nhưng tìm được
một ước lượng của Γ một việc khó khăn.
Một số nghiên cứu gần đây về lĩnh vực này đã cho những kết quả rệt
[như McFadden Train (2000) hay Greene (2001)] các nghiên cứu đã
đưa ra cách tiếp cận ước lượng dựa theo phỏng, đồng thời mở rộng
sang lĩnh vực hình tham số biến động ngẫu nhiên, chẳng hạn như
hình nhiều mức hay hình hồi quy có thứ bậc. Nghĩa là các hệ số
biến động ngẫu nhiên β
i
được biểu diễn dưới dạng
β
i
= β + Δz
i
+ v
i
Với z
i
một tập các biến person specific (đặc trưng ….) thể quan sát
được và Δ ma trận các tham s ước lượng được.
Phương pháp ước lượng hình hệ số biến động ngẫu nhiên tác
giả Greene đã tiếp cận đó phương pháp ước lượng phỏng hợp
tối đa hay phương pháp ước lượng Bayes.
0
i
ML
i
4.2. Phương pháp ước lượng hợp tối đa
a) Phương pháp ước lượng hợp tối đa với hình hồi quy tuyến tính
Xét nh
Y
i
= X
i
β + ε
i
Do giả thiết ε
i
~ N(0; σ
2
) nên (Y
i
X
i
β) ~ N(0; σ
2
)
Với mẫu gồm n quan sát độc lập ta hàm hợp
L (2
2
)
n
(Y
X
)
/
(Y
X
)
2
e
2
2
Từ đó ta tìm được loga hàm hợp dạng
ln L
n
ln2
n
ln
2
2 2
Điều kiện cần để lnL đạt cực đại
(Y
X
)
/
(Y
X
)
2
2
Hay
lnL
0
ln L
0
2
X
/
(Y X)
0
2
và
n
2
2
(Y X)
/
(Y X)
0
2
4
Giải hệ phương trình trên ta tìm được nghiệm
Lưu ý:
ˆ
ML
(X
X)
-1
X
Y = b
2
e
/
e
ML
n
ˆ
2
e
/
e
Với phương pháp OLS t
OLS
n-k
ước lượng không chệch của
2
do vậy
ˆ
2
cho ước lượng chệch
2
b) Phương pháp ước lượng hợp tối đa với hình hồi quy phi tuyến
Giả sử hình tổng quát dạng
g(Y
i
, θ) = h(X
i
, β) + ε
i
hay ε
i
= g(Y
i
, θ) h(X
i
, β)
Một trong những phương pháp tiếp cận để ước lượng các tham số, đó
tìm các tham số sao cho
S(θ, β) =
n
2
min
i1
Ta giả thiết ε
i
~ N(0, σ
2
) đt
ˆ
i
Y
i
2
2
i
2
n
n
n
n
J
i
= J(Y
i
, θ)
Jacobian của phép biến đổi
Thì hàm mật độ xác suất của Y
i
f (Y
i
)
i
Y
i
2
i
e
2
2
=
J(Y
i
, θ)
1
2
i
e
2
2
Từ đó ta tìm được loga hàm hợp dạng
n
2
1
2
n
i
ln L
[ln2
+ln
]+
lnJ(Y
i
,
)
i
1
i
1
2
i=1
2
2
n
1
[ln2 +ln
2
n
2
]+
lnJ(Y
i
,)
[g(Y
i
,
)
h(X
i
,
)]
2
i1
2
2
i1 i=1
Để tìm
ˆ
2
,
ˆ
,
ˆ
các ước lượng của
2
,, ta giải h phương trình
sau
ln L
=
1
n
i
1
h(X
i
,)
= 0
ln L
n
1
J
i
1
n
g(Y
i
,)
=
i1
( )
2
i
= 0
i
i1
ln L
n
1
n
2
2
=
2
2
4
i
= 0
i1
Với
ˆ
2
được tính bởi
ˆ
2
1
n
[g(Y ,
ˆ
)
h(X ,
ˆ
2
1
n
2
i1
i i
)]
e
i
i1
c) Ước lượng phỏng hợp tối đa
Trở lại với hình hệ số biến động ngẫu nhiên, ta gọi hàm mật độ xác
suất của Y
it
f(Y
it
X
it
, β
i
) với véc tơ tham số β
i
ngẫu nhiên theo các
thể
β
i
= β + Δz
i
+ v
i
g(Y
i
,
)
Y
i
1
2
J
i
với β + Δz
i
trung bình của phân phối, phụ thuộc thời gian, không thay
đổi theo các đặc trưng thể, các tham số cần ước lượng. Biến động
ngẫu nhiên là v
i
do các thể không thuần nhất. Đây véc ngẫu nhiên
được giả thiết trung bình bằng 0 ma trận Covariance Σ.
Hàm mật độ xác suất điều kiện của các tham số hiệu
g(β
i
z
i
, β , Δ , Σ) = g(v
i
+ β + Δz
i
, Σ)
Với T quan sát ứng với đơn vị chéo i thì hàm mật độ điều kiện của Y
i
T
là f (Y
i
X
i
, β
i
) =
f (Y
it
t1
X
it
,
i
)
Hàm mật độ không điều kiện của Y
i
thu được bởi tích phân theo β
i
f (Y
i
X
i
, z
i
, β , Δ , Σ ) =
E [ f (Y
i
X
i
, β
i
)]
i
=
f (Y
i
X
i
,
i
)g(
β
i
z
i
, β , Δ , Σ)dβ
i
Thực hiện phép biến đổi từ v
i
sang β
i
với
n
T
ln L
ln
v
f (Y
it
X
it
,
z
i
v
i
)
g(v
i
)dv
i
i1
n
ln
i
1
v
i
t
1
f (Y
i
i
X
i
,
z
i
v
i
)g(v
i
)dv
i
Kết quả cuối cùng của tích phân một hàm của (β , Δ , Σ) sau đó với
số liệu mẫu ta tìm ước lượng c tham số để hàm này đạt cực đại.
5. Cấu trúc hiệp phương sai của các sai số ngẫu nhiên trong hình
số liệu mảng
5.1. Ma trận hiệp phương sai của các sai số ngẫu nhiên đối với
hình số liệu mảng
Xét hình hồi quy
Y
it
= X
it
β + ε
it
Một điểm đặc trưng chủ yếu ta giả thiết
1
2
n
. Ứng với
đơn vị chéo thứ i (i = 1n) T quan sát nên ta thể viết nh dưới
dạng
Y
i
= X
i
β + ε
i
i = 1
n
Hay dưới dạng ma trận
n1 n2 n2
nn nn
2
n
I
nn
I
Y
2
X
2
2
2n
nn
Y
n
X
n
n
i j
Ta cần chỉ
Y
1
X
1
1
E[ε
i
X] = 0 E[
/
X] =
ij
Ω
ij
Với mỗi đơn vị chéo
Trường hợp với tất cả các đơn vị chéo mỗi đơn vị chéo T quan sát
ta
E[εX] = 0
Và
11
11
12
12
1n
1n
E[εε
X] = Ω =
21 21 22 22 2
n
n
1
2n
5.2. Ước lượng các tham số của hình bằng phương pháp bình
phương nhỏ nhất tổng quát (Generalized Least Squares GLS)
Ta giả thiết không hiện tượng tương quan giữa các chu kỳ chéo, điều
này ngụ ý rằng Ω
ij
= I
11
I
12
I
1n
I
I I
Ω =
21 22
n1
I
n 2
I
Khi đó ước lượng của β bằng phương pháp bình phương nhỏ nhất tổng
quát dựa trên giả thiết đã biết ma trận Ω
ˆ
= [X
Ω
-1
X]
-1
[X
Ω
-1
Y]
Ma trận Ω thể được viết dưới dạng
Ω = ΣI
11
12
1n
Với ma trận Σ =
21 22
thì
n1 n2
1n
I
I
2n
nn
I
e e
e
i j
t
11
I
12
I
21 22
Ω
-1
= Σ
-1
I =
I
I
n1
I
n2
I
Với
ij
hiệu phần tử thứ (i j) của ma trận Σ
-1
. Khi đó ta thể viết
lại công thức của
ˆ
như sau
n n
1
n n
ˆ
ij
X
/
X
ij
X
/
Y
i1 j1
i j i j
i1 j1
Ta nhận thấy các phần tử
ij
ij
chưa biết do vậy các ma trận Ω
Σ chưa biết.
Trong ứng dụng ta thể lấy
ˆ
1
e
/
e , tuy nhiên trong một số
ij
T
i j
nghiên cứu lại lấy
ˆ
ij
1
T
k
/
thay cho
ij
. đây
/
véc 1
dòng T cột các phần của đơn vị chéo thứ i e
j
véc T dòng 1
cột các phần của đơn vị chéo thứ j.
Với ma trận Σ ta thể thay bằng ma trận ước lượng
ˆ
với
1
T
/
1
ˆ
T
e
t
e
t
t
1
E
E
T
Với
/
véc 1 dòng n cột với n phần ứng với n đơn vị chéo tại
thời điểm t . E ma trận T dòng n cột các phần dư, lưu ý rằng ma trận
này hạng không lớn hơn T. Trường hợp n T thì ma trận cấp n
hạng bằng T nhỏ hơn n nên trường hợp này ma trận các phần ma
trận suy biến ước lượng các hệ số bằng phương pháp bình phương nhỏ
nhất tổng quát không thể tính toán được.
Phương pháp bình phương nhỏ nhất tổng quát thể dùng để ước lượng
hình phương sai của sai s thay đổi.
e
i
Một số nhận xét kết luận
Những ưu điểm của số liệu mảng
+) Tăng độ chính xác của các ước lượng do số quan sát được điều tra theo
cả đơn vị chéo theo thời gian
+) Nghiên cứu được sự khác biệt giữa các đơn v chéo trước đây ta sử
dụng biến giả.
+) Nâng cao được số quan sát của mẫu phần nào khắc phục được hiện
tượng đa cộng tuyến.
+) Chứa đựng nhiều thông tin hơn các loại số liệu khác
+) Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian
Những ưu điểm hạn chế khi ước lượng hình với s liệu mảng
+) Với hình hồi quy gộp
- Ưu điểm: Các ước lượng nhận được bằng phương pháp POLS
các ước lượng phù hợp hiệu quả.
- Hạn chế : hình dễ gặp phải hiện tượng tự tương quan (thể hiện
thống kê DW) mỗi đơn vị chéo lại được quan sát theo thời
gian. Với giả thiết tất cả các hệ số không đổi theo thời gian đơn
vị chéo dường như quá chặt, điều này khó xảy ra trong thực tế
+) Với hình tác động cố định
Kỹ thuật biến giả
- Ưu điểm : Cho ước lượng hệ số chặn ứng với từng đơn vị chéo, hoặc
từng đơn vị chéo thời gian. Các ước lượng nhận được phù hợp
hiệu quả
- Hạn chế : Không hiệu quả khi số đơn vị chéo thời gian khá lớn,
khi đó ta phải sử dụng quá nhiều biến giả, điều này làm giảm bậc tự
do của số liệu đi rất nhiều, nguy đa cộng tuyến cao quá nhiều
biến, giả thiết về tính chuẩn của các sai số ngẫu nhiên k được thỏa
n.
Kỹ thuật loại bỏ hệ số chặn α
i
ứng với mỗi đơn vị chéo i, tức ta ước
lượng hình (WE)
- Ưu điểm : Cho ước lượng phù hợp, hiệu quả vững đối với các hệ
số β
- Hạn chế : Không cho ước lượng các hệ số chặn α
i
.
+) Với hình tác động ngẫu nhiên
- Ưu điểm : Phù hợp với phương pháp ước lượng GLS
- Hạn chế : Khó kiểm định hiện tượng TTQ PSSS thay đổi trong
hình này hình chứa sai số ngẫu nhiên hỗn hợp.
Những vấn đề khác được đặt ra với hình số liệu mảng tiếp tục
được nghiên cứu đó :
+) Kiểm định giả thuyết với hình số liệu mảng
+) Phương sai của sai số thay đổi tự tương quan trong hình sai số
ghép
+) Số liệu mảng không cân xứng
+) hình số liệu mảng với biến phụ thuộc trễ biến giải thích
+) hình phương trình đồng thời với số liệu mảng
+) hình biến phụ thuộc biến chất lượng (hay biến nhị phân) với
số liệu mảng
…….
Tài liệu tham khảo
Gujarati D. N Basic Econometric (Fourth Edition)
William H. Greence Econometric Analysis (Fifth Edition)
Wooldridge J. M. Econometric Analysis of Cross Section and Panel
data.
……

Preview text:

TỔNG QUAN VỀ MÔ HÌNH VỚI SỐ LIỆU MẢNG
1. Mô hình với số liệu mảng
1.1. Số liệu mảng (Panel data)
Là số liệu được quan sát theo các đơn vị chéo và mỗi đơn vị chéo lại
được quan sát theo thời gian.
Các đơn vị chéo được sắp xếp theo thời gian một cách riêng biệt theo từng biến
Ví dụ : Giả sử ta có số liệu của 5 tỉnh (Hải Dương, Thái Bình, Nam Định,
Hà Nam, Ninh Bình) với các biến
Y = Tổng sản phẩm trong tỉnh
X1 = Tổng giá trị sản phẩm nông nghiệp của tỉnh
X2 = Tổng giá trị sản phẩm công nghiệp của tỉnh
Với mỗi tỉnh ta quan sát 3 biến trên từ năm 2000 đến năm 2009 (số liệu
năm). Khi đó ta trình bày số liệu như sau Tỉnh Hải Dương Năm Y X1 X2 2000 Y1 X11 X21 2001 Y2 X12 X22
………………………………………. 2009 Y10 X1,10 X2,10
………………………………………………………. Tỉnh Ninh Bình Năm Y X1 X2 2000 Y1 X11 X21 2001 Y2 X12 X22
……………………………………… 2009 Y10 X1,10 X2,10
Như vậy với số liệu được khảo sát ta có
+) Số đơn vị chéo (số tỉnh được khảo sát) n = 5
+) Số đoạn thời gian quan sát các biến cho mỗi đơn vị chéo (số năm) là T = 10
Khi đó ta có số liệu mẫu kết hợp với nT  510  50 quan sát
1.2. Mô hình hồi quy với số liệu mảng
Ý tưởng cơ bản về mô hình với số liệu mảng
 ) Một số trường hợp có thể xảy ra đối với các đơn vị chéo trong mô hình số liệu mảng như sau
+) Các đơn vị chéo có đặc thù giống nhau
+) Các đơn vị chéo có đặc thù không giống nhau
+) Các đơn vị chéo có sự khác biệt về tác động biên của các nhân tố ảnh hưởng
+) Các đơn vị chéo vừa có sự khác biệt về điều kiện đặc thù vừa khác biệt
về tác động biên của các nhân tố ảnh hưởng
+) Các đơn vị chéo không có sự khác biệt về điều kiện đặc thù và tác
động biên của các nhân tố đang xét.
 ) Mô hình với số liệu mảng hầu như ta không thực hiện hồi quy bằng
phương pháp OLS thông thường (như mô hình với số liệu chéo hay mô
hình với số liệu thời gian) vì các cá thể gần như không có tính thuần nhất.
Tất nhiên trong trường hợp rất đặc biệt ta có thể sử dụng OLS thông
thường để ước lượng các tham số của mô hình, đó là trường hợp mô hình
hồi quy gộp được xét ở phần sau.
Ta xét mô hình mà các đơn vị chéo không có sự khác biệt về tác động
biên của các nhân tố ảnh hưởng
Yit = Xitβ + Z’iα + εit
i 1; n t 1; T Trong đó
Y là biến phụ thuộc
X’ = (X1, X2,…, Xk) là vec tơ các biến giải thích (các biến hồi quy)
εit là sai số ngẫu nhiên
Giả thiết: it ~ N(0; 2)
β’ = (β1, β2,…, βk) là vec tơ hệ số (hay vec tơ tham số) tương ứng với các biến giải thích.
Z’iα gọi là tác động cá thể, hay tính không thuần nhất giữa các đơn vị chéo
Zi có chứa hằng số (thường ký hiệu là C hay INPT) ngoài ra là các biến
đặc trưng cho đơn vị chéo thứ i (hay nhóm i). Các biến đặc trưng trong Zi
có thể quan sát được như (giới tính, dân tộc, vùng – miền…) và cũng có
thể không quan sát được như (kỹ năng – kỹ sảo, khả năng, tính đặc trưng
của hộ gia đình,yếu tố đặc thù của ngành … ).
Tùy theo giả thiết (cùng với số liệu đã được khảo sát) mà ta xây dựng mô
hình sao cho phù hợp với một phương pháp ước lượng, rồi từ kết quả ước
lượng ta có thể đưa ra các phân tích và đánh giá phù hợp.
a) Mô hình hồi quy gộp (Pooled Regression)
Nếu Zi chỉ chứa một số hạng hằng số và tất cả các hệ số ( bao gồm hệ số
chặn và tất cả các hệ số của các biến giải thích) đều không đổi theo thời
gian và đơn vị chéo thì mô hình phù hợp là mô hình hồi quy gộp có dạng sau
Yit = α + Xitβ + εit (PR)
Trường hợp này là trường hợp các đơn vị chéo không có sự khác biệt về
điều kiện đặc thù và cũng không có sự khác biệt về tác động biên của các
nhân tố ảnh hưởng (biến giải thích).
b) Mô hình tác động cố định (Fixed Effects)
Nếu Zi không quan sát được nhưng tương quan với các biến giải thích X
thì ta không dùng phương pháp OLS thông thường để ước lượng các hệ
số β, bởi vì dùng phương pháp OLS trong trường hợp này (được xem như
mô hình bị bỏ sót biến) sẽ cho ước lượng chệch và không hiệu quả.
Tuy vậy mô hình cho trường hợp này có dạng
Yit = αi + Xitβ + εit (FE)
Với αi = Z’iα
-) Mỗi αi là số hạng đặc trưng nhóm, không đổi theo thời gian đối với mỗi
đơn vị chéo trong mô hình (có thể hiểu là hệ số chặn trong mỗi nhóm) -) αi không ngẫu nhiên
c) Mô hình tác động ngẫu nhiên (Random Effects)
Nếu Zi không quan sát được nhưng không tương quan với tất cả các biến
giải thích X thì mô hình cho trường hợp này có dạng
Yit = (α + ui) + Xitβ + εit (RE)
Hay Yit = α + Xitβ + ui + εit
Giả thiết ui ~ N(0; 2 ) u
Nếu đặt wit = ui + εit thì wit được gọi là sai số ngẫu nhiên hỗn hợp (hay
sai số ghép) và mô hình RE còn gọi là mô hình có sai số hỗn hợp
(Error Component Model – ECM ).
Trong mô hình RE chỉ có một Intercept duy nhất cho tất cả các đơn vị
chéo mà hệ số của INPT là α, phần khác biệt của các đơn vị chéo là ui
d) Mô hình với tất cả các hệ số là ngẫu nhiên
Như trên đã nêu, trường hợp các đơn vị chéo vừa có sự khác biệt về điều
kiện đặc thù vừa khác biệt về tác động biên của các nhân tố ảnh hưởng.
Hay nói khác đi mô hình có tất cả các hệ số biến đổi theo thời gian và đơn
vị chéo, khi đó mô hình cho trường hợp này có dạng
Yit = Xit(β + vi) + α + ui + t + εit
Với vi là một véc tơ ngẫu nhiên
2. Ước lượng mô hình với số liệu mảng
2.1. Ước lượng mô hình hồi quy gộp
Nếu mô hình hồi quy có tất cả các hệ số đều không đổi theo thời gian và
đơn vị chéo, đồng thời các giả thiết của phương pháp OLS được thỏa mãn
thì ta dùng phương pháp OLS thông thường để ước lượng các hệ số α và
β của mô hình hồi quy với nT quan sát. Khi đó ta gọi là dùng phương
pháp OLS cho mô hình hồi quy gộp (Pooled OLS – POLS).
2.2. Ước lượng mô hình tác động cố định
Mô hình tác động cố định giả thiết các hệ số chặn của mỗi đơn vị chéo
khác nhau còn hệ số của các biến giải thích (hệ số góc) không đổi theo
thời gian và đơn vị chéo. Mỗi αi được xem như một tham số cần ước lượng.
a) Kỹ thuật dùng biến giả (Dummy)
Để đơn giản khi trình bày ta không viết chỉ số t mà ta để ý rằng với mỗi i
thì Yi và Xi có T quan sát. Gọi i là véc tơ T dòng  1 cột, với tất cả các
phần tử của véc tơ i là số 1 và εi liên kết với véc tơ T 1 thành phần nhiễu
ngẫu nhiên. Khi đó mô hình Yit = αi + Xitβ + εit có dạng
Yi = Xiβ + i α + εi Y1  X1  i 0 0 1  1  Y  X  0 i 0     Hoặc
 2    2       2    2                     
Yn Xn  0 0 i   
n   n    Hay
Y = [ X d1 d2
dn]  + ε  
Với di là biến giả thứ i ( i  1; n ), di nhận giá trị bằng 1 (  t  1; T ) với
những quan sát rơi vào đơn vị chéo thứ i và bằng 0 với những quan sát rơi
vào đơn vị chéo khác i. Đặt D = [d1 d2
dn] thì D là ma trận nTn và ta có dạng ma trận của mô hình là
Y = + Dα + ε
Mô hình này gọi là mô hình hồi quy tuyến tính có sử dụng biến giả, và
với mô hình này có thể áp dụng phương pháp OLS để ước lượng, vì vậy
mô hình này còn gọi là Least Squares Dummy Variable Model – LSDV.
Để tìm các ước lượng cho các tham số của mô hình LSDV ta có một số lưu ý
-) Trong mô hình có k biến giải thích (X1, X2, . . . , Xk) do vậy ma trận
X’ nT dòng  k cột và D n cột nên ma trận D nT dòng n cột
-) Gọi b’ = (b1, b2, . . . ,bk) là ước lượng của β’ = (β1, β2, . . . ,βk)
a’ = (a1, a2, . . . ,an) là ước lượng của α’ = (α1, α2, . . . ,αn).
Khi đó ta có công thức sau
b = [X’MDX]-1[X’MDY]
Với MD = I – D(D’D)-1D’ I là ma trận đơn vị cấp nT
Để tìm a ta thay b cho β trong mô hình và nhân 2 vế với D’ ta có D’Y = D’Da + D’Xb
hay a = [D’D]-1D’(Y Xb)
Ta có ma trận Covariance của b
Cov(b) = s2[X’MDX]-1
với s2 là ước lượng của  2 và công thức tính s2 là n T
(Y X/ b a )2 it it i 2 (Y  M Xb)/ (Y  M Xb)
s i1 t1  D D
nT n k
nT n k 1 T 1 T Đặt
X  X ,Y  Y khi ấy các phần dư e i T it i it it là các ước t1 T t1
lượng điểm của εit được tính bởi công thức
eit = Yit – X’itb – ai = Yit – X’itb – (Y  X/ b) = (Yit – Y ) – (Xit – X )’b i i i i
với ai = iY  X/i b (i = 1; n )
Ma trận Covariance của a được tính bởi công thức s2 / Cov(a) =  X Cov(b)X T i i
Có thể sử dụng thống kê T (Student statistic) để kiểm định giả thuyết αi =
0 (i = 1; n ) đó cũng là kiểm định hệ số chặn ứng với đơn vị chéo thứ i
ý nghĩa thống kê hay không ?. Tuy nhiên việc lựa chọn POLS hay LSDV
để ước lượng thì ta kiểm định cặp giả thuyết
H0 : Dùng POLS để ước lượng
H1 : Dùng LSDV để ước lượng
Tiêu chuẩn kiểm định được lựa chọn là R2  R2 LSDV Pooled F n 1
~ F(n 1; nT n k) 1 R2LSDV
nT n k
Chú ý : Trong thực hành ta đặt (n – 1) biến giả với 1 D
Nếu quan sát thuộc vào đơn vị chéo i i 0 
Nếu quan sát thuộc vào đơn vị chéo khác Với i  2; n
b) Ước lượng giữa các đơn vị chéo và ước lượng trong mỗi đơn vị chéo (Between and Within Estimator)
Viết lại mô hình tác động cố định
Yit = αi + Xitβ + εit (FE) 1 T 1 T 1 T
Đặt X  X ,Y  Y ,    ta có mô hình sau i T it i it i it t1 T t1 T t1 Y   i + X/   i i i (BE)
Ước lượng mô hình (BE) bằng phương pháp OLS gọi là ước lượng giữa
các đơn vị chéo hay ước lượng giữa các nhóm.
Nếu lấy (FE) trừ (BE) vế với vế ta có mô hình
Yit – Yi = (Xit – Xi )’β + εit – i (WE)
Ước lượng mô hình (WE) bằng phương pháp OLS gọi là ước lượng trong các đơn vị chéo.
Để tìm công thức cho véc tơ b là ước lượng của véc tơ hệ số β trong các
mô hình (FE), (BE) và (WE) ta có thể sử dụng ma trận tổng bình phương
của các biến giải thích và ma trận tích chéo giữa các biến giải thích và biến phụ thuộc. 1 n T 1 n T Đặt X 
X , Y  Y it it nT nT i1 t1 i1 t1
Với mô hình (FE) ta ký hiệu n T n T total
SXX  (X it  X)(X  X)/ , Stotal  (X Y ) it X Y it  X)(Yit i1 t1 i1 t1
Với mô hình (BE) ta ký hiệu n T n T between
SXX  T (Xi  X)(X  X)/, Sbetween  T (X Y ) i X Y i  X)(Yi i1 t1 i1 t1
Với mô hình (WE) ta ký hiệu n T n T
Swihin  (X  X )(X  X )/, Swithin  (X  X )(Y Y ) X X it i it i X Y it i it i i1 t1 i1 t1
Ta dễ kiểm tra lại được
Stotal  Swithin  Sbetween ,
Stotal  Swithin  Sbetween X X X X X X X Y X Y X Y Chú ý :
X là 1 véc tơ k dòng 1 cột và Y là 1 điểm, tức là /
X  (X1,X2, , Xk), với số liệu mẫu cụ thể thì Y là một giá trị Stotal ,Sbetween , Swithin XX XX XX
là các ma trận k dòng k cột
Stotal,Sbetween, Swithin là các véc tơ k dòng 1 cột XY XY XY
Do vậy các công thức của véc tơ b là ước lượng của véc tơ β lần lượt đối
với các mô hình (FE), (WE) và (BE) là btotal = [Stotal XX ]-1Stotal  XY [Swithin XX + Sbetween XX ]-1[Swithin XY + Sbetween XY ]
bbetween  [Sbetween]-1Sbetween XX XY
bwithin  [Swithin]-1Swithin XX XY
c) Ước lượng mô hình tác động cố định theo cả thời gian và đơn vị chéo Xét mô hình có dạng
Yit = αi +  t + Xitβ + εit
Để ước lượng mô hình dạng này ta tiếp tục sử dụng kỹ thuật biến giả cho
cả đơn vị chéo và thời gian. Tuy nhiên với số đơn vị chéo n và số chu kỳ
thời gian T khá lớn thì kỹ thuật biến giả không còn phù hợp, bởi vì số
biến giả cần sử dụng trong mô hình sẽ rất lớn dẫn đến giảm bậc tự do của
số liệu đi rất nhiều, nguy cơ đa cộng tuyến cao vì có quá nhiều biến giả,
giả thiết cổ điển về εit ~ N(0; 2 ) không chắc thỏa mãn, công thức ước 
lượng rất phức tạp và kết quả ước lượng cũng không hiệu quả. Trong
trường hợp n T khá lớn thì ta có thể áp dụng phương pháp ước lượng
mô phỏng hợp lý tối đa, hoặc phương pháp ước lượng Bayes.
2.3. Ước lượng mô hình tác động ngẫu nhiên
Ta viết lại mô hình tác động ngẫu nhiên
Yit = (α + ui) + Xitβ + εit (RE)
Hay Yit = α + Xitβ + ui + εit
Với ui là yếu tố ngẫu nhiên đặc trưng tương ứng với đơn vị chéo thứ i
ui không biến động theo thời gian trong đơn vị chéo thứ i. Còn εit là yếu
tố ngẫu nhiên biến động theo cả i t.
a) Một số giả thiết đối với mô hình tác động ngẫu nhiên
+) εit ~ N(0; 2 ) , ui ~ N(0; 2 )  u
+) E(εit / X) = E(ui / X) = 0 , E(ε2it / X) =  2 , E(u2i / X) =  2u
+) E(εit uj / X) = 0  i,t, j , E(εit εjs / X) = 0 nếu t s hoặc i j
+) E(ui uj / X) = 0 nếu i j .
Với wit = ui + εit và wi = (wi1, wi2, . . . ,wiT) thì
+) E( w2 / X) =  2 =  2  2 , E(wit wis / X) =  2 với t s it  u u
+) E(wit wis / X) = 0 t,s nếu i j
Ứng với mỗi đơn vị chéo i ta có T quan sát theo các biến
Đặt Σ = E(wiw’i / X) thì Σ là một ma trận T dòng T cột có dạng như sau 22  2  2  2  u   u u u    2  2  2  2  2 uu u u Σ =      2
IT + 2 iTi u T   2  2  2   2  2  u u uu
Bởi vì các quan sát chéo i j là các quan sát độc lập nên ma trận hiệp
phương sai (Covariance) của các nhiễu ngẫu nhiên wit với đầy đủ cho nT quan sát là  0 0 0  0  0 0      = I  n  Σ 0 0 0    
b) Ước lượng mô hình (RE)
Nếu dùng phương pháp OLS để ước lượng mô hình (RE) thì kết quả ước
lượng sẽ không hiệu quả do sai số ngẫu nhiên wit trong mô hình (RE) là
sai số ghép (có Var(wit) =  2  2   2 ) nên phương pháp ước lượng  u
thích hợp nhất cho mô hình (RE) là phương pháp bình phương nhỏ nhất
tổng quát (Generalized Least Squares – GLS). Từ mô hình của (RE)
Yit = α + Xitβ + ui + εit ta dẫn đến các mô hình sau
Y   + X/  u   i i i i
Y Y  (1 ) + (X  X )/   (1 )u     (*) it i it i i it i  Với  1  , 0  1  2  2  Tu
Lưu ý: nếu   0 thì mô hình (*) trở thành mô hình (PR – hồi quy gộp),
còn nếu  1 thì mô hình (*) trở thành mô hình (WE – Within Estimator) ˆ
Để ước lượng (*) bằng phương pháp OLS thì ta cần tìm ˆ   ˆ 2  ˆ 2  Tu
là ước lượng điểm của  và ước lượng mô hình (*) khi thay  bằng ˆ
Y ˆY  (1ˆ) + (X ˆX )/   (1ˆ)u   ˆ (**) it i it i i it i
Để tìm ˆ ta tìm ˆ2 và ˆ2 .  u
Từ mô hình Yit – Yi = (Xit – Xi )’β + εit – i (WE) ta có
E T (  )2  (T 1) 2  it i    t=1 
Nếu β được quan sát thì một ước lượng không chệch của  2 dựa trên T
quan sát trong nhóm i T (  )2 it i
ˆ2(i)  t1  T 1
Bởi vì β được ước lượng từ mô hình (WE) ngụ ý ước lượng mô hình
LSDV là phù hợp, lúc đó ta sử dụng các phần dư khi ước lượng mô hình
LSDV với bậc tự do hiệu chỉnh T n T (e e )2 (e e )2 it i  1 n it i 2 2 2
s (i)  t1  s
s (i)  i1 t1 e e e T k 1 n i1
nT nk n s 2
Bậc tự do hiệu chỉnh trong e là thừa bởi vì giả thiết α và β được ước
lượng lặp lại với mỗi i . Các tham số được ước lượng là n trung bình Yi
k hệ số góc. Bởi vậy ta đưa ra ước lượng không chệch của  2 là n T (e e )2 ˆ2  s2 it ii1 t1  LSDV
nT k n
Tiếp theo ta tìm ước lượng cho  2 . Trở lại mô hình (RE), nếu ta dùng u
phương pháp OLS gộp (Pooled OLS) thì các phần dư thu được 2 sPooled
ước lượng của Var(wit) =  2  2 với  u 2 e/e 2 2 2 2 s
 ˆ ˆ  s ˆ Pooled nT k 1  u LSDV u  ˆ2  s2 2 u Pooled  sLSDV ˆ
Từ đó tìm được ˆ 
và ước lượng được (**) bằng phương ˆ 2  ˆ 2  Tu
pháp OLS tìm được véc tơ ˆ là ước lượng của β.
 ) Kiểm định xem một mô hình có phải là mô hình tác động ngẫu nhiên hay không ?
Breusch Pagan (1980) đã đề xuất kiểm định bằng nhân tử Lagrange
với mô hình tác động ngẫu nhiên dựa trên các phần dư khi ước lượng mô
hình bằng phương pháp OLS gộp.
Ta kiểm định cặp giả thuyết H : ,w )  0 0 Corr(w u  : 2  0 H0 it is 
H : 2  0  H : Corr(w , w )  0 1 it is  1 u Tiêu chuẩn kiểm định n T  2  n 2 2  2  nT (e ) itnT (T ei)  LM   i1 t1 1   i1 1 n T n T
2(T 1)  e2  2(T 1)  it e2    iti1 t1 
 i1 t1 
Nếu giả thuyết H0 là đúng thì LM ~  2(1)
 ) Kiểm định Hausman chỉ rõ một mô hình là mô hình tác động cố định hay tác động ngẫu nhiên
+) Nếu ta giả thiết mô hình là mô hình tác động cố định và ước lượng mô
hình LSDV thì ta tìm được véc tơ b là ước lượng của véc tơ β
+) Nếu ta giả thiết mô hình là mô hình tác động ngẫu nhiên và ước lượng
mô hình bằng phương pháp GLS thì ta tìm được véc tơ ˆ là ước lượng của véc tơ β
Xét véc tơ [b – ˆ ] ta có Var[b – ˆ ] = Var[ b] + Var[ˆ ] – 2Cov[ b, ˆ ]
Hausman đã chứng minh được
Cov[ (b –ˆ ), ˆ ] = Cov[ b, ˆ ] – Var[ˆ ] = 0 Đặt
Hˆ = Var[b – ˆ ] = Var[ b] – Var[ˆ ]
Ta cần kiểm định cặp giả thuyết
H0 : Mô hình phù hợp là mô hình tác động ngẫu nhiên
H1 : Mô hình phù hợp là mô hình tác động cố định
Wald đã chứng minh được, thống kê
2 = [b – ˆ ]’ Hˆ-1[b – ˆ ] ~ 2(k 1)
Khi đó với số liệu mẫu cụ thể và với mức ý nghĩa α cho trước mà 2
  2 (k 1) thì ta bác bỏ H qs  0
3. Hiện tượng phương sai của sai số thay đổi và hiện tượng tự tương
quan trong mô hình với số liệu mảng
3.1. Hiện tượng phương sai sai số (PSSS) thay đổi
+) Đối với mô hình tác động cố định thì chỉ có εit là các sai số ngẫu nhiên,
nên dù áp dụng phương pháp nào để ước lượng mô hình này đều thu được
các phần dư eit. Dựa vào các phần dư eit ta có thể đưa ra các chuẩn đoán
về hiện tượng PSSS thay đổi tương tự như Chương VI trong bài giảng
KTL của tác giả PGS.TS Nguyễn Quang Dong.
+) Đối với mô hình tác động ngẫu nhiên thì ta có sai số ngẫu nhiên hỗn
hợp wit = ui + εit với Var(wit) =  2  2 . Việc nghiên cứu cho việc chuẩn  u
đoán  2 có thay đổi hay không (dựa trên số liệu) thật sự là một việc u
không dễ. Trong rất nhiều bài báo đã công bố [như của Mazodier
Trognon (1978), Baltagi Griffin (1988), đặc biệt công trình nghiên
cứu gần đây của Baltagi (1995)] đều có những đề xuất nghiên cứu
phương sai của ui thay đổi như thế nào ? Nhưng trong thực nghiệm thì đó
là vấn đề không khắc phục được, tuy nhiên trong phân tích cuối cùng của
mình, một số tác giả đã lấy uˆ 2 là ước lượng cho  2 (với uˆ là ước lượng i u i
của ui) nhưng ước lượng này dường như không chắc đúng.
Đối với thành phần εit thì Var(εit) =  2 , do vậy để chuẩn đoán Var(εit) có
thay đổi hay không ? ta có thể dựa vào các phần dư eit khi ước lượng mô
hình có sử dụng biến giả (LSDV), bởi vì phương pháp này khử được tác
động cá thể đặc trưng ui ứng với mỗi đơn vị chéo i.
Như vậy ta có các bước thực hành sau
Bước 1 : Sử dụng phương pháp OLS cho mô hình (RE) ta thu được phần e ,ol i es ols dư trong nhóm i là i là ước lượng của 2   i u2 T i
Bước 2 : Sử dụng phương pháp LSDV cho mô hình (RE) ta thu được ước e,lsdv elsdv
lượng của  2 là ˆ2 và từ đó ta tìm được ii  i i T n  2  1 e,olseols
e,lsdvelsdv  1 n 2 ˆ  u  i i  i i   uˆi n i1  T Tn i1
Bước 3 : Sử dụng ˆ 2 và ˆ2 để đưa ra chuẩn đoán về phương sai của sai i u
số trong mô hình tác động ngẫu nhiên có thay đổi hay không ?
3.2. Hiện tượng tự tương quan (TTQ)
Để chuẩn đoán về hiện tượng tự tương quan của mô hình với số liệu
mảng thì cũng tương tự như mô hình với số liệu chéo và mô hình với số
liệu thời gian, chủ yếu ta cũng dựa vào thông tin từ các phần dư thu được
khi ước lượng mô hình. Cochrane – Orcutt đã đưa ra phương pháp ước
lượng phù hợp cho mô hình có hiện tượng tự tương quan bậc cao. Tuy
nhiên ở đây ta chỉ trình bày phương pháp ước lượng cho mô hình có hiện tượng TTQ bậc 1
Ta xét hiện tượng tự tương quan trong mô hình tác động ngẫu nhiên. Viết lại mô hình (RE)
Yit = α + Xitβ + ui + εit
Nếu εit được đưa ra bởi quá trình AR(1) theo thời gian
εit = ρεi,t - 1 + vit
Khi đó ta ước lượng mô hình sai phân tổng quát có dạng như sau
Yit – ρ Yi,t - 1 = α(1 – ρ) + (Xit – ρ Xi,t – 1)’β + εit – ρεi,t - 1 + ui(1 – ρ)
Yit – ρ Yi,t - 1 = α(1 – ρ) + (Xit – ρ Xi,t – 1)’β + vit + ui(1 – ρ)
4. Mô hình với hệ số biến động ngẫu nhiên
4.1. Giới thiệu mô hình Xét mô hình có dạng
Yit = X’itβi + α + ui + εit hay
Yit = X’it(β + vi) + α + ui + εit
Với βi = β + vi và vi là một véc tơ ngẫu nhiên thỏa mãn
E[vi / Xi] = 0
E[vi v’i / Xi] = Γ
Chú ý : nếu mô hình chỉ có hệ số chặn biến động ngẫu nhiên và các hệ số
khác là không biến động ngẫu nhiên thì đó là trường hợp của mô hình tác
động ngẫu nhiên mà ta đã xét ở trên.
Trường hợp tất cả các hệ số đều ngẫu nhiên nhưng ta giả thiết các tham
số không tự tương quan hay không tương quan chéo với nhau. Ta cần tìm
ma trận đường chéo hình khối Ω có dạng  0 0 0  ii   0  0 0 Ω = ii      0 0 0   ii  Với
Ωii = E[(Yi – Xiβ)(Yi – Xiβ)/ Xi] =  2 iT + Xi Γ X’i
Ta có thể viết công thức ước lượng bằng phương pháp bình phương nhỏ
nhất tổng quát có dạng sau n
ˆ = (X’Ω-1X)-1X’Ω-1Y = W b i i i1 1 n Với
W  (  2(X/X )1)1 (  2(X/X )1)1 i  i i i  i1  i i i
Trong thực hành chúng ta cần đến một ước lượng của Γ, nhưng tìm được
một ước lượng của Γ là một việc khó khăn.
Một số nghiên cứu gần đây về lĩnh vực này đã cho những kết quả rõ rệt
[như McFadden Train (2000) hay Greene (2001)] các nghiên cứu đã
đưa ra cách tiếp cận ước lượng dựa theo mô phỏng, đồng thời mở rộng
sang lĩnh vực mô hình có tham số biến động ngẫu nhiên, chẳng hạn như
mô hình nhiều mức hay mô hình hồi quy có thứ bậc. Nghĩa là các hệ số
biến động ngẫu nhiên βi được biểu diễn dưới dạng
βi = β + Δzi + vi
Với zi là một tập các biến person – specific (đặc trưng ….) có thể quan sát
được và Δ là ma trận các tham số ước lượng được.
Phương pháp ước lượng mô hình có hệ số biến động ngẫu nhiên mà tác
giả Greene đã tiếp cận đó là phương pháp ước lượng mô phỏng hợp lý
tối đa hay phương pháp ước lượng Bayes.
4.2. Phương pháp ước lượng hợp lý tối đa
a) Phương pháp ước lượng hợp lý tối đa với mô hình hồi quy tuyến tính Xét mô hình
Yi = X’iβ + εi
Do giả thiết εi ~ N(0; σ2) nên (Yi – X’iβ) ~ N(0; σ2)
Với mẫu gồm n quan sát độc lập ta có hàm hợp lý
n  (YX )/ (YX )
L  (2 2) 2 e 2 2
Từ đó ta tìm được loga hàm hợp lý có dạng
ln L   n ln 2  n ln 2  (Y  X)/(Y  X) 2 2 2 2
Điều kiện cần để lnL đạt cực đại là ln L 0 ln L và  0   2 Hay X/(YX) (Y  X )/ (Y  X)  0  0  2 và  n  2 2 2 4
Giải hệ phương trình trên ta tìm được nghiệm ˆ ˆ 
ML (X’X)-1X’Y = b và 2 e/e ML n Lưu ý: ˆ2 e/e
Với phương pháp OLS thì   OLS
là ước lượng không chệch của n-k
 2 do vậy ˆ2ML cho ước lượng chệch  2
b) Phương pháp ước lượng hợp lý tối đa với mô hình hồi quy phi tuyến
Giả sử mô hình tổng quát có dạng
g(Yi , θ) = h(Xi , β) + εi
hay εi = g(Yi , θ) – h(Xi , β)
Một trong những phương pháp tiếp cận để ước lượng các tham số, đó là tìm các tham số sao cho n
S(θ, β) = i  2 min i1
Ta giả thiết εi ~ N(0, σ2) và đặt i J g(Y i = J(Yi , θ)   i , ) Yi Yi
Là Jacobian của phép biến đổi
Thì hàm mật độ xác suất của Yi là  2  2 1  ii f (Y 1 i )  i
e 2 2 = J(Yi , θ) e 22 Y  2  2 i
Từ đó ta tìm được loga hàm hợp lý có dạng n n  2i n 1 2
ln L   [ln2 +ln ]+lnJ(Yi,)  i1 i1 2 i=1 2 2 n n 1 n
[g(Yi,)  h(Xi,)]2   [ln2+ln 2 2 ]+lnJ(Y i1 i , )  2 2 i1 i=1
Để tìm ˆ2,ˆ,ˆ là các ước lượng của  2, , ta giải hệ phương trình sau  ln Lh(X = 1 n  i ,  ) = 0   2 i i1   ln L n 1 Ji 1 ng(Yi,) =  ( )    Ji  2 i = 0 i1   i1 ln L n 1 n 2 =     2 2 2 2 4 i = 0 i1
Với ˆ 2 được tính bởi
ˆ2  1 n [g(Y,ˆ)h(X ,ˆ 2  1 n 2 n  i i )] e n i i1 i1
c) Ước lượng mô phỏng hợp lý tối đa
Trở lại với mô hình có hệ số biến động ngẫu nhiên, ta gọi hàm mật độ xác
suất của Yit là f(Yit│Xit , βi ) với véc tơ tham số βi là ngẫu nhiên theo các cá thể
βi = β + Δzi + vi
với β + Δzi là trung bình của phân phối, phụ thuộc thời gian, không thay
đổi theo các đặc trưng cá thể, là các tham số cần ước lượng. Biến động
ngẫu nhiên là vi do các cá thể không thuần nhất. Đây là véc tơ ngẫu nhiên
được giả thiết có trung bình bằng 0 và ma trận Covariance là Σ.
Hàm mật độ xác suất có điều kiện của các tham số ký hiệu là
g(βi│zi , β , Δ , Σ) = g(vi + β + Δzi , Σ)
Với T quan sát ứng với đơn vị chéo i thì hàm mật độ có điều kiện của Yi T
f (Yi│Xi , βi ) =  f (Yit X , it i ) t1
Hàm mật độ không điều kiện của Yi thu được bởi tích phân theo βi f (Y [
i│Xi , zi , β , Δ , Σ ) = Ef (Yi│Xi , βi )] i =  f (Y 
i Xi , i )g(βi│zi , β , Δ , Σ)dβi i
Thực hiện phép biến đổi từ vi sang βi với n   T  
ln L  ln   f (Y v
it Xit ,   zi  vi ) g(vi )dvi  i1  i t1   n  ln X  v f (Yi
i ,   zi  vi )g(vi )dvi i1 i
Kết quả cuối cùng của tích phân là một hàm của (β , Δ , Σ) và sau đó với
số liệu mẫu ta tìm ước lượng các tham số để hàm này đạt cực đại.
5. Cấu trúc hiệp phương sai của các sai số ngẫu nhiên trong mô hình số liệu mảng
5.1. Ma trận hiệp phương sai của các sai số ngẫu nhiên đối với mô
hình số liệu mảng
Xét mô hình hồi quy Yit=X’itβ+εit
Một điểm đặc trưng chủ yếu là ta giả thiết 1  2   n. Ứng với
đơn vị chéo thứ i (i = 1n) có T quan sát nên ta có thể viết mô hình dưới dạng
Yi = Xiβ + εi i = 1n Hay dưới dạng ma trận Y1  X1  1        Y  2 X  2 2                    Yn Xn  n  Ta cần chỉ rõ E[εi│X] = 0
E[i /j X] = ijΩij Với mỗi đơn vị chéo
Trường hợp với tất cả các đơn vị chéo và mỗi đơn vị chéo có T quan sát ta có
E[εX] = 0 Và        11 11 12 12 1n 1n       
E[εε’X] = Ω =  21 21 22 22 2n 2n             n1 n1 n2 n2 nn nn
5.2. Ước lượng các tham số của mô hình bằng phương pháp bình
phương nhỏ nhất tổng quát (Generalized Least Squares – GLS)
Ta giả thiết không có hiện tượng tương quan giữa các chu kỳ chéo, điều
này ngụ ý rằng Ωij = I  I  I  I 11 12 1n  I  I  I  21 22 2n Ω =      I  I   n 2 I  n1 nn
Khi đó ước lượng của β bằng phương pháp bình phương nhỏ nhất tổng
quát dựa trên giả thiết đã biết ma trận Ω
ˆ = [X’Ω-1X]-1[X’Ω-1Y]
Ma trận Ω có thể được viết dưới dạng Ω = ΣI    11 12 1  n     Với ma trận Σ =  21 22 2n   thì        n1 n2 nn  11I 12I  1nI 21 22   2n I 
Ω-1 = Σ-1I =  I  I    
n1I  n2I  nnI
Với  ij là ký hiệu phần tử thứ (i j) của ma trận Σ-1 . Khi đó ta có thể viết
lại công thức của ˆ như sau  n n 1  n n
ˆ   ijX/X   ijX/Y  i j i j     i1 j1
 i1 j1 
Ta nhận thấy các phần tử ij và  ij chưa biết và do vậy các ma trận Ω Σ chưa biết. 1
Trong ứng dụng ta có thể lấy ˆ  e/e , tuy nhiên trong một số ij T i j
nghiên cứu lại lấy ˆ  1 e/ ij ie j thay cho  e T k ij . Ở đây /i là véc tơ 1
dòng T cột các phần dư của đơn vị chéo thứ i ej là véc tơ T dòng 1
cột các phần dư của đơn vị chéo thứ j.
Với ma trận Σ ta có thể thay bằng ma trận ước lượng ˆ với 1 T / 1
ˆ  e  E’E T tet t1 T
Với e / là véc tơ 1 dòng n cột với n phần dư ứng với n đơn vị chéo tại t
thời điểm t . E là ma trận T dòng  n cột các phần dư, lưu ý rằng ma trận
này có hạng không lớn hơn T. Trường hợp n T thì ma trận cấp n
hạng bằng T nhỏ hơn n nên trường hợp này ma trận các phần dư là ma
trận suy biến và ước lượng các hệ số bằng phương pháp bình phương nhỏ
nhất tổng quát không thể tính toán được.
Phương pháp bình phương nhỏ nhất tổng quát có thể dùng để ước lượng
mô hình có phương sai của sai số thay đổi.
Một số nhận xét và kết luận
 Những ưu điểm của số liệu mảng
+) Tăng độ chính xác của các ước lượng do số quan sát được điều tra theo
cả đơn vị chéo và theo thời gian
+) Nghiên cứu được sự khác biệt giữa các đơn vị chéo mà trước đây ta sử dụng biến giả.
+) Nâng cao được số quan sát của mẫu và phần nào khắc phục được hiện tượng đa cộng tuyến.
+) Chứa đựng nhiều thông tin hơn các loại số liệu khác
+) Nghiên cứu được động thái thay đổi của các đơn vị chéo theo thời gian
 Những ưu điểm và hạn chế khi ước lượng mô hình với số liệu mảng
+) Với mô hình hồi quy gộp
- Ưu điểm: Các ước lượng nhận được bằng phương pháp POLS là
các ước lượng phù hợp và hiệu quả.
- Hạn chế : Mô hình dễ gặp phải hiện tượng tự tương quan (thể hiện
ở thống kê DW) vì mỗi đơn vị chéo lại được quan sát theo thời
gian. Với giả thiết tất cả các hệ số không đổi theo thời gian và đơn
vị chéo dường như quá chặt, và điều này khó xảy ra trong thực tế
+) Với mô hình tác động cố định Kỹ thuật biến giả
- Ưu điểm : Cho ước lượng hệ số chặn ứng với từng đơn vị chéo, hoặc
từng đơn vị chéo và thời gian. Các ước lượng nhận được là phù hợp và hiệu quả
- Hạn chế : Không hiệu quả khi số đơn vị chéo và thời gian khá lớn, vì
khi đó ta phải sử dụng quá nhiều biến giả, điều này làm giảm bậc tự
do của số liệu đi rất nhiều, nguy cơ đa cộng tuyến cao vì có quá nhiều
biến, giả thiết về tính chuẩn của các sai số ngẫu nhiên khó được thỏa mãn.
Kỹ thuật loại bỏ hệ số chặn αi ứng với mỗi đơn vị chéo i, tức là ta ước lượng mô hình (WE)
- Ưu điểm : Cho ước lượng phù hợp, hiệu quả và vững đối với các hệ số β
- Hạn chế : Không cho ước lượng các hệ số chặn αi.
+) Với mô hình tác động ngẫu nhiên
- Ưu điểm : Phù hợp với phương pháp ước lượng GLS
- Hạn chế : Khó kiểm định hiện tượng TTQ và PSSS thay đổi trong mô
hình này vì mô hình có chứa sai số ngẫu nhiên hỗn hợp.
 Những vấn đề khác được đặt ra với mô hình số liệu mảng và tiếp tục
được nghiên cứu đó là :
+) Kiểm định giả thuyết với mô hình số liệu mảng
+) Phương sai của sai số thay đổi và tự tương quan trong mô hình sai số ghép
+) Số liệu mảng không cân xứng
+) Mô hình số liệu mảng với biến phụ thuộc trễ là biến giải thích
+) Mô hình phương trình đồng thời với số liệu mảng
+) Mô hình mà biến phụ thuộc là biến chất lượng (hay biến nhị phân) với số liệu mảng …….
Tài liệu tham khảo
Gujarati D. N – Basic Econometric (Fourth Edition)
William H. Greence – Econometric Analysis (Fifth Edition)
Wooldridge J. M. – Econometric Analysis of Cross Section and Panel data. ……
Document Outline

  • TỔNG QUAN VỀ MÔ HÌNH VỚI SỐ LIỆU MẢNG
  • 1.1.Số liệu mảng (Panel data)
  • 1.2.Mô hình hồi quy với số liệu mảng
  • 2.Ước lượng mô hình với số liệu mảng
  • 2.1.Ước lượng mô hình hồi quy gộp
  • 2.2.Ước lượng mô hình tác động cố định
  • 0i0 
    • b = [X’MDX]-1[X’MDY]
    • D’Y = D’Da + D’Xb
  • (Y  M Xb)/ (Y  M Xb)
    • nTnT
  • i  X)(Xi
  • Swihin  (X  X )(X  X )/ , Swithin  (
    • 2.3.Ước lượng mô hình tác động ngẫu nhiên
    • Σ = 
  • 000 
  • 000 
  • 2e/e
  • LM 
    • 3.Hiện tượng phương sai của sai số thay đổi và hiện
    • 3.1.Hiện tượng phương sai sai số (PSSS) thay đổi
    • T
    • T
      • 3.2.Hiện tượng tự tương quan (TTQ)
      • 4.Mô hình với hệ số biến động ngẫu nhiên
      • 4.1.Giới thiệu mô hình
    • 000 ii 
      • 4.2.Phương pháp ước lượng hợp lý tối đa
    • 22
  • X/ (Y  X )  0
    • 0
  • 2e/e
  • n - k
  • min
    •  1 [ln2 +ln
    •  ln L
    •  ln L
    •  ln L
    • ˆ2  1
    • [g(Y ,ˆ)  h(X , ˆ
    • ii)]
    •  ln
      • 5.Cấu trúc hiệp phương sai của các sai số ngẫu nhiên
      • 5.1.Ma trận hiệp phương sai của các sai số ngẫu nhiên
      • 5.2.Ước lượng các tham số của mô hình bằng phương pháp
    • ˆ 
      • T
      • T
        • Một số nhận xét và kết luận
        • Tài liệu tham khảo