Bài giảng Kinh tế lượng | NEU

Tài liệu gồm 122 trang, có 5 chương chính giúp bạn củng cố kiến thức, ôn tập và đạt kết quả cao trong kỳ thi sắp tới. Mời bạn đọc đón xem!

PNG ĐI H C KINH TÉ Q U C DÂN
KHOA TOÁN KINH TÊ
B MÔN ĐIÈU KHIÉN HC KINH TÉ
NGUYN QUANG DONG
BÀI GING
KINH T LƯNG
í QTKD
NHÀ XUT BN ĐI HC KINH T QUỐC DÂN
PGS. N GUYÊN QUANG DONG
BÀI GIẢNG
KINH TÉ NG
N H À XU T BN Đ I H C K IN H T Q U C DÂN
M ĐU
L KINH T LƯNG LÀ Gì?
Cho đến nay chua có mt câu tr lời dược mi người cùng chp nhn cho câu
hỏi y .Thut ng tiếng Anh "Econometrics" được ghép t hai gc từ "Econo"
nghĩa "Kinh tế và Metrics có nghĩa o lưỉmg". Thut ng này do giáo sư
kinh tế hc nời Na-Uy là A.K.Ragnar Frisch- giải thưởng Nobel v kinh tế học
(1969) cùng vi J.Tinbergen, s dng lần đư tiên vào khong năm 1930.
Kinh tế ng có nghĩa Ịà đo lường kinh tế. Mc dù đo lưòmg kinh tế mt nội
dũng quan trng ca kinh tế lượng nhưng phạm vi ca kinh tế lượng rng n
nhiều.Điều đó đưc th hin thông qua mt sô' định nghĩa sau đây:
- Kinh tế ng bao gm viộc áp dụng thng kê toán cho các s liu kinh tế đ
cùng c v mt thc nghim cho c mô hình do các nhà kinh tế toán đ xut
để m ra i giải bng s.a)
- Kinh tế ng có th được định nghĩa như là sự [fhân ch vế ng các vấn đ
kinh tế hiện thỉri da trên việc vận dng đng thời thuyết và thc tế được tỉic
hiện bằng các phương pháp suy đoán thích hợp.<2)
- Kinh tế ng có th được xem như là mt khoa học xã hội trong đó các ng
cụ ca thuyết kinh tế, toán hc và suy đoán thng kê được p dng đ phân ch
cẳc vấn đkinh tế.(3)
- Kinh tế ng quan tâm đến việc xác định vthực nghim các lut kinh tế.<4)
TTiut ngữ "Econometrics"" được dịch sang tiếng Vit là "Kinh tế ng học''
hoặc "Đo ng kinh tế, ngn gn n "Kinh trc". Có nhng đnh nghĩa, quan
niệm khác nhau v kinh tế ng bt nguồn t thực tế: các nhà kinh tế ng trước
hết phần lớn h là các nhà kinh tế có kh năng sử dng thuyết kinh tế đ cài
tiến việc phân tích thc nghim vc vấn dề mà h đt ra. H đng thi là các
nhà kinh tế toán- m hình ho thuyết kinh tế theo cách m cho thuyết kinh
tế phù hợp với việc kim đnh gi thiết thng kê. H cũng là nhng nhà kế toán - '
tìm kiếm, thu thp các s liu kinh tế, gn các biến kinh tế thuyết với các biến
quan sát được. H cũng là các nhà thng kê thực hành- s dng k thut nh toán
đ ưc lượng các quan h kinh tế hoc d báo các hiện ng kinh tế.
(1) Gerhard Tinlner, Methodology of Mathematical Economics and
Econometrics, The University of Chicago Press,Chicago, 1968, p.74 .
(2) P-ASammuelson, T.C.Koopmans, and jp.N.Stone, " Report of the Evaluative
Committee for Economelrica", Econome trica.vol 22, no. 2, April 1954,pp. 141-146.
(3) ArthurS.Goldherger, Economet lie Theoiy, John Wiley & Sons, Inc.
(4) HJheil, Principles of Econometrics, John Wiley & Sons, Inc.
5
M ĐU
L KINH T LƯNG LÀ GÌ?
Cho đến nay chưa có mt u tr lòi được mi người cùng chp nhậii cho câu
i này .Thut ng tiếng Anh "Econometrics" được ghép t hai gc từ "Econo"
nghĩa "Kinh tế và Metrics c nghĩa o lường". Thut ng này do giáo
kinh tế hc ngưi Na-Uy là A.K,Ragnar Frisch- giải thưng Nobel v kinh tế học
(1969) cùng vi J.Tinbergen, s dng lần đư tiên vào khong năm 1930.
. Kinh tế ng có nghĩa Ịà do lường kinh tế. Mc dù đo lường kinh tế mt nội
dũng quan trng cùa kinh tế lượng nhưng phạm vi ca kinh tế lượng rng hớn
nhiềuiều đó đưc th hin thông qua mt sô' định nghĩa sau đây:
- Kinh tế ng bao gm việc áp dụng thng kê toán cho các s liu kinh tế đ
cùng c v mt thc nghiộm cho c mô hình do các nhà kinh tế toán đ xuất và
để tìm ra lời gii bng s.(1>
- Kinh tế ng có th được định nghĩa như là sự Íhân ch v ng các vấn đ
kinh tế hiện thi da trên việc vn dng đng thời thuyết và thc tế đưc thực
hiện bng các phương pháp suy đoán thích hợp.c)
- Kinh tế ng có th đưc xem như là mt khoa học xã hội trong đó các ng
cca thuyết kinh tế, toán hc suy đoán thng kê được áp dng đ phân ch
cẩc vấn đkinh tế.<3)
- Kinh tế ng quan tâm đến việc c định về thực nghim các luât kinh tế.(4)
Thuật ngữ "Econometrics"" ợc dịch sang tiếng Vit Kinh tế lượng học''
hoặc o ỉmg kinh tế", ngn gọn hơn là "Kinh trăc". Có nhũng đnh nghĩa, quan
niệm khác nhau v kinh tế ng bt ngun t thực tế: các nhà kinh tế ng trước
hết phần lớn h là các nhà kinh tế có kh ng s dng thuyết kinh tế đ i
tiến việc phân tích thc nghim vc vấn đề mà h đt ra. H đng thi là các
nhà kinh tế toán- mô hình hoá thuyết kinh tế theo cách m cho thuyết kinh
tế phù hợp với vic kim đnh gi thiết thng kê. H cũng là nhng nhà kế toán - '
tìm kiếm, thu thp cc s liu kinh tế, gn cac biến kinh tế thuyết với các biến
quan st được. H cũng là các nhà thng kê thực hành- s dng k thut nh toán
đ uc lượng các quan h kinh tế hoc d báo các hiện ng kinh tế.
(1) Gerhard Tintner, Methodology of Mathematical Economics and
Econometrics, The University of Chicago Press,Chicago, 1968, p.74 .
(2) PASammuelson, T.C.Koopmans, and J^i.N.Slone, " Report of the Evaluative
Committee for Econometrica", Econome tricaỳol 22, no. 2, April 1954,pp. 141-146.
(3) ArthurS.Goldherger, Economet ric Theory. John Wiley & Sons, Inc.
(4) H.Theil, Principles of Econometrics, John Wiley & Sons, Inc.
5
Tn các nh vực khác nhau, người ta các quan niem khác nhau v kinh tê'
lượng. Tuy vậy, theo các quan diổm trên thì kinh tế lượng la kết hp các lý
thuyết kinh tế, kinh tế toán, thng k kinh tế, thng toan nhưng vằii 'tt1
môn đc lập vì nhng lý do sau đây:
- Các thuyết kinh tế thưòng nêu ra các gi thuyết hay cc gi thiết. Phần lớn
các gi thuyết này nói v chất.
Ví d: kinh tế hc vi mô khng định Tng trong các điu kin khác không tha
đổi nếu gim giá về mt loi hàng hoá nào đó thì s làm ng ng cu vé loại
hàng hoá này ngợc lại. Dù rằng lý thuyết kinh t có khng đnh quan hệ
nghĩch biến gia giá ca vá lượng cầu nhung lý thuyết này không đưa ra mt s đo
bng s v quan h gia chúng, không nói cho ta biết ng cáu s tăng hoặc
gim bao nhu nếu ta gim hoc tăng mt đơn vgiá c. Các nhà kinh tế lung sẽ
cho chúng ta ước lưng bng s vcác con s này.
- Ni dung chính ca kinh tế toán là trình bày lý thuyết kinh tế dưi dng toán
hc (các phương tìn h và bt phương trình), nếu thiếu các mô hình toán hc thì
khng th đo hoc kim tra bng thc nghiệm thuyết kinh tế. Kinh tế ng chù
yếu quan tâm đến kim đinh vmt thực nghiệm các lý thuyết kinh tế. Kinh tê'
lượng thưng s dng các pơng trình toán hc do các nhà kinh tế toán đ
xut và đt cc phương trình dưi dng phù hợp đ kiểm đnh bng thc nghim.
Thng kê kinh tế ch yếu liên quan đn việc thu thp, x lý và trình bày các
s liệu. Nhng s liu này là nh&ng s liu thô dối với Kinh tế ng. Thng kê
kinh tế khng đi xa hơn, khâng liên quan đến việc s dng s liu đ kim tra
các gi thuyết kinh tế.
- Các s liu kinh tế các | liu không phải do các cuc thí nghim dem li,
chúng nm ngoài s kim soát ca tt c mọi ngucri. Các s liu vtiêu dùng, tiết
kiệm, giá c,... do các cơ quan Nhà nước hoặc tư nhãn thu thp đu là các s liu
phi thc nghiệm. Cc s liu này chứa sai s ca phép đo. Kinh tế ng phái sử
dng các công c, phương pháp cùa thng toán đ m ra bn cht ca các s
liu thng kê.
n. PHƯƠNG PHÁP LUN CA KINH TẾ LƯNG
Phân ch kinh tế lung được thc hiện theo các ớc sau đây:
1. Nêu ra các gi thuyết hay giả thiết về các mi quan h gia các biến kinh
tế. Chẳng hn kinh tế vĩ mô khng định rằng mức tiêu dùng cua các h gia đình
phthuc theo quan hộ cùng chiều i thu nhp kh dng ca họ.
2. Thiết lập các mô hình toán hc đ mô t mi quan hê gia các biến s này
Chng hn:
Y = p, + Pj X + u
trong đó, Y :CŨ tieu cho tiêu dùng ca môt h gia đình,
X :Thu nhp kh dng ca h gia đình
P(:Hs chn, p2: H s góc, u: Yếu t ngu nhn.
6
Stồn ti ca yếu t ngẫu nhiên bt nguồn từ mi quan h giữa các biến kinh
tế nói chung không chính xác.
3. Thu thp s liệu: Đ ước ợng c tham s của mô hình, cần phải thu thập
s liệu. Kinh tế ng đòi i kích thước mẫu khá ln.
4. Ưc lượng các tham s cùa mô hình nhằm nhn đưc s đo v mức nh
hưởng cùa các biến với c s liệu hiện có. Các ưc lượng này là c kiểm định
thực nghiệm cho lý thuyết kinh tế.
5. Phân ch kết qu: Dựa trên thuyết kinh tế đ plĩkn ch và đánh giá kết
quả nhn đưc. Xét xem các kết qu nhận được có phù hợp vi thuyết kinh tế
không, kiểm đinh các giả thiết thống về các ước lượng nhn được. Trong mô
hình:
Y= p, +p2X + u,
nếu ưổc ng cùa p2 là s ơng
và nh hơn 1 thì ước ng này
hợp về mt kinh tế. Trong trường
hợp ngược li ( < 0 hoc > 1) thì
khồng phù hp v mt kinh tế. Khi
đó cần phi tìm ra mt mô nh
đúng.
Ngoài phân tích v mt kinh tế
còn phải phân tích v k thut
c yêu cu về mt toán học.
6. Dbáo Nếu như m hình phù
hợp vói thuyết kinh tế thì có th s
đụng mô hình đ d báo. Dbáo giá
trtrung bình hoc d báo g trị
biệt.
7. Ra quyết đnh: Đ bào bo nh
hiên thc ca d báo cần các
cnh ch, c gii pháp tương ứng.
Các bước trên đây có nhim vụ khác nhau trong quá trình phân ch mt vấn đ kinh
tế chúng được thc hiện theo mt trình tự nhất định. Tìm ra bn cht mt vấn đé
kinh tế mt việc không đơn giàn. vậy, quá trình trên đây phải được thực hiện
nhiu lần như là các phép lp cho đến khi chúng ta thu được mt mô hình đúng.
th minh ha quá trình phân ch kinh-tế lượng mt vấn đ kinh tế bng sơ đ trên.
7
Nhng điu nói tran đây cho thy rõ nội dung nghn cứu di ơng và mục
đích, cũng như công c và cách tiếp cn trong nghien cứu ca bò môn khoa học
này. Chính vì vy, t khi ra đi đến nay kinh tế ng dã đem' lãi cho các nhà
kinh tế mt công c do ng sắc bén đ đo các quan he kmh t í Ngày nay.
phm vi s dng ca kinh tế lượng đs vượt quá phm vi kinh tế đã ian sang các
nh vực khác như xã hi học, trhọc... Trong 30 năm gn day kinh tế ng
mt b phn khng th thiếu được trong chuông trình đào to các cán b kinh tế
ca hu hết các c trên thế giới. S các đáu sách YÍỂt V kinh tế lứng, bao
gm các sách giáo khoa bc đi hc và sau đi hc, các sách chuyên kho,
cũng như các tài liêu thc hành, các chuyin san v ý thuyết và úng dng kình tế
lượng, đã trà nên hết súc phong phú. Sự đòi hi phi phân tích đnh ng các hn
tượng kinh tế, kim đnh sự phù hợp độ tin cy cùa các gi thuyết trong quá
trình hoch đnh chính sách vĩ mô ng như ra các quyết đnh tác nghip, vic d
báo và d đoán có đô tin cy cao..., tát c đã làm cho kinh tế ng hc có mt
vai trò ngày càng quan trng và bản than nó cũng khng ngng được phát triển
và hoàn thin. Sự phát trin cùa máy nh điện t đã làm ra ng sức mnh ca
kinh t i ng. Điều đó, gp các nhà kinh tế kiểm chúng được các lý thuyết kinh
tế thích hp hay không, dn tới nhng quyết đnh đúng đn trong hot đng
kinh doanh tác nghip và hoch định các chính sách và chiến c kinh tế xã hội.
Cùng với việc ging dy kinh tế vi mữ và kinh tế vĩ mô, thì kinh tế ng là mt
môn không th thiếu đuc. Nếu như kinh tế vĩ mô mô t s vn đng ca toàn b
nn kinh tế, kinh tế vi m m t nh vi cùa người sản xut và ngưi tiu dùng,
thì kinh tế lucmg trang b cho nhà kinh tế môt phương pháp ng hoá và phân ch
s vn đng và các hành vi trên. Ba n này s trang b nhng kiến thc cơ s đ
hc sinh và các nhà kinh tế đi vào c chuyên ngành hẹp.
8
CHƯƠNG I
MA HÌNH HI QUY HAI BIN
MĨVi ĩư TƯNG Cơ BN
Hi quy là mt công c cơ bản ca đo lường kinh tế. Phân ch hi quy gii
quyết nhng vn d c th gì, phân tích hôi quy khác với các phân tích khác như
thế nào, cơ s thông tín đ phân tích hồi quy , vì sao phi xây dựng mô hlnh
hi quy...? Các vn d trền và bn chất cùa chúng s được đ cạp mt cách vn tắt
trong cơng này.
Thut ng "Hi quy" đã được Francis Galíon s dng vào nãm 1886. Trong
mt bài báo nổi tiếng ca mình, ông đã cho rằng có mt xu hướng v chiều cao của
những đa trê do cha m cao không bình thường hoc thp không bình thường sinh
ra. Người ta gi xu hung này luật Galton. Trong bài báo ca mình Galton dùng
cin từ "regression to mediocrity" - quy về trung bình. T đó vn đ hi quy đưc
nhiu người quan m và hoàn thiện, các úng dụng ca phân tích hi quy dã có ni
dung rng hơn nhiều.
1.1. PHÂN TÍCH HI QUY
Phân ch hi quy nghn cứu mi liên h ph thuc cùa mt biến (gi là biến
phthuc hay biến dược giải thích) với mt hay nhiều biến khác ưc gọi (các)
biến độc lập hay gii thích) nhm ước lượng và/ hoc d báo g trị trung bình a
biến phụ thuc vi các g tr đã biết của (các) biến đc lập.
Ta xem xét các thí d sau đây:
Thí d 1.1
a. Luật Galton Karl Pearson nghn cứu sự ph thuộc chiu cao cùa c cháu
trai vào chiều cao ca b nhng đứa tr này. Ông đã xây dng được đ thchi ra
phân b chiều cao cùa c cháu trai ứng với chiều cao cùa nời cha. Qua mô hình
này có th thấy:
Th nht, vi chiu cao đã biết ca người cha thì chiều cao ca các cháu trai sẽ
mt khong, dao đng quanh g trtrung bình;
Th hai, chiu cao ca cha ng thì chiu cao ca các cháu trai cũng ng. Mô
hình này giải thích được điều mà Galton đặt ra n được đùng trong d báo.
9
Hình 1.1.
Tiếp tc nghiên cu vn d trên, Karl Pearson đã phát hin ra rng: chiu cao
trung bình cùa các cháu trai ca nhóm b cao nh hơn chiu cao cùa b và chiều
cao trung bình cù <^ác cháu trai ca nm b thấp lớn hơn chiêu cao ca bố. Điều
này duơc th hiên: h \ góc ca đường thng trên hình
1.1 nh hơn 1.
Trong thí d này, chíSụ cao ca c cháu trai biến ph thuc, chiu cao của
người b biến đc lập.
b. Mt người nghiên cứu sự ph thuộc ca lượng cầu v mt lot hàng hóa o
g bản thân hàng hóa, thu nhp cùa ngui tiêu dùng và giá ca nhng hàng hóa
khác cnh tranh với hàng hóa y.
Trong trường hp này, lượng cầu biến ph thuc, giá cùa bn thân hàng hóa,
ca các hàng hóa cnh ưanh, và thu nhp ca người tiêu dùng là các biến đc lập.
c. Mt nhà kinh tế lao động nghn cứu tỷ lệ thay đi cùa tin ơng trong
quan h vi t lộ tht nghp đã đưa ra đ th hình 1.2. Đưng cong trên hình 1.2
được gi là đưng cong Phillips, trong đó: tỷ lê thay đi ca tin ơng là biến ph
thuc, tỳ l tht nghip - biến đc lập. Mô hình cho phép d đoán đuc s thay đi
trung bình ca tỷ lộ tin luơng với mt tỷ lệ tht nghiệp nht định.
I'
d. Trong điều kiện các yếu t khác kng thay đi, tỷ l lm phát càng cao thì
tỳ thu nhp ca nhân dân được gi dưới dạng tiền mt càng ít.
05 th minh ha điu đó bàng đồ th hình 1.3.
10
Hình 1.2 Hình 13
Ta có th đưa ra được rt nhiều ví dv s ph thuc ca mt biến vào một
hoặc nhiều biến khác. K thut phân ch hồi quy gp ta nghn cứu mi quan l
như vậy giữa các biến.
Các ký hiệu: Y - biến ph thuộc [hay biến được giải thích]
Xi - biến độc lập [hay biến giải thích] th i
Trong đó, biến ph thuc Ylà đại ợng ngẫu nhn, có quy lut phân b xác
suất, c biến đc lập X không phải là biến ngẫu nhn, g trị ca chúng đã được
cho tớc.
Phân tích hi quy giải quyết c vn d sau đây:
l U6c lượng giá trtrung bình cùa biến ph thuc vi g trđã cho cùa biến
đc lập.
2. Kiểm đnh gi thiết vê bản chất cùa sự ph thuộc.
3. D đoán giá trtrung bình ca biến ph thuộc khi biết giá tr cùa các biến
đc lập.
4. Kết hp các vn đ trên.
Trong phân ưch hi quy chúng ta phân biệt các quan sau đây:
1. Q an h thng kè và quan h hàm số
Vấn đ mu cht trong phân ch hi quy sự ph thuc thng k cùa biến
ph thuc vào mt hay nhiều biến giải thích. Biến ph thuc là đi lượng ngẫu
nhiên, có phân b xác suất. Các biến giải thích thì g trị cùa chúng đã biết. Biến
ph thuc là ngu nhiên vì có vô vàn nhân tố c đng đến nó mà trong mô hình ta
11
trị ca chúng đã được xác định. Trong phân ch ơng quan, khng có s phan biệt
giữa c biến, chúng có nh cht đi xúng:
r (X,) = r (Y,X)
1.2. BN CHT VÀ NGUN sô' LIỆU CHO PHÂN TÍCH H i QUY
Thành cng ca bt k mt s phân tích kinh tế nào đều ph thuc việc vào sử
dng các s liệu thích hợp và ph thuộc vào phuơng pháp x lý c s liu dó. Do
vy đây s trình bày đôi t về bản chất, nguồn gốc và nhng hn chế ca s liu
mà chúng ta s gp phi trong phân tích kinh tế i chung và phân ch hbi quy nói
riêng.
l Các loi s liu
ba loi s liu: Các s liệu theo thời gian (chui thời gian), các s liu chéo
và các s liu hn hp ca hai loi trên.
Các s liu theo thi gian c s liẹu được thu thp trong mt thi k nhất
định, ví d như các s liu v GNP, s người tht nghiệp, lượng cung v tin... Có
sđ liu ợc thu thp bàng tun như ợng cung v tin, c s liu thu thp ng
tháng, quý, năm... Các s liu này có th đo đuợe bằng nhng con s như g ,
thu thp, nhung cũng có những s liu khổng đo đuc bng con s, chúng là những
chì tiêu cht lượng như: nam hoc nữ, có gia đình hay ca có gia đình, có vic làm
hay chưa có vic m, màu xanh hay màu trắng. Người ta gi các biến loi này
biến giả (dummy). Chúng cũng quan trọng nhu nhng biến s ng khác.
Các s liêu chéo là các sơ liu vè mt hoc nhiều biến được thu thp ti một
thời đim nhiều đa phuong, đơn v khác nhau: ví d nhu các s liệu về điều tra
dâu s vào 0 gi ngăy 1/1/1992; các s liu điều tra vồ vn cơ bn cùa các xí
nghiệp dt ngày 1A7/2006 Việt Nam. .. 4
Các s liu hn hp theo thòi gian và khng gian: các s liêu v giá vàng hàng
ngày ò thành ph Hà Ni, H Chí Minh, Hải Png, Nam Định.
2. Ngun gc các s liu
Các s liu có th do các cơ quan nhà nước, các tổ chc quc tế, các cng ty
nhân hay các cá nhăn thu thp. Chúng có thlà c s liu thực nghim hoc tehông
phi thực nghiệm. Các s liêu thực nghiệm thường đuợc thu thp trong khoa hc tự
nhiên, mt điu ưa viên mun thu thập các s liệu nh hưởng cùa mt s nhân tố
đến đi tượng nghiên cu, anh ta dã giữ nguyên các yếu t khác. Thí d, mt k su
nng nghiệp nghiên cúu kh năng chịu bnh cùa mt ging lúa mi. Anh ta tiến
hành thí nghim bng cách trng hai giổng a mi và cũ trên hai khu rung có đ
màu m như nhau, thc hiện chế đ chăm sóc hai khu rung như nhau và theo dõi
s phát triển ca sâu bnh trên hai khu ruộng Bày bằng cách gây cùng mt loại
bnh trên hai khu rung. Các s liu thu được sẽ các s liộu thc nghiệm.
13
Trong khoa hc xã hi các s liẹu nối chung các s liu không phi do thực
nghm mà . Các s liệu v GNP, s người tht nghiệp giá c phiếu... không nàm
ới s kim soát ca k thut viên. Điều y thường gây ra nhng vn <ft đặc biệt
trong việc m ra nhng nguyên nhân chính xác nh hưởng đến mt nh huống
riêng biệt. Thí dụ: có phi lượng cung v tiền nh ởng đến GDP hay còn
nguyên nhãn khác...?
3. Nhưc đim ca các s liu
Cht iượng ca các s liêu thu được thưng khng tốt. Điu dó do các nguyên
nhăn sau đay:
- Hu hết các s liu trong khoa hc xã hi đu các s liu phi thc nghiệm.
Do vy, có th có sai s quan sát hoặc bỏ sót quan sát hoc c hai.
- Ngay vi các s liu đuc thu thp bàng thc nghim cũng có sai s a
phép đo.
- Trong các cuc đíÊu tra bng câu hỏi, vn đ không nhn đuc câu tr i
hoc có tr lời nhưng khng tr lời hft c câu hỏi.
- Các mu đuc thu thp trong các cuc đíầu tra rt khác nhau vồ kích c cho
nên rất khó khăn trong vic so sánh các kết qu giữa các đt điu tra.
- Các s liu kinh tế thưng sn múc tổng hp cao, không cho phép đi sâu
vào các đcm vnhỏ.
- Ngoài ra còn có nhng s liu thuc bí mt quc gia mà không phi ai ng
c th s dng được.
Do vy kết qu nghiên cứu s ph thuộc vào cht lung ca cáo s liu được
s dng và ph thuc vào m hình được lựa chn (vâh d này s đuc trình bày
các cơng sau).
1.3. MÔ HÌNH HI QUY TNG TH
Phn trên chúng ta nói phân tích hồi quy dc bit quan tâm đến ước lượng
hociđ bo g tr trung bình của biến 'phụ thuộc trên cơ s biết các giá tr ca
biến đc lập. Ta xét c thí dụ giả định sau đây:
Thí d 1.3
y : Chi tiêu cùa mt gia đình trong mt tun tính bng $
X : Thu nhp sau khi đã tr thuế ca mt gia đình tính bàng $
Gi s n g mt đa pơng chcó c thy 60 gia đình, 60 gia dinh này được
chia thành 10 nhóm, chênh lệch v thu nhp ca c nhóm gia đình t nhóm y
sang nhóm tiếp theo đu bằng nhau. Ta bng s liêu sau đây:
14
Bng 1.1. Thu nhp và chi tiêu trong mt tun ca tng thé'
Y \
80
100 120
140 160 180 200
220 240 260
55 65
79
80
102 110 120 135 137 150
60
70 84 93 107
115
136
137 145 152
65
74 90
95 110 120
140
140 155 175
70 80 94
103 116
130
144
152
165 178
75
85
98 108 118 135 145 157 175 180
88
113 125
140 160
189
185
115
162
191
_
ĨỂĩĩS_
325 462 445 707
678 750 685 1043 966 1211
Các s bng trên có nghĩa là: với thu nhập trong mt tun chẳng hn x=$100
th 6 gia đình mà chi tiêu trong tuần nằm giữa 65 88. Hay nói khác đi mỗi
cột ca bng cho ta phân b ca s chi tiêu trong tuần Y vi mức thu nhp đã cho
X, đó chính là phân b có điều kiện ca Y với giá trị Xđã cho.
Vì bảng 1.1 tổng th n ta dí đàng m P(Y/X). Chẳng hạn,
P(Y=85/X=100)-l/6. Chứng ta bảng c sut điầu kiện sau đây:
Bng 1.2. Xác sut c đĩêu kin P(Y/X)
80 100
120 140
160
180
200 220
240 260
1/5 1/6
1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5
1/6 1/5 1/7
1/6 1/6 1/5 1/7 1/6
1/7
1/5 1/6
1/5
1/7
1/6 1/6 1/5
1/7
1/6
1/7
1/5 1/6
1/5
1/7
1/6
1/6 1/5
1/7 1/6
1/7
1/5 1/6
. 1/5
1/7 1/6
1/6 1/5
1/7
1/6 1/7
1/6
1/7
1/6 1/6 1/7 1/6 1/7
1/7
1/7
1/7
E(Y/Xi)
65 77 89
101
113
125
137
149 161 173
Trong đó: E(Y/Xi) = Y: P(Y= Yj/X=X).
7 J
Chẳng han: E(Y/100) = 2 ; y , P(Y= Yj/X=100)
7 J
= 65* 1/6+70* 1/6+74* 1/6+80* 1/6+85* 1/6+88* 1/6 = 77
Biểu din các diổm ca bng 1.1 và các trung bình E(Y/X|): i= l,2 ,... 10 lên h
tọa đ, nối các đim có ta đ (Xi,E(Y/Xi), ta được đô th sau đây:
15
Chi tiêu
Theo hình 1.4 ta thíy ràng trung nh có điều kin ca mc chi tiêu trong tun
nàm trên đưng thng có b s góc toong dương. Khi thu nhp ng thì múc chi tiêu
cũng tảng.
Mt cách tng quát, Ẹ(Y/X i) là mt hàm ca X
E(Y/X |) = Í(X |) (1 1)
trong đó ỊỌĩi) là mt hãm nào đó cùa biến giải thích XI, vi ví d trên f(Xi) là hàm
tuyến tính. '
Phuơng tìn h (1.1) gi hàm hi quy tổng th (PRP) hoc hi quy tng th
(PR). Nếu như hàm hi quy tng th có mt biến đc lp gi là hàm hi quy don,
có n mt biến đc lạp gi là hàm hi quy bội.
Hàm i quy tổng thổ cho chúng ta biết g trtrung bình ca biến Y s thay
di như thế nào theo X *
Hàm f(X |) có dng như thế nào - tuyến nh hay phi tuyín - chúng ta chua biết
được bi l trong thc tế chúng ta chua có sẵn tổng th đ kim tra. Xác đnh riạnẹ
hàm hi quy là vn đè thc nghiệm (chúng ta s đ cp đến vii đè này các chung
sau...).
Giả s ràng PRF E(Y/Xi) là hàm tuyến tính:
E07XD =p1 + p2X i , (l2)
trong đó Pi, P2 là các tham s chua biết nhung c định, và đuc gi là các he s
tò i quy,
(3| là hộ s t do (hê s chạn),
P2 là hô s góc.
Phương trình (1.2) gi là phuơng trình hồi quy tuyến nh đơn.
16
Trong phân ch hi qy chúng ta phải ưc lượng g trị trung bình cùa biến Y,
tức ước lượng hàm hi quy chẳng hạn dạng (1.2) phương trình (12), giá tr
cùa các X ta đã biết, đo vậviệc uớc ợng (1.2) tr thành việc ước lượng các tham
s chưa biết p và P2, trên cơ sở những quan sát của Y và X Phn này s được trình
bày chương II.
Thut ng "tuyến nh" đâ được hiểu theo hai nga: tuyến nh đối vi
tham s và tuyến nh đối: với c biến. Thí dụ E07X) = Pi + P2X j2 m tuyến
nh đi vái tham sô' nhung kng tuyến tính (phi tuyến) đối với biến; E(Y/X) =
p 1 + VpT Xi hàm tuyến tính đối với biến nhưng phi tuyến đối vói tham số. Hàm
hi quy tuyến tín tìu ô n luôn đuợhiểu hồi quy tuyến tính đi vi c tham số,
nó thhoc không phi lặ tuyêh tính đô'i với biến.
1.4. SAI S NGU NHIÊN VÀ BẢN CHẤT CA .NÓ
Giả s chúng tạ đã hàm hồi quy tổng th E(Y/Xi); vì E(Y/JQ giá trị trụng
bình ca biến Y vi gi X đã biết, cho nên các g trcá biột không phi bao
gi cung trùng vi E(Y/X|). mà chúng xoay quanh E(Y/Xj).
Ký hiệu n là chênh lch giữa g trị biệt Yi E(Y/X):
= Y ,-E (Y « )
ha: Yi= E(Y/Xi)+ Ui (1.3)
là biến ngu nhn, ngưi ta gi l í yếu t ngẫu nhn (hoc nhiễu) và (1.3)
đcte gội PRF ngu nhn.
Nếu n ECY/X) là tuyến nh đối với X thì Yi = /, + P1X l +
Vi thí đụ 1-3 và với x = $100 ta
Y| = 65 = pi + 100 P2 + U|
Yj = 70= 01 + 100 32 + ui
Y3 = 74 = Pi + 100 pĩ + l ĩ
Y4 = 80 = pi + 100 pj + l ĩ
Ys = 85 = Pi + 100Pi + Ub
yé = 88 = + 100 p2 +
T (1.3)
E(WJŨ) = E(E(Y/Xi) + E(UiyXi)
E(Y /») = E(Y/Xi) + E(WXÌ) (1.4)
-> E(U «;) = 0.
Như vy, nếu đưng hi quy ca tổng th đi qua các trung bình có điu kn
cùa Ythì E Ó m = 0, trong trường hợp này (1.2) và (1.3) là như nhau. Nhung (1.3)
chi ra rng ngoài các biến gii thích đã có trong mô hình còn có các yếu t khác
nh hưng đèn biến ph thuc Y. Nhung trung bình ảnh òng cùa các yếu t này
17
đến biến ph thuc bng 0 và do vy không cn phi đua các yếu t này vào
hình.
Nhung cũng có thnêu vấn dề: Các yếu t này những yếu t nào và th
đua vào mô hình được không? Câu trlời là: Chứng ta th xây dng được
hình hi quy bi, nhưng chúng ta đưa vào bao nhiêu biến di chăng na thì
yếu tố l vn n ti vì mt s do sau đây:
- Cng ta th biết mt cách chính c biến giải thích X và biẾn ph thuc
Y nhung chúng ta không biết hoặc biết không rõ v các biến khác nh hung đến
Y. Vì vy, Ư, được s dng nhu yếu l đại diộn cho tt c c biến không có ưong
m hình.
- Ngay cà khi biết c biến bị loi khi mô hình các biến nào, khi đó
chúng ta có th xây dng mô hình hồi quy bội, nhưng có th không có các s liệu
cho các biến này.
- Ngoài các biến giải thích đã trong mô hình còn có mt s biến khác
nhung nh hưcmg ca chúng đến Y rt nhỏ. Trong trường hp này, chúng ta ng sử
dng yếu t ngu nhn lí đi diện cho chứng. Trong thí dụ đã tìn h bày phần
trên: s con trong gia đình, giới nh, n giáo..., cũng nh hung đến chi tiêu trong
gia đình, u, đi din cho chúng.
- V mt kỹ thut và kinh tế, chúng ta muốn có mt mô hình đơn gin nht
thđược. Nếu như chúng ta có thổ giải thích được hành vi ca biến Y bng mt số
nhò nht cấc biến gii thích và nếu nhu ta khOng biết ng minh nhng biến khác
những biến nào có th bloi ra khỏi mô nh thì ta dùng yếu tô' Ư, đ thay cho
lất c c biến này.
Trên đây là mt vài do vsự tồn tại ca n . U| gi vai trò đc bit trong phân
tích hồi quy, chúng phi tha mãn những điều kiện nht đnh thì vic phân tích trên
mô hình hi quy mi có ý nghĩa. S sai lầm nghm trng nếu như sù dng một
công c mà không biết nhng điều kiện đ sử dng nó có dược tha mãn hay
khôngế Trong phm vi ca cun sách này chúng tôi đc bit quan tâm đến những
điều kiộn đ vn dng mô hình. Tuy nhn, trong thực tin nhũng điu kiên này
không phi bao gi cũng được tha mãn bn đc có th m thy cách phát hiện
và cách khác phc nếu như có mt s giả thiết ca mô hình khơng đưc tha mãn.
Những vn đ y s được trình bày dần dần trong các chương sau.
1.5. HÀM HI QUY MU
phn ph lục, chương n có trình bày lược vê tổng th và mu. vi sao phải
nghiên cứu mu. Ván dê ò đây cũng tương tự nhu vậy. Chúng ta không có tng thổ,
hoc có nhưng không th nghn cứu được toàn b tổng thể. Điu này có nghía
chúng ta không th xây dụng được hàm hi quy tổng th (PRF). Chung ta chì
mẫu ngẫu nhiên được lấy t tổng thể. Chúng ta mun ước ng PRF t nhng
thông tin thu được trên mu ngu nhn cùa các g trY đi với các giá tr ca X đa
18
biết. Mt đíẽu chc chn rằng cng ta không th ưc lượng mt cách cnh xác
PRF da trên mu ngu nhiên.
Hàm hồi quy được xây dựng trên cơ s một mẫu ngẫu nhn được gọi hàm
hồi quy mẫu (SRF) hoc hi quy mẫu.
Bảng 1.3 và 1.4 cho 2 mẫu ngẫu nhiên từ tổng thể trong thí dụ 1.2
Bàng 13. Mẫu th nht
Y 70
65
90 95
110. U5
120
140 155 150
X
80
100
120
140 160 180 200 220 240 260
Bàng 1.4. Mu th hai
Y 55 88
90 80 118 120
145 175
X
80 100 120 140 160 180 200 220
Vi hai mẫu ngu nhn trên ta y dựng dưc hai hàm h'ôi quy mu hiệu SRF1
và SRF2 (hình 1.5).
80 100 120 140 160 180 200 220 240 260
Hình 1.5
Vy đung hi quy mẫu nào sẽ được coi thích hợp với PRF. Câu hi ,này
không tr lời được bi lẽ PRF chua biết. Cũng giống như ưc lượng mt tham sổ, ta
sẽ ước lượng FRF bng SRF mà SRF y có tính chất: tuyến tính, không chch, cỏ
pơng sai nh nht.
Gi s rằng đưng hi quy mu dạng:
. - p . + M .
19
trong đó: j là uc lung cùa E(Y/X|)
P và p 2 là ước lung của p! và P2
Mt khác theo (1.3): Y| = E(Y/Xi) + u
Do đó: Y! = + p 2 Xi + e
trong đó, ei được gọi là phn du hay chính uc lung ca Uj. Sự tn ti cùa e;
duc gii thích nhu s tn tại ca .
Trên mu, vi X = Xi ta có Y=
- ,+ e |
-B C W O +
Hình 1.6. Đường hòi quy tổng th đưng hi quy mu.
Ván d đt ra là ta có th đưa ra mt phương pháp và mt s điu kin mà nh
SRF là uc ng tuyến tính, không chch có phung sai nh nht ca PRF hay nói
khác đi và gn nht vi g trthực p, và p2 có th đưc dù rng chúng ta
khng bao gi biết giá tr thc ca Pi và Văn dè này đưc trinh bày chương n.
20
CHƯƠNG 11
MÕ HÌNH HI QUY HAI BIÊN
ưc
LUNG
VÀ
KIM ĐNH GI THIT
Trong chương này s trình bày vấn d ưciung hàm hi quy tổng th PRF
mt cách chính xác có th được trên sở hàm hi quy mẫu. mt s phương
pháp ước ng hàm hi quy mu, pơng pháp thường ng phương pháp bình
pơng nh nht OLS (Ordinary Least Square). Chúng ta s trình bày pơng pháp
này cho mô hình hai biến chương này, chương sau sẽ trình bày pơng pháp OLS
cho mô hình hi quy bội.
2.1. PHUƠNG PHÁP BÍNH PHUONG n h n h t
Phương pháp bình phương nhnhất do nhà toán hc Đức Carl Friedrich Gauss
đua ra. Sử dng phương pháp này kèm theo mt vài gi thiết, các ước lượng thu
được có tính cht đc bit, nhò đó pơng pháp này pơng pháp mnh nhít
và được nhiều ngưi thích s dụng.
1. Ni dung phưomg pháp bình phuomg nh nht
Giả sử E(YIX) = pi + i32X là PRF
Khi đó giá tr quan t Yj!
Yi= E(YIX) + lí
= pi + P2X + lí
= P, + P2X; làSRF
Yi = p , + p 2X i + e i
Vấn d là phi tìm ý( = P + Pi X ,
Gi s rang chúng ta có n cặp quan t cùa Y và X, cp quan sát th i có g trị
ơng ứng (Yi,Xj) : i = l,n . Ta phải m Y sao cho càng gn với giá tr thực
ca Yi có th đưc, tức là phn
e, = Y ,- 1= Ì 1- í X J
càng nh càng tốt.
21
Ta xem đ th sau đay:
Hình 2.1
D oèj: i= l,n có thdtian g .o ihâm d o vy cn phi tìm sao cho tổng
bình phương ca các phn dư đt Cực tiểu. Tức là:
2? = n - . ý
i«l i-ì
= ( Y ,- P , - p 2X f)2 => min
il
D o X i,Y i:i = l,n đãbiết.nên là h à racù a P |,jj2
i«l
f(P,, p2) * = È (| - Â - fax, Ý => uiin
i-l ;-i
P ,, 2 là nghiộm. a h thL piìuơi.12 trình: áu:
a f ( P ê , ) f .. a
s S - - = I
op, i-i
hay n P ,+ P 2 X j = ] v
»1 i«l
'22
^ = 2 C - P ,- ,X iX-55) = 0
a p 2 i.1
hay w% x + p 2 X f , Y,JÍ
i=l h=l i**l
P t , P- được tìm t h phương tìn h sau:
n Á + Á í J f i = í Y,
.1=1 i-1
Á
x+
Á
x? =
£
Y,Xi (2.1)
M i-1 i»1
' H phương trình (2.1) gi là hộ pơng trình chun. Giải h phương trình trên
ta được:
n Y . X i - Í X . Y i
P 2 =
---------
----------
V = - (2.2)
n X ? - X , i ,
i«l \i-l /
P ,= - P 2X (2.3)
Đt Xi = X - X
yi = Y i-
È y iX
Khi đó P , =
-----
(2.2)'
*
i-l
P ,, P2 các ước ng ca Pi và p2 được nh bằng phuơng pháp bình phương
nhò nht - được gi là các ước ợng bình phương nh nhất.
2. Các tính cht ca các ưc ng bình phưong nh nht
1. P i, p 2 đưc xác đnh mt cách duy nht ứng với n cp quan sát (X|,Y1)
2. | , p 2 là các ưc ng điểm ca pi, p2 và là các đi lượng ngu nhn,
với các mu khác nhau chúng có giá trị khác nhau.
- = P, + P 2Xi - SRF có các nh cht sau đây:
1. SRF đí qua trung bình mu ( X , Y), nghĩa :
= p, + :ậ2 X
23
, f G trtrung binh ca bàng giá tr'trung- bình cù cc quan sát:
Y = .
3. Giá trbung bình ca các phn dứ: é = 0
I . *-!' L * -
4. Các phn du ei không tuơng quan vi j tức lài ;ej = 0
i»l
5. Các phn dư ei không tưong quan vi Xi tức là:. e, Xl = 0
Thí d 2.1
Bng sau đây cho s liu v lãi sut () và tỷ lệ lm phát(X) trong năm 1988
9 nước Gi sử rằng s ph thuc (Y/X> ó dng tến tính di vãi c biến s và
tham số. Hãy ước lượng hàm hi qy và nh cầo đc tnmg ca .
_____________
_
?^1v3
66,3
- m . :
1:S ®
r -7,6
X
i ã ế - l
s
Ì
k i p l i
1
WEN
l l i s
|p § p
.4,4
Quá trình tính toán được th hin trong bng 2.1.
2.2. CÁC GIẢ THIẾT c ơ BẢN CỦA PHUƠNG PHÁP NH PHUƠNG NH NHẤT
Trong phân tích tò i quy, mc đích ca chúng ta là ưc ng, d bo v tổng
th, tức là ước lượng E(Y I X i) hay trong mô hình hi quy tuyên tính, đơn là ước
lượng E0fl X i) = Pị + P2X1 Pi và P2 m được bng phương pháp bình pơng
nh nht là cc ước lượng điểm ca Pi và p2. Chúng ta không biết được cht lượng
cùa các ước lượng này như thế nào. c h ít iưọng ca các ước lượng ph thuc vào:
- Dng hàm ca mô hình được lựa chn
- Ph thuc vào các Xi và Ui
- Ph thuc vào kích thựớc mẫu
Về dng hàm ca mô hình chúng ta s đ& cp đến chương, IX đây chúng
ta s nói v các giả thiết đi vi Xi và Ư,. Vi các gi thiết này thì các uc lượng
tìm đưc bàng pơng pháp binh phng nh nht là các uc ng tuyến nh
không chch, có phương sai nh nhất. I
Gi thiết I: Biến (các biến) gii thíph phi ngu nhiên, tức là cc giá tr ca
chúng là các s đã đưc xác định.
Gi thiết này không có gì mi, vì phân ch hi quy đuơc đ cp phan ch
. hồi quy có điu kin, ph thuc vào các giá trị X đã cho.
2+
Bng 2.1
V, X, X,2
*ĩ
ypYrY
y f
m
V,
e^Y.-
e,2
1
11,9
7,2 51,84
-2,211 4,889 -2,6
6,76
5,749 11,737 0,1625770 0,0264312
2
9,4
4,0
16,0 -5,411 . 29,279
-5,1
26,01
27,566
7,739 1,6606782 2,7578521
3
7,5
3.1
9,61 -6,311
39,829
-7,0
49,00 44,177 6,615 0,8551442 0,7834802
4
4.0
1.6 2,56
-7,811
61,012 -10,5
110,25 82,016
4,741
-0,7407950 0,548703
5
11,3
4,8 23,04
-4,611 21,261 -3,2 10,24 14,755
8,739
2,5609783 6,5586089
6
66,3 51,0
2601,0
41,589
1729,645 51,8
2683,24 2154,31
66,461
-0,1614370 0,0210619
1
22 20 4,0
-7,411
54,923 -12,3
151,29 91,155
5,241
-3,0405000 9,2446913
8
10,3 6,6
43,56
-2,811
7,902
-4,2
17,64
11,806 10,988 -0,6877790 0,473055
9
7,6 4,4
19,38
-5,011 25,110 -6,9 47,61
134,576
8,239
-0,6390800 0,408429
I
130,0
84,7 2770,97
0,000
1973,849 0,0
3102,04
2466,14
130,500 -0,0002200 20,827314
Tj/b5nh
14,5 9,411
14,5
n
Z y ixi
i=l
n
p
i=i
Ỷj = 2,7418355 + 1.2494067X, - SRF
- w 2466,14 _ .
p2 =
------
= _ =» 1,2494067 ; B, = Y -B ,X = 14,5-1,2494067.9,411*2,7418355
V 2 1973,8489 1 2
2 X
Gi thiết 2: Kỳ vng ca yếu tó ngẫu nhn u bng khng, tức
E ( lX |) = 0
Gi thiết này có nghĩa là các yếu t kng có trong mô hình, đi din cho
chúng, không có nh hưởng h thng đến g trtrang b'mh ca Y.
VÔ mt hình hc gi thiết này được mô t bàng dò th(hình 2.2).
Đ th ch ra rng vi mõi giá trị ca X, cc giá trcó th có ca Y xoay quanh
giá tr trung binh. Phân b ca phn lớn n hay nh hơn giá trtrung bình chính
các l, theo gi thiết này trung bình ca các chênh lch này bang 0 .
Chú ý: Gi thiết E(U IX.) - 0 o theo E(Y, I + P2 Xa .
Y Giá tr trung bình PRF
Hình 2.2
26
Giá thiết 3. Phương sai bằng nhau (phương sai thún nht) ca c u
(Homoscedasticity of ).
Var (Ui I Xi) = Var(Uj I X) = ơ2 V i* j
Giả thiết 3 có nghĩa phân bô' có điểu kin ca Y vi giá trị đã cho ca X
phương sai bng nhau, các g trị cá biệt ca y xoay quanh giá trị trung nh vi
phương sai như nhau.
Giả thiết 3 kéo theo Var(Yr IX ) = ơ2.
Vmăt hình hc có th mô tả giả thiết y như hình 2.3.
Hình 2.4: Var (U I Xi) * Var (ƯJI x ;) = ơ j: j
(Phương sai khng thun nht)
Gi thiết 4. Không c s tương quan giữa các lí :
Còv( l í , Uj) = 0 Vi * j
Hình 2.5
a. Không t tương quan; b. T tuơng quan ơng;
c. T tương quan âm
27
Giả thiết này có nghĩa là ngu nhiên. V6 mt hình hc có nghĩa là u
như có mt giá tr u nào đó lớn n (nhn) g tr trũng bình thì không có nghĩa
giá b khác cũng ln han (nh n) g trị trung bình.
Gi thiết 5. L và Jí không tương quan với nhau:
Cov(Ư,, Xi) = 0.
Trên đây đã đưa mt s gi thiết cơ bản. Bạn đc có th đt ván d: vì sao
phi có các gi thiết này? Chng được thực hiện như thế nào? Ci gì s xy ra nếu
các gi thiết này không được thò mãn? Bằng cách nào biết đưc mô hình hi quy
tha mãn tt c các gi thiết này. Vấn d mà bn đưa ra tht thú nhưng kng
th gii đáp ngay trong chương này được. Chúng s đưc gii đáp dàn dn ưong
các chương sau.
2 .3 . Đ CHÍNH XÁC CA CÁC uc LUNG BÌNH PHUƠNG NH NHT
Theo phương pháp bình phương nh nhát, các ưc lucmg P ,, P2 được xác
đnh theo công thức:
p ,= - P2 X
2 = Xiy, / £ X?
ì-1 1-1
Các uớc ng này là hàm ca mu, là đi lưng ngu nhiên, vi các mu khác
nhau ta có các ưc ng khác nhau Vi phương sai hay đ lch chun đc trưng
cho đ phân tán ca đi lượng ngu nhn, nên ta dùng chúng làm thưc đo cho
chít lượng ca uớc lượng.
Vài các gi thiết cùa phuong pháp bình phương nh nht, phương sai và đ
lệch chun cùa các ước lượng đuc cho bời các cồng thức sau:
v a r ( ) = ^ ~ ; se( P2 ) = °
pĩ
M
V a r (P ,) = £ -^ -< 7 . se (/? ,) = <7
n í x f \ n f Xĩ
>= 1 M
trong đ, ơ2 = Var(U)
se: sai s tiêu chun (Standard error)
28
X| = J5- X
Trong c công thức trên ơ1 chua biết, ơ2 đuợc ưãc lượng bng ước ợng
....
k h ô n g ch ch c ù a I1Ó là =— ; â = ^ n _ 2 ) là s a i s ô 'tiê u c h u n cù a
đường hi quy (Standard error of regression). Nó chính đ lệch tiêu chun các
giá trị Yquanh đưng hi quy mẫu.
Các tính cht ca các ước lượng nh phương nh nht được thhin qua định
sau đây:
Đnh lý Gauss - Markov: Với các giả thiết 1-5 của phương pháp bình phương bé
nlĩất, các ưc ng bình phương nhò nhất cấc 1tóc ng tuyến tính, không chệch
phng sai nh nht trong lớp các ưc lưng tuyến nh không chệch.
Với các kết qu bng 2.1, ta nh đưc:
ơ2 chưa biết nhưng có thdùng ước lưcmg không chch ca nó 2.
, £ , ơ2 2,9746993
Var( B, ) = - = - » 0,001507055
V 2 1973,8489
M
se( p j) = 0,0388208
2> , 2770,97
Var (P ,) = - a =
------
-------
2,9746993 « 0,464
V 2 9.1973,8489
nZ /xi
i«l
se( P, ) *0,6811
2.4. H S r2 ĐO Đ PHÙ HP CỦA HÀM Hl QUY MU SPF
Ta có Yi = Ỷj + Ci
Yi- = i - + e,
= j - + e, hay y, = j+ e ,.
Z y? = i + í e ĩ + 2 S ,e ,
|=1 |»l M
= ý i + e- + 0 . Vì , = P 2 Xi nên :
i=l i=l
29
È y?*= N x? + £ e?
M jẵl i-1
hiệu: T S S = y? = Ơ I- Y )2 .
i-l i-l
-T> TSS (Total Sum of Squares) là tổng bình phương ca tt c cc sai lộch giữa
các giá trquan sát Y vi giẩ tri trung bình ca chúng,
ESS = £ (Ỷ, Y )J = £ < - )2= í ] = PI X?.
j=l ế| i-l i*l
ESS (Explained Sura of Squares) là tổng bình phương ca tt e các sai lệch
giữa các giá ư ca biến ph thuc Y nhn được t hàm ti&i quy mu vi giá trị
trung bình ca chúng ( - ). Phần này đo đ chính xác ca hàm hi quy.
RSS = e? = ơ i - %
i-l i-l
RSS (Residual Sum of Squares) là tổng bình phương ca tt c các sai lệch
giữa các giá trquan st Y và c giá trị nhn được từ hàm hi quy.
Vè mt hình học có th minh ha như trên hình 2.6.
Hình 2.6
TSS = ESS + RSS
TSS đưc chia thành hai phần: mt phn ESS do đường hi quy mu gây ra
phn cùa RSS do các yếu t ngu nhn gây ra.
T TSS = ESS + RSS ta chia c hai vế cho TSS, ta có:
30
Đt r 2 =
( - W e ?
ESS RSS £ r > M
TSS + TSS Í ( Y ; - / ( Y , - W
I»l i=I
( i - )
M
____
m - )
i-1
ESS RSS
2 TSS - TSS
>? Pỉ£x?
i=l
W ĩ
<G
.
1
II
1
n
Èy?
i-I
M
W-ĩ
Ól
II
n
i»l
}§
A /
/n-l
s2
= 6
s
2 n
I :
r /
A - 1
trong đó: S2X và Sy phương sai mẫu của X và Y.
X iy ,- ( * ! * )
Mt khác P, = - 3 - w
* ?
=> r
pìpi
r=j f l P =fS F )B H i?
Từ định nghĩa r2 chúng ta thấy r2 đo tỷ l hay sô' phần trãm ca toàn bộ sai lệch cùa
Y vái giá trị trưng bình ca chúng đưc giải thích bàng mô hình (hay biến độc lp), r2
được dụng đ đo đ thích hợp cùa hàm hồi quy. Dễ đàng thấy được 0 < r2 < 1. Nếu
lấy n bậc hai a r ta được r. r chính là hs tương quan mẫu, tuy nhiên dấu ca r tu
thuộc vào quan h ng chiều hay ngưc chiều giữa Y X.
31
Các tính chái ca h s tương quan r
l r có thé âm hoc duơng, du cùa r ph thuộc o dấu ca tử số, đó chính
du cùa Cov(X,Y), hay là du ca h só góc.
2. -1 á r <; 1
3. r có tính chát đì xúng r(X,Ỵ) = r(Y,X)
4 Nếu X' = a X + c ;Y = b V + a;
a,b,c,d là các hng s
a,b > 0 thì lỌC, ) = r(X,Y)
5. Nếu X,Y đc lp vi nhau thì r(X,Y) = 0; Điều ngưc li không đúng.
6. r đo s ph thuc tuyến nh, nhung không có ý nghĩa trong việc định
tính cht các quan h phi tuyến.
7. r đo đ ph thuc tuyến nh giữa X và Y, vy không đòi hi X,Y có mối
quan h nhãn qui.
8. r2 cQng có th tính bng công thức:
r =
é turn băng công mức:
[ ( v , - ) , - ? ) " ( y , , )
i“l j»I i-1 i«l
Vi các s bng 4.1 ta cổ:
246 6 142
= 1 0 9566
2.5. PHÀN B XÁC SUẤT CA Ui
Phn trên chúng ta đã trinh bày các ưởc lượng đim ca Pi và Pj thu đuợc
bng pbuơng pháp bình phuong nh nhít. Vi các gi thiết cơ bản:
E (U ) = 0
Var (I ) = o2
Cov (U , Uj) = 0 (V i*j)
thi p ,, P2 là các ước lượng tuyến nh không chêch có phương sai nhò nht ca Pi
và P í. Mc đích cùa phân ch hồi quy khôiig nhi chi là suy đoán v Pi và P hay
PRF mà còn phi kim tra bn chất ca s ph thuc, còn phi thc hin các d
đoán khác. Do vy cn phi biết phân b xác suit ca p! và p 2. Các phân b này
ph thuc vào phân b cùa các Uj.
y gi chúng ta đua them gi thiết.
32
Gi thit 6. có phân b N(0, ơ3)
.Vi các giả thiết trn, các ưc lượng bình phương nhnht P ,, p2 và 2
•các nh cht sau đây:
1. Chúng là các ưc lượng kng chệch
2. Có phuong sai cực tiểu
3. Khi s quan sát đù lớn thì c uớc lượng này xấp xvi g tr thc ca phân
7. Trong các ước ng không chch a Pi, pj bt k tuyến nh hay phi
tuyến nh thì P ,, P2 có phương sai nh nhít.
8. Yi - N(Pi + P2 , ơ2).
Với các nh cht trên chúng ta có th m khong tin cậy kiểm định gi
thiết v các tham s hi quy.
2.6. KHONG TIN CY VÀ KlM đ n h g i t h iế t V .CÁC h s
HI QUY
Vi các gi thiết 2-6 thì : p, ~ N (Pi, o | )
Pl
nhưng do ơ2 chưa biết nên a và a cũng chua biết. Do vy, phải dùng ưc
lứng không chch cùa c 2 là ô 2 . Khi đó c thng kề:
bố.
4.
Pl
TO nh cht này suy ra z = ~ N (0,1)
ơ p,
5. p2 ~ N (p2 ,ơ? )
T tính cht này ta suy ra z = 3— 1 K (0,1)
p2 ~ N (h ,o )..
2 _
trong dó : ơ * =
33
p , - P i p2 - p2
t = > và t = - J p f phn b T(n-2) và
se(P ,) se(P2)
X2 = ( n - 2 )-? 7 ~ x 2(n -2 ).
Ơ
Do đó có th m khoảng tin cậy, kiém định giả thiết cho các bs hi quy ƠJ.
1 Khong tin cy ca Pi
t= Pl~ ~ T (n -2 )
se(P i)
Với h s tín cy 1 - a la tìm được tc/2 (n -2) thòa mãn.
p (-W (tt-2) s < W (n -2)) = 1 - a.
se(P,)
Khoảng tin c&y (1 - a) ca Pi là:
(0 ! -ta/2 (n-2)s e ( Pj) ; p| + ta/2 (n -2) s e (P ,) )
2. Kim đnh gi thiết đi với p
Có th đua ra gi thiết nào đó v pi, ciiẳng hn Pi = p . Nếu gi thiết y
(King thì:
P i - P ,
t= - T(n-2).
se(P ,)
Ta có bng sau đây:
Bng 22.
Kim định gi thiết v pi
Loại gi thiết Gi thiết Ho Gi thiết đối H|
Miền bác b
Hai phía
p i = p ; Pi * p
m > W n -2 )
Phía phi
p i s p ; Pi > P*
t > t„ (n -2 )
Phía dái
Pi £ P*
P i< P *
t < - t a ( n - 2)
a thưng nhò hơn 0,1
ta (n -2) đuc xác đnh bi p (t > ta (n -2)) = a , đưc cho trong bng 2 phn
ph lục.
3. Khong tin cy ca Pi
Dựa o:
t = - T (n - 2)
se(P2)
do đó vi h s tin cy 1 - a, khong tin cậy cùa Pí được xác đnh bởi:
34
p 3 - i v
P ( - W ( n - 2 ) ili^ - t a (n - 2 )) = l - a
se(Pj)
~ P( p2 - ta/2 (n -2) se ( p2) Pj ^ p 2 + tan (n -2) se( P2)) = 1 - a.
4. Kim đnh gi thiết đi với Pj
th đua ra gi thiết v g trị thực ca p2. chẳng hn p2 = P*.
Nếu gi thiết này đúng thì
. _ P2 - P 2
seflij)
' T(n-2)
Bđng 2.3. Kim đnh gi thiết ví
Pi
Loại gi thiết Gi thiết Ho
Giả thiết đối H|
Miên bác bỏ
Hai phía
p2 = p ;
P2 * pj
11 1 > ta (n -2)
Phía phi
P2 > P2
t > t„ (n -2)
Phía trái
p2 s p ;
P 2 < P ;
t < - U n -2 )
Nếu như đua ra gi thiết P2 = (3 2 = 0 thì điều này có nghĩa là đua ra gi thiết
biến đc lp X không nh hưởng đến biến ph thuộc Y, .khi các ti được nh bằng
còng thức:
se(Pị) se(Pi)
Với các s bng 2.1, ta có th tun khong tin cậy ca Pi và (3j, cOng nhu
kim định- các gi thiết v tham s này.
Vi a = 0,10 => (0,050 (n - 2) = to,050 (7) = 1,895 (theo bng 2);
se(P,) = 0,6811; se( P j) = 0.0388
Khoảng tin cy ca Pi và p2 với hẹ s tin cy 90% là:
(P, -1,895 se(p ,); P, + 1,895 se(P,))
(2,7418335 - 1,895 . 0,6811 ; 2,741835 + 1,895 . 0,6811)
hay (1,451149:4.0325195)
( f2 -1,8*95 se ( p2 ); P2 + 1,895 . se ( p2 ))
(1,2494067 -1,895. 0,0388 ; 1,2494067 + 1,895. 0,0388)
(1,17588; 1,3229327)
Có th kim đnh gi thiết
Ho : = PĨ = 0
35
Giả thiết Ho v mt kinh tế c là chúng ta đua ra gi thi£t biến X khng ảnh
huởng đến Y, trong ví d c th này nghĩa là nêu ra gi thiết l lm phát không
nh hũng đến i sut ngân hàng.
Vi a = 0,05, to,(B5 ơ ) = 2,365 (bng 2)
i - g i 1,2494067 - 0 _
se(P2) = 0,0388.
t>to,cnj(7)
do đó ta bác b gi thiết Ho và chip nhn Hi
6. Khong tin cy đi với a2
XJ = ( n - 2 ) ^ - ~ x 2(n-2).
Do đó, khong tin cy (1 - a) của ơ2 đúc xác đnh t
, ô2 2
P ( X 1 ( n - 2 ) (n -2 ) ^ 7 á X «« (11-2 ) ) = 1 - a
p í í p i i £ l ^ s
{ z a/i(n - 2 ) Xi-*n(n - 2 ))
trong dóx*«(k) đuc cho bởi bng 4, phn ph lục.
6. Kim định gi thiết đtfi VỚI ơ
Bng 2.4
Loi giả thiết
Gi thiết
Ho
Gi thiết đối
H,
Min bác b
Hai phía
II
a 2 * ơ
~~°~v
- > x l , i l » - 2 )
hoãc
a O
< n -2)â* ,
1 ^
X\~m!
l\n *)
. <70
Phía phi
II
" b
ơ 2 > ơ
( n - 2)ôJ .
------
J > X (n -2 )
ơõ
Phía tiái
II
o°L
ơ 2 < o
(n-,2)l , . ... .
í
< x-« (n 2)
<*0
Kiểm đnh gi thiết cho thí d 2.1
Phần trên đã nh đuc ô2 = 2,9740993
th í kim tra gi thiết: H0 :ơ í = ơ = 3
H ,:ơ 2* 3
36
CL = 0,05 => 5C 0,025 (n-2) X 0.025 (7) = 16,0128;
x20.975 (7) = 1,68987
( n - 2 ) ô í 7.2,9746993
7 =
------
= 2,3136
o j 32
2.7. KIM ĐNH SPHÙ HP CỦA HÀM H i QUY, PHÂN TÍCH H i QUY
VÀ PHAN TÍCH PHUONG SAI
Phn này s trình bày việc phân ch hồi quy theo quan đim cùa phân tích
phương sai, nó cung cp cho chúng ta mt cách khác, hữu ích trong vic giải quyết
vn d phán đoán thng kê.Theo phn 2.5 chúng ta có:
y ì - ú ' !
i-1 i-l i-1
= ÍM X? + £ e?
i>1 i-1
hay TSS = ESS + RSS.
Mt khác:
r = ESS/TSS, nên ESS= I^TSS và RSS = (1-r) TSS.
ơ2
Do P2 c phân b N (Pj,
nên P ' \ I x ~N(0,1)
ơ V i-1
(Pí " P ĩ ) 2 V ĩ 2 , >
và - 2 X ~ x (1)
i.1
p
Do ( n - 2 ) p - = J^ - ~ x V 2 )
( P i - P a ^ * ? e? (P2 - P 2f Z x?
---------
/ 1 : - ^ 7 - / (n-2) =
--------
&
t i / .
nên: F =
--------
/ 1 : -*=4 ' <n*2) =
ơ
hay F =
---------
——
-------
có phân b F( 1, n-2).
Chứng ta kim đnh gi thiết:
n!
/ ( n - 2)
37
Ho: (32 = 0
H ,:p 2 * 0
P *?
Nếu F = - > Fg(l,n -2 )
Ơ .
thì c b gia thiết Ho, tức là c b giả thiết X không nh hưòng đến . Trong đó
a thưng nhò han 0,1.. r'
Mt khác
n 'Ti . . ' - 5 ? I
2
*2 ' X' ESS / 1 _ T S S r2 / 1
F = = RSS / (n -2 ) _ ( l - r 2) T S S /( n - 2 )
cho nên quá trình phân ch pơng sai cho phép chúng ta đưa ra các phán đoán
thng kê v đ thích hp ca hàm hi quy. Ta có th đưa ra quá trình phan ch
phương sai mt cách ngn gn ng bảng sau đay: -
Bng 2.5. Bng phn tích phucmg sai cho mô hình hi quy hai biến
Ngun biến thiên
Tng bình phương Bậc t do
Phuơng sai
T hàm hồi quy
(ESS)
i = P
i-l
1
Pl *?
i 1
T c yếu t ngẫu
nhn (RSS)
t e?
i-l
n-2
^ e =
( n - 2 )
T S S
tvĩ
i-l
n-1
Vi thí d (2.1) a = 0,05 ; F a (l,n-2) = 5,59 (bng 3) ta có:
r 2 n - 2 0,9932 7 '
= 1 - r 2 1 1 - 0,9932 1 - 1022,04
F > F « (141-2)
do đó bác b gi thiết P2 = 0 hay bác bố gi thiết r2 = 0
2.8. PHÂN TÍCH HI QU Y VA D BÁO
Các phn trên đã trình y phuơng pháp xây dng mt hàm hi quy các đánh
g và phán xét v các h s ca hàm hồi quy. Tuy nhn mc đích cuá chúng ta
không chdùng ti đó. Có th sử dụng m hi quy đ d báo. Có hai loi d báo-
- D báo trung bình có điều kiện a Y với mt giá tr X = Xb
38
- D báo giá trcá bit cùa Y với x = X)
- D báo giá trtrung bình.
Giả s X = Xó ta mun d báo E(YlXo). Đường hi quy mu cho ước ợng
điểm ca E(WCo)- 0 = P, + P2 Xo.
0 là ước ng không chch có phuong sai nhò nht ca E(YIXo). Tuy nhn .
0 vn khc so vi giá tri thực ca nó.
0 có phân b chun vi k vng pi + p2 Xo , nên
var ( 0 ) = E (P , + p jX o - P .- f t Xo)2
= E [ ( P , -P ,) + Xb( p j - f c )]2
= E [(P , - p , ) 1 + 2 J « P , - p i )( p 2 -p 2 ) + x ( p 2 -p 2 )2]
Var (, ) = E[( P, - p, )2] + E [X | ( p 2 - h )2]
+ 2XEKP, - p ,x pa - f t) ]
= Var (P ,) + Xb2 Var ( Pi) + 2 X) Cov ( P, , P2 )
Var(Ỳ0) = V ar( - P2 X ) + Xo2Var( p2 ) + 2X oCov( P, , p 2 )
= + X 2 V a r ifo + X ] Var(P1) + 2 X Cor{fi]J ì )
n
, ĩ L + T P - ? - + x i - 2 L - 2 X j L
>? íx íx
/-1 i=l i=1
V \1
= q 2 (l + (Xon- Z ) }
" ± *
im1
Nhưngơ2 chưa biết, n ta s dng ưc luọng không chệch cùa ơ2 2, khi dộ:
Ỷ0 - ( p , + p j X 0)
t - ° ; ^ \ - ~T(n-2)
se(Y0)
Do đó khong tin cy 1- a ca E( Yl Xo):
P( Pi + p2 ^0 t d/(n-2) se ( Y0 ) Pi + P2 Xo
á pi + p 2 Xo + 1 (n-2) s e ( Ý ó)) = 1-a.
Ỳ0-1 a/2 (n-2) s e ( 0 ) E(Y/Xo) < Ỷ0 + 1 a*(n-2) sè ( , ) )
Thí d : Hây d báo mc lãi sut trung nh nếu t lệ làm phát = 5%,
39
a = 0,1; c = 1.895.
Var(0 ) - * [-+
. n
.= 0,3366 suyra se( 0 ) = 0,58..
p, + P2 Xo = 2,7418335 + 1,2494067 , 5 = 8,98,8867
7,889767 E ( YIXo) 5 10,087967.
Dự báo g tr các biệt:
Nu chúng ta mun d báo giá trriêng biộl V = Yò vi X = Xd khi đó ưc
luọiig cà Yo là, Ỳ0 = p| + p 2 Xó
và Var ( Yo) = o2 [ 1+ + (x ^ - ]: -t= ~T(n-2).
n se(Jo )
i-l
Khoảng tin cậy ca Yo được c định bởi:
P(0 - t'c.a(n-2) se (Yo) í Y , í 0 + t a«(n-2) se (Y0)i = l-.a
. Thí dụ: Hãy d báo múc lãi sut nếu t iạm phát Xỉ = 5%, a = 0,1.
se (Yo) = 1,8184
8,988867 - 1,895 . 1,8184 Yo £ 8,988867 + 1,895 . 1,8184
2.9. TRÌNH BY KT QU PHÂN TÍCH H i QUY
kft qu phâii tích hi quy có th trình bày vn tắt dui dng sau đây:
5,542999 Yo 12,434735
Y . - P , + r2
(se( i )) ( se(. P j )) Bạc t do n - 2
t = (p ,/se ( P , U P 2 /s e ( P 2))" : .
Vi các thông tin trênbưtìc đầu cng ta ththc hiện đuc mt s phãn tích.
40
2.10. THÍ DỤ
\
1. Thí d 2.2: Cho s liu sau đây về ng sut (t / ha) cùa mt loi y
trng và mc phân bón(t / ha) cho loại cây này nh trên mt ha trong 10 năm từ
1988-1997. Hy'uc lượng mô hình hổi quy cua năng sut ph thuc mức phân
bón và tr lời các câu hòi sau đây:
a) H ãy gii thích ý nghĩa kinh tế ca các h s nhn đưc.
b) H ãy tính đ lch tiêu chun ca các ).
c) Vi mc ý nghĩa 5% hãy cho biết mc phân bón có nh hưng đến
năng sut loi cây này không?
d) H ãy tìm khong tin cy 95% cho các h s hi quy.
e) H ãy tính r 2 và gii thích ý nghĩa ca kết qu nhn đưc.
f) Vi mc phân bón là 20 t / ha, hãy d báo giá tr trung bình và giá
tr cá bit ca năng sut vái h s tin cy 95%.
i) Hãy đc kết qu và gii thích các kết qu do MFIT3 đưa ra
Năm
Pn.bón(X) Năng sut(Y) Năm
Phân bón(X)
Năng sut(Y)
1990
6
40 1995 18
58
1991
10
44
1994
22
60
1992
12
46 1995
24
68
1993
14 48 1996 26 74
1994
16 52
1997 32
80
Trưc khi ưc lưng m 90
hình ta vê đ th m ô t quan
h gia Năng sut- Y và
lưng Phân bón-X) tính trên
m t hecta. Trên hình (2.7) ta
nhn xét rng hàm hi quy
tng th biu th quan h gia
Y và X là tuyến tính .
20
10
0
Do đó ta có th ưc lưng
đưc hàm này bng phương
pháp OLS.
Hình 2.7: Sản lượng phân n
0
10 _ 20 30
Phán bón
40
Hàm hổi quy tng th có dng: E(Y/X|) = p, + p2 X, và hàm hi quy mu:
^ P ^ P i X ; .
41
Bây giờ ta sẽ tìm các p , dựa trên bảng tính các giá trị trung gian sau đây.
Bng 2.6 : ưc ưng các tham s
Yi X*
y>
y*
X,
X2,
>'ì X|
ei
*
X1,
40 6
-17 289
-12
144 204
37.08
2.92
8.5264
36
44
10
-13 169
-8
64
104
43.72
0.28
. 0.0784
100
46 12
-11
121 -6 36
66
47.04
-1.04
1.0816
144
48
14
-9
81 4
16 36 50.36 -2.36 5.5696
196
52 16
-5 25 -2
4 10 53.68
-1.68
2.8224
256
58
18 1 1 0 0
0
57 1
1
324
60 22
3
9
4 16
12
63.64
-3.64
13.2496 484
68
24
11
121 6 36 66 66.96
1.04 1.0816
576
74
26 17 289 8 64 136 70.28 3.72 13.8384
676
80 32 23
529
14 .196
322
80.24 -0.24 0.0576
1024
570 180 0 1634 0 576 956 57« 0
47.3Ơ56
3816
T bng nh ta có: Y = 570/10 = 51; X = 180/10=18 .
P i = y lxl / 2 X =956/576= 1,66.
M i-1
P , = - P2 * X =57- 1,66* 18 = 27,12
Vy đưng hi quy mu là : , = 27,12 + 1,66 Xj.
a. nghĩa kinh tế ca các h s p
Theo thuyết, khi tàng lượng phân bón cho mt ha thì năng sut cây trổng s
tâng, p 2 = 1,66 > 0, kết qu này phù hp vối thuyết Con s 1,66 cho biết nếu
chúng ta tăng thêm mt t phân n / ha thì sản lượng s gia tăng 1,66 / ha. fi t =
27,12 c nghĩa khi khng bón phân (X—0) thì năng sut trung bình ca loai cây
trên 27,12 t/h a.
b. Đ lch tiêu chun ca các :
Phương sai ca các p được cho bi các cng thc sạu đây:
42
V ar( y,) =
tức này ơ2 chưa biết, ước lương cùa nó : 2 = = 47,3056 / 8 = 5,9132;
n - 2
à = 2,432. Thay 2 vào các biểu thức trên và lấy n bc 2 ta có đ lch tiêu
chun ơng ứng:
c. Mc phán bón / ha nh hưng đến năng sut cùa loi cây trên
không? Đ tr lời câu hi này, ta phải kiểm định giả thiết sau đây:
Với mc nghĩa 5%, ta có (0025(8) = 2,306. I tj I = 16,43 > 10025(8), do đó
gi thiết Ho b bác bò. Điu này có nghĩa là lượng phân bón / ha có ảnh hưởng đến
năng suất.
d. Khong tin cy 95% cho các h s hi quy:
Khong tin cy ca các h s hi quy được cho bởi công thc sau:
( yi - 1 a/2 (n-2) se(p i) < Pi< P i + 1 /2(n-2) se(yj)) , i =1,2.
Khong tin cy đi với Pi :
(2742 - 2,306* 1,98 < p, < 27,12 - 2,306* 1,98)
e. H s r1: r2 = ESS/ TSS = (TSS- RSS) / TSS = (1- RSS/TSS)
r3 = 1- 47,3056/1634 = 0,971.
Như vậy ng phân bón gii thích xp xỉ 97% s biến thiên ca năng suất.
f D báo giá tr trung binh và cá biệt khi mức phân bn là = 20 t / ha:
Phương sai ca giá tr trung bình:
se(
P
,) =
2,432 = 1,98 ; se( /? 2) = 2,432/ V576 = 0,101;
Ho: 33 = 0
H| : P2 * 0.
t2 = (y2 - 3j) / se(y,J = (1,66-0) /0,101 = 16,43.
22,55 <p,< 31,69
Khong tin cy đi vối p2 :
(1 66 - 2,306* 0,101 < p2 < 1,66 - 2,306* 0,101 )
1,43 < p ,< 1,89
43
VarCf0W ( - + (* ° X- ) = 5,9132 (-L + g ^ j p L ) = 0,63238.
n ^ x 2
M
Se(0) = 0,795.'
Pơng sai cùa giá trị cá biệt:
Var(Y0)=<t2( 1+~~ + {X°~ X )- ) = 6,54558 ; Se(Y0) = 2,558.
" t x.
/-1
Mt ước lượng điổm ca năng sut khi mc phân bón là 20 t / ha.
0 = 27,12+ 1,66 * 20 = 60,32
to.o2í(8) = 2,306.
Khong tin y 95% cho mức sản lượng trung bình là:
0 - se( )t0,02s(8 ) < E(Y/ x = 20) < 0 + se( 0 > ^ ( 8 )
60.32 - 0,795* 2,306 < E(Y/ Xo = 20) < 60,32 + 0,795* 2,306
58,468 <E(Y/Xo = 20) <62,153
Do vậy khong n cy 95% cho mức sân ợng cá bit là:
Y0 - se(Yo)to,oj5(8) < Y0 < yo + se(Y0)t002J(8)
60.32 - 2,558* 2,306 < Y < 60,32 + 2,558* 2,306
54,421 < Y0< 66,218
h K ết qu ưc lưng mò hình này bng MFIT3:
Ordinary Least Squares Estimation
>|B^^4c^Jfe3K3|r>|r3|c3^4c9^4c3fca#c9|(i|ca|e4(4«3|ca|cafca|c3fc3|e3fca<c4c>|(f«aÌ«4**l«*K:4«3|«*Ì(a|«4(3|c3|c>Ìe3Ì>4e>|e3Ìe3Ìe4e3f<4c9|eaiiaica|caÌcfcafc
Dependent variable is Y
10 observations used for estimation from 1 to 10
I|ti|(%^9fr4e9|c3|c9|c3#c3fc3|c3fc4c3|c4e9fe3fe3fe3ic3|<3|ca|e3|(3f(>|(4e4*3|clc4c3fca|(3ieai(9fc3f(fc3fcafc9ic3ic3ic4e3|e#cafv9#:3|c3ie9ic9|c3|e3|c3tea|eafe9f(ace
Regressor Coefficient Standard Error T-Ratio[Prob]
1NPT 27.1250 1.9793 13.7046[.000]
X 1.6597 0.10132 16.3808[.0C0]
R-Squared .97105 F-statistic F( 1, 8) 268.3312[.000]
R-Bar-Squared .96743 S.E. of Regression 2.4317
Residual Sum of Squares 47.3056 Mean of Dependent Variable 57.00
S.D. of Dependent Variable 13.4743
Maximum of Log-likelihood -21.9596
DW-statistic 1.7836
44
Mt s Uiut ng:
Ordinary Least Squares Estimation: ước lượng bình phương nh nht c điển
Dependent variable = Biến phụ thuộc
Observation = 'Quan t
Regressor = Biến đc lập; Các phần mm kinh tế Iuọng đếu coi h s chặn
đưc nhân vi mt biến mà biến này ch có giá trị dùy nht bng 1. INPT là n
thưng đưc dùng cho iúến y. Nếu mun, ta có th dùng tên khác. phương
pháp ma trn ta s thy tin ích cùa vấn để này.
Coefficient = H s - giá tr a các P tuong rtg vi bộ s liệu dùng đ uúc lung;
Standard Error = Đ lệch tiu chun - c se( P)\
T-Ratió[Prob] = T s t[ Xác sut ] = p / se( P )[Prob];
[Prob] = p- value = P( I t(n-2) I > I p / se( p ) I). Có th dựa vào g trị y để
kim đnh gi th iế t: Ho: Pi = 0 ; H |: (3 * 0;
Nếu như a > p, suy ra a / 2 > p / 2 và t 0/2 < t p/2 thì Ho b bác bỏ. Tờng hợp
ngưc li, nếu a < p, suy ra t /2 > t , /2. Với t(n-2) < t p/2 thì t(n-2) cũng nh hcm t
a n . Điu này có nghĩa là khng có cơ s bc b H,. Như vy nếu a > p thì Ho b
bác bò, a < p thì không có cơ sà bác b Ho.
Chú ý rằng p-value trong phâíi b T, khi dùng MFTT3, đưc tính bằng công thc: JV-
value = P( I t(n-2) I > I y/se(/5)|). Nếu chúng ta kim định mt phía, ngWa H,: p,
> 0 (hoặc 3 < 0) đù cn so nh a với p/2 sau đó kết luận một cách tuơng tự.
R-Squared = r2; R-Bar-Squared = r đã hiộu chỉnh, được ký hiệu là:~ p .
Residual Sum of Squares = RSS = Tng bình phương của các phn dư.
S.D. of Dependent Variable = Đ lệch tiêu chun ca biến ph thuc =
r -y
F-statistic F( 1, 8) = 268.3312[.00Ọ]. G trị F (l,8) đưc nh bng công thức
1^ * n 2 .ặ
P( 1 g) = 1 - . Trong hi quy hai biến giản đơn, giá trị này cũng bng bình
phương ca tỳ s t ng với hê s c, trong ví dụ này, ta có t2 = 16,3808. Bình
piiuỡng t ta có (16.3808)2 = 268,3306. Kiểm định F đây là kiểm đnh mt phía vì
Ho
I
3
- 0- Hj: r3 > 0. Do đó g trị p-value được so nh trc tiếp với a .
s E of Regression = đ lệch tiêu chưẩii cùa hàm hi quy - .
Mean of Dependent Variable = Trung bình cùa biến phthuc.
45
2. Thí d 23: Cho kết qu ước lượng sau đây bng MFIT3, trong đó Y- tổng
chi tiêu; X- thu nhp sau thuế trong khong thi gian (1986-1997) và cho X =
145; £ x,2 =4817.
M
Ordinary Least Squares Estimation
*************************************************************
Dependent variable is
12 observations used for estimation from 1986 to 1997
***************************************************************
Regressor Coefficient Standard Eưor T-Ratio[Prob] :
ENFT 2.1288 7.1641 29715[.772]
X . ' .86118 .048943 17.5955[.000]
****** I*.********************************************************
R-Squared .96871 F-statistic F( 1, 10)- 309.6016[.000]
R-Bar-Squared .96558 S.E. of Regression 3.3951
Residual Sum of Squares 115.2685 Mean of Dependent Variable 127.0000
S.D. of Dependent Variable 18.3005 Maximum of Log-likclihood -30.6014
DW-statistic 1.7822 .
***************************************************************
a. Hãy viết hàm h6 i quy mu cho biết kết qu ước ng có phù hp vi lý
thuyết kinh tế không? Vì o?
b: Với mức ý riga 5%, phđn tiêu ng không ph thuc vào thu nhập có
khác không hay không?
c. Với m íc ý nghĩa 5%, thu nhp sau thuế có nh hưng đến mức tiêu ng
hay không?
d. Hãy tìm khong tin cây 95% cho h s góc.
e. Cho mức thu nhp sau thuế ià 150, hãy d báo giá tr trung bình và giá tr
cá bit cùa mc tiêu dùng vi hê s tin cy 95%.
46
2.1. Hãy gii thích các khái niệm sau đây:
a. Hàm hi quy tng th và hàm hổi quy mẫu.
b. Yếu t ngu nhn phần dư.
c. Các h s hi quy, ước lượng ca c h s hồi quy.
d. T tương quan.
e. Phương sai ca sai s đng đều.
f. Hàm hi quy tuyến nh.
2.2. Cho các mô hình sau đây, m nh nào tuyến nh đi vói tham số, m hình
nào tuyến nh đi với các biến số, mô hình nào là tuyến nh đối với c tham
s và cà biến s? Mô hình nào mô hình hi quy tuyến nh?
a.Y= p, + p2/X +U ; đ. Ln(Y) = Pi + Pj ln(X) + U;
b. Y = p, + p,ln(X) + U; e. Ln(Y) = p, + p2 / X + U;
c.L n (Y )= 0i + p2 x + u.
2.3. Các mô hình sau đây có phi là mờ hình hổi quy tuyến nh?Vì sao?
a. .Y = exp(|3| + p2 X + U).
b. ¥ = 1 /(1 + exp(Pi + p2 X + U)).
c. Ln(Y) = p, + p2/x + u
d. Y = 3 , + p2í x + u
2.4. Hãy biến đi các mô hình sau đây về mô hình hi quy tuyến nh.
a. Y = l/(P, + Pi X);
b. Y = X / (P, + Pí X);
c. Y = 1 / ( 1 + exp(-Pi - p2 X)).
25. Cho các giả thiết ct (1), hãy chì ra rang các giả thiêt cột (2) tuơng đuong.
Các gi thiết cùa mô hình hi quy c điển
0 ) (2)
Ei / Xi ) = 0 E(Y./Xi) = p,+p2Xi
Cov(Ui, Uj) = 0 , i * j Cov(Yi, j) = 0, i * j
Var(U/ X |) = 0 Var( Y / X i) = 0.
2.6. Trong mô hình Yi = Pi + Pí X + Uj.
a. Nếu ta nhân mi Xi vdi mt hng s, chng "hn 10, khi đó các e và
các giá tr ý s thay đi? Hãy gii thích?
b. Nếu ta cng vào mi X| với mt hàng s thì các e và các giá tr sẽ
thay đi không? Hay gii thích?
I TP: CÁC KHÁI NIỆM VÀ MÔ HÌNH HI QUY HAI BIẾN
47
2.7. Bng dui đây cho cặp' biéh ph thuc và đc lập. Trong mi trơông hp
cho biết quan h giSa hai biến li: ng chiềui nợc chiu hay không xác
đnh. Hãy gii thich.
B iến P hu th u c B iến đ òc lp
a. GNP Li sut
b. Tiết kim cá nhân Lãi suit
c. Cu v tién GDP
d. Sản ng Vn cơ bn( hoăc lao đng)
e. Lưng cu vé xe máy ' Giá Xăng
f. Lưng đin tiêu th ca G á ga
h gia đình. .
2.8. Bng sau dãy cho chui thòi giạn v mức áSu dng (Y) / đU ' ngưi và thu
nhp( X) / đu ngui nh theo giá c định (1980, n vị: 100.000 VNĐ) Song
thi k t 1971-1990 ò mt đa pơng . .
Năm
Y
X
Nàm
Y
X
1971 48,34 52,02
1981
57,17 .
6336 !
1972 48,54 52,41
982
60,84
67.42
1973
47,44 51,55
1983
60,73 67Ị86
1974 54,58 58,88
.1984 76,04
§3,39
1975 55,00 59,66
1985 76,42 84,26
1976
63,49 68,42
1986 69,34 77,41
1977
59,22
64,27 1987 61,75 70,08
1978 57,77
63,01 1988 68,78
77,44
1979
60,22
65,61
1989
67,07
75,79
1980 55,40 61,05
1990 72,94.
81,89
T bng trèn nh đuc: X - 76,289; Y = 61,054; X;2 = 1961Ị1;
X* = 92520; y = 1414,7; I X! y = 1658,2.
a. Hãy u<fc ng mô hình Y = Pị + Pj Xj + U|.
b. Hãy cho biết kết qu uc ng có phù bop với l thuyết kinh tế không?
Visao?
c. Hãy tính ESS, RSS, ước lung ca phương sai cùa u.
d. Vói h s tin cậy 95% y úm khoẻng tin cậy cùa c K 'số hồi quý,
e. Vi mc ý nghĩa 5% hãy kim đnh gi thiết p2 = 0. Tdr kết qú nhân
được hãy nêu ý nghĩa vé mt kinh tế cùa kết luânT
g. Hãy tính và gii thích ý nghĩa ca I1.-.
2.9. Quan sát ngu nhiên 10 người trong tuẩn người ta có các .sđ liu sau:
48
Thu nhp $ (X)
31
50 47 45
39
50 35 40 45 50
Chi tiêu $ (Y)
29 42
38 30 29
41 23 36 42 48
' 10
10 10
Ngưi ta nh được: = 547,6 ; = 403,6 ; / .y XI = 385,4 ;
1=1 /-I /=1
RSS = 132,3561. Cho a = 5%.
a. Bộ s liu trên thuc loại s liệu ?
b. Ưc lượng hàm hồi quy dạng tuyến tính: Y = pi + (32 X + u
c. Nâu ý nghĩa kinh tế ca các h s hổi quy ưc lượng dược. Các g trị đó
phù hp với ly thuyết kinh tế không?
d. Tìm r bng 2 cách ứng vi 2 trường hp: biết và không biết RSS. Giải
thích ý nghĩa r2?
e. Có ý kiến cho rng thu nhập không nh hưdng đến chi tiêu, bn hãy nhận
xét v ý kiến này(thc hiện bng 2 kiểm định: t F).
f. Tim khong tin cy 95% cho hệ số góc.
g. Trong các thi k trước người ta vẫn đùng 80% thu nhp cho chi.tiỄu,
thể kết luận rằng trong thời k quan sát tỷ l y đã giảm hay không?
h. Hãy d báo mc chi tiêu trung nh nếu thu nhp tun là 42$.
2.10. Mt công ty sản xut mt loại sản phẩm. Lượng sản phm (Q) mà cng ty
sản xut ph thúc vào giá sàn phẩm y trên thị trường (P). Da trên s liu trong
27 tháng t tháng 1 năm 2006 đến tháng 3 năm 2008, người ta ưc lượng được
hình dưới đây. Cho a = 5%; Q nh bằng 1000 sản phẩm, p nh bằng nghi đồng!
Ordinary Least Squares Estimation
* * * * * * **** * * * * * **** **** * * * * ** * * * * * ** ** * * * * * * * * * * * * * * * * * * * * * * * * *
Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
*****************************************************************
Regressor Coefficient Standard Error T-Ratio[P-ob]
p 0.389687 0.118694 3.283121 [C0028}
INPT 10.31076 2.586328 3.986638 [0.0004]
*****************************************************************
R-Squared 0.277958 F-statistic F( 1,25) 10.7788[.0027]
R-Bar-Squared 0.25217 S.E. of Regression ' 3.989267
Residual Sum of Squares 445.599 Mean of Dependent Variable 18.45833
S.D. of Dependent Variable 4.613 Maximum of Log-likelihood -83.04149
DW-statistic 2.409
a. Viết hàm hi qu tng th', hầm hổi quy mẫu.
49
b. H s chn và hộ s góc đuc ưc lượng bng bao nhu?
c. Cc h s thu được t hàm hi quy m&ú có p hp thuyết kinh tế
không?
d. Các hê s ca mô hình có ý nghĩa thống kê không? Con s [Prob] cho biết
điu gi?
e. Có th nói rng khi gi thay đi thì lttợng cung có tha đi không?
f. H s xác đnh đo đ php cùa hm hỏi quy bng bao nhu, giá tr đó
có ý nghĩa ?
g. Hàm có th coi là phù hợp khững?
h. Tìm ưc lưng đim cho phuong sai y.ếú t ngu nhiên
L Tng bình phương phn dư bng bao nhu?
j. TSS và ESS bng bao nhu?
k. Tìm khong tin cy cho h s chn và h s c ca mô hình
1. Khi giá tăng thêm 1 nghìn thì lượng cung thay đổi trung bình trng khoảng
nào?
m. Khi giá tăng 1 nghìn thì lượng cung tăng tối đa bao nhiêu?
n. Có th nói khi giá gim 1 nghìn .thì lung cung gim 0,5 đom v đưc
không?
o. Tìm mt ưc lưng diển cho lưọng cung khi giá là 10,5 nghìn đng,
p. Tìm ng cung trung bình và cá bit khi g là 10,55 nghìn đng.
2.11. Mt cơ quan nghiên cứu mi quan h giữa s đơn vị sn phm và các yếu tố
đẩu vào ca quá trình sn xut mt s ca s sản xut đã đưa ra nhng mô hình
hồi quy. Lúc đu ngưi nghin cứu chú trng vào qun ngun nhân lực nên đưa -
ra m hình sau:
Với s là sản lucmg, L là lao đng (ngưi). Cho á =5%.
Ordinary Least Squares Estimation Ordinary Least Squares Estimation
Dependent variable is s
20 observations used for estimation from 1 to 20 <
Regressor Coefficient Standard Error T-Ratio[Prob]
INPT 34.4438 29.0219 1.1868[.251]
L 19.2371 6.8786 2.7967[.012]
R-Squared .30290 F-statistic F( 1,18) 7.8213[.0'2]
R-Bar-Squared .26417 S.E. of Regression 49.5267
Residual Sum of Squares 44152.1 Mean of Dependent Variable 109.4666
S.D. o f Dependent Variable 57.7367 Maximum of Log-likelihood -105 .3754
DW-statistic 0.7151
*****************************************************************
50
a. Viết hàm hi quy tổng th, m s đó các tham s có ý nghĩa như thế
nào?
b. Viết hàm hi quy mẫu. Các h sô' cùa m hổi quy mu có phù hợp
thuyết kinh tế không?
c. Theo thuyết thì khi không có lao động s kng sản lượng, nhưng
trong m hổi quy mu thì khi kng có o động ước lượng điểm mức sn
ng li không bng kng. Trên thực tế gia trị đó có th coi bng 0
hay không?
đ. Hộ s góc ca mô hình có ý nga thng kê không?
e. H s xác định bng bao nhu %, giá trđó có ý nghĩa như thê' nào?
f. Có th nói hàm hồi quy phù hợp không?
g. Tim ước ng điểm khong cho phương sai yếu tô' ngu nhiên.
h. RSS, TSS, ESS bng bao nhiêu?
i. Tim khong tin cy cho hê sô' chận ca hình.
j. Khi doanh nghip thêm mt lao động thì sàn ợng tăng trong khong nào?
k. Khi gim bót 1 lao đng thì sản ợng giảm tối đa bao nhiêu đơn vị?
1. Có th cho rng khi bt 1 lao động thì sản lượng giảm 30 đơn vị được
không?
m. Nếu tăng 1 lao đng thì sản ợng tăng nhiều n 20 đơn v có đúng
không?
n. Tim ước ng đim mc sn lượng vi doanh nghiệp có 30 lao động.
o. Tìm mc sản ng trung bình và cá biệt khi doanh nghiệp có 30 lao động?
51
CHƯƠNG in
Hi QUY Bi
Mô bình bi qui hai biến duc trình bày chuông n là mt mô hình gin đem
nhái. Trong nhiu trưng hp mô hình này khng phù hp có nhièu biến c
đng đến biến ph thuc Y, nếu như chì dùng mt bến đc lập thì khng thể gii
thích đuc s biến đi cùa biến Y. Chng hạn khi nghiên cứu nhu cu v mt loại
hàng hóà nào đó (Y), thì nhu cu y ph thuc vào nhiều yếu t, trưc hết là: thu
nhp ca ngưi tiêu dùng, giá ca bn thân bàng hóa, giá cùa các loi hàng hóa
thay thế tỊ*ng hóa này ... Do đó cn phi m rng mô hình hi quy hai biến thành
mô hình có cha nhiu biến hon, đây là mô hình hi quy bi 3 biến và sau đó s
trình bày m hình dưi dng tng quát có s biến đc lp bt k bngiphuong pp
ma trn.
3.1. MÔ HÌNH HI QUY BA BIẾN
Giống như bong m hình hai hih, hằm hồi quy 3 biến của tổng th PRF dng;
E ( YI ) = Pi + p2 + PjX (3 .1 )
PRF là k vng c điu kiên ca biến Y với g tr đã cho ca các biến và Xj
Trong đó Y : Biến ph thuc; Xì, X j: Các biến đc lập.
Pi : H s t do ( h s chăn ), nó chính là giá tr trang bình cùa biỗh Y
khiX j= X3 = 0.
p2 , p3 : Gi là các h s hi qui riêng.
g tr ca biến Y quan sát th i, khi đó:
Ỵ= E ( Yl Xa . X,,) + = p, + Pa Jfc + .p, Xji + .
L là yếu t ngu nhiên, s tồn tại cùa u đã được gii thích chương I.
3.2. CÁC GIẢ THIT CA MÔ HÌNH
- Các lí có k vng bng 0 :E( iXa.Xji) =0(Vi)
- Khổng có sự tương quan gia các Ư,: Cov ( , Uj ) = 0 Vi * j
- Các 15 thun nht: Vai ( U ) = a2
- Giữa các biến gii thích X2, X3 không có quan h tuyến nh
- u có phân b N (0 , o2).
Trong mô hình hi quy bi có thêm mt gi thiết mi - gi thiết th 4 - giữa
các biến Xị, x 3 không có quan h tuyến nh. Nếu I)hư XiJii có quan h tuyến nh
vi nhau thì ngui ta nói răng có hiện tượng đa cng tuyến. Chúng ta s gii thích
52
mt cách sơ lược v gi thiết này. chương V chúng ta s giải thích u n. Các
gi thiết khác đã đưc nói cơng II.
mt hình thức, nếu như hiện tuợng cộng tuyến giữa cc biến giải thích
và trong mô hình có tt c các biến này (hì chúng ta không th ch được ảnh
hưởng cùa từng biến lên biến biến ph thuộc Y. Thật vậy:
Gi s Xa = 3Xj|
Khi đó Yi = p, + & Xji + (3, X,, +
= P, + 3PĨ Xa + pjXji + U
= Pi + ( 3 P2 + p3) x 3[ +
Đt P3 = 3 P2 + P3 => Yi = (3] + P3 x3i + Ư,
Như vý trên thc tế ta có mô hình hai biến mà không phài mô hình ba biến.
Uarc ng mô hình này bng phương pháp OLS ta m được p ' 1, P 2 ước ợng
cùa p, và p3 . p 2 là nh hưởng kết hợp của Xj và x 3 lên Y. Chúng ta khng
cách nào đ tách riêng ra trong P2 bao nhiêu là p3.
Gi Ihiết 4 nói rng hàm PRF chcha các biến giải thích mà chúng không
phi là hàm tuyến nh ca mt vài biến nào đó trong hình.
nghĩa ca các h s p2 và
E (Y IX ii^ i) = p1 + pjXii + P3X i.
= p2 . Điêu này có nghĩa khi chúng ta giữ nguyên yếu tỐXí (Xì-
ÕX2
constant) thì giá trị trung bình a biến phụ thuộc Y sẽ thay đổi (tng hoặc giảm tùy thuc
vào du của P2 ) P2 đơn v cho mi đơn vị ng cùa yếu t X2.
= P3 điẽu y nghĩa là giá tri trung bình cùa biến Y tăng ( hoặc gim)
â X y
03 đơn vị cho mi đơn v tăng của x3. Nhu vậy c h s tíi qui riêng ( hsố góc) phản
ánh ảnh liuủng của mt biến giải thích đi vói giá tr trung nh cùa biến ph thuộc khi giá
trị cùa biến giải thích khác chứa trong hỉnh không đi.
3.3. u c LUNG CÁC THAM s CA MÔ HÌNH Hi QUY BA BIN
Đ ước lượng các tham s ca mô hình:
E ( YlXji, X31) = Pi + P2 Xji + P3 Xji
53
chúng ta s dng phuong pháp bình phương ti thiu OLS, tư ng chính của
phuong pháp này đã được trình bày chương n . »i - ; ; '
Gi s chúng ta có n quan sát, quan t th i-có 3 g tri ứng vi Y, Xĩ,
vàX 3,k íh i u ( ,JQ í,Xal). ; í .
Hàm hi quy mu SRF đưc xây dng tìm quan st này có dạng:
Yj = p, + p2 Xái + P3 Xai
Trong đó Pi : i=l,2,3 là ưc lượng tương ứng cùa Pi: i=l,2,3.
Khiđó Yi=p, + Xii + p 3 X^ + e,; e, là phn dư ứng vi quan sát th i,
é, = Ya - | = Y, - Pi - P2 Pa
Phuơng pháp OLS tính g tr cùa các tham s Pi , P2 , P3 sao cho:
RSS= £ ^ * = 1/ ( -P, - PjXa-PjXj,)2 =>min.
A iBU A ,
Các tham s P , P2,P3 đuc tính t h phương trình chuán sau đây:
P .+ p2 X 2+ P3 x 3=
P i £ x«+ , í X,+ Pxí X3= z YịXa
j»l i»l i«l i-1 i-|
P, í *31+ P2 x3j + p , Xi =
Yi x3i.
i«al i»l i»l i»l
Trong đ ó :
x , = 5Wn;X3= Xa/n; = í Y,/n.
Đt :yi = Y - Y ; Xjj = Xjj X2íXjj=J^j- X3 .
Gii h phương trình ta đuc;
, - - p2 x 2 - p , x 3
( >'*iM È xĨJ - ( M iX ix2ixjiJ
P 1-1 1=1 M W
( j xì ) ( j xh ) - ( é Xĩix} i)2
i-l /-/ 1*1
ix3 X ^ jx2j) (£yj* 2 i x3i)
P
_ _ii
______
i-1 -
______
-______
3 A J L , r~ĩ
-------------------
(zCXJ iX 2 X3i)_ ( 2 j X2iX3i)2
. » . w i-1 i-l
Pi . P2 . P3 dưc gọi các uc lưng bình phưcmg nh nht.
54
Thí d 3.1
Bảng sau đây cho s liu v doanh thu 00, chi phí- cho qung cáo (X2) tiền
lương ca nhân viên tiếp th (X3) của 12 ng ty tu nhân ơn v 1.000.000 đ ). Xây
dng hàm hi quy ph thuc vào Xì, x 3.
STT
Y
X,
X, X,=x,- X , X i X, - X ,
1
II
1
127
18
10 -2,417 -2,167
-14,333
2
149
25
11
4,583 -1,167 7,667
3
106
19
6 -1,417 -6,167
-35,333
4
163
24 16
3,583 3,833
21,667
5
102
15
7
-5,417
-5,167
-39,333
6
180 26 17 5,583
4,833 38,667
*7
161 25 14
4,583 1,833
19,667
8
128
16 12
-4,417
-.1667
-13,333
9
139
17 12 -3,417
-.167
-2,333
10
144 23 12
2,583
-,167 2,667
11 159
22 4 1,583
1,833 17,667
12
138
15
.15
-5,417
2,833
-3,333
1696 245
146 0
0 0
STT
Xi1
Xj-
yx2
y*3
X2X3
y'
1
5,840
4,694
34.3 Ĩ.5 5,236 ÌỎ5.444
2
21,007 1,361
35,139
-8,944
-5,347 58,778
- 3
2,007 38,028
50,056
217,889 8,736 1248,4
4 12,840
14,694
77,639
83,056 13,736 469,444
5
29,340
26,694
213,056 203,222 27,986 1547,1
6
31,174
23,3611 215,889
186,889
26,986
1495,1
7
21,007
3,361 90,139
36,056
8,403
386,778
8
19,507
,028 58,889
2,222 ,736
177,778
9
11,674
,028
7,9722
,389
,569
5,444
10
6,674
,028 6,889
-,444
-.431
7,111
11
2,507
3,361
27,972 32,389
2,903 312,111
12
29,340
8,028
18,056
-9,444
-15,347 11,111
192.917
123,667
836,333
774,333
74,167 5924,7
Theo kết quà bng trên đây ta có: Y =1696/12 = 141,3333.
x 2 = 245/ 12 = 20,4167 và X j =146/ 12 .= 12ÌÌ667.
Theo các công thc ( 3ế2 ):
836,3333-123,6667-774,3333-74,1668
P2 - 192,9167 123,6667 - (74.16668)2
= 4 7587. P, = 141,3333 - 2,5057 . 20,4167 - 4,7587 . 12,1667 = 32,2773.
55
e,
é*!
124,9673
2,0327
4,1319
147,2661
1,7339
3,0064
108,4383
-2.4383
5,9453
168,5530
-5,5539.
30,8450
103,1741
-1,1741
1,3785
178,3240
1,6760
0,2940
161,5422
-0,5422
0,2940
129,4732
-1,4732
2,1703
. 131,9790
7,0210 49,2944
147,0134
-3,0134
9,0806
154,0250
4,9750
24,7506
141,2436
-3,2436
10,5209
0
144,2269
PHUONG NH NHẤT
Phương sai và đ ch chun ca các ưc ợng bình phương nh nht đuợc
cho bi các công thúc sau đ&y:
var( j ) =
l ch chun ca các ưc lượng bình phương nh nh
: sau đ&y:
xi !
__
;
________
2-2
__________
o 2
( 4 X 4 ) - (Jxj.xj, )2 £ x |, (1 - r)
i-1 i-l i-l Í_1
Trong đó r23 là h s tuơng quan mu giữa biến Xi và X j.
se ( ) = -y/variPj)
pl
i-l
var(P3)s --------f
(Txi)(ixi) - ( gxilx3l)ỉ
W i-1 M /!
s e ( P 3)= VvarCP3); cov( p 2 , 3 ) =
------------
O - t y í x J Ì x ,
56
( È x 2ix3i)
Trong đó 1 2 3 h s tướng quan giữa biến Xi và Xi .r = V 2 v ~
2-i*2i Z jX3
Trong các công thúc ưên ơ2 phương sai c a U nhimg chưa biết, u&c ợng
không chêch ca o2 l à : ơ 2 = = ẼỄỄ.
n - 3 n - 3
3 là s tham s ca mô hình, trong trường hợp tổng quát nếu mô hình có k
th a m s p ,, 02 ... pk thì 2 = e/ ' ( n - k
ik
Vi các S liu thí d3.1, ta có:
n - 3
=144,2269/ 9 = 16,0252
123,6667 » /
-----
-ĩ
Var( p2) = i 3 3 ^ 6 7 5 -16,0252 * 0,107959;Se( p 2)=1/v a r(p 2) =0,32857
Var < p 3 ) = ĩ S ă r S l6 0252 * ° 16841 :Se( Â ) = # i ) = ° '41038
1o3j 0 ,0 /j
3.5. MÔ HÌNH HI QUY TUYN TÍNH K BIN-PHUƠNG PHÁP MA TRẬN
Phn này giới thiu vi bn đc mô hình hi quy bi k biến bng ngôn ng ma
trn. Vi ngôn ng ma trn kết hp vi kỹ thut nh toán cho phép chúng ta giải
quyết các ván d cùa phân tích hồi quy mt cách nhanh chóng, chính c.
Hàm hi quy tng th có dạng
Yj = Pi + piX* + .. + pkXki + U
Trong đó (3| là h s tự đo (h s chặn).
Pj: j = 2, k là các h s hồi quy riêng.
Giả s chúng ta có n quan sát, mỗi quan sát gồm k giá trị (Ỵ,
.....
Xci)
Y| = Pi + pĩXíi +•• + PkXci + u,
= pi + PỉXáí + l i
Y = Pi + pXín +... + PkXic, + IỊ,
'V ,'
P r'
' u , '
hiệu: Y=
Y,
; p =
; u =
u 2
.Yn.
.Pk.
u ế .
57
1
*21
x n ..
X u '
x =
1 X j2
x 32 .
X ^
,
x 2„
x 3n
Khi ta có: Y = xp + U
Gi thiết 4 nói rng gia các biến đc lập không có quan h tuyến tính vi
nhau, khi đó các ct ca ma trn X l dc lập tuyến nh. Do đó hng ca ma trận X
bằng s ct ca ma trăn này tức là R(X) = k, ma trn X khng suy biến.
Thí d 3.2. Với thí d 3.1 ta ma trn Xnhư sau:
X =
1,0000
18,0000 10,0000
1,0000 25,0000 11,0000
1,0000
19,0000 ,
6,0000
1,0000
24,0000
16,0000
uoooọ 15,0000
7,0000
1,0000
26,0000
17,0000
1,0000
25,0000
14,0000
1,0000
16,0000
12,0000
1,0000
17,0000
12,0000
1,0000
23,0000
12,0000
1,0000
22,0000
14,0000
1,0000
15,0000
15,0000
3.6. UC LUNG CÁC THAM s - OLS
Hàm hi qui mu SRF c dạng
,= p , + M 2i + . . . + p k X ki
Y |= P i + P X jj + .. . + p k X kj + e i
Y=xp+e
hay
Trong đó e =
. = Y -X P
Các uớc lượng OLS duc m bằng cách:
58
£ .2 = 2 ( - p, - p2X2i-...-p kX ki)2^min
i 1 i*l
e? tng bình pơng ca c phn (RSS).
i=j
e'e = e ĩ = (Y -X P )'(Y -x p ) = Y Y- P ,X Y-YXP+ p'x xp
= Y Y -2 p'X Y + p 'x 'x p
= -2X Y + 2X x p X Y = x x p
n
£*2i
z x 3i
- ZX/0 '
P.'
1*2,
v
I ^ 2 i x 3 i
5 %
p2
VC
I X t à
^ /
5
í: fo
.
X X
P
1 1 - i '
r
II
X 2Ì x 22 " x 2 n
y2
1
?
»
1
^
1
X' Y
Vi gi th iết4, X kỊiông suy biến, n XX cũng không suy biến,iđo tíó tồn tai
(X *X) . T đó: p = ( X X) A Y.
Thí dụ: Vói ma trn X thí d 3.2, khi đó:
'1 2 245 146'
; ( x 'x ' =
2,440
-0,0884
-0,0454
X X =
245 5195
3055
-0,0884
0,0067
-0,0040
146 3055
1900
-0,0454
-0,0040
0,0105
'1696
32,2773"
X Y =
35463,048
21409,652
: .
-
2,5057
4,7587
59
3.7. MA TRN PHUONG SAI CA 3
Đ kim đnh gi thiết, tìm khong tin cy. cOng như thc hin các suy luân
thng kê khc cn phi tìm var(Pi), = 1, k và Cov( pi, P j). Phuơng pháp ma
trn cho phép chúng ta tìm chúng mt cách d dàng.
Ma trân hip phuơng sai của:
> a r ( ) C ơ v í ,^ ) - CovCPv ếk)
VarCpj) - Cov(P2J k)
Cov(P) =
C o v { P k , P C o v ( k J 2 )
-
V a r ( p k )
Cov( ) đuc xác đnh nhu thế nào?
ì= (X 'V 'X 'Y
Y = xp + u
P = (X 'X )lX'(Xp + ) = p + ix'xr'x'u
- P = ( x 'x )' x 'u
Cov(p) = E i(P - P) (P - P) ] = E{[(xx)'x u][ ( x x ) ‘x u ] }
= E[(X'X) 'X u u X(XX )•*]=(X'X) X E(UU')X(X'xy
= (X,X)IXo2IX (X'X )'
Cov(P) =Ơ2(X 'J '
Trong công thc trên (X X) ' là ma n nghịch đo cùa ma trn (X X ), a2 là
Var (), nhung chua biết chúng ta phi dùng ưóc lược khng chch ca o2 là:
* = £ e / ( n - k )
e' e = -!
Vi thí d 3.2 thì:
Cov(/) =
er
> . ,
= i-> (Y i-Yi ) = Y ' Y -2 ' Y + ' Y
= ' Y -2P'X'Y + P'X'XP
= Y Y- P 'X 'Y .
39,1009 -1,4164 - 0,72713'
-1,41464 0,10796 - 0,064747
-0,72713 -0,064747 0,16841
60
3.8. CÁC TÍNH CHẤT CA UC LUNG BÌNH PHUDNG NH NHT
Trong mô hlnh hi quy bi c ưc lượng binh pơng nh nht có c tính
cht ging nhu trong mô hình 2 giản biến đơn. đây chnêu ra các nh cht, việc
chng minh các tính cht này duc .ình bày trong phàn phụ
lục m .2, sách ! Kinh tế ng - Nhà xut bn Khoa hc và K thut, 2001.
đơn gin hoá ới đây ch đưa ra c nh cht đổi vi mô hình có hai biến đc lập.
Tuy nhn nhng tính cht này đúng cho mô nh có sđ biến đc lập bt kỳ.
1. Đưng hi quy bi cùng đi qua đim ( Y , x 2 , x 3)
2. = Y
3. e, = 0
i-l
4. Các phn dư e không tương quan với Xa và x3i, nghĩa :
Ci Xíi = 2 ^ e, x 3i = 0
i=l i=l
5. Các phn đưe-, không tương quan với ; : J ei j = 0
i-1
6. T công thc se ( P2 ) và se ( 3 ) ta thy rng nếu như giữa X và X,
quan h tuyến tính quá cht, Ĩ23 * ± 1 thỉ var( P j ) và var(p3) rt lớn. Do đó ta s
khó khăn trong vic đoán nhn giá trthực ca p2 và p3. Vấn d này s được giải
thích dy đ hơn chương V.
7. T công thc xác đnh var( P2 ) và var(P3), la thấy chúng tỷ lệ thun với ơ2
và Ĩ23, t l nghch .vi J [ X x3i I Như vậy s biến thin cùa Xi càng lớn t
i-1 Vi=i /
var (Pj) càng nh, hay Pj càng được ước ợng chính c.
8. P2 , p3 là các ước ng tuyến tính không chch có pơng sai nh nhất
trong lớp các ng tuyến tính không chệch cùa p2 và p3.
3.9. UỚC LUNG HP LÝ TI ĐA ( ML)
Vi các gi thiết đã trinh bày (3.2) thì Yi ~ N(pi + P2X21 + ... + pk Xti, ơ2) và
các ước ng ca Pi, p2 Pk là .p ,,..... Pk thu được bng OLS và ML như
nhau Nhưng ước lung ca ơ2 t ML: J = ef / n ưc lung chệch.
Í«| . .
61
3.10.HSXÁCĐNHBIR2VÀHSXÁCĐNHBÃH]ỆUCHÌNH r 2
Trong mô hình hồi quy hai bih, do độ thích hp cùa hàm K6Ì qui. Nó chính t
l của toàn bộ sự biến đi của biii phụ thuộc Y do biến giải thích X gâyia. Trong mô hình
i quy bội tỷ l cùa toàn bộ sự khác biệt cùa biến Ydo tt cả các biến giải thích X2. X, ....
Xk gây ra đuợc gọi h s c định bội, hiu R2. I
Hẹ s xác định bôi R2 có Ihể tính bàng mt trong hai cng thức sau:
'2 _ ESS T S S -R S S RSS
R - T S S - TSS - TSS
Phần trước đã chúng minh
e'e = S ? = Y Y - P'XY.~
1=1
= eM-t)= e,(7 , - Â - A xv - ..- Â ^ )
M il
= e,, - - (X2, -X)...-pk(Xki- x u))
í-1
= e,( y ,- - & ( X 2i-X )...- K w » - * » > )
/-I
= e (y< - X 2i - ' * * ) = - ° -
/-1 1-1
A
s, i yi(yi-0i*ĩi~-0*xi)
Im I
= *<>/ - Â Ê y .- x a - * Á y i * «
/-I i-l i-1
TSS = y i = Yj2 - 2 I +n 2 = Y Y - n 2 .
i=l i=l
ESS = TSS - c*e = p X Y - nY
2 p x Y - n 2
Y Y - n Y 2
= ESS_= § c '2 y lx2i + ^ l i + - + h I , y ixk i
= ras = ~ p ĩ = y'
/»l ,~ 1
62
0 R2 1. Nếu R2 = 1, nghĩa đường hồi quy giải thích 100% s thay đổi
cùa Y . Nếu R3= o! có nghĩa mô hình không gii thích sự lhay đi nào cùa Y.
Mt nh cht quan trng của R2 nó hàm kng giảm ca s biến giải
thfch Irong mô hình. Dẻ dàng thấy rằng J y? = (Yi - Y Ý không ph
i-1 Í.I
n
thuc vào s biến gii thích trong m hình, nhưng X e í hàm gim ca s y.
i-1
Do đó, nếu ng s biến giải thích trong mô hình thì R2 ng tăng. Vấn đ đt ra là
khi nào thì đưa thêm biến gii thích mới o mô hình?
Kng th dùng R2 m tiêu chun đ xem xét viộc đưa Ihêm hay không đưa
thêm mt biến gii thích mi vào mô hình. Bi vì R2 còn ph thuc vào sô' bậc tụ
đo ca 05 - ; Ý và (Y - Y )2 ơng ứng (n-k) và (n-1). Trong đó k là
i-1 . *1
s các tham s (k c h s chn) ca mô hình.
Ngưi ta dùng h s xác định bi đã hiệu chình, ký hiộu R 2 d cân nhc khi
xem xét vic thêm biến gii thích mi vào mô hình.
___
e f /( n -k ) 2
ý(n-l) s
» - *
R 2 có các nh cht sau:
1. Nếu k>l, R 2 <, R2 < 1, điều này có nghĩa nếu s biến gii thích tăng
n thl R J tăng chm hơn so vi R2.
2. R
2
£ 0, nhưng
R 2
có th âm. N vy khi
R 2
còn tăng thì ta còn phài
đưa thêm biến mi. R 2 còn có thng khi mà h s cùa biín mi trong hàm hồi
quy khác không. Khi nào biết được h s cùa biến mi Xk trong hàm hồi qui khác
không? Khi mà gi thiết:
Ho : pk = 0
H ,: p k* 0
bi bác b trong đó Xk là biến chúng ta định đưa thm vào mô hình.
63
_
7 R S S
J
Trong thí d 3 .2 : R = l
144,2269
= 0 , 9 7 5 6 6
R 2 = l- C L - R 2) ^ - = 1-(1-0,97566)(12-1) / (12-3) = 0,97025
n - k
3.11. MA TRẬN TUDNG QUAN
Gi s chúng ta có mô hình hồi quy bội:
Yi =pi +PjXjì + ... +pkXici + l
Kí hiệu
Ti
là h s tuơng quan giữa biến th t và th j. Nếu t=l thì r,j là h số
tương quan gia c biến Y biến X|.
f e y 'x ' ) ; r , ( l ĩ ĩ i l ;
n n ' ril n n
x x i
i=l =1i=I i=l
Trong đó: Xji = - X j
Dẻ dàng thấy rằng: r,j = Ij,; Tjj = 1.
'rll r12
r13
r\k '
1 rì2 rl3 ...
rlk
R =
r21
r22
r23
" r2k
=
r21 1 r23 "
r2 k
/ t ì
rk2
rk3
rkk.
&
(S
1
...
1
3 . 1 2 . H S T U Ơ N G Q U A N R I Ê N G P H A N
Chúng ta dã biết h s tương quan r đo múc đ ph thuc tuyến' tính giũa hai
biến. Đối' vi m hình hi quy 3 biến:
Yi = pi + PzJfcj + P3X31 + lí
Chúng ta địnti nghĩa r,M là h s tương quan giữa biến Y vàXĩ trong khi Xi không
đổi,
ri3,2 là h s tương quan riêng giữa biến Y và Xi trong khi Ti không đi.
Ĩ23.I hộ s tirong quan riêng giữa X2 và x3 trong khi Ykhông đi.
Ta th d dàng ch ra rằng:
64
123,1 ='
rl2 ~ r13r23
V(1 ~ r>3 )(1 r23 )
r23 ~ rl2~r13
V ( l - 4 ) ( l - r ,3 )
1 13.2 -
r13 ~ r12r23
\/(1_ r ) ( 1~ r )
Hộ s tương quan riêng đã được định nga n trên được gi h s tương
quan bậc nht. T bc đây ng ý chi s hạng sau du phy vì thế Ĩ 2 14 h số
tương quan riêng bc 2; còn ri2, Ĩ13 các h s ơng quan bậc không.
Giữa h s xác định bi và c h s tương quan bc không và hộ s ơng
quan bc nht có các mi liên hệ sau:
r 2 _ rn + Tầ ~ ^ r!2r13r23
1-4
r + ( 1- r l ) r u,2 vâ R2 = r?3 + ( 1' r 13) r 12,3
Ma trn R i trên đuc gọi là ma trn h s tương quan riêng cp 0.
1 0,78228 0,90463]
Vi thí d 3.2, ta cò: R = 0,78228 1 0,48017
0,90463 0,48017 1
3.13. KIỂM ĐNH GI THIT VÀ KHONG TIN CÂY CA CÁC H s H i
QUY RIÊNG-KIM ĐNH T
Vi giả thiết u - N(0,ơ2) ta có thkiểm đnh giả thiết, m khong tin y cho
c s hi quy riêng.
P ~ N(P,ơ2(XX) ')
Thành pKần P i c phân b chun với kỳ vọng. Pi và pơng sai bng ơ 2 nhan
vi phn t nm trên dòng th i và ct i ca ma trn (XX) ' 1 hay chnh là phn t
th i trên đưímg chéo chính ca ma n Cov( P ). Tuy nhn do ơ2 chưa biết, nên
ta phi dùng ước ng không chch của ơ2 là:
ô 2= e ? / ( n - k )
i=l
65
Khi đó t = V có phân b t(n - k). Vi tiêu chun này có th tìm khong tin
cậy kim đnh gi thiết v các h s hi quy rifing.
Khoảng tin cy với hộ s tin cy 1- a ca Pi đuợc xác đnh:
3 - P
P (-tofl( n - k ) < - r - s T < t« fl(n -k)) = 1-a.D ođó :
Se(P|)
(Pi-t«fl(n,-k)Se(Pi) < P,< i + tafl(n-k}Se(Pi)),Vi= 1,* .
Chúng ta có th kim đnh gi thiết Pi = pi
Tiêu chun dùng đ ldm dinh:-1 = - Ệ^- t(n - k)
5e (Â )
Tùy theo cc gi thiết Hi, chúng ta có các min bác b sau dây:
B ng 3.1
Loại gi thiết
Ho
H,
M inbcb
Hai phía
n trái
Bên phi
Pi = P>*
p. = £)& *
p. = (Sft*)
Pi ^ pế*
p i< p r
ft*p T
ltl> to /2(n - k )
t < - t B(n -k )
t > ta (n -k )
Nếu Pi* = 0, chúng ta muD kiểm định biến đc lập Xi không nh hưòng đến
biến phụ thuc.
3.14. KIM ĐNH GI THIT
Pí = p3 = ... = Pk = 0 hay R2 = 0
Chúng ta đã trinh bày k thut phan ch phucmg sai và mi quan h giũa R2
v ì F. Bằng ngôn ng ma trn có th trình y tổng quát các vn d dó.
Bng 33. Phân tích phương sai cho mò hình hi quy bi k biến
Ngun biến thiên
Tng bình phương
Bậc t do
Phuangsai
T hàm hi quy (ESS)
P 'X Y -n Y * k-1
P'X'Y-nYl
k-\
Phần dư (RSS)
y 'y - p ' x 'y
n - k
Y'Y - ệ' X'Y
n - k
Tổng
Y Y - n 2
n - 1
66
Do R2 = VXh g
Y Y - n Y 2
nên P'X 'Y -nY 2 = R2(Y 'Y -n 2),
Y Y - p X Y = (1 - R2) (YY - nY 2).
Ta có bng sau đây:
Bàng 5J Phân tích phương sai đi vái R2
Nguôn biến thiên
Tng bình phương
Bc t do
Pơng sai
T hàm hi quy
(ESS)
R2(Y " Y - n 2)
k - 1
R 'iY 'Y - n ĩ 1)
k - l
Phần dư
(1 - R 2)(Y "Y -n 2)
n - k
(1 - R 3)(Y' Y -n J)
(RSS)
n - k
Tng Y "Y - n 2
rv- 1
Vi gi thiết P ~ NCP.Ơ2) thì gi thiết
Ho: p2 = p3 = ... = pk = 0 ( hayR2 = 0)
Hi: có ít nht mt pi * 0 ( hay R2 > 0 )
được kim đnh bàng tiêu chuẩn:
(P ' XY-n2) /
F = ..... ....... / - 1- - F ((k -l),(n-k ))
(Y Y - ếXY ) /
/ (n
(n-k)
, X Y - n 2 R V ( k - l )
° 0 R " Y Y - n Y 2 n n " ( 1 - R ) / ( n - k ) '
Vi tiêu chun F cho phép kiểm đnh giả thiết:
Ho:(32= p 3 = ... Pk = 0 ( hay R5 =0)
H,: Có ít nht mt Pi * 0 ( hay R2 > 0 )
Vi thí d 3.2 :
67
F = 180,3545; F0.Ũ5(2,9) = 4,26. F > F0.05(2,9),_do dó gi.thiết Ho bbác bỏ.
3.15. HI QUY Đ U KIN NG BUC KlMĐNH F
Giả sử rằng chúng ta có hàm hi quy
Y, = p 1 + p2Xi1 + ...;+pkXu + a '(*)
Bây giờ chúng ta kim định gi thiết:
Ho: Pk-m+i'= Pk-nH-2 - - Pk = 0
V.githiítnàythìhànihi.quycó.dng: .
. i = pi +. PíXai + + Pk-mXic-m + y
(đuợc gi là hàm hồi quy thu hp hay hầm hi quy đi kiên ràng buộc).
Kíhiu en; ctơptìàn dư tiỊrhàmh&qy.có điếu kin ng buộc.
:i euR : Véctơ phn du từ hàm hi quy ban đu( không điều
Nếu F > F„(m, n - k) thì giả thiết Hũ bị c bỏ.
Đôi khi ta dùng cng thúc sau đây:
(e Re R ~ e URe UR)/m (TSS - ESS) - (TSS ~^ESSU )/m
® U R ® Ư R k ) (TSS - ESSUR) ( n - k )
'Cách trình bày như trên chì trung hop riêng của kiểm định tổ-hp tuyến táih cùa
các h' S hổi quy”, vai githt vể tổ họp tuyến tính a c hs hổi quy, có thé làm
kiện ng buộc),
m: S biến bị loại khi mô hình ban đu ( s điu kiện
ràng buộc),
n: S quan t.
Khi đ tiêu chun kiểm định githiết Ho:
(ESSjR ESS r ) ĩĩĩ
Chia t t s và mu cho TSS, ta đuợc
công thcxút gọn: F=
(TSS-ESSm)l(n-k>
" p _ (R2ur-R2R)/m
i: ~
- R 2u K )/(n -k)
F(m, (n - k)).
iittù
68,
công thức tính F qua các R2 s không ng đưc. Trong trưng hợp này chúng ta phi
dùng ng thức ban đẩu, tính F qua RSS.
3.16. DBÁO
Chúng ta c th s dng mô hình hi quy vào d báo: d báo g trtrung
bình và d báo giá trcá biệt
ì
Cho =
x 2°
X?
D báo giá trtrung bình: E (Y IX0 )
pi + PỉXỉ + + Pk Xic = x p .
Vi x = x ° ta có ( 7 olX 0 ) = X°'p =>var(olXo) = X0'var(p)X0
v a r i f o i x f ) = ^ '( X 'X j Y vì v ar(P ) = ơ2(X X r'
Nhưng ơ 2 chưa biết nên phi dùng ước lượng không chch 2 ca nó :
V ar( lX °) = ^ Q Ó Q ' 1*0
s e i^ o ix 0 ) = V ^ x ' ^ x ' ^ - ' x 0
0 - ty n - k) se( 0 IX0 ) 5 E(YI Xo)
fo + t^ (n - k) se (ý 0 I )
D báo giá tr cá bit
Yi = x 'p +e, =>var(YolX0) = var(Xỏ,p) + ơ2
Var(Yo I x°) = 2[l+ X °'(X X rlX0 ]
se(Yo I x°) = var(Yo|X0)
0 -t^ (n -k )s e (Y IX °) < (YI X°) fo + tyt (n - k) se(Y0 1 x 0) .
Viêc trinh bày mô hình hi quy bằng ngôn ng ma trn đã cung cp cho
chúng ta mt công ngh mà nh đó có thổ s dng k thut nh toán, t đng hóa
toàn bô quá trình nh toán, phân ch và d báa
69
3.17. THÍ D -thí d 3.3
Cng ta c các biến s sau -đay: Y- sản ng/ ha; Xj- phân hoí hc/ ha; X)
thuốc tr sau / ha. Hãy ước lượng m hình hổi quy tuyên nh theo tham stf và các
biến s ca Y ph thuc vìo
x2 và X} và tr íri các cu hi sau đây. Cho a = 5%.
a. Kết qu ước lượng c phù hp với thực tế không? HSy gii thích ý nghĩa
kinh tế ca các hộ s nhn được.
b. Phân bón( thuc tr u) có nh hung đến năng sut cùa loi cay trổng
trên hay không?
c. Hãy tìm khong tin cy cho các hộ s hồi quy riêng.
d. Hãy gii thích nghĩa ca h s R2 nhận được.
e. C phan bón và thuc tr sau đéu khng nh hưng đến năng suit ?
g. Bạn c th b biến x 3 ra khi mô hình dược khng vì sao?
h. Hãy ước lượng mô nh bng phương pháp ma trận.
i. Phi chãng phân bón và thuc tr u đéu có nh hung như nhau đn nang
sut ging cây tròng trên?
k. Hãy d báo giá tr trung bình vì cá bit khi x 2 = 20; Xj = 15.
1. Hãy phân ch kết qu da trên nh toán bng MFTT3
'T
Đtr i được câu hi a trước bết phi ước lượng m hlnh. Da vào bng(33) ta
nh được:
n n n n
( 4 ) ( 4 ) - < X w 2
M M .im/-1 /1 . /-]
(956X504)ễ- (900)(524) _
-
-------------------
-
--------
T = Ư,5.
(576)(504) - (525)
", _E_, n n
i x 3i x 2 x 2i) ( S y i x 2i x S x 2x 3i)
i«l 1*1 i.|
70
Bng 3.3
Y
x2 X,
y
x2
X3
yx2
y*3
X2X2
V 2
X2
x32
e e2
y2
40 6
4
-17 -12
-8
204
136
96
144 64
40.32 -0.32 0.1024
289
44 10 4 -13
-8
-8
104
104 64
64 64
42.92 1.08 1.1664
169
46 12
5 -11
-6 -7
66 77
42
36
49
45.33 0.67
0.4489
121
48 14 7
-9
-4
-5 36
45 20
16 25
48.85
-0.85
0.7225 81
52
16
9
-5
-2 -3 10
15
6 4
9 52.37 -0.37
0.1369
25
58
18 12 1 0
0 0
0 0
0
0
57
1
1
1
60
22 14 3
4
2
12
6 8
16 4 61.82 -1.82
3.3124
9
68 24 20 11
6 8 66 88 48
36
64
69.78
-1.78
3.1684
121
74 26 21 17 8
9
136 153 72
64 81 72.19
1.81 3.2761
289
80
32 24 23 14
12 322 276 168 196
144 79.42 0.58
0.3364
529
570
180
120
0 0
0
956
900 524
576
504 S70
0
13.67 1634
g ( 9 0 0 ) ( 5 7 6 ) - ( 9 5 6 X 5 2 4 )
Ps (576)(504) - (524)2
y p * ,X2--P3. XJ = 57^-0,65* 18.U,U-?1Z ^31,98.
Vy hàm hồỊ qu mu: = 31,98'+ 0,65 X2 + j JjXjj
a. Khi người;ta tãng phân; bón / ha và ng thêm thuc tr u /Jia thì nâng suất
loại cây trên s tặng.; /3 2 và p. đ dương.chanên.cóth ni rng kết qu ưc
lượng phù hp vi thc tế. Tt nhiỀn điu ttên không có nghĩa khi tăng phân bón(
thuc tr sâu) / ha đến vô cùng thì ng suất cũng, tăng như yậy. p 1 = 0,65
nghĩa là khi gia tang phân bn /.há tấn till hg sut trung bình / ha s tăng 0,65
tá n ; v à /? 3 = 1 ,11 c n g lũ á là k h i g ia tă n g tiiu c tr s â iT /h a 1 t n th ì n ă n g suât
trung bình / ha s tàng 1,11 tán.
b. Đ tr lòi câu, hòi nà chúng ta phi kim định .các.gịả thiết:
Hq : Pi = 0;H |-: Pj 5* 0 i i = 2,3
bng kiểm định;t: tS |/./S e i).
* = RSS/(n-k) = 13,6704/(10-3) = 1,95.
± A
var( p2 ) =
-----
; w
-----------
crr '
( xl ) ( * i ) - ( E xĩ i ^ y
/| /mí /-'
= (504)01.95)/ (57*504-524J) = 0,06.
se( P2)=yvar(P2) = 054.
var < P irv Jsi .
---
&
(/L iX2l)(5',Xìl ) - ( ^ X2lX3l)2
1*1 l - l 1.1
= ( 5 7 6 X 1 ,9 5 ) / ( 5 7 6 * 5 0 4 - 5 2 4 2) = 0 ,0 7 .
se ( P 3 ) = V var(P j) = 0,27.
72
Tđó t,= /2 / S c ( ^ j) = 0,65 / 0,24 = 2,7và
tj= ^ 3/S e (/3) = 1,11 /0,27 = 4,11.
to.raí(7) = 2,365. t2 > W 7 ) ; *3 > t«02j(7 ) do đó gi thiết Ho bị c b, tha nhãn H|,
nghĩa pn bón( thuc tr sâu) ảnh hưởng đến năng suất ging cây trên.
c. Khong tin cy cho các h s hổi quy riêng được cho bỏi công thức sau:
( Pi - torc (n - k) Se (Pi) < p < Pi + W ( n -k )S e ( p i)) ,V i= T J c .
( Â - ta f l( n .-3 )S e ( ) < p2 < p 2 + - 3) Se ( 0 2))
0,65- 2,365*0,24 < P2 < 0,65+ 2,365*0,24
0,0824 < P2 < 1,2176
( /?3 - t/2(n - 3) Se (Â 3) <03 < /?3 + t a* (n - 3 )S e ( /Â3))
1,11-2,365*0,27 < Pj < 1,11+2,365*0,27
0 .461 < p3 < 1,738
d. H s xác đnh bi và hộ s xác định bi đã hiệu chinh.
R = 1- RSS/TSS = 1- 13,6704/ 1634 = 0,9916.
" F = 1 - (l-RJ) (n -l)/(n-k ) = l - (1-0,9916) (10-1)/(10-3)
= 0,9892.
e. Chai yếu t phân bón và thuc tr sâu đều không cùng nh hường tới
năng suất:
Ho: P2 = p3 = 0 hay R2 = 0
H t: có ít nht mt trong hai h s khác 0 hay R2 > 0.
p_ R /Qc-l) _ 0,9916/(3-1)
(1 - R 2 ) / (n - k) (1 -0 ,9 9 1 6 )7 (1 0 -3 ) "
Trong khi đó F0i05(2,7) = 4,47, do đó Ho bc bỏ. Ta kết lun rng có ít nht môt
yếu t nh hưng đến nang suất.
g. 05 th bò biến x3 ra khi mô hình được không?
Đ tr lời câu hòi này cn phi dùng kiểm định hổi quy có điéu kin Tàng
buc. Ưc ng m hình có c hai biến x , và Xj ta có R-ur = 0,9916. Khi b biến
X chúng ta thu đưc mô hình ví dụ 2.2, R2r = 0,971.
H o : p 3 = 0 ; H , : P j * 0 .
73
(J?2W -R *R )/m (0,9916 - 0,971)/!
(J L -R 'u r t/ in -k ) ( l - 0 9 9 1 6 )/( 1 0 - 3 )
Fftos<1.7) = 3.59. F > Fojb(1,7), gi thiết Ho bị bác bỏ.
1. Phương pháp ma trn
1 6 4
1 10 4
1 12 5
1 14 7
1 16 9
118 12
1 22 14
1 24 20
1 26 21
1 32 24
10 180 120
180 3816 2684
120 2684 1944
X'X=
ì 1 1 1 1 1 1 1 1 1
6 10 12 14 16 18 22 24 26 32
4 4 5 7 9 12 14 20 21 24
' 1.363 -0.177 0.1602'
570'
(XX)-'=
-0.18 0.032
-0.033
XY =
11216
0.16
-0.03 0.0366
7740
P =(X ,X)-'(XY) =
31.98067
0.6500Ĩ ,Y'Y = 34124.
1.10986
ee = RSS = Y'Y - ~p (XY) = 13,6704. .
1 = RSS /(n-3)= 13,6704/7= 1,952914.
2.662$ -Q.S456 0.3129
-0.3456 0.06258 - 0.065
0.3129 - 0.065 0.0715
Cov( p ) = 1 (XX)'1 =
TSS= YY n y 2 = 34124 - 10* 572 =
1643.
74
ESS = TSS-RSS= 1643- 13,6704= 1629,3296. R2 = 0,9916.
Các phn t dc đưng chéo chính cùa ma trn Cov( P ) trên là phương sai của
các p ơng ứng. T ma trn y biết được Cov( p i , P ) , chng hn Cọv( p J ,
P j) = -0,065 và tính được:
Vai</?2- i 3) = Vai(y 3) + V aK ^3)-2CcA<^2, pỉ>
= 0,063 + 0,0715 - 2(-0,065) = 0,2645.
SeCyffj-/?,) = 0,514.
Đến đây có đ thng tin đ thc hiện các phin ch đã nói ò trn.
i. Phi chãng phán bn và thuc tr sâu đều có ảnh hưng như nhau đến ng
sut ging cây trng trên. Đ tr lri, ta phải kiểm định gi thiết sau đây: Ho: (ì> =
Pj hay í - p3 = 0 ; H,: p2 * p j .
t = - l Z Ì Z = - 4 _ t(n_3)
5 e ( Â - Â )^ SeCp2 - p J
t = ~ f t , - = - - % = (0,65-1,11) /0,514 = - 0,895.
S c ( Â - Â ) S e ( Â - Â )
Trong trường hp này ta chua c đ cơ s đ bác b Ho to 025(7) = 2,36.
k. D báo : Với x 2 = 20; x 3 = 15, mt ước lượng điểm tương ng là:
0= (X, = 20; X, = 15) = 31,98 + 0,65*(20) + 1,11*(13) = 61,63.
Pơng sai ca giá tr trung bình:
Var(ý1 x ° ) = o2X°'(X'X)-'X°
= (1,20,15)
2.6628 - 0.3456 0.3129
-0.3456 0.06258 - 0.065
0.3129 - 0.065 0.0715
1
20
15
= 0,308533
Se(0 l Ar0 ) = 0^55.
Khong tin cy 95% cho giá tr trung bình:
To - t(n - k) sc( 0 1 x ° ) á E(YI x>) í o + t^ (n - k) se (ý I x°)
61 63 - 2,365*(0,555) á E(YI Xo) á 61,63 + 2,365*(0,555)
60,317 <; E(YIXo) < 62,943
Phương sai cùa giá tr cá b i t: » . .
Var(Yo Ix°) = t1 + ]= var(KoI *°)+ 2
75
= 0,308533+li95= 2.2585
Se(Yo I x°) = ýVar(Y0|X a) = 'I ^ í'
Khong tin cy cua g tr cá biêt:
?0 -
t y
(n - k) se(Yo I x°) £ (Yo I x°) <; 0 +
^ í V Ũ
l^o )
61,63 - 2,365*(2,2585) s E(Y I Xo) á 61,63 2,365*(2,2585)
56,289 EÍ IXo) 66,971
l Da ơên kết qu nh bng MFIT3, đối chiếu li vi các kết qu nh toái
trên.
Ordinary Ixast Squares Estimation
***********************************************************
Dependent variable is Y
10 observations used for estimation from 1 to 101
Regressor Coefficient Standard Error Í T-Ratio[Prob]
INPT 31.9807 " 1.6318 19,5985[.000]
X2 _ .65005 f , .25016
.
2.5985[.036]
X3 : 1.1099 : .26743 - < u 501 [.004]
R-Squared .99163. F-statistic F( 2, 7) 4J4.8492[.000].
R-Bar-Squared .98924 S. of Regression 1.3975
Residual Sum of Squares 13.674
Mean of Dependent Variable 57.0000
S.D. of Dependent Variable 13-4743
Maximum of Log-likelihood -15.7526
DW-statistic 2.1141
3.18. MT S DNG CA HAM H i QUY
Mô Mnh hi quy tuyến nh đuc hiu theo nghĩa tuyến tính đi vi c tham
số. Nó có th tuyến tính hoc không tuyén tính đi vi các biến. Dng ca hàm hi
qui mt ván dồ quan trng, mt trong nhng nhân t có nh cht quyết đnh đì
với két qu nghiên cu. Tuy vy, ván đ "dng cùa hàm hi quy" li không có một
cơ s lý thuyết đ mnh đ . th khlng định dng cùa hàm hi quy là dạng y
mà khOng phi là dng khác. Dng hàm ca mô hình hi quy là mt vn d thạc
nghiệm. , v y : f . . . V.,
Mt trong nhng phưong pháp thung đue dùng-là biu -diẻn cíc s liu len
hộ ta đ. Nếu như dô th ch ra quan hệ giữa hai biến là tuyến ttoh thì dng .hm
76
ca mô hình tuyến nh, nếu quan hê được chì ra hàm bc 2,3 (phi tuyến)... thì
dng hàm cùa mô hình được chn mt cách tương úng. Pơng pháp này đuc sử
dng trong mô hình hi quy giản đơn. sẽ không hữu ích nếu chúng ta có
hình hi quy bi.
đây s trình bày mt s dng hàm đơn giản mà hay gãp trong ng dụng thực
tiễn.
1. Hàm có h s co giãn khng đi - hàm Cobb - Douglas
Hàm Cobb - Douglas có dng Y= p|X P2
Hàm này là phi tuyến đi vi X và phi tuyến đi vãi tham s Ps- Tuy nhn
th biến đi v dng tuyến nh đi với tham số. Lấy ln hai vế, ta :
lnY = ln 13, + p2 lnX
Đt (V = ln P i; Y ' = lnY
X ' = lnX
Ta có ' = p,' + fe X '
Đây là mò bình gin đơn đã biết. Ta c th minh ha hàm ban du và hàm sau
khi biến di Y bng d th sau:
Hình 3.1 Hình 3.2
Hàm Cobb - Douglas có th m rộng cho trữỉmg hợp có nhiều biến giải thích:
Y = p 1x > x 3p . . . x mp"
Bng phép biến đổi:
ln Y = ln P i + P2lnX j+ P3ln)Q + ... PolnXm
chúng ta d Hang có hàm tuyến tínỉi đi vi các tham số. Trong hàm Cobb -
Douglas, h s co dãn cùa Y đi với X; bng Pi.
77
2. Hàm có dng:
Ys= P (l+ r) '
Hàm có dng Y, = p (1+ r), trong dó t là thi gian. Hàm này tbung dùng dể
do sự ng trưởng ca yếu t Y| theo thời gian, r là tỷ lê ting trường.
năm (thi k) t = 0, ta có Y0 = p , do đ Y, = Yo (1+r)
Biến di hàm v dng tuyến tính đi vi tham số:
lnY, = inY + tln(l+r)
Đt Y|' = In Y,; Po = ln Yo; pi = In (1 + r)
Kh đó Y|'= 3o + Pi t
D dàng ước lung ợc hàm này và t đó m được Yo và r
3. Hàm dng Hypecbol: Y = p, +
X
Hàm này là phi tuyến đi với X, nhưng tuyến tính đi vi các tham số. Sau
đây là mt s tning hp quan trng ca hàm này
a) P i»p2 > 0, khi đó d th có dạng: Y
Trung hp này có mc tim cn dui, X
có tảng đến diu, Ykhông th nh han pi.
Hàm này thưng được dùng khi phân
ch chi phí trung bình đ sn xut ra mt
sn phẩm.
b) Pi>0,P2<0
Trung hp này c múc tim cận
trên. Engel (821 - 1896) khi nghn
cúu mức chi tiu ph thuc vào thu
nhp đã đ xut hãm này.
78
4. Hàm có dng đa thc: Y = p, + (5j X + Pj X2 + Ps X3
Hàm này thưng được s dng đnghn cứu quan hgiữa chi phí và s lượng
sản phm được sit xut ra. Chng hn Y - tổng chi phí, X - s lượng sn phm
đuc sn xut ra. Nếu như xây dng được hàm này thì ta đ dàng m được chi phí
trung bình và chi phí bn.
T C : Tng chi phí; MC: Chi phí biên; AC: Chi phí trung nh.
Trôn đây đã trình bày mt s dng mô hình hi quy. Tt nhn rng còn rất
nhiều dng khác mà đây cũng chi giới thiu được vi mô hình gin đcm.Trong
thc tế đ vân đng mô hình này hay mô hình khác tnrc hết phi hiểu đuc mối
quan hộ gia các biến, nh cht cùa các mô hình (các dng hàm) mun vn dụng.
79
BÀI TP
3.1. Hã gii thích l õ :
a. H s hói quy riêng. .
b. Hs xác đnh bi và h s p đnh bội đã hiu chình.
c. Đa công tuyến.
d. Kiểm định v s bng không đng thời , cùa tá t các h số>hổi quyng vi
biỂn độc lp và kiếm định riêng từng h s hi quy.
3.2. Bảng' duới đây cho: - Thu iibp/đu nguìriOO nh bng USD; X ,-T l
phẩn' trăm ca' ladđng nông nghiệp; X* - Số nănvtrung bình đợc đào tạo đối vói
những nời trên 25tui. Cho a = 5%. '-'- -í-' ì '-
n 1 2
3 4 5 6 7 8 9
10
i l
12 13
14
15
Y
6 8 8 7
.7
12 9
8
9
10 10 11 9
10
11
X,
9
10 8 7 10 4 5 5
6 8
7
4
9 5
8
Xí
8 13 11
10 12 16 10 10 12 14 12 16 14
10
12
T các s liu trên tính đưc: Y = 9; X I = 7; X 2 = 12; ĨXii y-, =;-28; Zxa i =
-Í2; Zxu Xa =-12; Sx2ii = 60; 2x2a = 74.
a. Giả thiết rng; (Y/ XÊt X ,) = Po + Pi x ,,+ P2X2 . Da vàomutrêivhãy
m đưnghi.quy mu.
b. Tim ước lưcmg phương sai ,của yếu t ngu nhn.
c. Tun lượng pơng sai ca các hê s hi quy mẫu.
d. Hãyikim đnh s bng không ca tng h s hi quy và ýrighlart ra t
các kim đnh ấy.
e. Hãy m khong tíu cy đối xứng cho các h shi quy.
f. Tim h s R2 và R2 .
g. Phi chăng c hai yếu t "Tỷ lệ lao dng nông nghip" và "S năm đuọc
đào tạo" đéu không ng nh hưởng đến Thu nhp theo đu người.
3.3 Tr lại bài tp 2.11, chương n , khi hổi quy biến Sản ng (S) theo Lao động
(L: nguòi), thy h s xác định (r* = 0,3029) cùa mô hình s ph thuc L và s
chặn khá nh, nên người ta đưa thêm biến K là vn (triu đng) vào và hổi quy
được mô hình dui đây. Cho a = 5%.
80
Ordinary Least Squares Estimation
****^^*^*^ + + + + + + ^ + + ^ ^ + + + ^++^^^ + ^JjfS|c|í|<scí|ci<esjísíSj(. + ^:jesjc|<ses{+^^e+^e){jjeS|f+#j|eS|,í( + #
Dependent variable is s
20 observations used for estimation from 1 to 20
Regressor Coefficient Standard Error T-Ratio[Prob]
INPT -20.6583 22.0029 -,93889[.361]
K 10.7720 2.1599 4.9874[.000]
L 17.2232 4.5279 3.8038[.001]
R-Squaréd F-statistic F( 2, 17) 21.5343[.000]
R-Bar-Squared .68369 S.E. of Regression 32.4717
Residual Sum of Squares 17925.0 Mean of Dependent Variable 109.4666
S.D. of Dependent Variable 57.7367 Maximum of Log-likelihood -96.3610
DW-statistic 2.3574
a. Viết hàm h quy tng th, hi quy mẫu.
b. Các ước ng nhn đuc có phù hợp về thuyết không?
c. Tìm ưc lưng đim mức sản ợng doanh nghiệp có 20 lao đng, nguồn
vn 300 triu đng.
đ. Các giá tr ước ng có ý nghĩa thng kê không?
e. Tính h s xác đnh bi bng c cách.
f. Phi chăng các biến đc lập không giải thích được cho sự biến đng của
sn ng?
g. Có th nói vn, lao đng cùng c động thun chiều đến sản ng không?
h. Khi lao đng không đi, nếu thêm vốn 1 triệu thì n lượng tang trong
khong nào?
j. Có th nói khi lao đng không đi, tăng vốn thêm 1 triu thì sản lượng
tăng ít hơn 10 đơn vđược không?
j. Ngun vn không đi, thêm 1 lao đng thì sản lượng tăng có bng 20 đơn
v không"
k Giá tr đ6 tối thiu bng bao nhiêu?
l Dùng lim đnh thu hp hi quy đ xem xét có nên đưa thêm biến K o
mô hình hay không nếu biết với mô hình s phụ thuc L có h s chn h sô'
xác định bng 0.3029 và RSS bằng 44152.1
3 4 Với i tp (3. 2), mt nời đưa ra dạng khác của mô hình và hi quy đưc
kết qu sau, với LS, LK, LL làlogarit cơ sđ t nhn cùa c biến ơhg ứng.
81
Ordinary Least Squares Estimation
Dependent variable is LS
20 observations used for estimation from 1 to 20
*****************************************************************
Regressor Coefficient Standard Error T-Ratio[Prob]
INPT 2.8749 .22746 12.6390[.000]
- LK .52178 .093498 5.5806[.000]
LL .68225 .14080 4.8457[.000]
R-Squared .78117 F-statistic F( 2, 17) 30.3438[.000]
R-Bar-Squared .75543- S.E. of Regression .28222
Residual Sum of Squares 1.3540 Mean of Dependent Variable 4.5516
S.D. of Dependent Variable .57067 Maximum of Log-likelihood -1.4523
DW-stastic 1.9062
Cho hiệp pơng sai ca các ưc lượng úng với các biến LK và LL bng 0,0127.
a. Viết hàm s kinh tế ban đu với các biến S,K, L.
b. Viết hàm hi quy mẫu. Cho biết ý nghĩa cùã các ước ng nhn được.
c. Các uớc lượng nhận c phù hợp thuyết không?
d. Các biến gii thích gii thích được bao nhu phẩn ăm s biến đng của
biến phthuc.
e. Kiểm định s phù hp của hàm hổi quy.
f. Khi lao đng tăng 1 % thì sn lượng ng trong khong'bao nhiêu%?
g. Khi vốn giảm 1% thì sản lượng gim tối đa bao nhỉẽu %?
h. Ngun vốn tăng n bng 1,2 lần so vdi trước thì sản cmg có tăng tưong
úng bng 1,2 lẩn kh0ng7
i. Khi yếu t khác không đổi, nếu nguổn vốn tăng lên t ln mà sản lung tâng
nh hon t lần thì ta i sản lưng tăng chm hon i tăng ngun vn, nếu
sản lượng tăng lổn h MI t lẩn ta gi là tăng nhanh hon so với tãng nguồn
vn và bng đúng t thì IÍ là ng bng với tăng ngun vn. Theo kết quả
hổi quy trên thì sn lượng ng nhanh, châm hay bng so với ng nguồn
vốn?
k. Sản ng tăng bng vói tăng lao đông?
82
CHƯƠNG IV
HỐI Q u r VI BIẾN GlÂ
Trong các mô hình hi quy tuyến tính mà chúng ta đã xem xét lừ c chương
trước cho đến nay thì các biến giải thích đêu là c biến s lượng. Các biến đó
th nhn giá tr bng số. Chẳng hạn, tiền ơng a cán b, doanh s bán ra cùa
mt ca hàng, chi tiêu cho qung cáo, cung tiền,... những biến s iượng. Nhưng
trong thc tế có nhiu trường hợp c biến gii thích (hoặc thm chí c biến ph
thuc) biến cht lung. Trong chương này ta s nghiên cứu hồi quy khi biến giải
thích là biến cht lượng.
4.1. BN CHT CA BIN GIẢ- MÔ NH TRONG ĐÓ BIEN g i i t h íc h
BIN GIẢ
Biến cht ng như đã nói ưên thường chi ra có hoc không có mt thuộc
nh nào đó, chng hn nam hay nữ; khu vực tư nhân hay nhà ớc... Vấn đ đạt ra
là m thế nào đ ng hóa được nhng thuộc nh như vy. Trong phân ch hi
quy người ta s dng k thut gi kỹ thut biến giả. K thut này cho phép ta
lượng hóa đuc nhũng thuc nh nhu vậy. Chặng hạn đ giải thích cho việc mt s
thanh niên vào trưng đi hc, mt s khấc thì không, chúng ta tạo r biến gi
nhận g tr 1 nếu thanh niên vào đại hc và nhn g tr không nếu thanh niên
đó khng vào đi hc. Chúng ta cũng s chì ra biến gi có th được sử dụng n
thế nào trong phm vi hi quy đ gii thích cho sự kiện là có nhng quan sát trong
phm trù (thuc tính) đã cho gn vi mt tập các tham s h'i quy còn các quan sát
khác ưong phm trù th 2 (hoc th 3) li gn vi nhng tham s hồi quy khác.
Biến giả được s dng trong mô hình hi quy giống như biến s lượng thông
thường.
Giả s mt công ty s dng 2 quá trình sản xut (kí hiẹu quá trình sn xuất A
và quá trình sn xut B) đ sn xut ra mt loi sản phm. Gi sử sản phm thu
được t mi mt quá trình sn xut là đại lượng ngẵii nhn có phân phi chun và
cí> k vng khác nhau nhưng phương sai như nhau. Cng ta th biểu thquá
t r ì n h sn xut đ như mt phương trình h i quy
Y, = p, + PJ>, + u (4.1)
trong đó Yi sn ng sn phm gn vi quá trình th i.
0 biến gi nhn 1 trong 2 g trị:
83
Di =
1 nếu sn lượng sản phm thu được t quá trình sn xut A.
0 nếu sn lưng sản phm thu được t quá trình sn xut B.
Mô hình hi quy trên đây giống như mo hình hi quy 2 biến mà chúng ta gp
trước đây chi khác là biến s lung X được thay bng biến giả D. Cân c vào mô
hình này chúng ta có th biết duc sản lượng trung bình do quá ưình sn xut A có
khác với sản lượng trung bình do quá trinh sản xut B to ra hay khng?
H s chặn Pi ca hi quy tuyến tính đo sin lượng trung bình gn vi quá
trình sản xuít B, trong khi đ đ dđc P2 ca dL\'rug ìj'0i quy đo s khác nhau vồ sn
lượng sinh ra do vic thay đi t quá trình sản xut B đến quá trình sn xut A
Điều nàý có th thấy bng cách lấy g tr k vng c 2 vế cùa phuong
trình(4.1) ứng vi D| = 0 và D| = 1:
E(Yj I Di = 0) =Pi
E(Yi I Di = 1) =p! + p2
Kiểm đnh gi thiết Ho: p = 0 cung cp kiểm đnh v gi thiết là khng s
khác nhau v i sn ng.do quá trình sn xuất Avà B tạo ra. Điều này d m đuc
như dã chi ra iruc dây.
Thù tục biến gi có th dễ đàng m í rr>ir cho trường li'ip biến định n;) có
nhiều hen 2 phm lrù. Chẳng hn Uorig ilú dụ ò Irêa ta gi'ả thiết có 3 quá trìuh sn
xut khác nhau có th s dng á i sản xuất ra úi', pkíừn và ngni ta hv vọng gii
thíc.1 cho vấn d là sn lưng duợc sản xuất ra cho mi quá Irình có th xhông hir
nhau. Trong trường hợp này ta s đita v\o 2 biến giả là Di và D2. Chúng ta sẽ xét
hình':
Yi = Pi +P2 D11 +P.1D21 + (4.2)
trng :
1 nếu sn lượng n phm thu được t quá trình sn xiit
0 nếu sn lưọiig n phẩm.tlui được t q-á trìnl khác.
D] -
1 nếu sn lượn3 ĩàn phm thu đuc lir quá trình s>.\ xu i: 'Jể I "
O2 - ' 0 uếu sn iur<5 ràâ phếm thu ùuc.ư quá trình khác.
, Nhu vy 3 quá trình sn su it này Uưc biểu tl dưới dng Jác kếi hi sao ù a
c g trca các biến giả:
! Quá trìnii sn xut
D,
Di
i A
1
0
B
0
1
c
0
0.
84
Bằng viộc ly k vng cho mỗi mt trong 3 trường hợp này chúng ta cố th
gii thích kết quhi quy:
E ( I D ã= l ; . Dĩ = 0) =Pi + 02;
E( ID, = 0; Dj = 1) =p, + p3
E(Y|ID, = 0; D2 = 0)=(3,.
H s chn ca hi quy biểu thị giá trị k vng của sản lượng do quá trình sản
xut c tạo ra. Hê s góc th nht do sự thay đi trung bình v'ê sn lung do việc
chuyn t quá trình sàn xut c sang quá trình sản xut A và hộ s góc th 2 tức là
p3 đo thay đi trung bình v sản ợng khi thay đổi từ q trình sn xuất c sang
quá trình sn xut B.
Kiểm đnh gi thiết Ho: P2 = 0 nghĩa không s khác nhau giữa q
trinh sn xut A và quá trình sản xut c . Giả thiết Ho: P3 = 0 cũng có ý nghĩa
tương t nhưng li so sánh 2 quá trình sản xut B và c.
Thí dụ: Đ xem xét kết qu sn luợng do 2 quá trình sn xut A và B có khấc
nhau hay không ngưi ta tiến hành lấy mt mẫu được cho trong bng dưới đây.
Hãy phân tích kết qu tíồi qui thu được.
Dựa vào các kít qu dưới đây ta thy ràng sản ợng trung binh 1 ca ca quá
trình sn xut B ước ng là 18000 kg = Pi, còn sản lượng trung bình 1 ca đã
duc ước lung ca quá trình sn xut Alà 21,280 kg = + P2 .
Bng 4.1
Quá trình sn xut A 1,
quá trình sn xut B 0.
.Sản lượng trong 1 ca
hot đng
1
22,0
0
19,0
0
18,0
1
21,0
0 18,5
1
21 0
1
20,5
, 0
17,0
0
17,5
1
21 ,2
Kết qu hi quy như sau:
j = 18 + 3,2 Di
85
(Se) = (0,44)
(t) = (7,439)
(p) = (0,000)
R2 = 0.8737. p 2 có ý nghĩa v mặt thng kê, kết qu chra rang sản ng trung nh cùa
2 quá trinh đó là kc nhau. i quy trn thmô tả trên hình 4.1.
3i + p 2
P
----------
Quá tiình Quá trình
sản xut B sản xuất A
Hình 4.1
Trước khi chuyn sang mc sau ta cn mt s chú ý:
l Đ phân bit 2 phm trù nam hoặc n hay quá trình sn xut À hoặc B
ngưri ta dùng mt biến giả. Đ phân bit 3 phm trù ngui ta dùng 2 biến giả. Một
cách tổng quát đ phân bit N phm trù người ta dùng N -l biến gi. Số biến gi
thấp hơn s phm trù là 1 d tránh nh đa cng tuyến hoàn ho. Đ phãn biệt 3
quá trình sàn xut A, B và c ta chsử dng 2 biến gi Di và E>2 nếu ta đua thêm 1
biến gi D3 nữa chng hạn.
1 nếu sản ượng n phm thu được từ quá trình sn xut c.
D3 = ' 0 nếu sản lượng sản phm thu được t quá trình sn xut khácế
Thì vic đua thêm Dj vào không cho thêm thôag tin mà li gp đa cộng
tuyến hoàn ho (xem chương VI). Trong trường hợp này thì ưc lượng bình phuơng
bé nhất cùa các tham s hi quy không ththu được. hin ng đa tuyến nh
hoàn hảo vì:
Dj= 1-D ,-D 2
2. Phạm trù đuợc gán giá trị 0 đưc coi li phạm trù cơ s. Phạm trù đưc gọi co s
theo nghĩa việc so sánh đuợc tiến nh với phạm trù này. Như vậy trong mô Kinh trên quá
tình sản xuất c phạm trù cơ s, nghĩa nếu ta uớc lưng hồi quy (4.2) vổi Di = , P2 =
0, thì chi quá trinh sản xuất c, hs chăn sẽ P|.
86
3 H s P2 gn vi biến giả Dj được gọi h s chặn chêch lch, vì cho
biết g trca h sõ chn ca phm trù nhận g trbằng 1 s khác bao nhu vi
hệ s chn cùa phm trù cơ s.
4.2. HI QUY VI MT BIN LUỢNG MT BIẾN CHẤT
Trong mc này ta s xét mô hình hồi quy chì có mt biến lượng và mt biến
cht vói s phm trù nhiu hơn hoặc ng 2. Trường hợp có nhiều biến lượng và
mt biến cht thì th tục cũng được xét ơng tự như ta sẽ làm ới đây chỉ khác
s biến lung s tăng lên. Đ đ theo i trong mục y ta chia
ra, làm 2 trường
hợp: trưng hp 1 khi biến cht ch hai phạm trù, trưcmg hợp 2 khi biến cht
nhiều hơn 2 phm trù.
1. Trưng hp khi biến cht ch 2 phm trù
Trong trưng hp này, mô hình hi qui s đơn giản vì theo chú ý trên khi
biến cht có 2 phm trù thì chì cn đt 1 biến gi là đủ. Thí d ta xét mô hình sau:
Trong đó:
Yj: Là tin lương hàng tháng cùa mt công nhân cơ khí i,
X i: bc th cùa công nhân i,
D i = 1 nếu công nhân i làm vic trong khu vc tư nhân,
D I = 0 nếu công nhân i àm vic trong khu vực quc doanh.
Mô hình có mt biến luọng đó bậc thợ cùa ngưi cổng nhân mt biến chất ch
l cồng nhân đó m việc thuộc khu vc nào. Nếu ta già thiết E(UÍ) = 0 ttó (4.3) thcho
ta thy liệu tiền Iutmg ca nguời công nhân làm việc khu vc nhân khác tiền lương
của ni 'công nhân m việc
khu vục nhà nưc không nếu các điều kiện khác kng
thay đổi. Bng'cách lấy k vọng c 2 vế (4.3) ta đuc:
Tiền lương trung bình a nguời công nhân khí làm việc trong khu vục nhà nuc:
Tiên lương tung bình ca người công nhân khí m việc trong khu vực tư nhân:
. Y, = p, + p2Di + p3JÍ +
(4.3)
E(Yi I Xj, Di = 0) = Pi +p3Xj
(4.3.1)
E(Yj IX, Di1) - (Pi + P2) + I3XÌ
(4.3.2)
87
Hình 4.2
Hình 4.2 ch cho chúng ta thy ng tiền lương ca công nhân cơ khí m vic
trong khu vực tư nhân và nhà nước nh theo bc th có cùng đ dc p3 nhung li
khác nhau v h s chn. Nói mt cách khác mô htah này gi thiết rng mc tiền
lương trung bình ca người công nhân nnh cơ khí làm vic ò khu vc tu nhân
khc với mc tin lương trung bình cùa công nhân cơ khí làm vic khu vục nhà
c nhung tốc đ ng luong trung bình theo bậc thì như nhau.
NU gi thiết v tốc đ đã nêu trn c g trthì kim đnh gi thiết ng 2
hồi quy (4.3.1) và (4.3.1) có ng b s6 chn có th tiến hình d dàng bng cách
uớc lượng tò i quy (4.3) và chú rằng ý nghĩa v mt thng kê ca Pj đã được ưc
ợng trn cơ s ca kim định t Nếu t chi ra rằng jj 2 là có ý nghĩa v mt thng
kê thì chúng ta t bỏ giả thiết Hũ tiền lương ca cng nhn cơ khí 2 khu vc
kinh tế như nhau.
2. Trưng hp khi biến cht có nhiu hơn 2 phm trù
Khi biến chít có nhiều hơn 2 phạm trù thì vn d cũng khng phc tạp hon
nhu bởi vì theo chú ý trn nếu sô' phm trù là N thì ta đưa vào mô hình hồi quy
N - 1 biến giả m biến giải thích..
Thí d căn c vào s liu chéo người ta mun hi quy thu nhp hàng năm của
mt cán b giảng dy đi hc đi vi tui ngh giảng dy và vùng mà,anh ta giảng
dạy. Vì biến vùng là biến cht, trên thực tế chúng ta có th căn c vào 3 ng khác
nhau trong c nưc, Bc, Trung, Nam. Như vây trong trưng hp này, biến chất
ca ta có 3 phm trù, theo chú ý trên ta s đưa vào m hình hi quy 2 biến giả.
Giả sử rng c 3 hi quy có ng đ dc nhưng khác nhau h s chăn, chúng
ta m bình sau:
Yj = Pi + PjDiì +P3D2Ì + P4XÌ + lí
Trong đó Y| thu nhp hàng Dăm cùa mt giảng viên đi hc
(4.4)
X: tui ngh của giảng viên
l nếu giảng vn i thuộc mt truỉrng đại hc min Bắc.
1 - I 0 nếu ging vn thuộc mt trường không phi min Bắc
1 nếu giảng viên i thuộc mt truờng di học min Nam.
0 nếu giảng viên thuc mt trưèmg không phi min Nam.
Như vy, ta coi ging viên thuộc mt trường đại hc miên Trung phm trù
cơ sở, h s chn chênh lệch p2 và cho chúng ta biết h s chn cùa c phạm
trù khác vi h s chn ca phm trù ca sà bao nhiêu. Chúng ta có th tính đưc
. nếu gi thiết E() = 0 thì t (4.4) ta có:
Thu nhập tnmg bình cùa một cán b ging dạy một trung đại học mn Thing:
E(Yi ID, = 0,D 2 = 0, J i) = p 1 + p4Xi (4.4.1)
Thu nhập trung nh a mt cán bgiảng dạy một trưng đi học miên Bc:
E(Yi ID, = 1, Da = 0, X,) = (p, + p2) + p4xi (4.4.2)
Thu nhp trung bình ca ml cán b giảng dy trường đi hc min Nam:
E(Yi ID, = 0, Dj = 1, x ;) = (Pi + p3) + P,Xi (4.4.3)
Gi s pi > 0 ta có minh ha sau:
Hình 4.3. Thu nhp ca mt cán bộ giảng dy đại hc trong
mi quan.h vi tui ngh và vùng mà anh ta giảng dạy.
Sau khi ưc ng hi quy (4.4) chúng ta d thy rằng liu có s khác nhau v'ê
thu nhp ca cán b ging dy các min khác nhau cùa đt ớc không.
Thí d : Cãn cú vào s liu chéo v doanh thu trên đu người t c tỉnh
thu nhp quc dân nh theo dâu người ca các nh đó. Người ta mun hi qui
logarit R (log thu nhp/ngưòi) đối vi logarit G (log thu nhp quc n/ngưòi)
nh vùng ca mi tỉnh. Theo cách phân chia đã biếl 1 tỉnh thuc 1 trong 3 vùng
Bắc (N) Trung (Q hoc Nam (S). S liu cho trong bng 4.3.
89
Mô hình hi quy là :
Log R = Pi + P2D1Ì +P3D + P4 logGi + l í
Trong đó:
Log R: ln(thu nhập/ngưi)
Log G: ln ( thu nhp quc dân /ni).
1 nếu tỉnh đó thuc mièn Bc
0 nếu tnh đó không phi là tnh min Bác.
D , i =
1 nếu tỉnh đó thuc min Nam
^ = 0 nếu tinh đó khng phi tinh min Nam.
Kết qu hồi quy như sau:
B n g 4.3
Tinh Vùng G R
Tinh Vùng G ,
R
H.Gìang
N
53099
15433 Q.Ngãi c
921501
51778
T.Q. N 1026246
32534
B.Đnh c
974381 71581
C.Bng N 939592 25915
P.Yên
c
1162995
69315
L.Sơn
N
1105916 79225
K.Hoà
c
2195192
204879
L.Châu N 1173320 27660 N.Thun c
506939
44556
L.Cai N 819802
35570 B.Thun
c
1825380 105927
Y.Bái N 1506025
4610
K.Tum
c
1181003 65642
B.Thái
N 1565816 48172 G.Lai
c
1024570 69518
S.La
N 643444
29338 Đ.lc
c
1725293
83590
Q.Ninh . N 2195642
311755
L.Đng
c
1493055
107289
H.Bình N
2040215 72890 HCM
s
4997041 962414
V.P N
1229249 74594 Đ.Nai
s
2370994 239017
H.Bc
N 1021338 47667
VT-BR
s
1991269
907834
H-Ni N
3631625 1062935 S.Bc
s
1491414 192057
H.Phòng
N 2070000
160291 T.Ninh
s
1553681
204342
H.Tây
N
1142000 45778 L.An
s
1762790 147537
H.Himg
N
1303451
105546 T. Giang
s
1057203
109833
T.Bình
N 1162747
51436
A. Giang
s
1760437
142684
N.Hà
N
1181747
53902 Đ.Tháp
s
1370071
100655
N.Bình
N
1062831
42545 B.Tre
s
1532974 82319
T.Hoá
c
1200650
102550
V.Long
s
2021798
116666
Ng. An
c
930844
59498 T.Vinh
s
2024467 66530
H/Tĩnh
c
910650
30163
Sóc trang
s
1571656
84334
Q.Blnh
c
992594
41673
Cn Thơ
s
1760304
121340
Q.Tr
c
943805
70579 K.Giang
s 2329861
154636
T.T.Huế
c
1009223
90856 M.Hi
s
1736902
142079
QN-ĐN
c
1367673
198297
90
logRi = -15,040082 - 0,42196 D, - 0,337541)2 + 1,94474 log G|
Ta có th viết 3 phương trinh hồi quy:
Min Trung: log R =-15,04 + 1,93 log Gi
Miên Bc: log R| = -15,46 + l,91i log Gi
Min Nam: log R = - 15,83 + 1,9.') log G i.
Theo chú ý trên p2 cho ta biết log (doanh thu) thay dổi khi chuyn t nh
min Trung đến mt tinh min Bc.
P 3 cho ta biết doanh thu thay đổi khi chuyển từ miền Trung đến mt tình miền Nan*.
4.3. HI QUY VI MT BIN LUỢNG HAI BIẾN CHẤT
Trong mc này ta xét hi quy với 1 biến ợng 2 biến cht. Nguyên tắc đã
trình bày à trên duc m rng cho trường hợp này. Số biến giả được đưa vào mô
hình hi quy ph thuc vào s biến cht c phm trù mà mi biến cht .
Thí dụ: Chúng ta hãy quay li thí dụ vê thu nhp cùa mt giảng viên đại học,
bây gi chúng ta gi thiết thêm rng giới nh ca giảng viên cũng là nhân t quan
trng đ xác đnh thu nhp ca giảng vn. Như vy ta 2 biến chất:
- ng có 3 phm trù
- Gii tính có 2 phm trù.
M hình s có dng
Yi = Pi +P2D11 + P3D2Ì +P4D3Ì +psX + Ư1 (4.5)
trong đó:
Yi là thu nhp hàng nm ca giảng vn đi hc
Xi là tui ngh ca ging vn i.
1 nếu ging viên thuộc tiirờng đại hc min Bc.
D ii =
0 nếu ging vn không thuộc trường đại hc min Bc.
1 nếu ging viên thuộc trường đại học min Nam.
D 2i =
0 nếu ging vn không thuộc trường đi học min Nam.
1 nếu ging viên nam
D 3i =
0 nếu ging viên nữ
Phm trù cơ s bây gi ỉà giảng vn n thuc mt trường đi hc min Trung.
G sử E(U) = 0 chúng ta có th thu được kết quà sau bng cách lấy kỳ vng
điều kiên c 2 vế (4.5).
Thu nhp trung bình cùa 1 giảng viên n mt trung đi hc min Trung
91
E(Y, I D,= 0, Dj = 0, Dj = 0, x,).=p, + PsX;
Thu nhp trung bình ca 1 giảng viên nam mt trung đi hc min Trung
E(Yi I D,= 0, E>2 = 0, D, = 1. Xi) = (Pi +P4) + p3x>
Thu nhp trung bình ca 1 giảng viên nữ mt trung đi hc miền'Bc
E(Yi I D,= 1, D ĩ= 0, Ds = 1. Xi) =(p +Pj) + PsX
Thu nhp trung nh ca.l gin? vn nam mt trung đi hc miền Bc
E( I D,= 1, = 0, D3 = 1, X,) =(P, +p2+ p4) + PsX,
Thu nhp trung bình cùa 1 giảng vn n mt trung đi hc m iln Nam
E(Yi I D,= 0. I>2 = 1, Dj = 0, X) =(p, +p3) + p3X;
Thu nhp trung bình ca 1 giảng vn nam mt tning đi hc min Nam
E(Y, I D,= 0, Dj = 1, D, = 1, Xi) =(p, +p3 + M + p5X,
4.4. SO SÁNH HAI H i QUY
l ễT u tudng cơbn
Tt c các mô hình hồi quy đã xét đến nay, chúng ta đu gi thiết ng biến
ợng nh hưởng đến h s cbn nng khng nh huởng đến h s góc các hồi
quy ca I'.áe»nhóin con khác nhau. Nhung nếu hs góc khác nhau thì việc kiểm
định về tính* khác nhau ca h s chặn s ít ý nghĩa. Mt khía cnh khác nữa
các tập s liu mà chúng ta s dng là các tập s liu (fan nhưng liu môt mô bình
đã cho có th áp dng cho hai tp s hay không? Chng hn khi nghiên cứu mối
qlan h giũa tiết kim và thu nhập trước sau chuyn đi kinh tế cùa c ta. Vì
thế chúng ta cn phát trin pơng pháp chung đ m xem liu 2 hi quy có khác
nhau hay không? S khác nhau nếu thì hệ s chn, h s góc híiy c hai.
Thí d: Ta có hi quy:
Thi k irước ci tổ:
Yi = Xi + XXì + Uii (4.5a)
vi i= l,n,
Thi k sau ci tổ:
Yj = yi + 2*j + U i Cj =T T «7) (4.5b)
t-ong đó X thu nhp; Yià tiết kim; Ưii, Ui các ĩihiẽu trong 2 hi quy.
4 khà năng xy ra đi với 2 hồi quy này:
I. X| = và x2 = 72, nghĩa 2 hồi quy đòng nht, írên đ th chúng chồng
khlt ìin nha-., điều ní.y ch ra hình 4/m
92
2. Xi * 7i và Xa = 72, nghĩa là 2 hồi quy có ng hộ s góc, điu này chì ra
hình 4.4b
3. A., = , và .2 y2, nghĩa 2 hồi quy có cùng h s chn nhung khác nhau
vh s góc, điu này chr hình 4.4c
4. X * y, và X-2 * y2, nghĩa 2 hi quy hoàn toàn khác nhau, điều này chì ra
hình 4.4d.
Hình 4.4.
a. Hai hi quy trùng nhau; b. Hai hi quy song song;
c. Hai hi quy cócùpg h s chặn; d Hai hồi quy hoàn toàn khác nhau.
Đ kim đnh s bng nhau ca h s hi quy chúng ta có th sử dng một
trong hai k thut: kim đnh Chow và s dng biến già. Sau đay chúng ta xét cả
hai k thut.
2. So sánh 2 hi quy - kiin đnh Chow
Mt trong nhng phucmg pháp ph biến đ kim đnh s khác nhau giũa hai
hôi quy kim đnh ca Chow. Kiểm định này da trôn nhng giả thiết sau:
93
a. Các nhiễu Hi và Uy có phân phi chun có k vng bng 0 và phuơng sai
khng di và du bàng ơ2:
Uii ~ N (0,ơ2)
lij-N ( 0 ,ơ 2).
b. Cấc Uii và Xj có phân phi đc lập.
Vi giả thiết đã cho thì thù tục kiểm định Chow như sau:
Bước 1. Kết hp ti c các quan st ca 2 thi k li ta đưc n = n, + n2 quan
sát ri ước lung hồi quy gộp. Mô hình gp ca (4.5a) và (4.5b) lúc này có th viết
dưới dạng:
Y i= P ,+ (325Q +U (4.6)
T hi quy này chúng ta thu đơợc tổng bình phuơng cc phn dư là RSS vi số
bậc tự do n, + n2 - k (trong đó k là s tham s duc ước ng, trong mô hình (4.6)
tM k=2.
Bưcĩ. uc lung riêng từng hồi quy (4.5a) và (4.5b) và thu được tng nh
phuong các phn dư tuơng ng t mô hình (4.5a) là RSS| và tù mô hình (4.5b)
R S S í và bậc t do tucmg ứng n, - k và n2 - k.
Đt RSS = RSS| +RSS2 với bậc t do ni + n2 - 2k
Bước 3. Sử dng tiêu chun F như sau :
n _ (RSS-RSS")/k
, A n s
F = 7/
-
--------
-T (4-7)
RSS/(n,+n2-2k)
Vi bc t do là k và ni + n2 -2k. Nếu g trị F tính đuc vưt giá trF tới hạn
thì ta tù b giả thiết rằng hai hồi quy như nhau. Điu này có nghĩa là hai tập s
liệu là khng gp được.
3. So sánh hai hi quy th tc biến gi
Kiém đnh Chow cho phép ta so sánh 2 hi quy. Sau dây ta s trinh y thù
tục biến gi mà cũng s cho ta gp ỉất c Di và n2 quan sát li vi nhau và uớc
lung hi quy sau:
Yi= p,+ Pj Dì + p3Xi + P«(D|Xi) + (4.8)
Gi s Y| và X là tiết kim và thu nhp trưc và sau khi chuyn đi kinh tế.
94
D ,=
0 đi vi quan t thuc vào trước thời điểm chuyn đi
1 đi vi quan sát thuộc o sau thời điểm chuyn đổi.
Đ thy được ứng dng ca mô nh (4.8) ta lấy kỳ vng có dĩèu kin c hai
vế cùa phương trình này với già thiết E() = 0 chúng ta thu đurc:
E(Yi I Di = 0, Xi) = Pi + P3XÌ (4.8a)
E(Y, ID, = 1. Xi) = O i + k ) + (P3 + PO X, (4.8b)
Với nghĩa các kí hiộu đã cho trên ta có thể giải thích như sau:
(4.8a) là hàm tiết kiêm trung bình cho thi k trước chuyn đi kinh tế diễn
ra.(4.8b) là hàm tiết kiêm trung bình từ khi chuyn đi kinh tế vê sau. Hai hàm này
hoàn toàn ging như hai hàm đã cho (4.5a) và (4.5b) cho nên uc lượng (4.8) cũng
tương đơng vi vic uc lượng hàm (4.5a) và (4.5b).
Trong (4.8) thì p2 chính h s chn biểu thsự khác nhau cùa tiết kiệm giữa
2 thi k còn (3* chính là h sô' đ dc khác nhau nó chra rng h s góc cùa hàm
tiết kiộm trưc khi chuyn đi khác với hộ s c cùa thời k t khi chuyn đổi
kinh tế là bao nhiu.
4.5. NH HUNG CA TUƠNG TÁC GIA CÁC B N g i
Chúng ta xét mô hình sau:
Y| = p!+ P2D2Ì + P3D 3Ì+ p4 Xj + t í
trong đó: chi tiêu hàng năm vê qun áo,
X là thu nhp
1 nếu là n
0 nếu là nam
(4.9)
D2 =
d 3=
1 nếu sinh viên
0 nếu là công nhân vn
Ng ý cùa mô hình trên đây nh hưởng chênh lch ca biến gi giới nh D2
là hng S qua 2 tng lp sinh viên và công nhân vn và nh hường chênh .lch D,
cũng là hàng s qua 2 giới. Điu này có nghĩa là nếu chi tiêu trung bình v qun áo
ca n cao hơn ca nam tw điu này cũng đúng vi c hai tng lớp. Tương t ng
có th nói ràng chì tiêu trung bình v'6 qun áo ca sinh vn nhiều hơn cùa công
nhân viên thì điu đó cũng đúng nó nam hay ti.
95
Trong nhiu áp dng thi gi thiết như vây khống duy trì đuc. N sinh có th
tiêu dùng nhiu qun áo hcm nam công nhăn viên. Nói mt cách khác có th có ảnh
hường tương tác gia 2 biến cht D2 và Dj và do đó nh hung ca chúng lên frung
bình Y có th không phi là phép cng đem giản như trôn mà là nhìn như m hình
sau:
Y; = Pi+ P2 P 21 + PjDjì+ P*(DDjì) + PsX + u (4.10)
T (4.10) ta thu được chi tiêu trung bình v qun áo cùa mt n sinh s
E(YI D2 = 1, Dj = 1, Xi) = (Pi + p2 + + P4) + p 5x;
Trong dó p2 nh hưng chênh lệch ca nfc, p3 là nh hưng chênh lch cùa
sinh viên, còn p< nh hưởng chnh lệch của n sinh. p4 cho ta biết chi tiêu trang
binh v qun áo ca mt n sinh khác khác với chi tiêu trung bình ca nam và n
công nhân viên. Điu này cho biết sự tuơng tác giữa các biến gi làm thay đi nh
ởng cùa 2 thuc tính đã đuc xem xét 1 cách riêng r như tbế nào.
Đ kim dinh h s P4 - tuong c của các biến gi - có ý nghiã v mt thng
k hay khng, có th kim đnh t.
4.6. SDNG BIN GIẢ TRONG PHÂN TÍCH MÙA
Như chúng ta đã biết nhiều chui thời gian trong kinh tế có tính cht thi v rít rõ,
chng hn doanh s bán ca các cửa hàng bán qun áo vào 10 ngày trưóc lết hàng
m, doanh s bán ra ca ca ng n phòng phm vào du năm h c ,... Thông
thường người ta mun loi nhãn t mùa khi chui thi gian đ ngưi ta c th tp
trung vào các thành phn khác ca chui thi gian nhu khuynh hưng tăng hoặc
gim hoàn toàn đu đn theo mt thời k thối gian dài. Quá trình loi thành phần
khi chui thi gian thu được như vây gi chui thi gian dã được điều chình
theo mùa. Có mt s phương pháp điu chinh theo mùa ca chui thi gian, trong
mc này ta xét phương pbáp biến giả.
Hoàn toàn như đã trình bày trên việc đưa biến gi vào đ loi yếu t kbỏi
chui thi gian đưc thc hiện, da ưn các gi thiết:
1. Yếu t thòi vụ ch nh hưởng đến h s chn ca hi qui,
hoc: 2. Yếu t thòi vụ nh huởng đến c h s c.
96
Ung vi mi gi thiết, mô hình được xem xét cũng khác nhau. Đ thun tin trình
bày, ta xét:
Nghiên cứu mi liên h giữa thu nhập với chi tiêu cho qun áo, dng cụ gia
đình, ngưi ta thu thp được mt mu ngu nhn kích thước n và cho ng mỏi
mt quí có th biu th mu theo a. Khi đó mô hình như sau:
Yi = P1 + p2p 2i + 33D3l+p4DJi + P 5X + IÍ (4.11)
Trong đó:
Y| biu thchi tiêu ca ngui tiêu đùng v các loi hàng nói trên .
Xj là thu nhp ngưi tiêu ng i
1 nếu quan sát nm quí 2
0 nếu quan sát nm quí khác.
1 nếu quan sát nàm quí 3
D2 =
Dj =
D 4 =
0 nếu quan sát nm quí khác
1 nếu quan sát nm quí 4
0 nếu quan sát nm quí khác.
Trong mô hình trên la gi thiết biến có 4 phm trù, nên ta dùng 3 biến giả,
phm trù cơ s là quí I. Nha vy nếu có nh hưởng theo' mùa ca từng quí khác
nhau thì hê s chn p2, 03 và p4 khác nhau có ý nghĩa ví mt thng kê. Mi mt h
sơ chn cho ta biết chi tiêu trung bình mi quí khác vi quí I như thế nìo. Vi giả
thiết E() = 0 ta có: Chi tiêu trung bình v các khon đã k trn trong quí I :
E(Y| I D2 = 0, E>3 - 0, D4 = 0, XI) = Pi + PsX
chi tiêu trung bình v các khon đã k trên trong quí n là:
E(Yi I D2 = 1, D3 = 0, D4 = 0, X) = (pi +pĩ) +PsXi
chi tiêu trung bình v các khon dã k trên trong qu m là:
E(Yi I Eh = 0, Dj = 1 , ^ = 0, Xi) = (p ,+ p3) + p 5X,
chi tiêu trung bình v các khon đã k trên trong quí IV là:
E(Y| I D2 = 0, D j = 0, D4 = 1, JQ) = (Pi +P4 ) + PsX
Bây gi ta gi s rng có s nh hưởng ơng tác giữa mùa và thu nhp 16n chi
tiêu nói cách khác là có s nh ởng 16n c h s góc ca hi qui. Sử dng
phưng pháp ơng t như tr đã tìn h bày trên ta di đến mô hình:
Yi= p, + 02 Díi + Pj D Ji+ p4 D« + p5Xi + p6(D,,Xi) +
+37(D3iXÍ) + Ps(D4jXi) + \j (4.12)
97
X : thu nhp trong năm bt đầu chuyển giai đon t cơ chế có kế hoạch
sang tơ chế thị trường.
1 nếu t > to
D| =
0 nếu g tr khác cùa t
Vi gi thiết E(U) = 0 chúng ta thấy ngay ràng: trung bình ca tiu ng trong
nhng năm trưc khi chuyn đi kinh tế là:
E(Y, I D| = 0, Xi) = Pi +(32X, (4.14)
và vói D, = 1 thì ta
E(Y, I D, = 1, X) = (B, - Pj X , ^ (P2 + P,)X, (4.15)
Vy 02 cho đ đc ca đường hi quy tớc khi chuyn đi. (p2 + pj) cho đô
dốc cùa đưng hi quy sau khi chuyn đổi.
Chú ý rng không có s gián đon
E(Yị ) = (3, + p2X , theo phương trình (4.14)
. = 0i-3.iXti) + (p3 + P3)X,0
= Pi+ P2 X,
Ta cũng chú ý rng khi p3 = 0 Ihì phuong trình (4.13) s tr thành phương
tìn h ca đưng thng, vy kim định p3 = 0 sẽ cung cp cho ta kim đnh đơn giản
về s thay đi cấu trúc.
Nhung vn d s như thế nào nếu mô hình có nhiều Ihay đi vê cu trúc ứng
vái to và t|, thi mô hình thich hp s là:
(4.16)
v,= (3, + p2X + pj(X, -x,0 )D| +p4(X, - xti )D2+U
trong đ ó r
1 nếu t > t|
0 nếu t nhn g trkhác
1 nếu t > t
0 nếu t nhn g trị khác
10 mõi mt ưong 3 giai đon như sau:
Pi + P2X; với 0 < t < t,,
Pi - P3 X , ) + (p2 + pi) X v<^ to < t ^ t|
Pi - Pj^( ) + (P2 + p3 + P4) X| i t > t| .
D2 =
d 4 =
Vậy phuơng trình c
ECO =
4.8. THÍ D
aThì d 4.1: Cho mc tiêu dùng theo đu người và thu nhp sau thuế của
Mtrong thời kỳ 1929-1970. Trong thời gian này có xy ra chiên tranh thế giđri th
hai từ 1941-1946. Da vào kết qu sau đây hãy cho biết " chiến tranh" có ảnh
99
hưng đên tiêu dùng không? Trong đó D= 1 trong thời k 1941-1946 và bằng
khng trong các năm khác.
Ordinary Least Squares Estimation
Dependent variable is c
42 observations used for estimation from 1929 to 1970
Regressor
Coefficient
Standard Error T-Ratio[Prob]
INPT
101.5147
25.4574 3.9876[.000]
D
-204.9233
18.7856
-10.9085[.000]
Y
.86363
.014718
58.6788[.000]
R-Squaied .98940 F-statistic F( 2, 39) 1820.4[.000]
R-Bar-Squared .98886 S.E. of Regression 42.5410
Residual Sum of Squares 70S79.9 Mean of Dependent Variable Ỉ498.S
S.D. of Dependent Variable 403.0243 Maximum of Log-likelihood -215.558
DW-statistic 1.6342
Theo kết qu trên p J = -20,4,92 < 0; tj = -10,90, p-value = 0,000. Do dó ta kết
luận: Chiến tranh thế gii th n có nh hưòng đến tíea dùng/ đu ngưi M và
lim gim mc y.
Trên d th cho
hỉnh nh trc gc
v mc tiêu dùng
gim trong thi kỳ
chiến tranh thế giới
thhai
b. Thí d 4.2: Cho t s giũa ch s giá các mạt hàng ché* các nưc
kém phát trin và chì s giá các mt hàng chế biến nhp t các nuc công nghip
trong khong thi gian 1950-1986. Trong khong thi gian này, t 1973- 1974,
người ta thy có biéh đng n vtỳ s y. Dựa o đ th dưới đây, người ta thấy
100
có bước nhy và xu thế ca t s này đã thay đổi. Bằng kim đnh Chow kỹ
thut biến gi hãy xem xét vn đ trên.
Các biến sđ: TOT - T s giữa ch s giá c mt hàng sơ chế các ớc kém pt
trin và chì s giá các mt hàng chế biến nhập từ các nước công nghiệp. T- biến xu
thế( T|950 1... T 86 = 37).
i Kim đnh Chow
ú c lưng mô hình trong sut thòi k 1950-1986
Ordinary Least Squares Estimation
Dependent variable is TOT
37 observations used for estimation from 1950 to 1986
9f( * * * * * * * * * * * ** * ** ** * *** *** ** * * * * * ** * *»H * ** * * + ** * * * *** * ** +* * * * * * * * *
Regressor Coefficient Standard Error T-Ratio[Prob]
INPT 1.1737 .041617 28.2027[.000]
T -.0072022 .0019095 -3.7717[.001]
*****************************************************************
R-Squared .28899 F-statistic F( 1, 35) 14.2256[.001]
R-Bar-Squared .26867 S.E. of Regression .12402
R e s i d u a l Sum of Squares .53831 Mean of Dependent Variable 1.0369
S.D. of Dependent Variable .14502 Maximum of Log-likelihood 25.7588
DW-statistic .86906
*****************************************************************
101
c ng mô hình trong sut thi k 1950-1972
Ordinary Least Squares Estimation
****************************************************** ***********
Dependent variable is TOT
23 observations used for estimation from 1950 to 1972
Regressor Coefficient Standard Eưor T-Ratio[Prob]
INPT 1.2269 .031119 39.4271[.000]
T -.014305 .0022696 -6.3031[.000]
R-Squared .65420 F-statistic F( 1, 21) 39.7295[.000]
R-Bar-Squared .63774 S.E. of Regression .072199
Residual Sum of Squares .10947 Mean of Dependent Variable 1.0553
S.D. of Dependent Variable .11996 Maximum of Log-likelihood 28.8621
DW-statistic .95185
* * * * * + afr 4* * * * * * * * * * * * * * a*e 4c $ 4c 4c * * % * * * * * * * * * * $ % * % sfc 4c 9fc * 3fc * * * * * *
*
* * % * * * * *
c ng m hình trong sut thi k 1973-1986
Ordinary Least Squares Estimation
* * * * * * * * * * * * ** **** * * * * ** ** * * * * * * * * * ** * 9|( * * % * afc * % * % * 3fc * 9fc * * * * 3fc * afe * * * * * *
Dependent variable is TOT
14 observations used for estimation from 1973 to 1986
Regressor Coefficient Standard Error T-Ratio[Prob]
INFT 2.0906 .21450 9.7465[.000]
T -.035538 .0069721 -5.0971L 000]
*****************************************************************
R-Squared .68405 F-statistic F( 1, 12) 25.9806[.000]
R-Bar-Squared .65772 S.E. of Regression .10516
Residual Sum of Squares Mean of Dependent Variable 1.0067
S.D. of Dependent Variable .17975 Maximum of Log-likelihood 12.7456
DW-statistic 2.2306
Theo các kết qu trên: RSS = 0,53831;
RSS =RSS, + RSS; = 0.10947 + 0,13271= 0.24218
p _ (R S S - R S S ) /k (0,53832 - 0 ,242 1 8)/2
~ R S S /(n l + n2 -2k) ~ 0 ,2 4 2 1 8 /(3 7 -4 )
Fo,oj(2i33) = 3,3. F > Fũi0j(2,33) diều này chứng t có thay đi ca hê s chăn hoặc
h s gc hoc c hai.
102
2. K thut biến gi
Các biến D = 1 trong thi ktừ 1973-1986; TD = T*D.
Ordinary Least Squares Estimation
Dependent variable is TOT
37 observations used for estimation from 1950 to 1986
Regressor Coefficient Standard Eưor T-Ratio[Prob]
INPT 1.2269 .036923 33.2293[.000]
T -.014305 .0026929 '-5.3123[.000]
D .86368 .17859 4.8361 [.000]
TD -.021232 .0062856 -3.3779[.002]
R-Squared .68013 F-statistic F( 3, 33) 23.3891 [.000]
R-Bar-Squared .65105 S.E. of Regression .085665
Residual Sum of Squares .24217 Mean of Dependent Variable 1.0369
S.D. of Dependent Variable .14502 Maximum of Log-likelihood 40.5362
DW-statistic 1.7080
T kết qu trên, các kiểm định t vh s ca D và TD đéu cho biết chúng
khác không. Nghĩa là đã có đ có thay đổi về hs chn và h s góc.
v mt kinh tế, phép kim định trên cho biết trong khong thời gian 37
năm 1950-1986, t lệ gia ch s giá c mt hàng sơ chế c nước kém pt
triển và ch s giá các măt hàng chế biến nhập t các ớc công nghip có xu
hướng giảm. Mt đô la xut các mt hàng sơ chế ngày càng mua được ít hàng chế
biến n.
103
BÀI TẬP
4.1. Các biến s sau đây là đnh lưng hay định tính:
a. GDP
b. Khng hong du m 1973.
c. Xut khu ca Vit nam sang các nước ASIAN.
d. Thành vn cùa T chc thương mi thế gii. WTO.
e. Cán b tt nghip ĐH. Kinh tế quóc dân.
f. Hc sinh din chỉnh sách.
4.2. Nghin cứu sự biến đng ca lưng gas bán ra (Q: bình) ph thuc vào giá gas
(PG: nghìn đ/bình), có người cho rằng cht lưọng gas là quan trng, người đ cho
rằng Trong nhng tháng đi nhộp binh gas mi thì ng bán ra khng giống vãi
nhãng tháng nhp bình gas cũ, do dó dã hổi quy m hình có các biến như sau:
D = 1 với nhng tháng nhp bình mới, D = 0 với nhng tháng khác, DPG = D*PG.
Cho a = 5% .
Ordinary Least Squares Estimation
Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
*****************************************************************
Regressor Coefficient Standard Error T-Ratio[Prob]
PG -7.0673 .20832 33.9252[.000]
D 106.0104 98.5409 1.0758[.293]
DPG .278299 .078845 2.6307[.012]
INPT 2403.548 564.094 4.2609[.000]
R-Squared .99252 F-statistic F( 3,23) 1016.28[.000]
R-Bar-Squared .99154 S.E. of Regression 41.5680
Residual Sum of Squares 39741.7 Mean of Dependent Variable 1831.4
S.D. of Dependent Variable 451.9370 Maximum of Log-likelihood -136.78
DW-statistic 1.9506
a. Viết hàm hồi quy tng th, m hồi quy mu cho tng trưng hp tháng
bán bình gas mi cũ?
b. Tìm ước ng đim mc chênh lệch ca hê s chn trong 2 trưng hợp
trên.
c. Trong tháng bn bình gas mới nếu giá gas 110 nghìn thì ước lung điểm
lượng bán là bao nhiéu? Với tháng bán bình cũ thì giá tr đó bng bao
nhiu?
d. V đ th cùa hàm hổi quy mu trong 2 trường hợp.
104
e. Các h s ca mô hlnh có khác 0 mt cách có ý nghĩa không?
f. H s chn ca mô hình trong những tháng nhập bình mi và bình cO có
thực sự khác nhau không?
g. Đ th thc tế ca hàm hi quy tổng th th có dng nh thế nào?
h. Khi cùng gim g 1 nghìn thì kh năng n thm ca nhng binh gas
và mi chênh lệch nhau trong khoảng nào?
i. Mt người cho rằng do binh ga luôn g cao an toàn nên lượng bán
không chu nh hưng ca cht lượng bình gas mà chu ảnh hưởng cùa việc
quàng cáo. Ajih ta cho ng trong những tháng có qung cáo ch cực thl
ng bán tâng hơn so vi những tháng khng ch cực qung cáo. Hãy y
dng mô hình và nều cách kiểm tra.
j. NU mun xem xét nh hưng đng thi ca c vic tháng nhp bình gas
mi hay cũ và có qung cáo ch cực hay không thì phải xây dng mô hình
và thc hin các kim đnh như thế nào?
4.3. Mt cơ quan nghiên cứu mi quan hê giữa sản lượng đầu ra cùa các cơ s sản
xut và ngun lực đu vào (Vn : K ; Lao đng :L) cho rng cơ s sản xut thuộc
s hu nhà nước và không thuc s hữu nhà nước thì hiệu qu ca ngun vốn và
lao đng không như nhau, do đó xem xét sự biến đng ca sàn ng khng chì
phthuc vào vn và lao đng mà n c yếu t thuc s hữu nhà nưóc hay khổng.
Khi đt thêm biến D: D =1 nếu cơ s sản xuất không thuc nhà c vàD = 0 nếu
nguọc lại, và hổi quy mô hình sau vi DL = D*L; DK = D*K. Cho a = 5%.
Ordinary Least Squares Estimation
Dependent variable is s
20 observations used for estimation from 1 to 20
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
Regressor
Coefficient
Standard Error T-Ratio[Prob]
INPT 19.0034 26.9511
.70511[.492]
L
16.9695
6.4600
2.6268[. ]
K
9.7180 3.3396
2.7482[. ]
DL
5.7866
1.7489
3.3086[. ]
DK
2.8915
1.7838
1.6209[.126]
*****************************************************************
R-Squared .79542 F-statistic F( 4,15) 14.5806[.000]
R -B ar-S q u a re d .74087 S.E. of Regression 29.3907
R e s i d u a l Sum of Squares 12957.2 Mean of Dependent Variable 109.4666
s D. of D ep en d e n t Variable 57.7367 Maximum of Log-likelihood -93.1155
DW-statistic 2.4750
if****************************************************************
105
a. Viết hàm hi quy tng th. Người nghiên cứu xem xét yếu t thuc và
không thuc s hu nhà nước tác đng đến những h s hi quy nào?
xem xét tác đng đến h s chặn không?
b. Viết hàm hi quy mu cho c cơ s sản xut thuộc s hu nhà nước
không thuc nhà nước. : <' !
c. Tim ưc lưng đim ca sin lưng ca doanh nghip thuc nhà nưc và
khng thuc nhà nuớc khi 30 ng nhãn và ngun vốn 350 triộụ.
d. Tìm ước ng đim mức chênh lêch sản lượng cùácơ s thuc ivà khổng
thuc s hữu nhà nước khi thay đổi mt lao đng và ngun vn thay dổi 1
triệu.
e< Khi cùng thay đổi ngun vốn, lao động khng đi thì cơ sở thuc và không
thuc nhà ớc mức sản lượng thay đi có khác nhau khng? Nếu cùng
thay đi lao đng, vốn không đi thì mc thay, đi sn lượng trong hai
troâmg hp trên có ging nhau không?
f. Việc đưa thêm biến gi vào có thực sự cán thiết và làm tăng ý nghĩa
hình khng? Dùng kiểm định thu hẹp hổi quy đ đua ra kết lun nếu biết
với mô hình s phụ thuc o K, L có h s chăn RSS bng 17925,0
g. Nếu có người quan tâm khổng phải là việc cơ s sn xut đó thuc hay
không thuc s hữu nhà óe mà là cơ s sản xut thuc loi lớn (nguổn
vốn trên 1 tỷ) hay loại nh (nguồn vốn dưới 1 tỷ) cho rng cơ s loi lớn
thì hiệu qu ngun vốn và nguồn lao động n hơn cơ s loi nhỏ. Khi đó
mun kiểm tra phi làm như thế nào.
h. Nếu muón xem xét tác đng ca c yếu t thuc và không thuc sở liữu
nhà nước và yếu t cơ s lớn và nh thì phải m như thế nào ?
106
CHƯƠNG V
BACNSĨOTH
Trong mô hình phân tích hi quy bội, cng la đã g thiết giữa c biến giải
thích ca mô hình không có đa cộng tuyến. Nhưng già thiết đó bị vi phm thì hn
qu s như thế nào và làm thế nào đ phát hin ra rng gi thiết này b vi phm và
biộn pháp khc phc nó. Đó là nội dung của chucmg này. Trựớc hết ta cần m
bn cht và nguyên nhân ca đa cng tuyến.
5.1. BN CHT CA ĐA CNG TUYẾN- ĐA CNG TUYN h o à n h o
KHÔNG HOÀN HO
Tư tưởng đa cng tuyến thm sâu vào mọi khía cạnh ca hồi quy bi. do
m cho đa cng tuyếncó ảnh hưởng lớn như vậy khi ta nghiên cứu mối
quan h giữa biến Y và các biến giải thích Xi. ta gập quan h nào đó gia các biến
Xi vi nhau.
Tng hp ng là các biến Xí trong mô hih hồi quy không có ơng
quan vi nhau; mi mt biến Xi chứa mt thông tin riêng v Y, thông tin không
chứa trong bt k biến Xj khác. Trong thực nh, khi điều này xy ra ta không gặp
hiện tượng đa cng tuyến.
trưng hp ngưc li, chúng ta gặp đa cộng tuyến hoàn ho. Giả s ta phải
ước lượng hàm hi quy gm k biến giải thích Xi, X , x3
.....
Xk,
Yi = P ,X M + p2Xa +
....
+ p à + ĩ
Đa cng tuyến hoàn ho xảy ra khi mt biến giải thích được biểu diẽn dưi
dạng tổ hp tuyến tính ca các biến giải thích còn li đi với mi đim cùa tập s
liu. Hoc có th pht biu: Đa cng tuyến hoàn ho giữa các biến giải thích X|,
X2, X )......Xk xy ra nếu điều kin sau được tha mãn:
l lX, + X2X2 + .........+ XkXk = 0 (5.1)
trong đó Xi, ta
.........
A.k, là các hng s không (Tông thi bng không.
Thut ng đa cng tuyến lần du tien được Ragnar Frisch s dng vào năm
1934 vi ni đung trên. Tuy nhiên ngày nay, thut ng này đưc s dng theo
nghĩa rng n. Nó bao gôm c đa cng tuyến hoàn ho và trưng hp trong đó
các biến gii thích có tương quan vi nhau theo nghĩa sau:
\)X ii + XĩXìi +
.......
+ XkXiá + Vj-= 0 (5.2)
107
trong dó V| là sai s ngu nhn.
Ta hãy minh ha tư tung trên bằng d thnhư sau:
Các biến gidi thích X
Biến ph thuc Y
X,
Các bin trc giao cho
thng tin t nhng ngun
đc lp. Không cộng
tuyến.
Cng tuyến hoàn toàn.
Thông tin dông nht
Không cổ i quy.
Xj X|
* ^
X,
Múc đ cng tuyến nìo
gia các biến X Nhng ván
dè hi quy ph thuc v&o
bc ca công tuyến.
N x*
\ - -
Tương quan ngưc chiu
gia các biến X. Cng
tuyến mnh.
Hình 5.1
Gi s ta xét mô hình hi quy trẽn vi hai biến gii thích (k = 3). Ta biểu th
mt biến cùng ni dung thông tin ca nbng mt vectơ trong mt phng. Hai
biến khng cng tuyến biểu thi bi 2 vec trục giao bong mt phng. Đó là những
vec có cùng gc và to thành gc 90 độ. Các biến cng tuyến hoàn toàn biểu thị
bằng 2 vectơ nm trn cùng mt ờng thng. Các biến cng tuyến khong hoằn
toàn nàm giữa hai cc trên. Góc tucmg ứng giữa hai vecto s hoc nàm giũa 0 và 90
đ hoc nm giữa 90 đ và 180 độ. Gc giữa các vecto càng gn 0 đ hoc 180 đ
thì nh cng tuyến càng lớn.
5.2. UỐC LUNG KHI c ó ĐA CNG TUYN HOÀN HO
- Sau đây chúng ta s chra rằng khi có da cng tuyến hoàn ho thì các hê số
hi quy là khng xác định còn các sai s tiêu chun là v hn.Đ đơn gin v mặt
trình bày, chúng ta xét m hình hi quy 3 biến và chúng ta s s dng dng đ ìẹch
ưong đó:
y, = - ; X, = Xi- X ; ( i = ũ õ (5.3)
108
(5.6)
(5.5)
(5.7)
(5.4)
Gi s X3| = XXĩi trong đó X là hằng s khác không, thay điều kin này vào
(5.6) ta được:
biểu thúc khổng c định, -niơng tự như vậy ta cũng thể chi ra jj3 không xác đnh.
Vì sao chúng ta li thu được kết qu như (5.8). Lưu ý đến ý nghĩa ca 2
th gii thích điu đó. p2 cho ta tc đ thay đi trung bình cùa Y khi X2 thay đi 1
đơn v còn x3 không đi. Nhung khi Xj = XXì thì điều đó có nghĩa là không thể
tách nh hung ca Xỉ và X3 khi mu đã cho. Trong kinh tế lung thì điều này
phá hy toàn b ý đnh tách nh hưởng riêng ca từng biến n biến ph thuc.
Thí dụ: X31 = , thay điu kiên y vào (5.5) ta được:
yi = I + Pj(ÀX2i) + Ci = ( P 2 + xp3)xji + ei
= axji + ei
Trong đó ă = p2 + ^ p 3 .
Áp dng công thc tính ước lượng a phưcmg pháp nh phương bé nhít
thông thưng ta được:
â = (pJ + X p3) =
2Jx 2i2
Như vy a được ước ng mt cách duy nht thì cững không th xác định
ơc P và >! t mt phương tình 2 ẩn.
% _ ( Y , y , X,) ( ^y^^X^xl)
( ' * i) (À í x i ) - ( * i ' lx ĩi) i
(5.8)
109
Như vy trong trưng hp đa cộng tuyến hoàn hảo, chúng ta không th nhận
được lời gii duy nht cho các h s hi quy riêng, nhung trong khi đó ta li có thể
nhn được lòi gii duy nht cho tổ hợp tuyến tính ca các h s này. C ý rằng
trong tiucmg đa cng tuyến hoàn ho thì phương sai và cc sai s tiêu chun của
các uc lượng P i , P ì là vô hn.
5.3. UỚC LUNG TRQNG TRUNG HỢP ĐA CNG TUYN KHÔNG
HOÀN HO
Đa cng tuyến hoàn ho ch là trường hợp đặc biột hiếm xy ra. Trong các số
liu liên quan đến chui thi gian, thưng xy ra đa cng tuyến không hoàn hảo.
Xt mô hình (5.5).
Bây gi chúng ta già thiết giữa Xì và X3 có cng tuyến không hoàn toàn
theongũa: . ' -V
X31 = Xx2i + V|
trong đó \ * 0, V là nhiu ngu nhn sao cho X xjjVj = 0 .
Trong trưng hp này theo pơng pháp bình phương bé nht ta d dàng thu
được các ước lượng P2 và . /?2
A 6 (i> , xvK^Jĩj+r*)-$ylx2l
, = ( 2 4 x ^ 2 4 + 2 > , 1) - ( ^ Z 4 )2
(5.9)
Trong truỉmg hp này khng có đo gì đổ nói rng (5.9) là không ước luợng
đuọc.
5.4. HẬU QU CA ĐA CNG TUYN
Trong trường hp có tồn tại đa cộng tuyến gn hoàn ho thì có th gp mt số
nh hung sau:
1. Phương sai và hip phương sai ca các ưc lưng bình quân
nht ln
Chúng ta xét mô hình (5.5), theo công thức nh phương sai và hip phương
sai ca các ước lung P i và p ì (cơng hi quy bi) ta có:
v" < fo = ĩ )
(5' 10)
110
v à :
COV(2,p3) = -
-----
-
(l r23)'V^'X2i 2 jx3i
(5.12)
Trong đó Ĩ23 là h s tương quan giữa X2, X3
T (5.10) và (5.11) ta thy khi r23 tăng dăn đến 1 (nghĩa là cng tuyến ng)
thì phương sai ca 2 ước lượng y tăng dn đến hạn. (5.12) chra ng khi f23
ng dn đến 1 thì cov( P 2. P 3) ng về giá trị tuyt đối.
2. Khong tin cy rng hơn
Như ta đã biết trong chương tnrớc khong tin cậy 95% cho (32 và p3 khi ơ2 đã
biết là:
Â2 ± 1,96se( P2) p3 ± l,96se(p3)
Trong đó:
s e ( Â ) = Vvar(Â ) - ~ f = T
Cho nên ta th viết li các khong i cậy 95% cho p2 là:
P i + 1,96
y
23
í x,
và cho P3 là:
P i ± 1,96
Í P
(5.13)
(5.14)
(5 13) và (5.14) chng t khi r23 càng gn tới 1 thì khong tin cy cho các tham s
càng rng.
Do đó trong trưng hp có đa cộng tuyến gn hoàn ho thì s liu ca mu
th thích hp vi tp các gi thiết khác nhau. Vì thế xác sut chp nhn gi thiết sai
tăng n (tc tăng sai lm loi n).
111
3. T s t m t nghĩa
Như dã biã, khi kim định githiết Ho: Pj = 0, chúng ta dã sử dụng tỷ s t =
Pj/seijjj) và đan so sánh gíà tr t đwjc uôc Iiwng với giá u tới hạn t Nhung khi có đa
cộng tuyến gn hoàn hảo thì sai s tiêu chuẩn uc lưng đuợc s rất cao vì vậy làm cho d
st nhđi v í giá trị tuyé đối. Kít qu là sẽ m ng khả năng chấp nhn giả thiô Ho.
4. R2 cao nh ung tì s t it nghĩa
Đế gii thích điu này. Ta hãy xét m hình hi quy k biến như sau:.
Yj = Pi + + p3Xái + + PfcXid + y
Trong trưng hp có đa cng tuyến gn hoàn ho, như đã chi ra
trin, ta có th tìm được mt hoc mt s h s góc riêng là không có ý nga về
mt thng kê trên cơ s kim định t. Nhung trong khi đó R2 lại
có th rt cao, nên bàng kiểm đnh F, chúng ta th bác bỏ gi thiết: Ho: P2 = P3
= ...... = pk = 0. Mâu thun này ng n hiệu ca đa cng tuyến.
s. Các ưc lưng bình phuong bé nhát và các sai s tiêu chun ca chúng
tr nên rt nhy đi vi nhng thay đi nh trong s liu
6. Du ca các uc lưng ca h s hi quy có th sai
Khi có đa cng tuyến gn hoàn bảo thì có th thu đuc các ưc lượng ca các
h s hi quy trái vi điu chúng ta mong di. Chng hn lý thuyết kinh tế cho
rng đi vi hàng hóa bình thường khi thu nhp ng, cu hàng hóa lng, nghĩa
khi bi quy thu nhp là mt trong các biến gii thích, biến ph thuôc là lung u
ca hàng hóa, nếu xy ra hiện tong đa cng tuyến gn hoàn hó thì uớc lung của
h s ca biến thu nhp có th mang díu am - màu thun vi dĩèu ta mong đợi.
7. Thêm vào hay bt đi các biỂn cng tuyến với các biỂn khác, m hình se
thay đi vi đ lớn ca các uc ng hoc đu ca chúng
Tóm li triệu chúng chù yếu ca đa cng tuyến mà ta đã nói trên là ng sai
s tiêu chun. Sai s tieu chun cao hơn có ng ý rng s biến thiên ca b s hồi
quy từ mu này đến mu khác cao hơn do đó mt s thay đi nh trong s liu
hoc trong mô hình hi quy (nhu thêm vào hoc bt di mt biến) s gay ra s thay
đi lớn ca các h số.
Nhu vy chúng ta đã biết đuợc mt s bu qu ca đa cng tuyến. Nhung
hu quà như thế nào đi chăng nữa thì diều quan trng là làm thế nào đ thy duc
s (n tại ca nó đ ta có th ngăn ngừa nhng bu quà tai hi đi vi th tc ước
lượng và s dng m nh hi quy đổ d đoán, điu khin hoc hiu quá tiình liên
quan vi nó. Sau đây s trình bày mt s pơng pháp đ phái hin đa cng tuyD
và m t ỉỉhững triu chng ch yếu ca nó.
112
5.5. PHÁT HIN RA STN TI CA ĐA CỘNG TUYN
Theo Kmanta thì mvn d vè đa cộng tuyến là vn đê v í bc ch khng phải
y loi, nên vic phân biệt có ý nghĩa khng phải có hay khng có đa cộng
tuyến mà là bậc khác nhau cùa chúng.
Vì đa cng tuyến d cập đến điều kiện a các biến giải thích mà được già
định là phi ngu nhiên, đó đc đim cùa mu chứ không phi cùa tổng th.
Do đó chúng ta không kiểm định “tính đa cộng tuyến - mà nếu mun chúng ta
có th đo bc ca nó trong mt mu bất kỳ.
Sau đây mt vài quy tắc đ đo mức đa cộng tuyến.
1. R2 cao nhung tì s t tbp
Trong trưng hp R2 cao (thung R2 > 0,8) mà tỳ s t thp như trên đã chú
đó chính là du hiộu ca đa cộng tuyến.
2 Tương quan cáp gia các biỂn gii thích cao
Nếu h s ơng quan cp giũa c biến giải thích cao (vượt 0,8) thi c kh
năng c tn ti đa cng tuyến. Tuy nhn tiẽu chun này thưng khng chính c.
Có nhũng trường hp ơng quan cp khng cao nhung vn c đã cng tuyến. Thí
dụ, ta c 3 biến gii thích Xi, "Xì, và X] nhu sau:
X , = ( 1 ,1 , 1 , 1 , 1 . 0 , 0 , 0 . 0 , 0 , 0 , 0 , 0 ,0 , 0 , 0 , 0 , 0 ,0 , 0 )
Xi - ( 0 , 0 , 0 , 0 , 0 , 1 , 1 , 1 , 1 . 1 , 0 ,0 , 0 ,0 , 0 , 0 , 0 ,0 , 0 , 0 )
X, = (1,1,1,1,1,1,1,14,1. 0,0,0,0,0, .0,0,0,0,0)
Rõ ràng x 3 = Xĩ + X| nghĩa là ta có đa cng tuyến hoàn ho, tuy nhn
tuơng quan cp là: 1
Tiĩ = »1/3 ; r,3 = rjj = 0 ,59
Nhu vy đa cng tuyến xy xa mà không có s báo trước ca tương quan cp
nng du sao nó cOng cung cp cho ta những kim tra tiên nghim có ích.
3 Xem xét tương quan riêng
Vì vn d đưc d cp đến da vào tương quan bc khng. Farrar và Glauber
đã (fô ngh s dng h s tirong quan riêng. Trong hồi quy cùa Y đối vói các biến
Xi Xì, x». Nếu tá nhn thy ràng r2|,234 cao trong khi đó r2,2.34 ; r\ 3.24 ; r214,23 tucmg
đi thp thì điu dó có th gi ý rng các biến Xj, Xí, và X* có tương quan cao
ít nht mt trong các biến này thừa.
Dù ơng quan riêng rt có ích nng nó ng khng đm bo rằng s cung
cp cho ta hướng dn chính xác trong việc phát hiện ra đa cng tuyến.
113
0
Hình 5.2
Như hình v ch ra khi R2i ng từ 0,9 đến 1 thì VIF ng rất mạnh. Khi R2, = 1
thì VIF là vô hạn.
Có nhiu chương trình máy tính thể cho biết VIF đối vi c biến độc lập
trong hi quy.
6. Đđo Theil
Ka cnh ch yếu ca VIF ch xem xét đến ơng quan qua li giữa các biến
giải thích. Mt đ đo mà xem xét lương quan cùa biến giải thích với biến được giải
thích là đ đo Theil. Đ đo Theil được định nghĩa nhu sau:
m = R2 - ( R 2 - R Ì j)
1=2
Trong đó R2 là h s xác đnh bội trong hi quy của Y đi vi các biến Xj, x 3,
.... Xk trong mô hình hi quy:
Yj= Pi + p 2X2i + P3X31 +
.......
+ PkXki +Ui
R^i là h S xác đnh bi trong mô hình hi qui ca tíiến Yđi vi các biến X2 ,
x3, ... ,X[.1,X +1
.......
X k '
Đi lượng R2 - J^2.| được gi là "đóng p ng thêm vào" vào hệ s xác định
bội. Nếu X2, X3, ..... Xk không tương quan với nhau thì m = 0 nhng đóng p
ng thm đó cng li bng R2 . Trong c trường hợp khác m có thể nhn giá trị
âm hoc dương lớn.
Đổ thy đuc đ đo này có ý nghĩa, chúng ta xét trưng hp hình hai
biến gii thích Xj và x 3. Theo ký hiệu đã s dng chương trước ta :
m = R2 - (RJ - r212) - (R2 - r213)
T s t liê.1 h vi cmg quan riêng r2!2.3 , r2i3,2
Trong phn hi quy bi ta đã biết:
R = r 12 + (1 -^ 12) 1^13,2
R = r 13 + (1 - r2ij) ^123
Xhay 2 công thc này vào biu thc xác định m ta đuợc:
115
m = R2 - [r2i2 + (1 - r212) r213,2 - r^id - [1*13 + (1 - 1* 13) r2i2j - r213 ]
= R2 - K1 - r212) I*1M + (1 - > ,3> r2!2,3 ] (5.17)
Công thc (5.17) cho ta biết điều gì? Đ thấy được đíồu đó ta hãy đạt
1 - r*!2 = w2 ; 1 - r2!, = w3 và gi là các ting số. Công thc (5.17) được viết lại
dui dạn
m = R2 - [W2 r2|},2 + W3 r*I2jl
Như vy đ do Theil bàng hiu giữa b s xác đnh bi và tng có trọng số
ca các h s ơng quan riêng.
Thí d: Gi s các hộ s tương quan giữa c biến Y và Xì, Xì là nhu sau:
Y
X í X a
Y
1 ,0 0
0 ,9 5
0 ,9 5
*
0 ,9 5
1 ,0 0 .
0 ,9 7
X a
0 ,9 5
0 ,9 7 1 ,0 0
Đ tính duc đ do Theil ta phi nh đuợc R2 và 1*12,3 > r2!3,2 .Theo công thúc
đã biết chương hi quy bi ta cố:
- h i z l n h ú í (0.95-0,95 *0,97)2
' - (1 - rĩ)(1 - r ) ( 1 -0,9S2X I- 0.972 )
fa» = Siư ; r^ế3 - (0.95)2 = 0,9025
R * = ĩ \ i + ( 1 - I* ,2) 1* 13* = ( 0 .9 5 ) * + (1 - 0 , 9 5 2) 0 , 1 4
* 0,916
Vy m = 0,916 - 2[1 - 0,9025]’0,14 = 0,888.
Do đó đ đo cùa Theil v mức đ đa cộng tuyến 0,888.
Tuy nhiên chúng ta vn không th tr lời dược câu hi tnh cng tuyến
nghm trng khng?.
Nhu vy trên đây chúng ta đã thảo lun mt s đ đo đa cng tuyến nhung tất
cả đu có ý nghĩa s dng hn chế. Chúng chcho ta nhng thng báo rng sự việc
kng phi là lý tưởng.
n nit s đ đo na nhung liên quan đến giá tr riêng hoc thng k Bayes
chúng ta không trình bày đá y.
5.6. BIN PHÁP KHÁC PHC
n d đt ra là nếu đa cng tuyến nghm ưng thì ta có th lm gì? cõng
như trong trưng hp trên, chúng ta cũng khng c nhng bin pháp hoàn ho bởi
vì đa cng tuyến cơ bn là vn đ mu. Tuy nhn nhng quy tc ngón tay cái
th đuc áp dng đây, còn s thành cống lại.ph thuc vào tính nghiêm trng của
vn d cng tuyến. Sau đây ta xem xét mt s phuơng pháp:
U6
1. S dng thông tin tién nghiêm
Mt trong các cách tiếp cn để giải quyết vấn đê đa cng tuyến là phải tận
dng thông tin tiên nghim hoặc thông tin t ngun kc đ ước lượng các h sổ
riêng.
Thí d: Ta mun ước lượng hàm sản xuất ca mt quá ình sn xut nào đó
có dạng:
Q, = AƯYkV * (5.17)
. Trong đó Q, là ng sản phm được sản xuất thời kỳ t; L, lao đng thòi kỳ t;
Ki vn thi k t; nhiễu; a, p c tham s mà chúng ta cn ước lượng.
Lấy ln c hai vế (5.17) ta được:
InQ, = lnA + ctlnL, +PK, u,
Đt lnQ, = Q \ ; InA = A* ; lnL, = L‘,
ta được Q*. = A* + txL*, + 3K*, + Ui (5.18)
Gi s K và L có ơng quan rt cao dĩ nhn điều này s dn đến pơng sai
ca các ước ng cùa các hộ s co gn ca hàm sản xt lớn.
Gi s t mt ngùn thông tin khác nào đó mà ta biết đưc lng ngành ng
nghip này thuc ngành có lợi tức theo quy mô không đi nghĩa là
a + p = 1. Với thông tin này, cách x của chúng ta s là thay p = 1 -a vào
(5.18) và thu đuợc:
Q| = A* + a L \ + (1 -a)K*, + u, (5.19)
T đó ta c Q*. - K*| = A* + <x(L*,-K\) + u
Đt Q*, - K*, = y , và L*| - K*| = z , ta được
Y , = A' + a Z \ + ut
Thông tin tiên nghim đã giúp chúng ta gim s biến đc lập trong mô hình
xung còn 1 biến z \
Sau khi thu đuc ước lượng à của a thì P nh đưc từ điều kiên
p = 1 -â
2. Thu thp thêm s liu hoc ly thỀm mu mi
Vì đa cng tuyến là đc trưng a mu nên có th có mu khác- liên quari đến
cùng các biến ong mu ban đàu mà cộng tuyến có th không nghm trng na.
Điều này ch có th làm được khi chi phí cho việc lấy mu khác th chp nhận
được trong thực tế.
Đ ô i k h i c h c n th u th p th m s li u , tă n g c m u có th là m g i m tín h
nghm trng cùa đa cng tuyến.
117
3. B bái
Khi có hin ng đa cng tuyến nghm trng tỉử cách đơn giản nht bỏ
biến cng tuyến ra khi phương trình. Khi phi sử dụng bin pháp này thì cách
thức tiến hành như sau:
Gi s trong mô hình hi quy ca ta có Ylà biến được giải thích còn X2, Xa,....
là các biỂn gii thích. Chúng ta thấy rằng X tương quan cht ch vói X3 . Khi đó
nhiều thông tin v Y cha Xi thì cũng chứa X3 . Vậy nếu ta bỏ mt trong hai
biến X hoc x 3 khi mô hình hi quy, ta s giải quyết được vn đ đa cng tuyến
nhung s mt đi mt s thng tin v Y.
Bằng phép so sánh R2 và R 2 trong các phép hi quy khác nhau mà và
khng có mt trong hai bn chúng ta có th quyết định nn b biến nào trong 2
biến x 2 và x 3 khõi mô nh.
Thí dụ: R2 đi vi hi quy ca Yđi với tt c cc biến Xi, X2, ...,Xk 0,94;
R2 khi loi biến Xí là 0,87 và R2 khi- loi X) là 0,92 ; Nhu vy trong trường hợp
y ta loi Xa.
Chúng ta lưu mt bn chế ca bin pháp này là trong các m hình kinh tế cổ
nhâng trưng hp đòi hi nht đnh phi có biến này hoc biến khác trong m
hình. Trong nhng trường hp như vậy vic loi b 1 biến phi được cân nhác cẩn
thn giữa sai lch khi b mt biến cộng tuyến vi việc tăng phương sai ca các uớc
luợng h s khi biến đó ưong m hình. Điều này s đuc xem xét chương XL
4. S dng sai phân cp mt
Thù tục này đuc trình bày trong chng v in - T ơng quan. Mc dần
bin pháp này có th gim tương quan qua li giữa các biến nhung chng cũng
th dược s dng như mt gii pháp cho vin d đa cng tuyến.
Thí dụ: Chúng ta có s liu chuõi thời gian biểu thliên h giữa biến Y và c
biến ph thuc Xi và X3 theo mô hĩnh sau:
Trong đó t là thi gian. Phương trình trên đúng vói t thì cũng đúng với
t -1 nghĩa :
T (5.20) và (5.21) ta đuợc:
Y| - Y|.1 = PCXii - X,.]) + P3CX3, + Xji-i) + I - H-I (5.22)
Đt y, = Y[ - Y|_1 ; X21 = Xj| - Xjt-|; X31 = Xìt + X31.1;
. V, = u - ., .
Y| = Pi + IW&I + P A + (5.20)
Y|-1 - Pi + PXjM + P3X31-1 + IỊ-I
(5.21)
ta được: y, - P2X2, + £ 3X3, + V,
(5.23)
118
Mô hình hi quy dng (5.23) thường m giảm tính nghm trng ca đa cng
tuyến vì dù x 2 và Xj có th ơng quan cao nhung không do tiên nghm nà<>-
chc chn rng sai phân cùa chúng cũng ơng quan cao.
Tuy nhiên biến đi sai ph in bc nht sinh ra mt s vn d chng hn như s
hạng sai s V| trong (5.23) có thể không thỏa mãn gi thiết ca mô hình hi quy
tuyến tính c đin là các nhiu không ơng quan. Vy thì bin pháp sa cha này
có th li còn ti tê hơn căn bnh.
5. Gim tưong quan trong hi quy đa thc
Nét đc bit ca hi quy đa thc là các biến gii thích xut hin vi lũy tha
khác nhau trong mô hình h'ôi quy. Trong thc hành, đ gim tương quan trong hồi
quy đa thc, ngưi ta thưng sừ dụng dạng độ lệch (lệch so với giá trị trung bình).
Nếu vic s dng dng đ lch mà vn không gim da cng tuyến thì ngưi ta có
th phi xem xét đến k thut đa thc trc giao.
6. Mt s bin pháp khác
Ngoài các bin pháp đã k trên, ngưi ta còn s dng mt s biên pháp khác
na đ cu cha căn bnh }ày như sau:
- Hi quy thành phn chính.
- Sử dng các ước lượng t bên ngi...
Nhưng tt c các bin pháp đã trình y trên có th m gii pháp cho vấn
dề đa cng tuyến như thế nào còn phthuộc vào bn cht ca tập s liu và tính
nghiêm trng ca vn đ đa cng tuyến.
7/T hí d
Cho các biến s c - Tu dùng; Y- Thu nhập sau thuế; L- Tài sản dễ chuyển
thành tin. Da trên 38 quan st, ta ưc lưng đưc các mô hình sau đây:
c = -7,160+ 0,95213Y + e RJ = 0,9933 (5.24)
(t) ( 1,93) (73,25)
C = -10,627 + 0,68166Y + 0.37252L + e R- = 0,9953. (5.25)
(t) (-3,25) (9,60) (3,96)
L = 9,307 + 0,76207 Y + e R2 = 0,9758 (5.26)
(t) (1,8) (37,2)
(5 26) cho ta thy gia L và Y có tương quan khá cao với nhau. Điểu này chng tỏ
có đa cng tuyến. Nếu thay L trong (5.26) vào (5.25) s được (5.24). Tuy nhiên
nếu ch nn vào (5.25) thì ta không pt hiện ra điu đó. Bởi vì các tỷ s t trong
(5 25) đu cao, du ca các h s đều phù hợp. Dựa trên (5.24) và (5.25), bằng
kiểm định F, ta thy không th b L đi được.
119
Bay gi s xem xét k hon vn d này. Ta s ước lung li mô hình (5.24),
(5.25) và (3.26) sau khi b di hai quan sát cuổi ng. Ta c ieết qú sau đay:
c = -6,980 + 0,95145Y + e RJ = 0,9925 (5.27)
(t) (-1,74) (67,04)
c = -13,391 +0,63258Y + 0,45065L + e RJ = 0,9951. (5.28)
(t) (-3,71) (8,12) (4,24)
L = 9,307 + 0,76207 Y + e R2 = 0,9758 (5.29)
(t) (2,69) (37,80)
Bằng cách so sánh tng h s (5.24) với (5.27); (5.25) với (5.28) và (5.26) vi
(5.29), s thy ràng dù ch thay đi chút ít s liu nhung kết qu khác biệt rít
nhiều. Điẻu này cho thy đa cng tuyến đây là nghm trng.
120
B À I TP
5.1. Hãy gii thích các văn đ sau:
a. Đa cng tuyến, đa công tuyến hoàn ho đa cộng tuyến không hoàn hào.
b. Hàm hi quy ph, mc đích cua vic đust vào hàm hi quy ph là gì?
c. Hàm tng chi phí có dạng: TCOST = p, + P Q + PjQ2 + PQ3. Trong hàm
này có cha c Q, Q2 và Q3 . Bn có chó rng có đa cng tuyến trong mô
hình này không?
5. 2. Vri Q là ng bán gas, PG là giá mt blah gas, PE là giá đin sinh hot, PC
là giá bếp gas.
a. Khi hi quy Q ph thuc PG h s chăn, có th có hin tượng đa cộng
tuyến không?
b. Cho mô hình [1]
[1] Ordinary Least Squares Estimation
Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
*****************************************************************
Regressor Coefficient Standard Error T-Ratio[Prob]
INPT 1053.6 123.052 8.5615[.000]
PG -6.9435 .626036 -11.09i2[.000]
PC -.001737 .001815 -.95682[.349]
PE 338.15 128.23 2.6371[.015]
****************************************************************
R-Squared .99406 F-statistic F( 3,23) 1284.9[.000]
Nghi ng trong mô hình [1]: Q phụ thuộc PG, PC, PE và hs chn có th có hiộn
ợng đá cng tuyến, vì thng kê T ca hs ng với biến PC nh mà R5 lớn. Hãy
nêu mt cách kim tra hin ng đó.
c. Tiến hành hi quy được kết qu sau đay:
[2] Ordinary Least Squares Estimation
Dependent variable is PC
27 observations used for estimation from 97M1 to 99M3
Regressor Coefficient Standard Errol- T-Ratio[Prob]
P E -7 . 3 6 0 8 3 .6 7 3 0 -2 .0 0 4 0 [ . 0 5 6 ]
p5 .34168 .020910 16.3406[.000]
TxJ-pT 555.70 82 50.9517 10.9066[.000]
*****************************************************************
R Sauared .93617 F-statistic F( 2,2 4) 176.0110[.000]
****************************************************************
121
d. Mô hình [2] nhm mc đích gì?
e. Biến PC có phthuc tuyến nh vào biến PE không? Có ph thuc tuyến
tính vào biến PG không?
f. Mô hình [1] có khuyết tật đa cng tuyến không? Đa cng tuyến này
hoàn ho hay không hoàn hảo? Các ưóc lung cua mô hình [1] còn ue
ng tt nht khng?
g. Nêu mt ch khc phc đơn giản khuyết tật trong mô hình [1]
h. Khi bò biến PC khi mô hình [1], tiến nh hi quy Q theo PG, PE hê
s chn thu đưc R2 = 0,9821. n bỏ biến PC không?
i. Đ kim tra mô hình Q ph thuc PG, PE và h s chn có khuyết tt
không, người ta hi quy PG theo PE có h s chn thu được h s xác đnh
bng 0,1215. Mô hình đó dùng đ m gì, có kết lun gì thu dược?
j. Khi hi quy mô hình : Q ph thuộc PG, D, DPG có h s chặn với D là
biến gi nhn giá trì bng 1 nếu tháng đại bán bình gas mới, D = 0
vi các thng bán bình gas cũ, DPG = D*PG. Các biến D và DPG cố th
có quan h cng tuyến vi nhau hay không?
5.3. Với s sn ng ca mt cơ sở sản xuít, K ngun vn, L là lao đng, D
biến giả với D = 1 nếu cơ s sản xut khng thuc sò hữu nhà nước và D = 0 nếu
cơ s thuc s hữu nhà ớc, a =
5%.
a. Khi hi quy mô hình: s phthuc L h s chn có th có hin tung đa
cng tuyến không?
b. Khi hi quy mô hình [1]:
[1] Ordinary Least Squares Estimation
* * % % * * * % % * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * % * * * * * * * st * * * * * * * 4c
Dependent variable is s
20 observations used for estimation from 1 to 20
Regressor Coefficient Standard Eưor T-Ratio[Prob]
INFT -20.6583 22.0029 -,93889[.361]
K 10.7720 ế 2.1599 4.9874[.000]
L 17.2232 4.5279 3.8038[.00I]
R-Squared .71699 F-statistic F ( 2 ,17) 21.5343[.C00]
*****************************************************************
122
Nếu nghi ng mô hình [1] trên có hin tưng đa cng tuyến, hãy nêu mt cách
kim đnh.
c. Cho biết bàng kết qu hồi quy [2] i đây dùng đ m ? Kết lun gì thu
đưc v hin tưng đa cng tuyến trong mô hình [1]?
[2] Ordinary Least Squares Estimation
Dependent variable is K
20 observations used for estimation from 1 to 20
Regressor Coefficient Standard Error T-Ratio[Prob]
L .18696 .07589 2.4634[.024]
INPT 5.1153 13.4659 -37987[ế708]
*****************************************************************
R-Squared .254482 F-statistic F( 1,18) 6.1443[.024]
d. Khi hi quy s ph thuc vào L, K, T có hệ s chn, trong đó T là biến s
công ngh, ngưi ta thu được h s ca T bằng 5.8332 i đ lch chuẩn
bng 4.9235. Biến s T đua vào có ý nghĩa không?
e. Nghi ng trong mô hình nói câu (d) có hiện tượng đa cng tuyến, người
ta hi quy T theo L, K có h s chặn thu được R2 bng 0,6213. Kết qu đó
cho biết điu gì? Khi đó có n đưa biến T vào mô hình không?
f. Nếu mun kim tra mô hình LS phụ thuc vào LL, LK - L. là logarit cơ
s t nhiên ca các biến ơng ứng - có h s chn, đ biết có hiện ợng
đa cng tuyến hay không, ta co th m thế nào?
g. Khi hi quy LK theo LL có h s chận thu được ưc ng h s góc bằng
1,928 và đ lệch ehun bng 1,437. Kết qu đó dùng đ làm gì, kết luận gì
thu được.
h. Khi đt biến DL = D*L với D biến g, khi đó D và DL có quan hộ cộng
tuyến không?
123
| 1/122

Preview text:

PỜ N G Đ ẠI H Ọ C KINH T É Q U Ố C DÂN KHOA TOÁN KINH TÊ
BỌ MÔN ĐIÈU KHIÉN HỌC KINH TÉ NGUYỄN QUANG DONG BÀI G IẢ N G KINH TẾ LƯỢNG ■ í QTKD
NHÀ XUẤT BẢN ĐẠI HỌC KINH TẾ QUỐC DÂN
P G S . N G U Y Ê N Q U A N G D O N G BÀI GIẢNG KINH TÉ LƯỢNG
N H À X U Ấ T BẢ N Đ Ạ I H Ọ C K IN H T Ế Q U Ố C DÂN MỎ ĐẦU
L KINH T Ế LƯỢNG LÀ G ì?
Cho đến nay chua có một câu trả lời dược mọi người cùng chấp nhận cho câu
hỏi này .Thuật ngữ tiếng Anh "Econometrics" được ghép từ hai gốc từ "Econo" có
nghĩa là "Kinh tế” và Metrics có nghĩa là "Đo lưỉmg". Thuật ngữ này do giáo sư
kinh tế học người Na-Uy là A.K.Ragnar Frisch- giải thưởng Nobel về kinh tế học
(1969) cùng với J.Tinbergen, sử dụng lần đẳư tiên vào khoảng năm 1930.
Kinh tế lượng có nghĩa Ịà đo lường kinh tế. Mặc dù đo lưòmg kinh tế là một nội
dũng quan trọng của kinh tế lượng nhưng phạm vi của kinh tế lượng rộng hơn
nhiều.Điều đó được thể hiện thông qua một sô' định nghĩa sau đây:
- Kinh tế lượng bao gồm viộc áp dụng thống kê toán cho các số liệu kinh tế để
cùng cố về mặt thực nghiệm cho các mô hình do các nhà kinh tế toán đề xuất và
để tìm ra lòi giải bằng số.a)
- Kinh tế lượng có thể được định nghĩa như là sự [fhân tích vế lượng các vấn đẻ
kinh tế hiện thỉri dựa trên việc vận dụng đồng thời lý thuyết và thực tế được tỉiực
hiện bằng các phương pháp suy đoán thích hợp.<2)
- Kinh tế lượng có thể được xem như là một khoa học xã hội trong đó các công
cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được ấp dụng để phân tích
cẳc vấn đề kinh tế.(3)
- Kinh tế lượng quan tâm đến việc xác định về thực nghiệm các luật kinh tế.<4)
TTiuật ngữ "Econometrics"" được dịch sang tiếng Việt là "Kinh tế lượng học''
hoặc "Đo lường kinh tế”, ngắn gọn hơn là "Kinh trắc". Có những định nghĩa, quan
niệm khác nhau về kinh tế lượng bắt nguồn từ thực tế: các nhà kinh tế lượng trước
hết và phần lớn họ là các nhà kinh tế có khả năng sử dụng lý thuyết kinh tế để cài
tiến việc phân tích thực nghiệm về các vấn dề mà họ đặt ra. Họ đồng thời là các
nhà kinh tế toán- m ổ hình hoấ lý thuyết kinh tế theo cách làm cho lý thuyết kinh
tế phù hợp với việc kiểm định giả thiết thống kê. Họ cũng là những nhà kế toán - '
tìm kiếm, thu thập các số liệu kinh tế, gắn các biến kinh tế lý thuyết với các biến
quan sát được. Họ cũng là các nhà thống kê thực hành- sử dụng kỹ thuật tính toán
để ước lượng các quan hệ kinh tế hoặc dự báo các hiện tượng kinh tế. (1) Gerhard Tinlner, Methodology of Mathematical Economics and
Econometrics, The University of Chicago Press,Chicago, 1968, p .74 .
(2) P-ASammuelson, T.C.Koopmans, and jp.N.Stone, " Report
o f the Evaluative
Committee for Economelrica", Econome trica.vol 22, no. 2, April 1954,pp. 141-146.
(3) ArthurS.Goldherger, Economet lie Theoiy, John Wiley & Sons, Inc.
(4) HJheil, Principles o f Econometrics, John Wiley & Sons, Inc. 5 MỎ ĐẦU L KINH T Ế LƯỢNG LÀ GÌ?
Cho đến nay chưa có một câu trả lòi được mọi người cùng chấp nhậii cho câu
hòi này .Thuật ngữ tiếng Anh "Econometrics" được ghép từ hai gốc từ "Econo" có
nghĩa là "Kinh tế” và Metrics cổ nghĩa là "Đo lường". Thuật ngữ này do giáo sư
kinh tế học người Na-Uy là A.K,Ragnar Frisch- giải thường Nobel về kinh tế học
(1969) cùng với J.Tinbergen, sử dụng lần đầư tiên vào khoảng năm 1930.
. Kinh tế lượng có nghĩa Ịà do lường kinh tế. Mặc dù đo lường kinh tế là một nội
dũng quan trọng cùa kinh tế lượng nhưng phạm vi của kinh tế lượng rộng hớn
nhiều.Điều đó được thể hiện thông qua một sô' định nghĩa sau đây:
- Kinh tế lượng bao gồm việc áp dụng thống kê toán cho các số liệu kinh tế để
cùng cố về mặt thực nghiộm cho các mô hình do các nhà kinh tế toán đề xuất và
để tìm ra lời giải bằng số.(1>
- Kinh tế lượng có thể được định nghĩa như là sự ỊÍhân tích về lượng các vấn đề
kinh tế hiện thời dựa trên việc vận dụng đổng thời lý thuyết và thục tế được thực
hiện bằng các phương pháp suy đoán thích hợp.c)
- Kinh tế lượng có thể được xem như là một khoa học xã hội trong đó các công
cụ của lý thuyết kinh tế, toán học và suy đoán thống kê được áp dụng để phân tích
cẩc vấn đề kinh tế.<3)
- Kinh tế lượng quan tâm đến việc xác định về thực nghiệm các luât kinh tế.(4)
Thuật ngữ "Econometrics"" dược dịch sang tiếng Việt là “Kinh tế lượng học''
hoặc "Đo lưỉmg kinh tế", ngắn gọn hơn là "Kinh trăc". Có nhũng định nghĩa, quan
niệm khác nhau về kinh tế lượng bắt nguồn từ thực tế: các nhà kinh tế lượng trước
hết và phần lớn họ là các nhà kinh tế có khả năng sử dụng lý thuyết kinh tế để cài
tiến việc phân tích thực nghiệm về các vấn đề mà họ đặt ra. Họ đổng thời là các
nhà kinh tế toán- m ô hình hoá lý thuyết kinh tế theo cách làm cho lý thuyết kinh
tế phù hợp với việc kiểm định giả thiết thống kê. Họ cũng là những nhà kế toán - '
tìm kiếm, thu thập cấc số liệu kinh tế, gắn cac biến kinh tế lý thuyết với các biến
quan sất được. Họ cũng là các nhà thống kê thực hành- sử dụng kỹ thuật tính toán
để uớc lượng các quan hệ kinh tế hoặc dự báo các hiện tượng kinh tế. (1) Gerhard Tintner, Methodology of Mathematical Economics and
Econometrics, The University of Chicago Press,Chicago, 1968, p.74 .
(2) PASammuelson, T.C.Koopmans, and J^i.N.Slone, " Report o f the Evaluative
Committee for Econometrica", Econome tricaỳol 22, no. 2, April 1954,pp. 141-146.
(3) ArthurS.Goldherger, Economet ric Theory. John Wiley & Sons, Inc.
(4) H.Theil, Principles o f Econometrics, John Wiley & Sons, Inc. 5
Trên các lĩnh vực khác nhau, người ta có các quan niem khác nhau vể kinh tê'
lượng. Tuy vậy, theo các quan diổm trên thì kinh tế lượng la sư kết hợp các lý
thuyết kinh tế, kinh tế toán, thống kề kinh tế, thống kê toan nhưng nó vằii là 'ttộ1
môn độc lập vì những lý do sau đây:
- Các lý thuyết kinh tế thưòng nêu ra các giả thuyết hay cấc giả thiết. Phần lớn
các giả thuyết này nói về chất.
Ví dụ: kinh tế học vi mô khẳng định Tằng trong các điều kiện khác không thaỵ
đổi nếu giảm giá về một loại hàng hoá nào đó thì sẽ làm tăng lượng cẩu vé loại
hàng hoá này và ngựợc lại. Dù rằng lý thuyết kinh tố có khẳng định quan hệ
nghĩch biến giữa giá ca vá lượng cầu nhung lý thuyết này không đưa ra một số đo
bằng số vể quan hệ giữa chúng, không nói cho ta biết lượng cáu sẽ tăng hoặc
giảm bao nhiêu nếu ta giảm hoặc tăng một đơn vị giá cả. Các nhà kinh tế luợng sẽ
cho chúng ta ước lưạng bằng số vẻ các con số này.
- Nội dung chính của kinh tế toán là trình bày lý thuyết kinh tế dưới dạng toán
học (các phương tìn h và bất phương trình), nếu thiếu các mô hình toán học thì
khỡng thể đo hoặc kiểm tra bằng thực nghiệm lý thuyết kinh tế. Kinh tế lượng chù
yếu quan tâm đến kiểm đinh vẻ mặt thực nghiệm các lý thuyết kinh tế. Kinh tê'
lượng thường sử dụng các phương trình toán học do các nhà kinh tế toán đề
xuất và đặt cấc phương trình dưối dạng phù hợp để kiểm định bằng thực nghiệm. •
Thống kê kinh tế chủ yếu liên quan đẾn việc thu thập, xử lý và trình bày các
số liệu. Những số liệu này là nh&ng số liệu thô dối với Kinh tế lượng. Thống kê
kinh tế khổng đi xa hơn, khâng liên quan đến việc sử dụng số liệu để kiểm tra các giả thuyết kinh tế.
- Các số liệu kinh tế là các | ố liệu không phải do các cuộc thí nghiệm dem lại,
chúng nằm ngoài sự kiểm soát của tất cả mọi ngucri. Các số liệu về tiêu dùng, tiết
kiệm, giá cả,... do các cơ quan Nhà nước hoặc tư nhãn thu thập đều là các số liệu
phi thực nghiệm. Cấc số liệu này chứa sai số của phép đo. Kinh tế lượng phái sử
dụng các công cụ, phương pháp cùa thống kê toán để tìm ra bản chất của các số liệu thống kê.
n . PHƯƠNG PHÁP LUẬN CỦA KINH TẾ LƯỢNG
Phân tích kinh tế luạng được thực hiện theo các bước sau đây:
1. Nêu ra các giả thuyết hay giả thiết về các mối quan hệ giữa các biến kinh
tế. Chẳng hạn kinh tế vĩ mô khẳng định rằng mức tiêu dùng cua các hộ gia đình
phụ thuộc theo quan hộ cùng chiều vói thu nhập khả dụng của họ.
2. Thiết lập các mô hình toán học để mô tả mối quan hê giữa các biến số này Chẳng hạn: Y = p, + Pj X + u
trong đó, Y :CỊŨ tieu cho tiêu dùng của môt hộ gia đình,
X :Thu nhập khả dụng của hộ gia đình
P (:Hệ số chặn, p2: Hệ số góc, u: Yếu tố ngẫu nhiên. 6
Sự tồn tại của yếu tố ngẫu nhiên bắt nguồn từ mối quan hệ giữa các biến kinh
tế nói chung là không chính xác.
3. Thu thập số liệu: Để ước lượng các tham số của mô hình, cần phải thu thập
số liệu. Kinh tế lượng đòi hòi kích thước mẫu khá lớn.
4. Ước lượng các tham số cùa mô hình nhằm nhận được số đo về mức ảnh
hưởng cùa các biến với các số liệu hiện có. Các ước lượng này là các kiểm định
thực nghiệm cho lý thuyết kinh tế.
5. Phân tích kết quả: Dựa trên lý thuyết kinh tế để plĩkn tích và đánh giá kết
quả nhận được. Xét xem các kết quả nhận được có phù hợp với lý thuyết kinh tế
không, kiểm đinh các giả thiết thống kê về các ước lượng nhận được. Trong mô hình: Y= p, +p2X + u,
nếu ưổc lượng cùa p2 là số dương
và nhỏ hơn 1 thì ước lượng này là
hợp lý về mặt kinh tế. Trong trường
hợp ngược lại ( < 0 hoặc > 1) thì
khồng phù hợp vể mặt kinh tế. Khi
đó cần phải tìm ra một mô hình đúng.
Ngoài phân tích về mặt kinh tế
còn phải phân tích về kỹ thuật —
các yêu cầu về mặt toán học.
6. Dự báo Nếu như mồ hình phù
hợp vói lý thuyết kinh tế thì có thể sử
đụng mô hình để dự báo. Dự báo giá
trị trung bình hoặc dự báo giá trị cá biệt.
7. Ra quyết định: Để bào bảo tính
hiên thực của dự báo cần có các
chính sách, các giải pháp tương ứng.
Các bước trên đây có nhiệm vụ khác nhau trong quá trình phân tích một vấn đề kinh
tế và chúng được thực hiện theo một trình tự nhất định. Tìm ra bản chất một vấn đé
kinh tế là một việc không đơn giàn. Vì vậy, quá trình trên đây phải được thực hiện
nhiều lần như là các phép lặp cho đến khi chúng ta thu được một mô hình đúng. Có
thể minh họa quá trình phân tích kinh-tế lượng một vấn đề kinh tế bằng sơ đồ trên. 7
Những điểu nói tran đây cho thấy rõ nội dung nghiên cứu dối tương và mục
đích, cũng như công cụ và cách tiếp cận trong nghien cứu của bò môn khoa học
này. Chính vì vậy, từ khi ra đời đến nay kinh tế lưọng dã đem' lãi cho các nhà
kinh tế một công cụ do lường sắc bén để đo các quan he kmh t í Ngày nay.
phạm vi sử dụng của kinh tế lượng đs vượt quá phạm vi kinh tế đã ian sang các
lĩnh vực khác như xã hội học, vũ trụ học... Trong 30 năm gần day kinh tế lượng là
một bộ phận khững thể thiếu được trong chuông trình đào tạo các cán bộ kinh tế
của hầu hết các nước trên thế giới. Số các đáu sách YÍỂt VỀ kinh tế lứợng, bao
gồm các sách giáo khoa bậc đại học và sau đại học, các sách chuyên khảo,
cũng như các tài liêu thực hành, các chuyin san về Ịý thuyết và úng dụng kình tế
lượng, đã trà nên hết súc phong phú. Sự đòi hỏi phải phân tích định lượng các hiên
tượng kinh tế, kiểm định sự phù hợp và độ tin cậy cùa các giả thuyết trong quá
trình hoạch định chính sách vĩ mô cũng như ra các quyết định tác nghiệp, viẹc dự
báo và dự đoán có đô tin cậy cao..., tát cả đã làm cho kinh tế lưọng học có một
vai trò ngày càng quan trọng và bản than nó cũng khổng ngừng được phát triển
và hoàn thiện. Sự phát triển cùa máy tính điện tử đã làm ra răng sức mạnh của
kinh t i lượng. Điều đó, giúp các nhà kinh tế kiểm chúng được các lý thuyết kinh
tế có thích hợp hay không, dẫn tới những quyết định đúng đắn trong hoạt động
kinh doanh tác nghiệp và hoạch định các chính sách và chiến lược kinh tế xã hội.
Cùng với việc giảng dạy kinh tế vi mữ và kinh tế vĩ mô, thì kinh tế lượng là một
môn không thẻ thiếu đuọc. Nếu như kinh tế vĩ mô mô tả sự vạn động của toàn bộ
nền kinh tế, kinh tế vi mỡ mổ tả hành vi cùa người sản xuất và người tiều dùng,
thì kinh tế lucmg trang bị cho nhà kinh tế môt phương pháp lượng hoá và phân tích
sự vận động và các hành vi trên. Ba môn này sẽ trang bị những kiến thức cơ sở để
học sinh và các nhà kinh tế đi vào các chuyên ngành hẹp. 8 CHƯƠNG I
MA HÌNH HỐI QUY HAI BIẾN
MỘĨVẦi ĩư TƯỞNG Cơ BẢN
Hồi quy là một công cụ cơ bản của đo lường kinh tế. Phân tích hồi quy giải
quyết những vấn dề cụ thể gì, phân tích hôi quy khác với các phân tích khác như
thế nào, cơ sở thông tín để phân tích hồi quy là gì, vì sao phải xây dựng mô hlnh
h'ôi quy...? Các vấn dề trền và bản chất cùa chúng sẽ được đề cạp một cách vắn tắt trong chương này.
Thuật ngữ "Hồi quy" đã được Francis Galíon sử dụng vào nãm 1886. Trong
một bài báo nổi tiếng của mình, ông đã cho rằng có một xu hướng về chiều cao của
những đứa trê do cha mẹ cao không bình thường hoặc thấp không bình thường sinh
ra. Người ta gọi xu huống này là luật Galton. Trong bài báo của mình Galton dùng
cụin từ "regression to mediocrity" - quy về trung bình. Từ đó vấn đề hồi quy được
nhiều người quan tâm và hoàn thiện, các úng dụng của phân tích hồi quy dã có nội dung rộng hơn nhiều. 1.1. PHÂN TÍCH HỐI QUY
Phân tích hồi quy nghiên cứu mối liên hộ phụ thuộc cùa một biến (gọi là biến
phụ thuộc hay biến dược giải thích) với một hay nhiều biến khác (được gọi là (các)
biến độc lập hay giải thích) nhằm ước lượng và/ hoặc dự báo giá trị trung bình cùa
biến phụ thuộc với các giá trị đã biết của (các) biến độc lập.
Ta xem xét các thí dụ sau đây: T h í dụ 1.1 a.
Luật Galton Karl Pearson nghiên cứu sự phụ thuộc chiều cao cùa các cháu
trai vào chiều cao của bố những đứa trẻ này. Ông đã xây dựng được đồ thị chi ra
phân bố chiều cao cùa các cháu trai ứng với chiều cao cùa người cha. Qua mô hình này có thể thấy:
Thứ nhất, với chiều cao đã biết của người cha thì chiều cao của các cháu trai sẽ
là một khoảng, dao động quanh giá trị trung bình;
Thứ hai, chiều cao của cha tăng thì chiều cao của các cháu trai cũng tăng. Mô
hình này giải thích được điều mà Galton đặt ra và còn được đùng trong dự báo. 9 Hình 1.1.
Tiếp tục nghiên cứu vấn dề trên, Karl Pearson đã phát hiện ra rằng: chiều cao
trung bình cùa các cháu trai của nhóm bố cao nhỏ hơn chiều cao cùa bố và chiều
cao trung bình cùằ <^ác cháu trai của nhóm bố thấp lớn hơn chiêu cao của bố. Điều
này duơc thể hiên: h ệ \ố góc của đường thẳng trên hình 1.1 nhỏ hơn 1.
Trong thí dụ này, chíSụ cao của các cháu trai là biến phụ thuộc, chiều cao của
người bố là biến độc lập.
b. Một người nghiên cứu sự phụ thuộc của lượng cầu về một loạt hàng hóa vào
giá bản thân hàng hóa, thu nhập cùa nguời tiêu dùng và giá của những hàng hóa
khác cạnh tranh với hàng hóa này.
Trong trường hợp này, lượng cầu là biến phụ thuộc, giá cùa bản thân hàng hóa,
của các hàng hóa cạnh ưanh, và thu nhập của người tiêu dùng là các biến độc lập.
c. Một nhà kinh tế lao động nghiên cứu tỷ lệ thay đổi cùa tiền lương trong
quan hệ với tỷ lộ thất nghiêp đã đưa ra đồ thị ờ hình 1.2. Đường cong trên hình 1.2
được gọi là đường cong Phillips, trong đó: tỷ lê thay đổi của tiền lương là biến phụ
thuộc, tỳ lệ thất nghiệp - biến độc lập. Mô hình cho phép dự đoán đuợc sụ thay đổi
trung bình của tỷ lộ tiền luơng với một tỷ lệ thất nghiệp nhất định. ■ • I'
d. Trong điều kiện các yếu tố khác không thay đổi, tỷ lệ lạm phát càng cao thì
tỳ lê thu nhập của nhân dân được giữ dưới dạng tiền mặt càng ít.
0 5 thể minh họa điều đó bàng đồ thị hình 1.3. 10 Hình 1.2 Hình 1 3
Ta có thể đưa ra được rất nhiều ví dụ về sự phụ thuộc của một biến vào một
hoặc nhiều biến khác. Kỹ thuật phân tích hồi quy giúp ta nghiên cứu mối quan lỉệ như vậy giữa các biến.
Các ký hiệu: Y - biến phụ thuộc [hay biến được giải thích]
Xi - biến độc lập [hay biến giải thích] thứ i
Trong đó, biến phụ thuộc Y là đại lượng ngẫu nhiên, có quy luật phân bổ xác
suất, các biến độc lập Xị không phải là biến ngẫu nhiên, giá trị của chúng đã được cho trước.
Phân tích hồi quy giải quyết các vấn dề sau đây:
l ắ U6c lượng giá trị trung bình cùa biến phụ thuộc với giá trị đã cho cùa biến độc lập.
2. Kiểm định giả thiết vê bản chất cùa sự phụ thuộc.
3. Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị cùa các biến độc lập.
4. Kết hợp các vấn đề trên.
Trong phân ưch hồi quy chúng ta phân biệt các quan hê sau đây:
1. Q ụan hệ thống kè và quan hệ hàm số
Vấn đề mấu chốt trong phân tích hồi quy là sự phụ thuộc thống kẻ cùa biến
phụ thuộc vào một hay nhiều biến giải thích. Biến phụ thuộc là đại lượng ngẫu
nhiên, có phân bố xác suất. Các biến giải thích thì giá trị cùa chúng đã biết. Biến
phụ thuộc là ngẫu nhiên vì có vô vàn nhân tố tác động đến nó mà trong mô hình ta 11
không đề cập đến được, úng với mỗi giá trị đã biết cùa biến độc lập có thổ có nhiêu
giá trị khác nhau cùa biến phụ thuộc. Trong quan hệ hàm sổ các biến không phải là
ngẫu nhiên, ứng với mỗi giá trị của biến dộc lập có một giá trị của biến phụ thuộc,
phân tích hồi quy không xét đến các quan hệ hàm sỗ. T hí dụ l ã
Sự phụ thuộc cùa năng suất một loại iúa trên một hecta vào nhiệt độ, lượng
mưa, dộ chiếu sáng, phân bón... là quan'hệ tỉiđng kê. Các biến: nhiêt độ, lượng
raua, độ chiếu sáng, phân bón là các biến độc lập. Năng suất tính trên 1 hecta là
biến phụ thuộc, là đại lượng ngẫu nhiên không thể dự báo một cách chính xác năng
su it của giống lúa này trên một hecta vì:
- Có sai số trong phép đo các biến này,
- Còn rất nhiều nhân tố khác cũng ảiih hưởng đến năng suất mà ta không th”
liệt kê ra và nếu cũng khổng thể tách được ảnh hưởng cùa riêng từng nhần tố đến
. năng su it dù ràng chúng ta có đua thêm bao nhiêu biến giải thích khác.
Trong vật lý khi xét một động từ chuyển động dẫu, người ta có công thức: s= vểt
trong dó, s là độ dài quầng dường đi dược;
V là vận tốc trong một đơn vị thời gian; t là thời gian.
Đây là quan hộ hầm số, ứng với mỗi giá trị cùa vận lốc và thời gian ta chì có
một giá trị duy nhất cùa đọ dài quãng đuờng, phân tích hồi quy không xét các quan hệ này.
2. H àm hbi quy và quan hệ nhàn quả
Phân tích hồi quy nghiên cứu quan hệ giữa một biến phụ thuộc với một hoặc
nhiều biến độc lập khác. Điều này không đòi hỏĩgiữa biến độc lập và cá biến phụ
thuộc có mối quan hệ nhân quả. Nếu như quan hệ nhân quả tồn tại thi nó phải được
xác lập dựa trên các lý thuyết kinh tế khác. Thí dụ, luật cầu nói ràng trong điều kiện
các biến (điều kiện) khác không thay đổi thì nhu cầu về một loạt hàng hóa tỷ lộ
nghịch với giá của chính hàng hóa này hay íxong thí dụ 1.2 chúng ta có thể dự đoận
sản luựng dựa vào luợng mua và các biến khác, nhung không thổ chấp nhận dược
việc dự báo lượng mua bằng việc thay đổi sản luợng. 3. Hồi quy và tương quan
. Hồi quy và tuơng quan khác nhau về: mục đích'và kỹ thuật. Phân tích tương
quan trước hết là đo mức độ kết họp tuyến tính giữa hai biến. Ví dụ: Mức độ quan
hệ giữa nghiên thuốc lá và ung thư phổi, giữa kết quả thi môn thống kê và môn
toán. Nhung phân tích hồi quy lại ước lượng hoặc dự báo một biến ưên cơ sở giá trị'
đã cho của các biến khác. Về kỹ thuật trong phân tích hồi quy các biến không có
tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên. Các biến giải thích giá 12
trị của chúng đã được xác định. Trong phân tích tương quan, khổng có sự phan biệt
giữa các biến, chúng có tính chất đối xúng: r (X,Ỵ) = r (Y,X)
1.2 . BẢN CHẤT VÀ NGUỒN sô ' LIỆU CHO PHÂN TÍCH H ồ i QUY
Thành cồng của bất kỳ một sự phân tích kinh tế nào đều phụ thuộc việc vào sử
dụng các số liệu thích hợp và phụ thuộc vào phuơng pháp xử lý các số liệu dó. Do
vậy ở đây sẽ trình bày đôi nét về bản chất, nguồn gốc và những hạn chế của sổ liệu
mà chúng ta sẽ gặp phải trong phân tích kinh tế nói chung và phân tích hbi quy nói riêng. l ễ Các loại số liệu
Có ba loại số liệu: Các số liệu theo thời gian (chuỗi thời gian), các số liệu chéo
và các số liệu hỗn hợp của hai loại trên.
Các số liệu theo thời gian là các số liẹu được thu thập trong một thời kỳ nhất
định, ví dụ như các số liệu về GNP, số người thất nghiệp, lượng cung về tiền... Có
sđ liệu dược thu thập bàng tuần như lượng cung vầ tiền, cố số liệu thu thập hàng
tháng, quý, năm... Các số liệu này có thể đo đuợe bằng những con sổ như giá cà,
thu thập, nhung cũng có những số liệu khổng đo đuợc bằng con số, chúng là những
chì tiêu chất lượng như: nam hoặc nữ, có gia đình hay chưa có gia đình, có việc làm
hay chưa có việc làm, màu xanh hay màu trắng. Người ta gọi các biến loại này là
biến giả (dummy). Chúng cũng quan trọng nhu những biến số lượng khác.
Các số liêu chéo là các sơ liệu vè một hoặc nhiều biến được thu thập tại một
thời điểm ở nhiều địa phuong, đơn vị khác nhau: ví dụ nhu các số liệu về điều tra
dâu số vào 0 giờ ngăy 1/1/1992; các số liệu điều tra vồ vốn cơ bản cùa các xí
nghiệp dệt ngày 1A7/2006 ở Việt Nam. .. 4
Các số liệu hỗn hợp theo thòi gian và khổng gian: các số liêu về giá vàng hàng
ngày ò thành phố Hà Nội, Hồ Chí Minh, Hải Phòng, Nam Định.
2. Nguồn gốc các số liệu
Các số liệu có thể do các cơ quan nhà nước, các tổ chức quốc tế, các cống ty tư
nhân hay các cá nhăn thu thập. Chúng có thể là các số liệu thực nghiệm hoặc tehông
phải thực nghiệm. Các số liêu thực nghiệm thường đuợc thu thập trong khoa học tự
nhiên, một điều ưa viên muốn thu thập các số liệu ảnh hưởng cùa một số nhân tố
đến đối tượng nghiên cứu, anh ta dã giữ nguyên các yếu tố khác. Thí dụ, một kỹ su
nống nghiệp nghiên cúu khả năng chịu bệnh cùa một giống lúa mới. Anh ta tiến
hành thí nghiệm bằng cách trồng hai giổng lúa mới và cũ trên hai khu ruộng có độ
màu mỡ như nhau, thực hiện chế độ chăm sóc hai khu ruộng như nhau và theo dõi
sự phát triển của sâu bệnh trên hai khu ruộng Bày bằng cách gây cùng một loại
bệnh trên hai khu ruộng. Các số liệu thu được sẽ là các số liộu thực nghiệm. 13
Trong khoa học xã hội các số liẹu nối chung là các số liệu không phải do thực
nghiêm mà có. Các số liệu về GNP, số người thất nghiệp giá cổ phiếu... không nàm
dưới sự kiểm soát của kỹ thuật viên. Điều này thường gây ra những vấn trong việc tìm ra những nguyên nhân chính xác ảnh hưởng đến một tình huống
riêng biệt. Thí dụ: có phải lượng cung về tiền ảnh hưởng đến GDP hay còn có nguyên nhãn khác...?
3. Nhược điểm của các số liệu
Chất iượng của các số liêu thu được thường khổng tốt. Điều dó do các nguyên nhăn sau đay:
- Hầu hết các số liệu trong khoa học xã hội đều là các số liệu phi thục nghiệm.
Do vậy, có thể có sai số quan sát hoặc bỏ sót quan sát hoặc cả hai.
- Ngay với các số liệu đuợc thu thập bàng thục nghiệm cũng có sai số cùa phép đo.
- Trong các cuộc đíÊu tra bằng câu hỏi, vấn đề không nhận đuợc câu trả lòi
hoặc có trả lời nhưng khững trả lời hft các câu hỏi.
- Các mẫu đuợc thu thập trong các cuộc đíầu tra rất khác nhau vồ kích cỡ cho
nên rất khó khăn trong việc so sánh các kết quả giữa các đợt điều tra.
- Các số liệu kinh tế thường sẵn múc tổng hạp cao, không cho phép đi sâu vào các đcm vị nhỏ.
- Ngoài ra còn có những số liệu thuộc bí mật quốc gia m à không phải ai cũng
cố thể sử dụng được.
Do vậy kết quả nghiên cứu sẽ phụ thuộc vào chất luợng của cáo số liệu được
sử dụng và phụ thuộc vào mỡ hình được lựa chọn (vâh dề này sẽ đuợc trình bày ở các chương sau).
1.3. MÔ HÌNH HỒI QUY TỔNG THỂ
Phần trên chúng ta nói phân tích hồi quy dặc biệt quan tâm đến ước lượng
hoặciđụ bấo giá trị trung bình của biến 'phụ thuộc trên cơ sở biết các giá trị của
biến độc lập. Ta xét các thí dụ giả định sau đây: Thí dụ 1.3
y : Chi tiêu cùa một gia đình trong một tuần tính bằng $
X : Thu nhập sau khi đã trừ thuế của một gia đình tính bàng $
Giả sử ổ n g ở một địa phương chỉ có cả thảy 60 gia đình, 60 gia dinh này được
chia thành 10 nhóm, chênh lệch về thu nhập của các nhóm gia đình từ nhóm này
sang nhóm tiếp theo đều bằng nhau. Ta có bảng số liêu sau đây: 14
Bảng 1.1. T hu nhập và chi tiêu trong một tuần của tổng thé' 80 100 120 140 160 180 200 220 240 260 Y \ 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185 115 162 191 _ĨỂĩĩS_ 325 462 445 707 678 750 685 1043 966 1211
Các số ở bảng trên có nghĩa là: với thu nhập trong một tuần chẳng hạn x=$100
thỉ có 6 gia đình mà chi tiêu trong tuần nằm giữa 65 và 88. Hay nói khác đi ờ mỗi
cột của bảng cho ta phân bố của số chi tiêu trong tuần Y với mức thu nhập đã cho
X, đó chính là phân bố có điều kiện của Y với giá trị X đã cho.
Vì bảng 1.1 là tổng thể nên ta dí đàng tìm P(Y/X). Chẳng hạn,
P(Y=85/X=100)-l/6. Chứng ta có bảng xác suất có điầu kiện sau đây:
Bảng 1.2. Xác suất cố đĩêu kiện P(Y/X) 80 100 120 140 160 180 200 220 240 260 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 . 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/6 1/7 1/6 1/6 1/7 1/6 1/7 1/7 1/7 1/7 E(Y/Xi) 65 77 89 101 113 125 137 149 161 173 Trong đó:
E(Y/Xi) = Ị Y: P(Y= Yj/X=X). 7 J Chẳng han:
E(Y/100) = 2 ; y , P(Y= Yj/X=100) 7 J
= 65* 1/6+70* 1/6+74* 1/6+80* 1/6+85* 1/6+88* 1/6 = 77
Biểu diễn các diổm của bảng 1.1 và các trung bình E(Y/X|): i= l,2 ,... 10 lên hộ
tọa độ, nối các điểm có tọa độ (Xi,E(Y/Xi), ta được đô thị sau đây: 15 Chi tiêu
Theo hình 1.4 ta thíy ràng trung bình có điều kiện của mức chi tiêu trong tuần
nàm trên đường thẳng có bệ số góc toong dương. Khi thu nhập táng thì múc chi tiêu cũng tảng.
Một cách tổng quát, Ẹ(Y/X i) là một hàm của Xị E (Y /X |) = Í(X |) ( 1 Ể1)
trong đó ỊỌĩi) là một hãm nào đó cùa biến giải thích XI, với ví dụ trên f(Xi) là hàm tuyến tính. '
Phuơng tìn h (1.1) gọi là hàm hồi quy tổng thể (PRP) hoặc hồi quy tổng thể
(PR). Nếu như hàm hồi quy tổng thể một biến độc lạp gọi là hàm hồi quy don,
có hơn một biến độc lạp gọi là hàm hồi quy bội.
Hàm Ịiòi quy tổng thổ cho chúng ta biết giá trị trung bình của biến Y sẽ thay dổi như thế nào theo X *
Hàm f(X |) có dạng như thế nào - tuyến tính hay phi tuyín - chúng ta chua biết
được bởi lẽ trong thạc tế chúng ta chua có sẵn tổng thể để kiểm tra. Xác định riạnẹ
hàm hồi quy là vắn đè thục nghiệm (chúng ta sẽ đẽ cập đến vẫii đè này các chuỡng sau...).
Giả sử ràng PRF E(Y/Xi) là hàm tuyến tính: E 0 7 X D = p 1 + p 2X i , (lệ2)
trong đó Pi, P2 là các tham số chua biết nhung cố định, và đuợc gọi là các he số t ò i quy,
(3| là hộ số tự do (hê số chạn), P2 là hô số góc.
Phương trình (1.2) gọi là phuơng trình hồi quy tuyến tính đơn. 16 ■
Trong phân ứch hồi qủy chúng ta phải ước lượng giá trị trung bình cùa biến Y,
tức là ước lượng hàm hồi quy chẳng hạn dạng ( 1.2)ể Ở phương trình ( 1Ể2), giá trị
cùa các X ta đã biết, đo vậỵ việc uớc lượng ( 1.2) trở thành việc ước lượng các tham số chưa biết p Ẫ
và P2, trên cơ sở những quan sát của Y và X Phần này sẽ được trình bày ở chương II.
Thuật ngữ "tuyến tính" đâỵ được hiểu theo hai nghĩa: tuyến tính đối với
tham số và tuyến tính đối: với các biến. Thí dụ E07X) = Pi + P 2X j2 là hàm tuyến
tính đối vái tham sô' nhung không tuyến tính (phi tuyến) đối với biến; E(Y/X) =
p 1 + V pT Xi là hàm tuyến tính đối với biến nhưng phi tuyến đối vói tham số. Hàm
hồi quy tuyến tín tìu ô n luôn đuợọ hiểu là hồi quy tuyến tính đối với các tham số,
nó có thể hoặc không phải lặ tuyêh tính đô'i với biến. 1.4.
SAI S ố NGẪU NHIÊN VÀ BẢN CHẤT CỦA .NÓ
Giả sử chúng tạ đã có hàm hồi quy tổng thể E(Y/Xi); vì E(Y/JQ là giá trị trụng
bình của biến Y với giẩ Ị ậ X đã biết, cho nên các giá trị cá biột Ỵ không phải bao
giờ cung trùng với E(Y/X|). mà chúng xoay quanh E(Y/Xj).
Ký hiệu n là chênh lệch giữa giá trị cá biệt Yi và E(Y/X): ụ = Y , - E ( Y « ) h a ỹ : Yi= E(Y/Xi)+ Ui (1.3)
ụ là biến ngẳu nhiên, người ta gọi l í là yếu tố ngẫu nhiên (hoặc nhiễu) và (1.3)
đứcte gội PRF ngẫu nhiên.
Nếu như ECY/X) là tuyến tính đối với X thì Yi = /ổ, + P 1X l +
Với thí đụ 1-3 và với x = $100 ta có Y| = 65 = pi + 100 P2 + U| Yj = 7 0 = 01 + 100 32 + u i Y3 = 74 = Pi + 100 pĩ + l ĩ Y4 = 80 = pi + 100 pj + l ĩ Ys = 85 = Pi + 100Pi + Ub yé = 88 = pĩ + 100 p2 + Từ (1.3) E(WJŨ) = E(E(Y/Xi) + E(UiyXi) E (Y /») = E(Y/Xi) + E(WXÌ) (1.4) -> E (U « ;) = 0.
Như vậy, nếu đường hồi quy của tổng thể đi qua các trung bình có điều kiên
cùa Y thì E Ó m = 0, trong trường hợp này (1.2) và (1.3) là như nhau. Nhung (1.3)
chi ra rằng ngoài các biến giải thích đã có trong mô hình còn có các yếu tố khác
ảnh hưởng đèn biến phụ thuộc Y. Nhung trung bình ảnh hưòng cùa các yếu tố này 17
đến biến phụ thuộc bằng 0 và do vậy không cần phải đua các yếu tố này vào mô hình.
Nhung cũng có thể nêu vấn dề: Các yếu tố này là những yếu tố nào và có thể
đua vào mô hình được không? Câu trả lời là: Chứng ta có thể xây dựng được mô
hình hồi quy bội, nhưng dù chúng ta có đưa vào bao nhiêu biến di chăng nữa thì
yếu tố l ỉ vẫn tôn tại vì một số lý do sau đây:
- Chúng ta có thể biết một cách chính xác biến giải thích X và biẾn phụ thuộc
Y nhung chúng ta không biết hoặc biết không rõ về các biến khác ảnh huởng đến
Y. Vì vậy, Ư, được sử dụng nhu yếu lố đại diộn cho tất cả các biến không có ưong mồ hình.
- Ngay cà khi biết các biến bị loại khỏi mô hình là các biến nào, khi đó
chúng ta có thể xây dựng mô hình hồi quy bội, nhưng có thể không có các số liệu cho các biến này.
- Ngoài các biến giải thích đã có trong mô hình còn có một sổ biến khác
nhung ảnh hưcmg của chúng đến Y rất nhỏ. Trong trường hợp này, chúng ta cũng sử
dụng yếu tố ngẫu nhiên l í đại diện cho chứng. Trong thí dụ đã tì n h bày ỏ phần
trên: số con trong gia đình, giới tính, tôn giáo..., cũng ảnh huởng đến chi tiêu trong
gia đình, u, đại diện cho chúng.
- Về mặt kỹ thuật và kinh tế, chúng ta muốn có một mô hình đơn giản nhất có
thể được. Nếu như chúng ta có thổ giải thích được hành vi của biến Y bằng một số
nhò nhất cấc biến giải thích và nếu nhu ta khOng biết tường minh những biến khác
là những biến nào có thể bị loại ra khỏi mô hình thì ta dùng yếu tô' Ư, để thay cho lất cả các biến này.
Trên đây là một vài iý do về sự tồn tại của n . U| giữ vai trò đặc biệt trong phân
tích hồi quy, chúng phải thỏa mãn những điều kiện nhất định thì việc phân tích trên
mô hình hồi quy mới có ý nghĩa. Sẽ là sai lầm nghiêm trọng nếu như sù dụng một
công cụ mà không biết những điều kiện để sử dụng nó có dược thỏa mãn hay
khôngế Trong phạm vi của cuốn sách này chúng tôi đặc biệt quan tâm đến những
điều kiộn để vận dụng mô hình. Tuy nhiên, trong thực tiễn nhũng điều kiên này
không phải bao giờ cũng được thỏa mãn và bạn đọc có thể tìm thấy cách phát hiện
và cách khác phục nếu như có một số giả thiết của mô hình khơng được thỏa mãn.
Những vấn đề này sẽ được trình bày dần dần trong các chương sau. 1.5. HÀM HỒI QUY MẪU
Ở phần phụ lục, chương n có trình bày sơ lược vê tổng thể và mẫu. vi sao phải
nghiên cứu mẫu. Ván dê ò đây cũng tương tự nhu vậy. Chúng ta không có tổng thổ,
hoặc có nhưng không thể nghiên cứu được toàn bộ tổng thể. Điều này có nghía là
chúng ta không thể xây dụng được hàm hồi quy tổng thể (PRF). Chung ta chì có
mẫu ngẫu nhiên được lấy từ tổng thể. Chúng ta muốn ước lượng PRF từ những
thông tin thu được trên mẫu ngẫu nhiên cùa các giá trị Y đối với các giá trị của X đa 18
biết. Một đíẽu chắc chắn rằng chúng ta không thể ước lượng một cách chính xác
PRF dựa trên mẫu ngẫu nhiên.
Hàm hồi quy được xây dựng trên cơ sở một mẫu ngẫu nhiên được gọi là hàm
hồi quy mẫu (SRF) hoặc hồi quy mẫu.
Bảng 1.3 và 1.4 cho 2 mẫu ngẫu nhiên từ tổng thể trong thí dụ 1.2
Bàng 13. Mẫu thứ nhất Y 70 65 90 95 110. U5 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260
Bàng 1.4. Mẫu thứ hai Y 55 88 90 80 118 120 145 175 X 80 100 120 140 160 180 200 220
Với hai mẫu ngẫu nhiên trên ta xây dựng dược hai hàm h'ôi quy mẫu ký hiệu SRF1 và SRF2 (hình 1.5).
80 100 120 140 160 180 200 220 240 260 Hình 1.5
Vậy đuờng hồi quy mẫu nào sẽ được coi là thích hợp với PRF. Câu hỏi ,này
không trả lời được bời lẽ PRF chua biết. Cũng giống như ước lượng một tham sổ, ta
sẽ ước lượng FRF bằng SRF mà SRF này có tính chất: tuyến tính, không chệch, cỏ phương sai nhỏ nhất.
Giả sử rằng đường hồi quy m ỉu có dạng: Ỳ . - p . + M . 19
trong đó: Ỹj là uớc luợng cùa E(Y/X|)
Pị và p 2 là ước luạng của p! và P2
Mặt khác theo (1.3): Y| = E(Y/Xi) + u Do đó: Y! = + p 2 Xi + eị
trong đó, ei được gọi là phần du hay chính là uớc luọng của Uj. Sự tồn tại cùa e;
duợc giải thích nhu sự tồn tại của ụ .
Trên mảu, với X = Xi ta có Y = Ỵ Ỵ - Ỳ , + e | Ỵ - B C W O + ụ
Hình 1.6. Đường hòi quy tổng thề và đường hồi quy mẩu.
Ván dề đặt ra là ta có thể đưa ra một phương pháp và một số điều kiện m à nhờ nó
SRF là uớc lượng tuyến tính, không chệch có phuỡng sai nhỏ nhất của PRF hay nói khác đi và
gần nhất với giá trị thực p, và p2 có thể được dù rằng chúng ta
khổng bao giờ biết giá trị thực của Pi
Văn dè này được trinh bày ở chương n. 20 CHƯƠNG 11 MÕ HÌNH HỔI QUY HAI BIÊN
ưức LUỰNG VÀ KIỂM ĐỊNH GIẢ THIẾT
Trong chương này sẽ trình bày vấn dề ướciuợng hàm hồi quy tổng thể PRF
một cách chính xác có thể được trên cơ sở hàm hồi quy mẫu. Có một số phương
pháp ước lượng hàm hồi quy mẫu, phương pháp thường dùng là phương pháp bình
phương nhỏ nhất OLS (Ordinary Least Square). Chúng ta sẽ trình bày phương pháp
này cho mô hình hai biến ở chương này, chương sau sẽ trình bày phương pháp OLS cho mô hình hồi quy bội.
2.1. PHUƠNG PHÁP BÍNH PHUONG n h ỏ n h ấ t
Phương pháp bình phương nhỏ nhất do nhà toán học Đức Carl Friedrich Gauss
đua ra. Sử dụng phương pháp này kèm theo một vài giả thiết, các ước lượng thu
được có tính chất đặc biệt, nhò đó mà phương pháp này là phương pháp mạnh nhít
và được nhiều người thích sử dụng.
1. Nội dung phưomg pháp bình phuomg nhỏ nhất
Giả sử E(YIXị) = pi + i32Xị là PRF
Khi đó giá trị quan sát Yj! Yi= E(YIXị) + l í = pi + P2X + l í Ỷị = P, + P 2X; làSRF Yi = p , + p 2X i + e i
Vấn dề là phải tìm ý( = P ị + P i X ,
Giả sử rang chúng ta có n cặp quan sát cùa Y và X, cặp quan sát thứ i có giá trị
tương ứng (Yi,Xj) : i = l , n . Ta phải tìm Yị sao cho nó càng gần với giá trị thực
của Yi có thể được, tức là phần dư
e, = Y ,-Ỷ 1= Ỵ Ì ậ 1 - ệ í X J càng nhỏ càng tốt. 21 Ta xem đồ thị sau đay: Hình 2.1
D o è j: i= l , n có th ể d tia n g .o ih ổ â m d o vậy cần phải tìm Ỳị sao cho tổng
bình phương của các phần dư đạt Cực tiểu. Tức là: Ỉ 2? = Ỉ n - Ỷ . ý i«l i-ì = ỉ
( Y ,- P , - p 2X f)2 => min iễl
D o X i,Y i:i = l ,n đãbiết.nên
l à h à r a c ù a P |,jj2ỉ i«l
f(P, p2)ề Ỉ*ỉ = È (Ỵ| - Â - fax, Ý => uin i-l ;-i
P , , ậ 2 là nghiộm. ủa hệ thỐLịị piìuơi.12 trìn h : áu: a f ( P „ ê , ) f .. a op, Ii-i s S - - = hay n P , + P 2Ỉ X j = Ị ] v »■1 i«l '22 ^
— = Ẻ 2 C Ỵ - P , - ệ , X iX-55) = 0 a p 2 i.1 hay
ệ w% x + p 2 ỉ X f , Ề Y,JÍ i=l h=l i**l
P t , P-Ị được tìm từ hệ phương tìn h sau: n Á + Á í J f i = í Y, . 1 =1 i-1
Á ẳ x+ Á ẳ x? = £ Y,Xi (2.1) M i-1 i»1
' Hệ phương trình (2.1) gọi là hộ phương trình chuẩn. Giải hệ phương trình trên ta được:
n Ỉ Y . X i - Í Ỉ X . Ỉ Y i
P 2 = — ------------------- V — = — - (2.2) n Ẻ X ? - Ỉ X , i , i«l \ i - l / P , = Ỹ - P 2X (2.3) Đặt Xi = X - X yi = Y i - Ỹ È y iX ị Khi đó P , = ----- (2.2)' Ỉ * ỉ i-l
P ,, P2 là các ước lượng của Pi và p2 được tính bằng phuơng pháp bình phương
nhò nhất - được gọi là các ước lượng bình phương nhỏ nhất.
2. Các tín h c h ấ t của các ước lượng bình phưong nhỏ n h ất
1. P i , p 2 được xác định một cách duy nhất ứng với n cặp quan sát (X|,Y1)
2. ậ | , p 2 là các ước lượng điểm của pi, p2 và là các đại lượng ngẫu nhiên,
với các mẫu khác nhau chúng có giá trị khác nhau.
Ỳ- = P, + P 2Xi - SRF có các tính chất sau đây:
1. SRF đí qua trung bình mẫu ( X , Y ), nghĩa là : Ỹ = p, + :ậ2 X 23 ,
f Giá trị trung binh của Ỹị bàng giá trị 'trung- bình cùạ cậc quan sát: Y = Ỹ .
3. Giá trị bung bình của các phần dứ: éị = 0 I . *-!'• L * -
4. Các phần du ei không tuơng quan với Ỷj tức lài Ỳ;ej = 0 i»l 5.
Các phần dư ei không tưong quan với Xi tức là :. e, Xl = 0 T hí dụ 2.1
Bảng sau đây cho số liệu về lãi suất (Ỷ) và tỷ lệ lạm phát(X) trong năm 1988
9 nước Giả sử rằng sự phụ thuộc Ẹ(Y/X> ẹó dạng tụỵến tính dối vãi cả biến số và
tham số. Hãy ước lượng hàm hổi qụy và tính cầo đặc tnm g của nó._____________ _ Ệị?^1v3 ■ 66 ,3 - m . : 1 :S ® r -7,6 Ì X k i p l i EN l l i s i ã ế - l s Ẻ 1 W | p § p .•4,4
Quá trình tính toán được thể hiện trong bảng 2.1.
2.2. CÁC GIẢ THIẾT c ơ BẢN CỦA PHUƠNG PHÁP BÌNH PHUƠNG NHỎ NHẤT
Trong phân tích tò i quy, mục đích của chúng ta là ước lượng, dự bảo về tổng
thể, tức là ước lượng E(Y I X i) hay trong mô hình hồi quy tuyên tính, đơn là ước
lượng E0fl X i) = Pị + P2X1 • Pi và P2 tìm được bằng phương pháp bình phương
nhỏ nhất là cấc ước lượng điểm của Pi và p2. Chúng ta không biết được chất lượng
cùa các ước lượng này như thế nào. c h ít iưọng của các ước lượng phụ thuộc vào:
- Dạng hàm của mô hình được lựa chọn
- Phụ thuộc vào các Xi và Ui
- Phụ thuộc vào kích thựớc mẫu
Về dạng hàm của mô hình chúng ta sẽ đ& cập đến chương, IX Ở đây chúng
ta sẽ nói về các giả thiết đổi với Xi và Ư,. Với các giả thiết này thì các uớc lượng
tìm được bàng phương pháp binh phuơng nhỏ nhất là các uớc lượng tuyến tính
không chệch, có phương sai nhỏ nhất. I
G iả thiết I: Biến (các biến) giải thíph là phi ngẫu nhiên, tức là cấc giá trị của
chúng là các số đã được xác định.
Giả thiết này không có gì mới, vì phân tích hồi quy đuơc đề cập [à phan tích
. hồi quy có điều kiện, phụ thuộc vào các giá trị X đã cho. 2+ Bảng 2.1 V, X, X,2 ypYrY y f m V, e^Y.-Ỹị e,2 1 11,9 7,2 51,84 -2,211 4,889 -2,6 6,76 5,749 11,737 0,1625770 0,0264312 2 9,4 4,0 16,0 -5,411 . 29,279 -5,1 26,01 27,566 7,739 1,6606782 2,7578521 3 7,5 3.1 9,61 -6,311 39,829 -7,0 49,00 44,177 6,615 0,8551442 0,7834802 4 4.0 1.6 2,56 -7,811 61,012 -10,5 110,25 82,016 4,741 -0,7407950 0,548703 5 11,3 4,8 23,04 -4,611 21,261 -3,2 10,24 14,755 8,739 2,5609783 6,5586089 6 66,3 51,0 2601,0 41,589 1729,645 51,8 2683,24 2154,31 66,461 -0,1614370 0,0210619 1 2 2 20 4,0 -7,411 54,923 -12,3 151,29 91,155 5,241 -3,0405000 9,2446913 8 10,3 6,6 43,56 -2,811 7,902 -4,2 17,64 11,806 10,988 -0,6877790 0,473055 9 7,6 4,4 19,38 -5,011 25,110 -6,9 47,61 134,576 8,239 -0,6390800 0,408429 I 130,0 84,7 2770,97 0,000 1973,849 0,0 3102,04 2466,14 130,500 -0,0002200 20,827314 Tj/b5nh 14,5 9,411 14,5 n Z y i xi - i=l w 2466,14 _ . p 2 = „------= _ =» 1,2494067 ;
B, = Y - B , X = 14,5-1,2494067.9,411*2,7418355 n V 2 1973,8489 1 2 p 2 X i=i
Ỷj = 2,7418355 + 1.2494067X, - SRF
Giả thiết 2: Kỳ vọng của yếu tó ngẫu nhiên u bằng khống, tức là E ( ự l X |) = 0
Giả thiết này có nghĩa là các yếu tố không có trong mô hình, ụ đại diện cho
chúng, không có ảnh hưởng hệ thống đến giá trị trang b'mh của Y.
VÔ mặt hình học giả thiết này được mô tả bàng dò thị (hình 2.2).
Đồ thị chỉ ra rằng với mõi giá trị của X, cắc giá trị có thể có của Y xoay quanh
giá trị trung binh. Phân bố của phần lớn hơn hay nhỏ hơn giá trị trung bình chính là
các lị , theo giả thiết này trung bình của các chênh lệch này bang 0 .
Chú ý: Giả thiết E(U I X.) - 0 kéo theo E(Y, I + P2 Xa . Y G iá trị trung bình P R F Hình 2.2 26
Giá thiết 3. Phương sai bằng nhau (phương sai thúần nhất) của các u (Homoscedasticity o f ụ ).
Var (Ui I Xi) = Var(Uj I X ị) = ơ2 V i* j
Giả thiết 3 có nghĩa là phân bô' có điểu kiộn của Y với giá trị đã cho của X có
phương sai bằng nhau, các giá trị cá biệt của y xoay quanh giá trị trung bình với phương sai như nhau.
Giả thiết 3 kéo theo Var(Yr IX ) = ơ2.
Về măt hình học có thể mô tả giả thiết này như hình 2.3.
Hình 2.4: Var (U I Xi) * Var (ƯJI x ; ) = ơ j : j
(Phương sai khống thuần nhất)
Giả thiết 4. Không cổ sự tương quan giữa các l í : Còv( l í , Uj) = 0 Vi * j Hình 2.5 a. Không tự tương quan; b. Tự tuơng quan dương; c. Tự tương quan âm 27
Giả thiết này có nghĩa là ụ là ngẫu nhiên. V6 mặt hình học có nghĩa là néu
như có một giá trị u nào đó lớn hơn (nhỏ hơn) giá trị trũng bình thì không có nghĩa
giá b ị khác cũng lớn han (nhỏ hơn) giá trị trung bình.
Giả thiết 5. LỊ và J í không tương quan với nhau: Cov(Ư,, Xi) = 0.
Trên đây đã đưa một số giả thiết cơ bản. Bạn đọc có thể đặt ván dề: vì sao
phải có các giả thiết này? Chứng được thực hiện như thế nào? Cấi gì sẽ xảy ra nếu
các giả thiết này không được thòạ mãn? Bằng cách nào biết được mô hình hồi quy
thỏa mãn tất cả các giả thiết này. Vấn dề mà bạn đưa ra thật lý thú nhưng không
thể giải đáp ngay trong chương này được. Chúng sẽ được giải đáp dàn dần ưong các chương sau. 2 .3 .
Đ ộ CHÍNH XÁC CỦA CÁC uớc LUỢNG BÌNH PHUƠNG NHỎ NHẤT
Theo phương pháp bình phương nhỏ nhát, các ước lucmg P ,, P 2 được xác định theo công thức: p , = Ỹ - P2 X ậ 2 = Ẻ Xi y, / £ X? ì-1 1-1
Các uớc lượng này là hàm của mẫu, là đại lượng ngảu nhiên, với các mẫu khác
nhau ta có các ước lượng khác nhauề Vi phương sai hay độ lệch chuẩn đặc trưng
cho độ phân tán của đại lượng ngảu nhiên, nên ta dùng chúng làm thước đo cho
chít lượng của uớc lượng.
Vài các giả thiết cùa phuong pháp bình phương nhỏ nhất, phương sai và đọ
lệch chuẩn cùa các ước lượng đuợc cho bời các cồng thức sau: v a r ( Ằ ) = ^ ~ ; se( P2 ) = ° M
V a r ( P ,) = — £ - ^ - < 7 . s e ( / ? ,) = <7 n í x f \ n Ỷ f Xĩ >=• 1 M trong đố, ơ 2 = Var(U)
se: sai số tiêu chuẩn (Standard error) 28 X| = J5- X
Trong các công thức trên ơ1 chua biết, ơ2 đuợc ưãc lượng bằn ..g. . ước lượng
k h ô n g c h ệ c h c ù a I 1Ó l à ớ = — — ; â = ỵ ỵ ^ n _ 2 )
là s a i s ô 't iê u c h u ẩ n c ù a
đường hổi quy (Standard error of regression). Nó chính là độ lệch tiêu chuẩn các
giá trị Yquanh đường hồi quy mẫu.
Các tính chất của các ước lượng bình phương nhỏ nhất được thể hiện qua định lý sau đây:
Định lý Gauss - Markov: Với các giả thiết 1-5 của phương pháp bình phương bé
nlĩất, các ước lượng bình phương nhò nhất là cấc 1tóc lượng tuyến tính, không chệch và
có phuơng sai nhổ nhất trong lớp các ước lượng tuyến tính không chệch.
Với các kết quả ở bảng 2.1, ta tính được:
ơ2 chưa biết nhưng có thể dùng ước lưcmg không chệch của nó là ờ 2. „ , £ , ơ2 2,9746993 Var( B, ) = —-— = - ■ — — » 0,001507055 ■V 2 1973,8489 M se( p j) = 0,0388208 2>ỉ , 2770,97 Var ( P ,) = -
a = ------ —------- 2,9746993 « 0,464 Ỷ V 2 9.1973,8489 n Z / xi i«l se( P, ) *0,6811
2.4. HỆ SỐ r2 ĐO ĐỘ PHÙ HỢP CỦA HÀM H ỗ l QUY MẪU SPF Ta có Yi = Ỷj + Ci
Y i- Ỹ = Ỹ i - Ỹ + e,
= Ỷj - Ỹ + e, hay y, = ỹj+ e , . Z y? = ỉ
ỷ i + í e ĩ + 2 S ỷ ,e , |Ế=1 |ắ»l M = ỉ ý i +
e- + 0 . Vì ỹ, = P 2 Xi nên : i=l i=l 29
È y?*= N Ẻ x? + £ e? M jẵl i-1 Ký hiệu:
T S S = ẳ y? = ẳ Ơ I- Y )2 . i-l i-l
-T> TSS (Total Sum o f Squares) là tổng bình phương của tất cả cấc sai lộch giữa
các giá trị quan sát Yị với giẩ tri trung bình của chúng, ESS = £ (Ỷ,
Y )J = £ <Ỷ€ - Ỹ )2 = í
ỳ ] = P I X?. j=l ịế| i-l i*l
ESS (Explained Sura of Squares) là tổng bình phương của tất eả các sai lệch
giữa các giá ư ị của biến phụ thuộc Y nhận được từ hàm ti&i quy mẫu với giá trị
trung bình của chúng (Ỳ - Ỹ ). Phần này đo độ chính xác của hàm hồi quy.
RSS = ỉ e? = ơ i - % Ỷ i-l i-l
RSS (Residual Sum o f Squares) là tổng bình phương của tất cả các sai lệch
giữa các giá trị quan sất Y và các giá trị nhận được từ hàm hồi quy.
Vè mặt hình học có thể minh họa như trên hình 2.6. H ình 2.6 TSS = ESS + RSS
TSS được chia thành hai phần: một phần ESS do đường hồi quy mẫu gây ra và
phần cùa RSS do các yếu tố ngẫu nhiên gây ra.
Từ TSS = ESS + RSS ta chia cả hai vế cho TSS, ta có: 30 Ỳ ( Ỷ Ẵ- W Ỷ e ? E SS RSS £ r > M TSS + TSS Í ( Y ; - ỹ / ẻ ( Y , - W Iẳ»l i=I ẳ ( Ỹ i - Ỹ ) M ____ ESS RSS Đặt r 2 = — 2 — TSS — - TSS m - Ỹ ) i-1 W >? Pỉ£x? 1 I 1 i=l ĩ .I Ó n l W M Èy? i-I n A / i»l /n- l s2 = 2 n 6 — sị I : r ỉ / A - 1 trong đó: S 2
X và Sy là phương sai mẫu của X và Y. Ỉ X iy ,- ( ỉ * ! * ) Mật khác P , = - 3 - — => r ’ w ỉ * ? p ìp i
r=j f l P =f S F ) B H i ?
Từ định nghĩa r2 chúng ta thấy r2 đo tỷ lộ hay sô' phần trãm của toàn bộ sai lệch cùa
Y vái giá trị trưng bình của chúng được giải thích bàng mô hình (hay biến độc lập), r2
được sư dụng để đo độ thích hợp cùa hàm hồi quy. Dễ đàng thấy được 0 < r2 < 1. Nếu
lấy căn bậc hai cùa r ta được r. r chính là hệ số tương quan mẫu, tuy nhiên dấu của r tuỳ
thuộc vào quan hệ cùng chiều hay ngược chiều giữa Y và X. 31
Các tính chái của hệ s ổ tương quan r
l ễ r có thé âm hoặc duơng, dấu cùa r phụ thuộc vào dấu của tử số, đó chính là
dấu cùa Cov(X,Y), hay là dấu của hệ só góc. 2 . -1 á r <; 1
3. r có tính chát đốì xúng r(X,Ỵ) = r(Y,X)
4ằ Nếu X' = a X + c ; Y = b V + a; a,b,c,d là các hằng số
a,b > 0 thì lỌC, Ỹ ) = r(X,Y)
5. Nếu X,Y độc lập với nhau thì r(X,Y) = 0; Điều ngược lại không đúng.
6. r đo sự phụ thuộc tuyến tính, nhung không có ý nghĩa trong việc định rõ
tính chất các quan hệ phi tu y ến .
7. r đo độ phụ thuộc tuyến tính giữa X và Y, vậy không đòi hỏi X,Y có mối quan hệ nhãn qui. 8 . r2 cQng có thể é tín u h rn b bằăng công thức m : ức:
[ ỉ ( v , - Ỹ ) (Ý, - ? ) " ( ỉ y , ỹ , ) r = i“l j»I i-1 i«l
Với các số ở bảng 4.1 ta cổ: 2 4 6 6 142 = 1” 0 ’9566
2.5. PHÀN B ố XÁC SUẤT CỦA Ui
Phần trên chúng ta đã trinh bày các ưởc lượng điểm của Pi và Pj thu đuợc
bằng pbuơng pháp bình phuong nhỏ nhít. Với các giả thiết cơ bản: E ( U ) = 0 Var ( I Ị ) = o 2 Cov (U , Uj) = 0 ( V i* j)
thi p , , P2 là các ước lượng tuyến tính không chêch có phương sai nhò nhất của Pi
và P í. Mục đích cùa phân tích hồi quy khôiig nhải chi là suy đoán về Pi và Pỉ hay
PRF mà còn phải kiểm tra bản chất của sự phụ thuộc, còn phải thực hiện các dự
đoán khác. Do vậy cần phải biết phân bố xác su it của p! và p 2. Các phân bố này
phụ thuộc vào phân bố cùa các Uj.
Bây giờ chúng ta đua them giả thiết. 32
G iả thiềt 6. Ụ có phân bố N(0, ơ3)
.Với các giả thiết trẽn, các ước lượng bình phương nhỏ nhất P ,, p 2 và ở 2 có
•các tính chất sau đây:
1. Chúng là các ước lượng không chệch 2. Có phuong sai cực tiểu
3. Khi số quan sát đù lớn thì các uớc lượng này xấp xỉ với giá trị thực của phân bố. 4. Pl
TO tính chất này suy ra z = —— — ~ N (0,1) ơ p, 5. p 2 ~ N (p 2 ,ơ? )
Từ tính chất này ta suy ra z = Ẽ3—Ẻ 1 „ K (0,1)
7. Trong các ước lượng không chệch cùa Pi, pj bất kể là tuyến tính hay phi
tuyến tính thì P ,, P2 có phương sai nhỏ nhít. 8 . Yi - N(Pi ■+ P2 , ơ2).
Với các tính chất trên chúng ta có thể tìm khoảng tin cậy và kiểm định giả
thiết về các tham số hồi quy.
2 .6 . K H O Ả N G T IN CẬY VÀ K lỂM đ ị n h g i ả t h i ế t VỀ .CÁC h ệ s ố H Ồ I QUY
Với các giả thiết 2-6 thì : p, ~ N (Pi, o | ) Pl p 2 ~ N ( Ị h , o ị ).. 2 _ trong dó : ơ * =
nhưng do ơ 2 chưa biết nên a ị a ị cũng chua biết. Do vậy, phải dùng ước
lứợng không chệch cùa c 2 là ô 2 . Khi đó các thổng kề: 33 p , - P i p 2 - p 2 t = ■ >— v à t = — - J p f có phần bố T(n-2) và s e ( P ,) se(P 2) Ẳ
X2 = ( n - 2 ) - ? 7 ~ x 2( n - 2 ). Ơ
Do đó có thể tìm khoảng tin cậy, kiém định giả thiết cho các bệ số hồi quy và ƠJ.
1Ễ Khoảng tin cậy của Pi t = P l ~ ~ T (n -2 ) se (P i)
Với hộ số tín cậy 1 - a la tìm được tc/2 (n -2) thòa mãn. p ( - W ( t t-2) s < W (n -2)) = 1 - a . se(P ,)
Khoảng tin c&y (1 - a ) của Pi là:
(0 ! -ta /2 (n -2) s e ( Pj) ; p | + ta/2 ( n - 2) s e ( P , ) )
2. Kiểm định giả thiết đối với pỂ
Có thể đua ra giả thiết nào đó về pi, ciiẳng hạn Pi = p ị . Nếu giả thiết này (King thì: P i - P , t = - T (n -2 ). se (P ,) Ta có bảng sau đây:
Bảng 2 2 . Kiểm định giả thiết về pi Loại giả thiết Giả thiết Ho Giả thiết đối H| Miền bác bỏ Hai phía p i = p ; Pi * p ’ m > W n - 2 ) Phía phẫi t > t„ (n -2 ) p i s p ; Pi > P* Phía dái t < - t a ( n - 2 ) Pi £ P* P i< P * a thường nhò hơn 0,1
ta (n -2) đuợc xác định bởi p (t > ta (n -2)) = a , được cho trong bảng 2 phần phụ lục.
3. K hoảng tin cậy củ a Pi Dựa vào: t = - T ( n - 2) se(P 2)
do đó với hệ số tin cậy 1 - a , khoảng tin cậy cùa được xác định bởi: 34 p 3 - i v
P ( - W ( n - 2 ) ắ i l i ^ - ắ t a ữ ( n - 2 ) ) = l - a • se (P j)
~ P( p 2 - ta/2 (n -2 ) se ( p 2) ổ Pj ^ p 2 + tan (n -2) se( P2)) = 1 - a .
4. Kiểm định giả thiết đối với Pj
Có thể đua ra giả thiết về giá trị thực của p2. chẳng hạn p2 = P*.
Nếu giả thiết này đúng thì . _ P2 - P 2 ' T (n -2) s e f lij)
Bđng 2.3. Kiểm định giả thiết v í Pi Loại giả thiết Giả thiết Ho Giả thiết đối H| Miên bác bỏ Hai phía p 2 = p ; P2 * pj 11 1 > taữ (n -2 ) Phía phải t > t„ (n -2 ) P2 > P2 Phía trái t < - U n -2 ) • p2 s p ; P 2 < P ;
Nếu như đua ra giả thiết P2 = (3 2 = 0 thì điều này có nghĩa là đua ra giả thiết
biến độc lập X không ảnh hưởng đến biến phụ thuộc Y, .khi các ti được tính bằng còng thức: se(Pị) se(Pi)
Với các số bảng 2.1, ta có thể tun khoảng tin cậy của Pi và (3j, cOng nhu
kiểm định- các giả thiết về tham số này.
Với a = 0,10 => (0,050 (n - 2) = to,050 (7) = 1,895 (theo bảng 2);
se(P ,) = 0,6811; se( P j ) = 0.0388
Khoảng tin cậy của Pi và p2 với hẹ số tin cậy 90% là: •
(P , -1,895 s e ( p ,); P, + 1,895 se(P,))
(2,7418335 - 1,895 . 0,6811 ; 2,741835 + 1,895 . 0,6811) hay (1,451149:4.0325195)
( fỳ2 -1,8*95 se ( p 2 ); P2 + 1,895 . se ( p 2 ))
(1,2494067 -1,895. 0,0388 ; 1,2494067 + 1,895. 0,0388) (1,17588; 1,3229327)
Có thể kiểm định giả thiết Ho : = PĨ = 0 35
Giả thiết Ho về mặt kinh tế túc là chúng ta đua ra giả thi£t biến X khổng ảnh
huởng đến Y, trong ví dụ cụ thể này nghĩa là nêu ra giả thiết ợ lệ lạm phát không
ảnh hũởng đến lãi suất ngân hàng.
Với a = 0,05, to,(B5 ơ ) = 2,365 (bảng 2) ■ Ễ i - g i 1,2494067 - 0 _ se(P 2) = 0 ,0 3 8 8 . t>to,cnj(7)
do đó ta bác bỏ giả thiết Ho và chip nhện Hi
6. Khoảng tin cậy đối với a2 XJ = ( n - 2 ) ^ - ~ x 2(n-2).
Do đó, khoảng tin cậy (1 - a ) của ơ2 đúợc xác định từ , ô 2 2 P ( X 1
( n - 2 ) ắ ( n - 2 ) ^ 7 á X « « (11- 2 ) ) = 1 - a p í í p i i £ l ^ s { z a / i ( n - 2 ) X i - * n ( n - 2 ) )
trong dóx*«(k) đuợc cho bởi bảng 4, phần phụ lục.
6. Kiểm định giả thiết đtfi VỚI ơ Bảng 2.4 Loại giả thiết Giả thiết Giả thiết đối Miền bác bỏ Ho H, Hai phía II a 2 * ơ ị
~~°~v • - > x l , i l » - 2 ) hoãc a O < n - 2)â* , 1 ^ X \ ~ m ! l \ n *) . <70ặ " b I Phía phải I ơ 2 > ơ ị ( n - 2)ôJ .
------J — > X Ỉ ( n - 2 ) ơ õ Phía tiái II o°L ơ 2 < o ị (n -,2 )ỡ l , . ... . í < x ỉ-« (n 2) <*0
Kiểm định giả thiết cho thí dụ 2.1
Phần trên đã tính đuợc ô 2 = 2,9740993
Có th í kiểm tra giả thiết: H0 : ơ í = ơ ị = 3 H , : ơ 2 * 3 36
CL = 0,05 => 5C
0,025 (n-2) — X 0.025 (7) = 16,0128; x20.975 (7) = 1,68987 ( n - 2 ) ô í 7.2,9746993 — 7 = — ------ = 2,3136 o j 32
2.7. KIỂM ĐỊNH SỰPHÙ HỢP CỦA HÀM H ồ i QUY, PHÂN TÍCH H ồ i QUY VÀ PHAN TÍCH PHUONG SAI
Phần này sẽ trình bày việc phân tích hồi quy theo quan điểm cùa phân tích
phương sai, nó cung cấp cho chúng ta một cách khác, hữu ích trong việc giải quyết
vấn dề phán đoán thống kê.Theo phần 2.5 chúng ta có: ị y ì - ị ỹ ú ị ' ! i-1 i-l i-1 = ÍM ỉ X? + £ e? i>1 i-1 hay TSS = ESS + RSS. Mặt khác:
r = ESS/TSS, nên ESS= I^TSS và RSS = (1 -r) TSS. ơ 2 Do P2 cổ phân bố N (Pj, nên P’ ' \ Iẽ x ỉ ~N(0,1) ơ V i-1 (P í " P ĩ ) 2 V ĩ 2 , ệ> và — - ỷ — 2 X ~ x ( 1) i.1 pỉ Do ( n - 2 ) p - = J^ - ~ x V 2 ) ( P i - P a ^ ỉ * ? ỉ e? (P2 - P 2f Z x? ---------
— / 1 : - ^ 7 - / (n -2) = — --------& — nên: F = -------- — / 1 : -*=4“ ' ơ t i / . ỉn! / ( n - 2)
hay F = --------- ——------- có phân bố F( 1, n-2).
Chứng ta kiểm định giả thiết: 37 H o: (32 = 0 H ,:p 2 * 0 P Ỉ Ẻ * ? Nếu F = - > Fg(l,n -2 ) Ơ .
thì bác bỏ gia’ thiết Ho, tức là bác bỏ giả thiết X không ảnh hưòng đến Ỳ. Trong đó a thường nhò han 0 ,1.. ■ r' ■ Mặt khác n ' Ti . . ' Ệ - 5 ? I 2 *Ỉ 2 '“ X' ESS / 1 _ T S S r 2 / 1 F = ỹ
= RSS / (n -2 ) _ ( l - r 2 ) T S S / ( n - 2 )
cho nên quá trình phân tích phương sai cho phép chúng ta đưa ra các phán đoán
thống kê về độ thích hợp của hàm hồi quy. Ta có thể đưa ra quá trình phan tích
phương sai một cách ngắn gọn bàng bảng sau đay: -
Bảng 2.5. Bảng phản tích phucmg sai cho mô hình hồi quy hai biến Nguồn biến thiên Tổng bình phương Bậc tự do Phuơng sai Từ hàm hồi quy 1 Plỉ *? (ESS)
Ẹ ỹ i = P Ỉ ằi-l iấ 1 Từ các yếu tố ngẫu t e? n -2 ^ e ‘ = ề ’ nhiên (RSS) i-l ( n - 2 ) T S S tvĩ n-1 i-l
Với thí dụ (2.1) a = 0,05 ; F a (l,n-2) = 5,59 (bảng 3) ta có: „ r 2 n - 2 0,9932 7 ' = 1 - r 2 ‘ 1
“ 1 - 0,9932 ■ 1 - 1022,04 F > F « (141-2)
do đó bác bỏ giả thiết P2 = 0 hay bác bố giả thiết r2 = 0
2.8. PHÂN TÍCH HỎI Q U Y VA D ự BÁO
Các phần trên đã trình bày phuơng pháp xây dựng một hàm hồi quy các đánh
giá và phán xét về các hệ sổ của hàm hồi quy. Tuy nhiên mục đích cuá chúng ta
không chỉ dùng tại đó. Có thể sử dụng hàm hồi quy để dụ báo. Có hai loại dự báo-
- Dự báo trung bình có điều kiện cùa Y với một giá trị X = Xb 38
- Dự báo giá trị cá biệt cùa Y với x = X)
- Dự báo giá trị trung bình.
Giả sử X = Xó ta muổn dự báo E(YlXo). Đường hồi quy mẫu cho ước lượng
điểm của E(WCo)-ễ Ỷ0 = P, + P2 Xo.
Ỷ0 là ước lượng không chộch có phuong sai nhò nhất của E(YIXo). Tuy nhiên .
Ỹ0 vẫn khấc so với giá tri thực của nó.
Ỳ0 có phân bổ chuẩn với kỳ vọng pi + p2 Xo , nên
var ( Ỳ0 ) = E (P , + p j X o - P . - f t X o)2
= E [ ( P , - P , ) + Xb( p j - f c )]2
= E [(P , - p , ) 1 + 2 J « P , - p i )( p 2 - p 2 ) + x ’ ( p 2 - p 2 ) 2]
Var (Ỷ , ) = E[( P, - p, )2] + E [X | ( p 2 - h )2]
+ 2 X E K P , - p , x p a - f t ) ]
= Var (P ,) + Xb2 Var ( P i) + 2 X) Cov ( P, , P2 ) Var(Ỳ0)
= V ar( Ỹ - P 2 X ) + Xo2 V ar( p 2 ) + 2X oC ov( P, , p 2 )
= — + X 2 V a r i f o + X ] Var(P1) + 2 X ữC o r{fi]J ì ) n
, ĩ L + T P - ? - + x i - 2 L - 2 X j Ị L /> -1 ? íix =l íix =1 V \ 1 = q 2 ( l + (Xon- Z ) } ■ " ± * ỉ im1
Nhưngơ2 chưa biết, nôn ta sử dụng ước luọng không chệch cùa ơ 2 là ồ2, khi dộ: Ỷ0 - ( p , + p j X 0) t - ° ; ^ \ - ~T(n-2) se(Y 0)
Do đó khoảng tin cậy 1- a của E( Yl Xo):
P( Pi + p 2 ^0 ■ t d/ỉ(n-2) se ( Y0 ) ắ Pi + P2 Xo
á p i + p 2 Xo + 1 „ữ(n-2) s e ( Ý ó ) ) = 1 -a .
Ỳ0-1 a /2 (n-2) s e ( Ỳ0 ) ắ E(Y/Xo) < Ỷ0 + 1 a *(n-2) sè ( Ỷ, ) )
Thí d ụ : Hây dự báo mức lãi suất trung bình nếu tỷ lệ làm phát = 5%, 39 a = 0,1; c = 1.895. V ar(Ỷ 0 ) - ớ * [ - + . n
.= 0,3366 suyra se ( Ỳ0 ) = 0,58.. p, + P2 Xo
= 2,7418335 + 1,2494067 , 5 = 8,98,8867
7,889767 ắ E ( YIXo) 5 10,087967.
Dự báo giá trị các biệt:
NẾu chúng ta muốn dự báo giá trị riêng biộl V = Yò với X = Xd ■ khi đó ước
luọiig củà Yo là, Ỳ0 = p | + p 2 Xó
và Var ( Yo) = o2 [ 1+ — + ( x ^ -— ]: -t= ~ T (n -2 ). n se(J o ) i-l
• Khoảng tin cậy của Yo được xác định bởi:
P(Ỹ0 - t'c.a(n-2) se (Yo) í Y , í Ỹ 0 + t a«(n-2) se (Y0)i = l - .a
. Thí dụ: Hãy dự báo múc lãi suất nếu tỷ lê iạm phát Xỉ = 5%, a = 0,1. se (Y o) = 1,8184 • 8,988867 - 1,895 . 1,8184 ắ Yo £ 8,988867 + 1,895 . 1,8184 5,542999 ắYo ắ 12,434735
2.9. TRÌNH BẰY KẾT QUẢ PHÂN TÍCH H ồ i QUY
k ft quả phâii tích hồi quy có thể trình bày vắn tắt duứi dạng sau đây: Y . - P , + r2 • (se( ậi ) ) ( se(. P j )) Bạc tự do n - 2
t = ( p , / s e ( P , U P 2 / s e ( P 2) ) " : ễ.
Với các thông tin trênbưtìc đầu chúng ta có thể thục hiện đuọc một số phãn tích. 40 2.10. THÍ DỤ \ 1.
T h í dụ 2.2: Cho số liệu sau đây về năng suất (tạ / ha) cùa một loại cây
trổng và mức phân bón(tạ / ha) cho loại cây này tính trên một ha trong 10 năm từ
1988-1997. Hặy'uớc lượng mô hình hổi quy cua năng suất phụ thuộc mức phân
bón và trả lời các câu hòi sau đây:
a) H ãy giải thích ý nghĩa kinh tế của các hệ số nhận được.
b ) H ãy tính đ ộ lệch tiêu chuẩn của các Ị).
c) V ới m ức ý nghĩa 5% hãy cho biết m ức phân bón có ảnh hưởng đến
năng su ất loại cây này không?
d) H ãy tìm khoảng tin cậy 95% cho các hệ số hồi quy.
e) H ãy tính r 2 và giải thích ý nghĩa của kết quả nhận được.
f) V ới m ức phân bón là 20 tạ / ha, hãy dự báo giá trị trung bình và giá
trị c á b iệ t của năng suất vái hộ số tin cậy 95%.
i) Hãy đọc kết quả và giải thích các kết quả do MFIT3 đưa ra Năm Phân.bón(X) Năng suất(Y) Năm Phân bón(X) Năng suất(Y) 1990 6 40 1995 18 58 1991 10 44 1994 22 60 1992 12 46 1995 24 68 1993 14 48 1996 26 74 1994 16 52 1997 32 80
Trước k h i ước lượng m ồ ị 90
h ình ta vê đ ồ th ị m ô tả quan
hệ giữ a “ N ăng suất- Y ” và
lượng ‘ễ Phân bón-X ) tính trên
m ộ t hecta. T rên hình (2.7) ta
n h ận x é t rằng hàm hồi quy
tổng thể b iểu thị quan hệ giữa 20 10 Y và X là tuyến tính . 0
D o đó ta có thể ước lượng 0 10 _ 20 30 40 Phán bón
được hàm này bằng phương
Hình 2.7: Sản lượng và phân bón p háp OLS.
Hàm hổi quy tổng thể có dạng: E(Y/X|) = p, + p 2 X, và hàm hổi quy mẫu: Ỷ ^ P ^ P i X ; . 41
Bây giờ ta sẽ tìm các p , dựa trên bảng tính các giá trị trung gian sau đây.
Bảng 2.6 : ước ỉưạng các tham số Yi X* y> y* X, X2, >'ì X| ei * ẳ X1, 40 6 -17 289 -12 144 204 37.08 2.92 8.5264 36 44 10 -13 169 -8 64 104 43.72 0.28 . 0.0784 100 46 12 -11 121 -6 36 66 47.04 -1.04 1.0816 144 48 14 -9 81 ■4 16 36 50.36 -2.36 5.5696 196 52 16 -5 25 -2 4 10 53.68 -1.68 2.8224 256 58 18 1 1 0 0 0 57 1 1 324 60 22 3 9 4 16 12 63.64 -3.64 13.2496 484 68 24 11 121 6 36 66 66.96 1.04 1.0816 576 74 26 17 289 8 64 136 70.28 3.72 ‘13.8384 676 80 32 23 529 14 .196 322 80.24 -0.24 0.0576 1024 570 180 0 1634 0 576 956 57« 0 47.3Ơ56 3816
Từ bảng tính ta có: Y = 570/10 = 51; X = 180/10=18 .
P i = ỉ Ềy lx l / 2 X = 9 5 6 /5 7 6 = 1,66. M i-1
P , = Ỹ - P 2 * X = 57- 1,66* 18 = 27,12
Vậy đường hổi quy mẫu l à : Ỹ, = 27,12 + 1,66 X j.
a. Ỹ nghĩa kinh tế của các hệ số p
Theo lý thuyết, khi tàng lượng phân bón cho một ha thì năng suất cây trổng sẽ
tâng, p 2 = 1,66 > 0, kết quả này phù họp vối lý thuyết Con số 1,66 cho biết nếu
chúng ta tăng thêm một tạ phân bón / ha thì sản lượng sệ gia tăng 1,66 / ha. f i t =
27,12 cổ nghĩa là khi khổng bón phân (X—
0) thì năng suất trung bình của loai cây trên là 27,12 tạ /h a .
b. Độ lệch tiêu chuẩn của các ậ :
Phương sai của các p được cho bởi các cổng thức sạu đây: 42 V a r( yậ,) =
tức này ơ2 chưa biết, ước lương cùa nó là: ở 2 = —— = 47,3056 / 8 = 5,9132; n - 2
à = 2,432. Thay ở 2 vào các biểu thức trên và lấy căn bậc 2 ta có độ lệch tiêu chuẩn tương ứng: se ( P ,) =
2,432 = 1,98 ; se( /? 2) = 2,432/ V576 = 0,101; c.
M ức phán bón / h a có ảnh hưởng đến năng suất cùa loại cây trên
không? Để trả lời câu hỏi này, ta phải kiểm định giả thiết sau đây: Ho: 33 = 0 H| : P2 * 0.
t2 = (yố2 - Ị3j) / se(yỡ,J = (1,66-0) /0,101 = 16,43.
Với mức ỷ nghĩa 5%, ta có (0025(8) = 2,306. I tj I = 16,43 > 10025(8), do đó
giả thiết Ho bị bác bò. Điều này có nghĩa là lượng phân bón / ha có ảnh hưởng đến năng suất. d.
K hoảng tin cậy 95% cho các hệ số hồi quy:
Khoảng tin cậy của các hệ số hổi quy được cho bởi công thức sau:
( yỡi - 1 a/2 (n-2) se (p i) < P i< P i + 1 ờ/2 (n-2) se(yờj)) , i =1,2.
Khoảng tin cậy đối với Pi :
(2 7 4 2 - 2,306* 1,98 < p, < 27,12 - 2,306* 1,98) 22,55 < p , < 31,69
Khoảng tin cậy đối vối p2 :
(1 66 - 2,306* 0,101 < p2 < 1,66 - 2,306* 0,101 ) 1,43 < p ,< 1,89
e. H ệ số r 1: r2 = ESS/ TSS = (TSS- RSS) / TSS = (1- RSS/TSS) r3 = 1- 47,3056/1634 = 0,971.
Như vậy lượng phân bón giải thích xấp xỉ 97% sự biến thiên của năng suất. f
Dự báo giá trị trung binh và cá biệt khi mức phân bốn là = 20 tạ / ha:
Phương sai của giá trị trung bình: 43 VarCf0W
( - + (* ° X- ) = 5,9132 ( - L + g ^ j p L ) = 0,63238. n ^ x 2 M Se(ỷ0) = 0,795.'
Phương sai cùa giá trị cá biệt: Var(Y0)={ X ° ~ X )- ) = 6,54558 ; Se(Y0) = 2,558. " t/-1 x‘.
Một ước lượng điổm của năng suất khi mức phân bón là 20 tạ / ha.
ỷ0 = 27,12+ 1,66 * 20 = 60,32 to.o2í(8) = 2,306.
Khoảng tin cây 95% cho mức sản lượng trung bình là:
Ỳ0 - se( Ỹữ )t0,02s(8 ) < E(Y/ x„ = 20) < Ỵ 0 + se( Ỳ0 > ^ ( 8 )
60.32 - 0,795* 2,306 < E(Y/ Xo = 20) < 60,32 + 0,795* 2,306
58,468 Do vậy khoảng tín cậy 95% cho mức sân lượng cá biệt là:
Y0 - se(Yo)to,oj5(8) < Y0 < yo + se(Y0)t002J(8)
60.32 - 2,558* 2,306 < Y„ < 60,32 + 2,558* 2,306 54,421 < Y0< 66,218 Ị
hẵ K ết qu ả ước lượng mò hình này bằng M FIT3:
Ordinary Least Squares Estimation
>|B^^4c^Jfe3K3|r>|r3|c3^4c9^4c3fca#c9|(i|ca|e4(4«3|ca|cafca|c3fc3|e3fca|(ỉf«aÌ«4**l«*K:4«3|«*Ì(a|«4(3|c3|c>Ìe3Ì>4e>|e3Ìe3Ìe4e3f<4c9|eaiaica|caÌcỉfcafc Dependent variable is Y
10 observations used for estimation from 1 to 10
I|ti|(%^9fr4e9|c3|c9|c3#c3fc3|c3fc4c3|c4e9fe3fe3fe3ic3|<3|ca|e3|(3f(>|(4e4*3|cỉlc4c3fca|(3ieai(9fc3f(ỉfc3fcafc9ic3ic3ic4e3|e#cafv9#:3|c3ie9ic9|c3|e3|c3tea|eafe9f(ace Regressor Coefficient Standard Error T-Ratio[Prob] 1NPT 27.1250 1.9793 13.7046[.000] X 1.6597 0.10132 16.3808[.0C0] R-Squared
.97105 F-statistic F( 1, 8) 268.3312[.000] R-Bar-Squared .96743 S.E. of Regression 2.4317
Residual Sum of Squares 47.3056 Mean of Dependent Variable 57.00
S.D. of Dependent Variable 13.4743
Maximum o f Log-likelihood -21.9596 DW-statistic 1.7836 44 M ột số Uiuật ngữ:
Ordinary Least Squares Estimation: ước lượng bình phương nhồ nhất cổ điển
Dependent variable = Biến phụ thuộc Observation = 'Quan sát
Regressor = Biến độc lập; Các phần mềm kinh tế Iuọng đếu coi hệ số chặn
được nhân với một biến mà biến này chỉ có giá trị dùy nhất bằng 1. INPT là tên
thường được dùng cho iúến này. Nếu muốn, ta có thể dùng tên khác. Ở phương
pháp ma trận ta sẽ thấy tiện ích cùa vấn để này.
Coefficient = Hệ số - giá trị cùa các P tuong ứrtg với bộ số liệu dùng để uúc luọng;
Standard Error = Đ ộ lệch tiẻu chuẩn - các se( P )\
T-Ratió[Prob] = Tỳ số t[ Xác suất ] = p / se( P )[Prob];
[Prob] = p- value = P( I t(n-2) I > I p / se( p ) I). Có thể dựa vào giá trị này để
kiểm định giả th iế t: H o: Pi = 0 ; H | : (3ị * 0;
Nếu như a > p, suy ra a / 2 > p / 2 và t 0/2 < t p /2 thì Ho bị bác bỏ. Trường hợp
ngược lại, nếu a < p, suy ra t / 2 > t , /2. Với t(n-2) < t p/2 thì t(n-2) cũng nhỏ hcm t
a n . Điều này có nghĩa là khổng có cơ sờ bằc bỏ H,. Như vậy nếu a > p thì Ho bị
bác bò, a < p thì không có cơ bác bỏ Ho. ■
Chú ý rằng p-value trong phâíi bố T, khi dùng MFTT3, được tính bằng công thức: JV-
value = P( I t(n-2) I > I y ồ /s e (/5 )|). Nếu chúng ta kiểm định một phía, ngWa là H,: p,
> 0 (hoặc Ị3ị < 0) đù cần so sánh a • với p/2 sau đó kết luận một cách tuơng tự.
R-Squared = r2; R-Bar-Squared = r đã hiộu chỉnh, được ký hiệu là :~ p .
Residual Sum o f Squares = RSS = Tổng bình phương của các phẩn dư.
S.D. o f Dependent Variable = Độ lệch tiêu chuẩn của biến phụ thuộc = ỵợrằ -ỹy F-statistic F( 1,
8) = 268.3312[.00Ọ]. Giá trị F (l,8) được tính bằng công thức 1ể^ * n Ệ2 • .ặ ■ P( 1 g) = —1— ■
- . Trong hổi quy hai biến giản đơn, giá trị này cũng bằng bình
phương của tỳ số t ứng với hê số góc, trong ví dụ này, ta có t2 = 16,3808. Bình
piiuỡng tị ta có (16.3808)2 = 268,3306. Kiểm định F ở đây là kiểm định một phía vì
Ho I3 - 0- Hj: r3 > 0. Do đó giá trị p-value được so sánh trực tiếp với a .
s E o f Regression = độ lệch tiêu chưẩii cùa hàm hồi quy - .
Mean o f Dependent Variable = Trung bình cùa biến phụ thuộc. 45 2.
Thí dụ 2 3 : Cho kết quả ước lượng sau đây bằng MFIT3, trong đó Y- tổng
chi tiêu; X- thu nhập sau thuế trong khoảng thời gian (1986-1997) và cho X = 145; £ x,2 =4817. M
Ordinary Least Squares Estimation
************************************************************* Dependent variable is Ỵ
12 observations used for estimation from 1986 to 1997
*************************************************************** Regressor Coefficient Standard Eưor T-Ratio[Prob] : ENFT 2.1288 7.1641 ễ29715[.772] X . ' .86118 .048943 17.5955[.000]
****** I*.******************************************************** R-Squared .96871 F-statistic F( 1, 10)- 309.6016[.000] R-Bar-Squared .96558 S.E. of Regression 3.3951
Residual Sum of Squares 115.2685
Mean of Dependent Variable 127.0000
S.D. of Dependent Variable 18.3005 Maximum of Log-likclihood -30.6014 DW-statistic 1.7822 .
*************************************************************** a.
Hãy viết hàm h6 i quy m ỉu và cho biết kết quả ước lượng có phù hợp với lý
thuyết kinh tế không? Vì sáo?
b: Với mức ý righĩa 5%, phđn tiêu dùng không phụ thuộc vào thu nhập có khác không hay không?
c. Với m íc ý nghĩa 5%, thu nhập sau thuế có ảnh hường đến mức tiêu dùng hay không?
d. Hãy tìm khoảng tin cây 95% cho hệ số góc.
e. Cho mức thu nhập sau thuế ià 150, hãy dự báo giá trị trung bình và giá trị
cá biệt cùa mức tiêu dùng với hê số tin cậy 95%. 46
BÀI TẬP: CÁC KHÁI NIỆM VÀ MÔ HÌNH HỒI QUY HAI BIẾN
2.1. Hãy giải thích các khái niệm sau đây:
a. Hàm hổi quy tổng thể và hàm hổi quy mẫu.
b. Yếu tố ngẫu nhiên và phần dư.
c. Các hệ số hổi quy, ước lượng của các hệ số hồi quy. d. Tự tương quan.
e. Phương sai của sai số đồng đều. f. Hàm hổi quy tuyến tính.
2.2. Cho các mô hình sau đây, mỏ hình nào là tuyến tính đối vói tham số, mỏ hình
nào tuyến tính đối với các biến số, mô hình nào là tuyến tính đối với cả tham
số và cà biến số? M ô hình nào là mô hình hồi quy tuyến tính? a . Y = p, + p2 / X + U ; đ. Ln(Y) = Pi + Pj ln(X) + U; b. Y = p, + p ,ln (X ) + U; e. Ln(Y) = p, + p 2 / X + U; c .L n (Y )= 0i + p2 x + u .
2.3. Các mô hình sau đây có phải là mờ hình hổi quy tuyến tính?Vì sao? a. .Y = exp(|3| + p2 X + U).
b. ¥ = 1 /( 1 + exp(Pi + p 2 X + U)). c. Ln(Y) = p, + p2 / x + u d. Y = 3 , + p2í x + u
2.4. Hãy biến đổi các mô hình sau đây về mô hình hồi quy tuyến tính. a. Y = l / ( P , + Pi X);
b. Y = X / (P, + Pí X);
c. Y = 1 / ( 1 + exp(-Pi - p2 X)).
25. Cho các giả thiết ờ cột (1), hãy chì ra rang các giả thiêt ở cột (2) là tuơng đuong.
Các giả thiết cùa mô hình hổi quy cổ điển 0 ) (2) E(Ưi / Xi ) = 0 E(Y ./X i) = p , + p 2Xi
Cov(Ui, Uj) = 0 , i * j Cov(Yi, Ỵj) = 0, i * j Var(Uị / X |) = 0 Var( Yị / X i) = 0.
2.6. Trong mô hình Yi = Pi + Pí Xị + Uj.
a. Nếu ta nhân mỗi Xi vdi một hằng số, chẳng "hạn 10, khi đó các e và
các giá trị ý sẽ thay đổi? Hãy giải thích?
b. Nếu ta cộng vào mỗi X| với một hàng số thì các e và các giá trị sẽ
thay đổi không? Hay giải thích? •47
2.7. Bảng duới đây cho cặp' biéh phụ thuỏc và độc lập. Trong mỗi trơông họp
cho biết quan hộ giSa hai biến li: cùng chiềui ngược chiẻu hay không xác định. Hãy giải thich. B iế n P h u th u ỏ c B iế n đ ò c lả p a. GNP Lẫi suất b. Tiết kiệm cá nhân Lãi suit c. Cẩu về tién GDP d. Sản lượng
Vốn cơ bản( hoăc lao động) e. Lượng cẩu vé xe máy ' Giá Xăng f.
Lượng điện tiêu thụ của G á ga hộ gia đình. .
2.8. Bảng sau dãy cho chuỗi thòi giạn về mức áSu dừng (Y) / đầU ' người và thu
nhập( X) / đầu nguời tính theo giá cố định (1980, dơn vị: 100.000 VNĐ) Song
thời kỳ từ 1971-1990 ò một địa phương . ’ . Năm Y X Nàm Y X 1971 48,34 52,02 1981 57,17 . 6 3 3 6 ! 1972 48,54 52,41 Ỉ982 60,84 67.42 1973 47,44 51,55 1983 60,73 67Ị86 1974 54,58 58,88 .1984 76,04 §3,39 1975 55,00 59,66 1985 76,42 84,26 1976 63,49 68,42 1986 69,34 77,41 1977 59,22 64,27 1987 61,75 70,08 1978 57,77 63,01 1988 68,78 77,44 1979 60,22 65,61 1989 67,07 75,79 1980 55,40 61,05 1990 72,94. 81,89
Từ bảng trèn tính đuợc: X
- 76,289; Y = 61,054; X;2 = 1961Ị1;
X* = 92520; y ỉ = 1414,7; I X! y€ = 1658,2. a. Hãy ub.
Hãy cho biết kết quả uớc lượng có phù bop với lỷ thuyết kinh tế không? V isao? c.
Hãy tính ESS, RSS, ước luọng của phương sai cùa u. d.
Vói hệ số tin cậy 95% hãy úm khoẻng tin cậy cùa các Kệ 'số hồi quý, e.
Với mức ý nghĩa 5% hãy kiểm định giả thiết p2 = 0. Tdr kết qúả nhân
được hãy nêu ý nghĩa m ặt kinh tế cùa kết luânT
g. Hãy tính và giải thích ý nghĩa của I1.-.
2.9. Quan sát ngẫu nhiên 10 người trong Ị tuẩn người ta có các .sđ liệu sau: 48 Thu nhập $ (X) 31 50 47 45 39 50 35 40 45 50 Chi tiêu $ (Y) 29 42 38 30 29 41 23 36 42 48 ắ' 10 10 10
Người ta tính được: = 547,6 ;
= 403,6 ; / . y Ị X I = 385,4 ; 1=1 /-I /=1 RSS = 132,3561. Cho a = 5%.
a. Bộ số liệu trên thuộc loại số liệu gì?
b. Ước lượng hàm hồi quy dạng tuyến tính: Y = pi + (32 X + u
c. Nâu ý nghĩa kinh tế của các hộ số hổi quy ước lượng dược. Các giá trị đó
có phù hợp với ly thuyết kinh tế không?
d. Tìm r bằng 2 cách ứng với 2 trường hợp: biết và không biết RSS. Giải thích ý nghĩa r2?
e. Có ý kiến cho rằng thu nhập không ảnh hưdng đến chi tiêu, bạn hãy nhận
xét về ý kiến này(thực hiện bằng 2 kiểm định: t và F).
f. Tim khoảng tin cậy 95% cho hệ số góc.
g. Trong các thời kỳ trước người ta vẫn đùng 80% thu nhập cho chi.tiỄu, có
thể kết luận rằng trong thời kỳ quan sát tỷ lệ này đã giảm hay không?
h. Hãy dự báo mức chi tiêu trung bình nếu thu nhập tuần là 42$.
2.10. Một công ty sản xuất một loại sản phẩm. Lượng sản phẩm (Q) mà cồng ty
sản xuất phụ thúộc vào giá sàn phẩm này trên thị trường (P). Dựa trên số liệu trong
27 tháng từ tháng 1 năm 2006 đến tháng 3 năm 2008, người ta ước lượng được mô
hình dưới đây. Cho a = 5%; Q tính bằng 1000 sản phẩm, p tính bằng nghi đồng!
Ordinary Least Squares Estimation
* * * * * * **** * * * * * **** **** * * * * ** * * * * * ** ** * * * * * * * * * * * * * * * * * * * * * * * * * Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
***************************************************************** Regressor Coefficient Standard Error T-Ratio[P-ob] p 0.389687 0.118694 3.283121 [C0028} INPT 10.31076 2.586328 3.986638 [0.0004]
***************************************************************** R -Squared 0.277958 F-statistic F( 1 ,2 5 ) 10.7788[.0027] R-Bar-Squared 0.25217 S.E. of Regression ' 3.989267
Residual Sum o f Squares 445.599 ■ Mean o f Dependent Variable 18.45833
S.D. of Dependent Variable 4.613 Maximum of Log-likelihood -83.04149 DW-statistic 2.409
a. Viết hàm hổi quỵ tổng thể', hầm hổi quy mẫu. 49
b. Hệ số chặn và hộ sổ góc đuạc ước lượng bằng bao nhiêu?
c. Cấc hộ số thu được từ hàm hồi quy m&ú có phù hợp lý thuyết kinh tế không?
d. Các hê sổ của mô hình có ý nghĩa thống kê không? Con số [Prob] cho biết điều gi?
e. Có thể nói rằng khi giấ thay đổi thì lttợng cung có thaỳ đổi không?
f. Hệ số xác định đo độ phù hợp cùa hầm hỏi quy bằng bao nhiêu, giá trị đó có ý nghĩa gì?
g. Hàm có thể coi là phù hợp khững?
h. Tìm ước lưạng điểm cho phuong sai y.ếú tố ngỉu nhiên L
Tồng bình phương phần dư bằng bao nhiêu? j. TSS và ESS bằng bao nhiêu?
k. Tìm khoảng tin cậy cho hẹ số chặn và hệ số góc của mô hình 1.
Khi giá tăng thêm 1 nghìn thì lượng cung thay đổi trung bình trọng khoảng nào?
m. Khi giá tăng 1 nghìn thì lượng cung tăng tối đa bao nhiêu?
n. Có thể nói khi giá giảm 1 nghìn .thì luợng cung giảm 0,5 đom vị được không?•
o. Tìm một ước lưọng diểnỊ cho lưọng cung khi giá là 10,5 nghìn đổng,
p. Tìm lượng cung trung bình và cá biệt khi giá là 10,55 nghìn đổng.
2.11. Một cơ quan nghiên cứu mối quan hệ giữa số đơn vị sản phẩm và các yếu tố
đẩu vào của quá trình sản xuất một số ca sở sản xuất đã đưa ra những mô hình
hồi quy. Lúc đầu người nghiẽn cứu chú trọng vào quản lý nguồn nhân lực nên đưa - ra mồ hình sau:
Với s là sản lucmg, L là lao động (người). Cho á =5%.
Ordinary Least Squares Estimation Ordinary Least Squares Estimation Dependent variable is s
20 observations used for estimation from 1 to 20 <• Regressor Coefficient Standard Error T-Ratio[Prob] INPT 34.4438 29.0219 1.1868[.251] L 19.2371 6.8786 2.7967[.012] R-Squared
.30290 F-statistic F( 1,18) 7.8213[.0'2] R-Bar-Squared .26417 S.E. of Regression 49.5267 Residual Sum o f Squares
44152.1 Mean of Dependent Variable 109.4666
S.D. o f Dependent Variable 57.7367 Maximum o f Log-likelihood -105 .3754 DW-statistic 0.7151
***************************************************************** 50
a. Viết hàm hồi quy tổng thể, hàm sổ đó và các tham số có ý nghĩa như thế nào?
b. Viết hàm hổi quy mẫu. Các hệ sô' cùa hàm hổi quy mẫu có phù hợp lý thuyết kinh tế không?
c. Theo lý thuyết thì khi không có lao động sẽ không có sản lượng, nhưng
trong hàm hổi quy mẫu thì khi không có lão động ước lượng điểm mức sản
lượng lại không bằng không. Trên thực tế gia trị đó có thể coi là bằng 0 hay không?
đ. Hộ số góc của mô hình có ý nghĩa thống kê không?
e. Hệ số xác định bằng bao nhiêu %, giá trị đó có ý nghĩa như thê' nào? f.
Có thể nói hàm hồi quy phù hợp không?
g. Tim ước lượng điểm và khoảng cho phương sai yếu tô' ngẫu nhiên.
h. RSS, TSS, ESS bằng bao nhiêu? i.
Tim khoảng tin cậy cho hê sô' chận của mô hình. j.
Khi doanh nghiệp thêm một lao động thì sàn lượng tăng trong khoảng nào?
k. Khi giảm bót 1 lao động thì sản lượng giảm tối đa bao nhiêu đơn vị? 1.
Có thể cho rằng khi bớt 1 lao động thì sản lượng giảm 30 đơn vị được không?
m. Nếu tăng 1 lao động thì sản lượng tăng nhiều hơn 20 đơn vị có đúng không?
n. Tim ước lượng điểm mức sản lượng với doanh nghiệp có 30 lao động.
o. Tìm mức sản lượng trung bình và cá biệt khi doanh nghiệp có 30 lao động? 51 CHƯƠNG in Hổi QUY Bội
Mô bình bồi qui hai biến duạc trình bày ở chuông n là một mô hình giản đem
nhái. Trong nhiẻu trường hợp mô hình này khống phù họp ví có nhièu biến tác
động đến biến phụ thuộc Y, nếu như chì dùng một bịến độc lập thì khổng thể giải
thích đuạc sự biến đổi cùa biến Y. Chẳng hạn khi nghiên cứu nhu cầu về một loại
hàng hóà nào đó (Y ), thì nhu cầu này phụ thuộc vào nhiều yếu tố, trước hết là: thu
nhập của người tiêu dùng, giá của bản thân bàng hóa, giá cùa các loại hàng hóa
thay thế tỊ*ng hóa này ... Do đó cần phải mở rộng mô hình hồi quy hai biến thành
mô hình có chứa nhiều biến hon, ờ đây là mô hình hồi quy bội 3 biến và sau đó sẽ
trình bày mỡ hình dưới dạng tổng quát có số biến độc lập bất kỳ bằngiphuong pháp ma trận.
3.1. MÔ HÌNH HỒI QUY BA BIẾN
Giống như bong mổ hình hai hiỄh, hằm hồi quy 3 biến của tổng thể PRF có dạng; E ( YI ) = Pi + p2 + P jX ỉ ( 3 .1 )
PRF là kỳ vọng cố điều kiên của biến Y với giá trị đã cho của các biến và Xj
Trong đó Y : Biến phụ thuộc; Xì, X j: Các biến độc lập.
Pi : Hệ số tự do ( hệ số chăn ), nó chính là giá trị trang bình cùa biỗh Y khiX j= X3 = 0.
p2 , p3 : Gọi là các hộ số hồi qui riêng.
Ỵ là giá trị của biến Y quan sát thứ i, khi đó:
Ỵ = E ( Yl Xa . X,,) + ự = p, + Pa Jfc + .p, Xji + ụ .
LỊ là yếu tố ngẫu nhiên, sự tồn tại cùa u đã được giải thích ở chương I.
3.2. CÁC GIẢ THIẾT CỦA MÔ HÌNH
- Các l í có kỳ vọng bằng 0 : E ( Ụ i Xa . Xj i ) = 0 ( V i )
- Khổng có sự tương quan giữa các Ư,: Cov ( ụ , Uj ) = 0 Vi * j
- Các 15 thuần n h ấ t: Vai ( U ) = a2
- Giữa các biến giải thích X2, X3 không có quan hệ tuyến tính
- u có phân bố N ( 0 , o 2).
Trong mô hình hồi quy bội có thêm một giả thiết mới - giả thiết thứ 4 - giữa
các biến Xị, x 3 không có quan hệ tuyến tính. Nếu I)hư X iJii có quan hộ tuyến tính
với nhau thì nguời ta nói răng có hiện tượng đa cộng tuyến. Chúng ta sẽ giải thích 52
một cách sơ lược về giả thiết này. ở chương V chúng ta sẽ giải thích sâu hơn. Các
giả thiết khác đã được nói ở chương II.
Vê mật hình thức, nếu như có hiện tuợng cộng tuyến giữa cắc biến giải thích
và trong mô hình có tất cả các biến này (hì chúng ta không thể tách được ảnh
hưởng cùa từng biến lên biến biến phụ thuộc Y. Thật vậy: Giả sử Xa = 3Xj| Khi đó Yi
= p, + & Xji + (3, X,, + Ụ = P, + 3 P Ĩ Xa + pjX ji + U
= Pi + ( 3 P2 + p3) x 3[ + Ụ Đặt
P3 = 3 P2 + P3 => Yi = (3] + P3 x 3i + Ư,
Như vậý trên thực tế ta có mô hình hai biến mà không phài là mô hình ba biến.
Uarc lượng mô hình này bằng phương pháp OLS ta tìm được p ' 1, P ’2 là ước lượng
cùa p, và p3 . p ’2 là ảnh hưởng kết hợp của Xj và x 3 lên Y. Chúng ta khống có
cách nào để tách riêng ra trong P ’2 bao nhiêu là p3.
Giả Ihiết 4 nói rằng hàm PRF chỉ chứa các biến giải thích mà chúng không
phải là hàm tuyến tính của một vài biến nào đó trong mô hình.
Ỹ nghĩa của các hệ số p2 và
E ( Y I X i i ^ i) = p 1 + pjX ii + P3X i .
= p2 . Điêu này có nghĩa là khi chúng ta giữ nguyên yếu tỐXí (Xì- ÕX2
constant) thì giá trị trung bình cùa biến phụ thuộc Y sẽ thay đổi (tẫng hoặc giảm tùy thuộc
vào dấu của P2 ) P2 đơn vị cho mỗi đơn vị tăng cùa yếu tố X2.
— — = P3 điẽu này có nghĩa là giá tri trung bình cùa biến Y tăng ( hoặc giảm) â X y
03 đơn vị cho mỗi đơn vị tăng của x 3. Nhu vậy các hộ số tíồi qui riêng ( hệ số góc) phản
ánh ảnh liuủng của một biến giải thích đổi vói giá trị trung bình cùa biến phụ thuộc khi giá
trị cùa biến giải thích khác chứa trong mô hỉnh không đổi.
3.3. u ớ c LUỢNG CÁC THAM s ố CỦA MÔ HÌNH Hồi QUY BA BIẾN
Để ước lượng các tham số của mô hình:
E ( YlXji, X31) = Pi + P2 Xji + P3 Xji 53
chúng ta sử dụng phuong pháp bình phương tối thiểu OLS, tư tưởng chính của
phuong pháp này đã được trình bày ở chương n . »i - ; •; '
Giả sử chúng ta có n quan sát, quan sát thứ i-có 3 giá tri ứng với Y, Xĩ,
vàX 3,k íh iệ u ( Ỵ ,J Q ỉí,Xal). ; ’ í .
Hàm hồi quy mẫu SRF được xây dụng tìm quan sất này có dạng: Yj = p, + p 2 Xái + P3 Xai
Trong đó Pi : i= l,2 ,3 là ước lượng tương ứng cùa P i: i=l,2,3. K hiđó Yi=p, +
Xii + p 3 X^ị + e,; e, là phần dư ứng với quan sát thứ i,
é, = Ya - ỹ | = Y, - Pi - P2 Pa
Phuơng pháp OLS tính giá trị cùa các tham số Pi , P2 , P3 sao cho:
RSS= £ ^ * = 1/ ( Ỵ - P, - P j X a - P j Xj , ) 2 =>min. A iBU A ,
Các tham số P ị, P2,P 3 đuợc tính từ hệ phương trình chuán sau đây: P . + p 2 X 2 + P3 x 3= Ỹ
P i £ x « + ậ , í X ị , + P x í X3ễ= z YịXa j»l i»l i«l i-1 i-| P, í *31+ P2Ỉ
x3j + p , ỉ XỈi = Ỳ Yi x3i. i«al i»l i»l i»l Trong đ ó : x , = ỉ
5 W n ; X 3= ỉ X a / n ; Ỹ = í Y , / n . Đặt :yi = Yị - Y ;
Xjj = Xj j “ X 2 í X j j = J ^ j - X3 .
Giải hệ phương trình ta đ u ợ c;
ậ , - Ỹ - p 2 x 2 - p , x 3
( ẻ >'‘*ỉ i M È xĨ ‘J - ( Ệ M i X ỷ ix2ixj i J P — 1-1 1=1 M W
( Ỹ j xì ‘) ( Ỳ j xh ) - ( Ỳ é Xĩ i x } i ) 2 i-l /-/ 1*1
ix3ỉ X ^ j x2j) “ ( £ y j* 2 i x3i) P _ _ i i ______ i-1 Ị-Ị______ ị-Ị______ 3 A
J L , r ~ ĩ -------------------
(zC XJ i X 2 X3i)_ ( 2 j X2iX3i)2 . » . w i-1 i-l
Pi . P2 . P3 dược gọi là các uớc lượng bình phưcmg nhỏ nhất. 54 T h í dụ 3.1
Bảng sau đây cho số liệu về doanh thu 0 0 , chi phí- cho quảng cáo (X2) tiền
lương của nhân viên tiếp thị (X3) của 12 công ty tu nhân (đơn vị 1.000.000 đ ) . Xây
dựng hàm hồi quy Ỵ phụ thuộc vào Xì, x 3. STT Y X, I X, X ,=x,- X , Xi— X, - X , 1 1 127 18 10 -2,417 -2,167 -14,333 2 149 25 11 4,583 -1,167 7,667 3 106 19 6 -1,417 -6,167 -35,333 4 163 24 16 3,583 3,833 21,667 5 102 15 7 -5,417 -5,167 -39,333 6 180 26 17 5,583 4,833 38,667 *7 161 25 14 4,583 1,833 19,667 8 128 16 12 -4,417 -.1667 -13,333 9 139 17 12 -3,417 -.167 -2,333 10 144 23 12 2,583 -,167 2,667 11 159 22 Ị4 1,583 1,833 17,667 12 138 15 .15 -5,417 2,833 -3,333 1696 245 146 0 0 0 STT Xi1 Xj- yx2 y*3 X2X3 y' 1 5,840 4,694 34.Ổ3Ộ ỈĨ.Ỗ5Ổ 5,236 ÌỎ5.444 2 21,007 1,361 35,139 -8,944 -5,347 58,778 - 3 2,007 38,028 50,056 217,889 8,736 1248,4 4 12,840 14,694 77,639 83,056 13,736 469,444 5 29,340 26,694 213,056 203,222 27,986 1547,1 6 31,174 23,3611 215,889 186,889 26,986 1495,1 7 21,007 3,361 90,139 36,056 8,403 386,778 8 19,507 ,028 58,889 2,222 ,736 177,778 9 11,674 ,028 7,9722 ,389 ,569 5,444 10 6,674 ,028 6,889 -,444 -.431 7,111 11 2,507 3,361 • 27,972 32,389 2,903 312,111 12 29,340 8,028 18,056 -9,444 -15,347 11,111 192.917 123,667 836,333 774,333 74,167 5924,7
Theo kết quà bảng trên đây ta có: Y =1696/12 = 141,3333.
x 2 = 245/ 12 = 20,4167 X j =146/ 12 .= 12ÌÌ667.
Theo các công thức ( 3ế2 ): ’
8 3 6 ,3 3 3 3 -1 2 3 ,6 6 6 7 -7 7 4 ,3 3 3 3 -7 4 ,1 6 6 8 P 2 -
192,9167 • 123,6667 - (74.16668)2 ’
ậ = 4 7587. P, = 141,3333 - 2,5057 . 20,4167 - 4,7587 . 12,1667 = 32,2773. 55 e, é*! 124,9673 2,0327 4,1319 147,2661 1,7339 3,0064 108,4383 -2.4383 5,9453 168,5530 -5,5539. 30,8450 103,1741 -1,1741 1,3785 178,3240 1,6760 0,2940 161,5422 -0,5422 0,2940 129,4732 -1,4732 2,1703 . 131,9790 7,0210 49,2944 147,0134 -3,0134 9,0806 154,0250 4,9750 24,7506 141,2436 -3,2436 10,5209 0 144,2269 PHUONG NHỎ NHẤT Phương sai và độ l
ộ Ịệch chuẩn của các ướ ư c ớ lượng
lượng bình phương nhồ nh nhắ t đuợc
cho bồi các công thúc: sau đ& đ y & : y Ỉ xỉi !■
v ar( ậ j ) = __ ;________ 2-2__________ — o 2
( Ỉ 4 X Ỉ 4 ) - (Jxj.xj, )2 £ x | , (1 - rẳ) i-1 i-l i-l Í_1
Trong đó r23 là hệ số tuơng quan mẫu giữa biến Xi và X j. se ( ) = -y/variPj) p l i-l v a r ( P 3 ) s — --------f
(TẨxi)( ỵ ixi ) - ( ỵ gxilx3l)ỉ W i- 1 M / „ !
s e ( P 3 ) = VvarCP3) ; co v ( p 2 , ậ 3 ) = ------------
ẳO - t Ề y í x ị J Ì x ỉ , 56 ( È x 2ix 3i) ’
Trong đó 123 là hệ số tướng quan giữa biến Xi và Xi .r ả = V 2 v ~ 2-i*2i Z j X3Ị
Trong các công thúc ưên ơ2 là phương sai c ủa Uị nhimg chưa biết, u&c lượng
không chêch của o 2 l à : ơ 2 = = ẼỄỄ. n - 3 n - 3
3 là số tham số của mô hình, trong trường hợp tổng quát nếu mô hình có k
t h a m s ố p ,, 02 ... pk thì Ớ 2 = ỉ e‘/ ' ( n - k Ỵ
Với các SỐ liệu thí dụ 3.1, ta có:
ik=144,2269/ 9 = 16,0252 n - 3 123,6667 » /----- - ĩ —
Var( p 2) = i 3 3 ^ 6 7 5 -16,0252 * 0,107959;Se( p 2)=1/v a r ( p 2) =0,32857
Var < p 3 ) = ĩ S ă r S ỉ •l 6 ’0 2 5 2 * ° ’16841 :Se( Â ) = # i ) = ° '41038 ■ 1o3j 0 , 0 / j
3.5. MÔ HÌNH HỒI QUY TUYẾN TÍNH K BIẾN-PHUƠNG PHÁP MA TRẬN
Phần này giới thiệu với bạn đọc mô hình hồi quy bội k biến bằng ngôn ngữ ma
trận. Với ngôn ngữ ma trận kết hợp với kỹ thuật tính toán cho phép chúng ta giải
quyết các ván dề cùa phân tích hồi quy một cách nhanh chóng, chính xác.
Hàm hồi quy tổng thể có dạng
Yj = Pi + piX* + Ể.. + pkXki + Uị
Trong đó (3| là hệ số tự đo (hộ số chặn).
Pj: j = 2 , k là các hệ số hồi quy riêng.
Giả sử chúng ta có n quan sát, mỗi quan sát gồm k giá trị (Ỵ, .....Xci)
Y| = Pi + pĩXíi +••• + PkXci + u, Yĩ = pi + PỉXáí + l i
Y„ = Pi + pỉXín + ... + PkXic, + IỊ, 'V , ' P r ' ' u , ' u 2 Ký hiệu: Y = Y , ; p = ; u = .Yn . .Pk. u ế . 57 1 * 2 1 x n .. ■ X u ' 1 X j 2 x 32 . ■ X ị^ x = Ị , x 2„ x 3n Khi ta có: Y = xp + U
Giả thiết 4 nói rằng giữa các biến độc lập không có quan hệ tuyến tính với
nhau, khi đó các cột của ma trận X lạ dộc lập tuyến tính. Do đó hạng của ma trận X
bằng sổ cột của ma trăn này tức là R(X) = k, ma trận X khổng suy biến.
T h í dụ 3.2. Với thí dụ 3.1 ta có ma trận X như sau: 1,0000 18,0000 10,0000 1,0000 25,0000 11,0000 1,0000 19,0000 , 6,0000 1,0000 24,0000 16,0000 uoooọ 15,0000 7,0000 1,0000 26,0000 17,0000 X = 1,0000 25,0000 14,0000 1,0000 16,0000 12,0000 1,0000 17,0000 12,0000 1,0000 23,0000 12,0000 1,0000 22,0000 14,0000 1,0000 15,0000 15,0000
3.6. UỞC LUỢNG CÁC THAM s ố - OLS
Hàm hồi qui mẫu SRF cố dạng Ỳ , = p , + M 2i + . . . + p k X ki
Y |= P i + P ị X jj + . . . + p k X kj + e i hay Y = x p + e Trong đó e = . = Y -X P
Các uớc lượng OLS duợc tìm bằng cách: 58
£ . 2 = 2 ( Ỵ - p, - p 2X 2i- . . . - p kX ki)2^ m i n i — 1 i*l ỵ e?
là tổng bình phương của các phần dư (RSS). i=j
e'e = ị e ĩ = ( Y - X P )'( Y - x p ) = Y Y - P ,X Y -Y X P+ p 'x x p = Y Y - 2 p'X Y + p 'x 'x p = -2X Y + 2X x p X Y = x x p n £ * 2 i z x 3i ■- ZX/0 ' P . ' 1 * 2 , ■vị I ^ 2 i x 3 i 5 % p2 fo VCỵ I X t à 5 ^ / í: • Ằ . X X P • r 1 1 - i ' I X 2Ì x 22 "■ x 2 n y2 ■■ ► ?» 1 1 ^ 1 X' Y
Với giả th iế t4, X kỊiông suy biến, nên X ’X cũng không suy biến,iđo tíó tồn tai
(X *X) . Từ đó: p = ( X X) A Y.
Thí dụ: Vói ma trận X ở thí dụ 3.2, khi đó: '1 2 245 146' 2,440 -0,0884 -0,0454 X’ X = 245 5195 3055 ; ( x ' x ỵ ' = -0,0884 0,0067 -0,0040 146 3055 1900 -0,0454 -0,0040 0,0105 '1696 32,2773" X Y = 35463,048 : . ậ - 2,5057 21409,652 4,7587 59
3.7. MA TRẦN PHUONG SAI CỦA 3
Để kiểm định giả thiết, tìm khoảng tin cậy. cOng như thục hiện các suy luân
thống kê khấc cần phải tìm var(Pi), ỉ = 1, k và Cov( pi, P j ). Phuơng pháp ma
trận cho phép chúng ta tìm chúng một cách dễ dàng.
Ma trân hiệp phuơng sai của: > a r ( Ậ )
C ơ v í Ậ , ^ ) - CovCPv ếk) VarCpj) -
Cov(P2J k) C o v (P ) = C o v { P k , P C o v ( ệ k J 2 ) - V a r ( p k )
Cov( ậ ) đuợc xác định nhu thế nào? ịì= (X 'V 'X 'Y Y = xp + u
P = (X 'X )lX'(Xp + Ụ) = p + ix'xr'x'u
ậ - P = ( x ' x ) ' ’x ' u
•Cov(p) = E i(P - P) (P - P) ] = E {[(x’x )'‘x ’u ][ ( x ’ x ) ’‘x ’u ] }
= E[(X'X) 'X u u ’X(XX’ )•*]=(X'X) ‘X E(UU')X(X'xy‘
= (X , X)‘IX o2IX (X 'X )' Cov(P) =Ơ 2(X 'JỘ '‘
Trong công thức trên (X X) ■' là ma ừận nghịch đảo cùa ma trận (X X ), a 2 là
Var (Ụ), nhung chua biết chúng ta phải dùng ưóc lược khổng chệch của o 2 là: * = £ e ‘ / ( n - k ) > . , e' e = ■-! er
= i-> ( Y i - Yi ) = Y ' Y - 2 Ỷ ' Y + Ỷ ' Y
= Ỷ' Y - 2 P ' X ' Y + P ' X' XP = Y ’ Y - P 'X 'Y . Với thí dụ 3.2 thì: 39,1009 -1,4164 - 0,72713' C ov(/ớ) = -1,41464 0,10796 - 0,064747 -0,72713 -0,064747 0,16841 60
3.8. CÁC TÍNH CHẤT CỦA UỚC LUỢNG BÌNH PHUDNG NHỎ NHẤT
Trong mô hlnh hồi quy bội các ước lượng binh phương nhỏ nhất có các tính
chất giống nhu trong mô hình 2 giản biến đơn. Ở đây chỉ nêu ra các tính chất, việc chứng minh các
tính chất này duợc .ựình bày trong phàn phụ
lục m .2 , sách ‘! Kinh tế lượng” - Nhà xuất bản Khoa học và Kỹ thuật, 2001. 'Để
đơn giản hoá dưới đây chỉ đưa ra các tính chất đổi với mô hình có hai biến độc lập.
Tuy nhiên những tính chất này đúng cho mô hình có sđ biến độc lập bất kỳ.
1. Đường hồi quy bội cùng đi qua điểm ( Y , x 2 , x 3) 2. Ỹ = Y 3. e, = 0 i-l
4. Các phần dư eị không tương quan với Xa và x 3i, nghĩa là: ỉ Ci Xíi = 2 ^ e, x 3i = 0 i=l i=l
5. Các phần đưe-, không tương quan với Ỹ; : J ’ ei Ỳj = 0 i-1
6. Từ công thức se ( P2 ) và se ( ậ 3 ) ta thấy rằng nếu như giữa Xỉ và X, có
quan hệ tuyến tính quá chặt, Ĩ23 * ± 1 thỉ var( P j ) và var(p3) rất lớn. Do đó ta sẽ
khó khăn trong việc đoán nhận giá trị thực của p2 và p3. Vấn dề này sẽ được giải
thích dầy đủ hơn ở chương V.
7. Từ công thức xác định var( P2 ) và var(P3), la thấy chúng tỷ lệ thuận với ơ2
và Ĩ23, tỷ lệ nghịch .với J
[ X x 3i I ■ Như vậy sự biến thiền cùa Xịi càng lớn thì i-1 Vi=i /
var (Pj) càng nhỏ, hay Pj càng được ước lượng chính xác. 8. P2 , p 3 ■
là các ước lượng tuyến tính không chệch có phương sai nhỏ nhất
trong lớp các lượng tuyến tính không chệch cùa p2 và p3.
3.9. UỚC LUỢNG HỢP LÝ TỐI ĐA ( ML)
Với các giả thiết đã trinh bày ở (3.2) thì Yi ~ N(pi + P2X21 + ... + pk Xịti, ơ2) và
các ước lượng của Pi, p 2
Pk là .p ,,..... Pk thu được bằng OLS và ML là như
nhau Nhưng ước luợng của ơ2 từ ML: ỡ J = ỉ
ef / n là ước luợng chệch. Í«| . . 61
3.10.HỆSỐXÁCĐỊNHBỘIR2VÀHỆSỐXÁCĐỊNHBỘIĐÃH]ỆUCHÌNH r 2
Trong mô hình hồi quy hai biỗh, do độ thích hợp cùa hàm K6Ì qui. Nó chính là tỳ
lệ của toàn bộ sự biến đổi của biỗii phụ thuộc Y do biến giải thích X gâyia. Trong mô hình
hôi quy bội tỷ lệ cùa toàn bộ sự khác biệt cùa biến Ydo tất cả các biến giải thích X2. Xị, ....
Xk gây ra đuợc gọi là hệ số xác định bội, ký hiệu R2. I
Hẹ số xác định bôi R2 có Ihể tính bàng một trong hai cồng thức sau: '2 _ ESS T S S - R S S RSS R - T S S - TSS - TSS
Phần trước đã chúng minh e'e = S ẹ ? = Y Y - P'XY.~ 1=1
= ỵ e M - t ) = Ệ e ,(7 , - Â - A x v - . . ẵ- Â ^ ) M iềl
= ỵ e , ợ , - Ỹ - Ằ (X2, - X ) . . . - p k ( X ki - x u )) í-1
= e, ( y , - Ỹ - & ( X 2i- X ) . . . - K w » - * » > ) / - I = ẳ
e ‘ (y< - Ấ X 2i - ' Ả * * ) = Ẻ - ° - /-1 1-1 A ■
s , ỵ i y i(y i-0 i* ĩi~ -0 * x iứ) Im I
= ấ *<>/ - Â Ê y . - x a - * Á ẳ y i * « /-I i-l i-1
TSS = ẳ y i = Yj2 - 2 I Ỵ Ỹ +n Ỹ 2 = Y Y - n Ỹ 2 . i=l i=l ESS = TSS - c*e = p X Y - n Y 2 p x Y - n Ỹ 2 Y Y - n Y 2
r ĩ = E S S _ = ị § c '2
y l x 2 i + ^ l i
+ - + h I , y i x k i
= ras = ~ /p »l ĩ = , ~ 1y' 62 0
ắ R2 ắ 1. Nếu R2 = 1, có nghĩa là đường hồi quy giải thích 100% sự thay đổi
cùa Y . Nếu R3= o! có nghĩa là mô hình không giải thích sự lhay đổi nào cùa Y.
Một tính chất quan trọng của R2 là nó là hàm không giảm của số biến giải
thfch có Irong mô hình. Dẻ dàng thấy rằng J y? = ỉ
(Yi - Y Ý không phụ i-1 Í.I n
thuộc vào số biến giải thích trong mồ hình, nhưng X e í là hàm giảm của số này. i-1
Do đó, nếu tăng số biến giải thích trong mô hình thì R2 cũng tăng. Vấn đề đặt ra là
khi nào thì đưa thêm biến giải thích mới vào mô hình?
Không thể dùng R2 làm tiêu chuẩn để xem xét viộc đưa Ihêm hay không đưa
thêm một biến giải thích mới vào mô hình. Bởi vì R2 còn phụ thuộc vào sô' bậc tụ đo của 05 - Ỳ; Ý
(Yị - Y )2 tương ứng là (n-k) và (n-1). Trong đó k là i-1 . Ỉ*1
số các tham số (kể cả hệ số chận) của mô hình.
Người ta dùng hẹ số xác định bội đã hiệu chình, ký hiộu R 2 dể cân nhắc khi
xem xét việc thêm biến giải thích mới vào mô hình. ___ ỉ e f / ( n - k ) „2
ị ý Ị Ị ( n - l ) s ị » - *
R 2 có các tính chất sau:
1. Nếu k > l, R 2 <, R2 < 1, điều này có nghĩa là nếu số biến giải thích tăng
lên thl R J tăng chậm hơn so với R2.
2. R2 £ 0, nhưng R 2 có thể âm. Như vậy khi R 2 còn tăng thì ta còn phài
đưa thêm biến mới. R 2 còn có thể tăng khi mà hệ số cùa biíỄn mới trong hàm hồi
quy khác không. Khi nào biết được hệ số cùa biến mới Xk trong hàm hồi qui khác không? Khi mà giả thiết: Ho : pk = 0 H , : p k * 0
bi bác bỏ trong đó Xk là biến chúng ta định đưa thềm vào mô hình. 63 _7 R SS J144,2269 Trong thí dụ 3 .2 : R = l — = 0 , 9 7 5 6 6
R 2 = l - C L - R 2) ^ - = 1-(1-0,97566)(12-1) / (12-3) = 0,97025 •• n - k 3.11. MA TRẬN TUDNG QUAN
Giả sử chúng ta có mô hình hồi quy bội:
Yi =pi +PjXjì + ... +pkXici + l ỉ
Kí hiệu Tiị là hộ số tuơng quan giữa biến thứ t và thứ j. Nếu t= l thì r,j là hẹ số
tương quan giữa các biến Y và biến X|. f e y 'x ' ) ; r , ( l ĩ ĩ i l ; n n ' r il n n ẳ x ỉ ẳ x Ị i i=I i=l i=l Ị=1 Trong đó: Xji = - X j
Dẻ dàng thấy rằng: r,j = Ij,; Tjj = 1. r13 •• ' rl l 1 rì2 rl3 ... r12 ■ r\k ' rlk r21 r22 r23 •" r2k r21 1 r23 " ể R = r2 k = & (S . . . 1 / t ì rk2 rk3 ể’ rk k . 1
3 . 1 2 . H Ệ S ố T U Ơ N G Q U A N R I Ê N G P H A N
Chúng ta dã biết hẹ sổ tương quan r đo múc độ phụ thuộc tuyến' tính giũa hai
biến. Đối' với mồ hình hồi quy 3 b iế n :
Yi = pi + PzJfcj + P3X31 + l í
Chúng ta địnti nghĩa r,M là hệ số tương quan giữa biến Y v à X ĩ trong khi Xi không đổi,
ri3,2 là hệ sổ tương quan riêng giữa biến Y và Xi trong khi Tỉi không đổi.
Ĩ23.I là hộ số tirong quan riêng giữa X2 và x3 trong khi Ykhông đổi.
Ta có thể dẽ dàng chỉ ra rằng: 64 rl2 ~ r13r23 r13 ~ r12r23 113.2 -
V (1 ~ r>3 )(1 — r23 ) ■\/(1_ r ằ ) ( 1~ rẳ ) r23 ~ rl2~r13 123,1 ='
V ( l - 4 ) ( l - r ,3)
Hộ số tương quan riêng đã được định nghĩa như trên được gọi là hệ số tương
quan bậc nhất. Từ “bậc” ờ đây ngụ ý chi số hạng sau dấu phảy vì thế Ĩ Ị 2 14 là hệ số
tương quan riêng bậc 2; còn ri2, Ĩ13 là các hệ số tương quan bậc không.
Giữa hệ số xác định bội và các hệ sổ tương quan bậc không và hộ số tương
quan bậc nhất có các mối liên hệ sau:
r 2 _ rn + Tầ ~ ^ r!2r13r23 1-4
rẩ + ( 1- r lỉ) ru,2 vâ R2 = r?3 + ( 1' r 13) r 12,3 ■
Ma trận R nói ỏ trên đuợc gọi là ma trận hệ số tương quan riêng cấp 0. 1 0,78228 0,90463] Với thí dụ 3.2, ta cò: R = 0,78228 1 0,48017 0,90463 0,48017 1
3.13. KIỂM ĐỊNH GIẢ THIỂT VÀ KHOẢNG TIN CÂY CỦA CÁC HỆ s ố H ồ i QUY RIÊNG -KIỂM ĐỊNH T
Với giả thiết u - N(0,ơ2) ta có thể kiểm định giả thiết, tìm khoảng tin cây cho các số hồi quy riêng. P ~ N (P,ơ2(XX) ■')
Thành pKần P i cổ phân bổ chuẩn với kỳ vọng. Pi và phương sai bằng ơ 2 nhan
với phần tử nằm trên dòng thứ i và cột i của ma trận (XX) ' 1 hay chỉnh là phần tử
thứ i trên đưímg chéo chính của ma ừận Cov( P ). Tuy nhiên do ơ2 chưa biết, nên
ta phải dùng ước lượng không chệch của ơ2 là: ô 2 = ẳ e ? / ( n - k ) i=l 65 Khi đó t = V
phân bố t(n - k). Với tiêu chuẩn này có thể tìm khoảng tin
cậy kiểm định giả thiết v ỉ các hẹ số hồi quy rifing.
Khoảng tin cậy với hộ số tin cậy 1- a của Pi đuợc xác đ ịn h : 3 - P
P ( - tofl( n - k ) < - r - s T
< t« fl(n -k )) = 1 -a .D o đ ó : S e(P |)
( P i- t« fl(n ,-k )S e (P i) < P , < ậ i + t afl(n -k } S e (P i) ) , V i = 1 , * .
Chúng ta có thể kiểm định giả thiết Pi = pi
Tiêu chuẩn dùng để ldểm dinh:-1 = - ậ —Ệ^- — t(n - k) 5 e (Â )
Tùy theo cảc giả thiết Hi, chúng ta có các miền bác bỏ sau dây: B ả n g 3.1 Loại giả thiết Ho H, M iầnbấcbỏ Hai phía Pi = P>* Pi ^ pế* l t l > t o / 2(n - k ) Bên trái p. = £ )& * p i< p r t < - t B( n - k ) Bên phải p. = (Sft*) f t* p T t > t a ( n - k )
Nếu Pi* = 0, chúng ta muốD kiểm định biến độc lập Xi không ảnh hưòng đến biến phụ thuộc.
3.14. KIỂM ĐỊNH G IẢ THIẾT
Pí = p3 = ... = Pk = 0 hay R2 = 0
Chúng ta đã trinh bày kỹ thuẠt phan tích phucmg sai và mối quan hẹ giũa R2
v ì F. Bằng ngôn ngữ ma trận có thể trình bày tổng quát các vấn dề dó.
Bảng 3 3 . Phân tích phương sai cho mò hình hồi quy bội k biến Nguồn biến thiên Tổng bình phương Bậc tự do Phuangsai Từ hàm hồi quy (ESS) P 'X Y - n Y * k-1 P ' X ' Y - n Y l k - \ Phần dư (RSS) y 'y - p ' x 'y n - k Y ' Y - ệ ' X ' Y n - k Tổng Y Y - n Ỹ 2 n - 1 66 Do R2 = V Xh g Y Y - n Y 2
nên P 'X 'Y -n Y 2 = R2( Y 'Y - n Ỹ 2),
Y Y - p X Y = (1 - R2) (Y Y - n Y 2). Ta có bảng sau đây:
B àng 5J ề Phân tích phương sai đối vái R2 Nguôn biến thiên Tổng bình phương Bậc tự do Phương sai Từ hàm hồi quy R2( Y " Y - n Ỹ 2) k - 1 R 'i Y ' Y - n ĩ 1) (ESS) k - l Phần dư (1 - R 2) ( Y " Y - n Ỹ 2) n - k (1 - R 3)(Y' Y - n Ỹ J ) (RSS) n - k Tổng Y "Y - n Ỹ 2 rv- 1
Với giả thiết P ~ NCP.Ơ2) thì giả thiết
Ho: p2 = p3 = ... = pk = 0 ( hayR 2 = 0)
Hi: có ít nhất một pi * 0 ( hay R2 > 0 )
được kiểm định bàng tiêu chuẩn: ( P ' X Y - n Ỹ 2 ) / F = . . . . .
....... / - 1- - F ( ( k - l) ,( n - k ) )
( Y Y - ặếX ễY ) / / (n (n -k ) , ậ X Y - n Ỹ 2 R V ( k - l ) ° 0 R " Y Y - n Y 2 ’ n n " ( 1 - R ) / ( n - k ) '
Với tiêu chuẩn F cho phép kiểm định giả thiết:
H o:(32= p 3 = ... Pk = 0 ( hay R5 = 0 )
H,: Có ít nhất một Pi * 0 ( hay R2 > 0 ) Với thí dụ 3.2 : 67
F = 180,3545; F0.Ũ5(2 ,9) = 4,26. F > F0.05(2,9),_do dó giả.thiết Ho bị bác bỏ.
3.15. HỒI QUY CÓ Đ Ề U KIỆN RÀNG BUỘC — KlỂMĐỊNH F
Giả sử rằng chúng ta có hàm hồi quy
Y, = p 1 + p2Xi1 + . . . ;+pkXu + a '(*)
Bây giờ chúng ta kiểm định giả thiết: Ho: Pk-m+i'= Pk-nH-2 - - Pk = 0
Vớị.gịảithiệítnàythìhànihồi.quycó.dạng: .
. Ỵi = pi +. PíXai + — + Pk-mXic-m + y
(đuợc gọi là hàm hồi quy thu hẹp hay hầm hổi quy điềụ kiên ràng buộc). Kíhiộu en;
Véctơptìàn dư tiỊrhàmh&qụy.có điếu kiện ràng buộc. :i euR :
Véctơ phần du từ hàm hồi quy ban đầu( không điều kiện ràng buộc), m:
SỔ biến bị loại khỏi mô hình ban đầu ( số điều kiện ràng buộc), n: SỐ quan sát.
Khi đố tiêu chuẩn kiểm định giả thiết Ho:
Nếu F > F„(m, n - k) thì giả thiết bị bác bỏ.
Đôi khi ta dùng cổng thúc sau đây: ( e Re R ~ e URe U R ) / m
(TSS - ESSịị) - (TSS Ẻ ~^ESSU„ ) / m ® U R ® Ư R k )
(TSS - ESSUR) Ị ( n - k )
(E SSịjR — ESS rị ) Ị ĩĩĩ
Chia t ả tử số và mẫu cho TSS, ta đuợc (TSS-ESSm)l(n-k>
" p _ ■ (R2u r - R2R)/m công thứcxút gọn: F= F(m, (n - k)).
i: ~ ạ - R 2u K )/(n -k )
'Cách trình bày như trên chì là truồng hop riêng của kiểm định “ tổ-hợp tuyến táih cùa
các hệ' SỐ hổi quy”, v a i giả thiét vể tổ họp tuyến tính cùa các hệ số hổi quy, có thé làm iittù 68,
công thức tính F qua các R2 sẽ không dùng được. Trong trường hợp này chúng ta phải
dùng công thức ban đẩu, tính F qua RSS. 3.16. D ựB Á O
Chúng ta cố thể sử dụng mô hình hồi quy vào dự báo: dự báo giá trị trung
bình và dự báo giá trị cá biệt ì x 2 ° Cho x° = X ?
Dự báo giá trị trung bình: E (Y IX0 )
Ỵ — pi + PỉXỉ + + Pk Xic = x p .
Với x = x ° ta có ( 7 o lX 0 ) = X°'p =>var(ỳolX o) = X0'var(p)X 0
v a r i f o i x f ) = ^ ' ( X ' X j Y vì v a r(P ) = ơ 2(X X r '
Nhưng ơ 2 chưa biết nên phải dùng ước lượng không chệch ớ 2 của nó : V a r ( ỹ l X ° ) = Ớ ^ Q Ó Q ' 1* 0 s e i ^ o i x 0 ) = V ^ x ' ^ x ' ^ - ' x 0
ỷ 0 - tyẠ n - k) se( Ỷ 0 IX0 ) 5 E(YI Xo)
ỉ f o + t ^ ( n - k) se ( ý 0 I x°)
Dự báo giá trị cá biệt
Yi = x 'p + e , =>var(YolX0 ) = var(Xỏ,p ) + ơ2
Var(Yo I x°) = ả 2[l+ X ° '( X X rlX0 ] se(Yo I x°) = ựvar(Yo|X0)
Ỳ 0 - t ^ ( n - k ) s e ( Y „ I X ° ) < (Y„I X °)ắ f o + ty t (n - k) se(Y0 1 x 0) .
Viêc trinh bày mô hình hồi quy bằng ngôn ngữ ma trận đã cung cấp cho
chúng ta một công nghệ mà nhờ đó có thổ sử dụng kỹ thuật tính toán, tự động hóa
toàn bô quá trình tính toán, phân tích và dự b á a 69
3.17. THÍ D Ụ -thí dụ 3.3
Chúng ta cố các biến số sau -đay: Y- sản lượng/ ha; Xj- phân h o í học/ ha; X) •
thuốc trừ sau / ha. Hãy ước lượng mố hình hổi quy tuyên tính theo tham stf và các
biến số của Y phụ thuộc v ìo x2 và X} và trả íỉri các cảu hỏi sau đây. Cho a = 5%.
a. Kết quả ước lượng cố phù hạp với thực tế không? HSy giải thích ý nghĩa
kinh tế của các hộ số nhận được.
b. Phân bón( thuốc trừ sâu) có ảnh huống đến năng suất cùa loại cay trổng trên hay không?
c. Hãy tìm khoảng tin cậy cho các hộ sổ hồi quy riêng.
d. Hãy giải thích nghĩa của hẹ số R2 nhận được.
e. Cả phan bón và thuổc trừ sau đéu khổng ảnh hường đến năng su it ?
g. Bạn cố thể bỏ biến x 3 ra khỏi mô hình dược khống vì sao?
h. Hãy ước lượng mô hình bằng phương pháp ma trận.
i. Phải chãng phân bón và thuốc trừ sâu đéu có ảnh huởng như nhau đền nang
suất giống cây tròng trên?
k. Hãy dự báo giá trị trung bình v ì cá biệt khi x 2 = 20; Xj = 15.
1. Hãy phân tích kết quả dựa trên tính toán bằng MFTT3 ễ'T
Để trả lòi được câu hỏi a trước bết phải ước lượng mỏ hlnh. Dựa vào bảng(33) ta tính được: n n n n ( Ỉ 4 ) ( Ỉ 4 ) - < X w 2 M /- 1 M / Ề1 .i.m / -] (956X504)ễ- (900)(524) _
----------------------------- T— = Ư,Ồ5. (576)(504) - (525) ", _E_, n n
i x 3i x 2 x 2 i) “ ( S y i x 2i x S x 2ỉx 3i) i«l 1*1 i.| 70 Bảng 3.3 Y x 2 X, y x2 X3 yx2 y*3 X2X2 V 2 X2 x32 e e2 y2 40 6 4 -17 -12 -8 204 136 96 144 64 40.32 -0.32 0.1024 289 44 10 4 -13 -8 -8 104 104 64 64 64 42.92 1.08 1.1664 169 46 12 5 -11 -6 -7 66 77 42 36 49 45.33 0.67 0.4489 121 48 14 7 -9 -4 -5 36 45 20 16 25 48.85 -0.85 0.7225 81 52 16 9 -5 -2 -3 10 15 6 4 9 52.37 -0.37 0.1369 25 58 18 12 1 0 0 0 0 0 0 0 57 1 1 1 60 22 14 3 4 2 12 6 8 16 4 61.82 -1.82 3.3124 9 68 24 20 11 6 8 66 88 48 36 64 69.78 -1.78 3.1684 121 74 26 21 17 8 9 136 153 72 64 81 72.19 1.81 3.2761 289 80 32 24 23 14 12 322 276 168 196 144 79.42 0.58 0.3364 529 570 180 120 0 0 0 956 900 524 576 504 S70 0 13.67 1634 g
( 9 0 0 ) ( 5 7 6 ) - ( 9 5 6 X 5 2 4 ) Ps (576)(504) - (524)2
y p * ,X2--P3. XJ = 57^-0,65* 18.U ,U -? 1 Z ^ 3 1,98.
Vậy hàm hồỊ quỵ mẫu: Ệ = 31,98'+ 0,65 X2 + Ịj ị JjXjj
a. Khi người;ta tãng phân; bón / ha và tăng thêm thuốc trừ sâu /Jia thì nâng suất
loại cây trên sệ tặng.; /3 2 và p.Ị đềụ d ư ơ n g .ch an ên .có th ể nồi rằng kết quả ước
lượng phù họp vổi thực tế. Tất nhiỀn điều ttên không có nghĩa là khi tăng phân bón(
thuổc trừ sâu) / ha đến vô cùng thì năng suất cũng, tăng như yậy. p 1 = 0,65 có
nghĩa là khi gia tang phân bốn /.há ỉ tấn till năhg suất trung bình / ha sẽ tăng 0,65
t á n ; v à / ? 3 = 1 ,1 1 c ố n g lũ á là k h i g ia t ă n g t iiu ố c t r ừ s â i T / ị h a 1 t ấ n t h ì n ă n g suât
trung bình / ha sẽ tàng 1,11 tán.
b. Để trả lòi câu, hòi nàỵ chúng ta phải kiểm định .các.gịả thiết:
Hq: Pi = 0 ;H |-: Pj 5* 0 vói i = 2,3
bằng kiểm định;t: tị S |/ Ị .ị / S e ị ậ i ) .
ở * = RSS/(n-k) = 13,6704/(10-3) = 1,95. ± A
v a r( p 2 ) = — -----— ; w -----------■crr ‘'
( Ẽ xl ) ( Ẹ * ỉ i ) - ( E xĩ i ^ y /ằ| /mí /-'
= (504)01.95)/ (57ố*504-524J) = 0,06.
se( P2 ) = y v a r ( P 2) = 054.
var < P i rv— Jsi . --- —&ỉ
( /L iX2 l)(5 ',Xìl ) - ( ^ X2lX3l)2 1*1 l - l 1.1
= ( 5 7 6 X 1 , 9 5 ) / ( 5 7 6 * 5 0 4 - 5 2 4 2) = 0 , 0 7 .
se ( P 3 ) = V var( P j ) = 0,27. 72 Từđó
t , = /ậ 2 / S c ( ^ j ) = 0,65 / 0,24 = 2,7và
t j = ^ 3/ S e ( /Ồ3) = 1,11 /0,27 = 4,11.
to.raí(7) = 2,365. t2 > W 7 ) ; *3 > t«02j(7 ) do đó giả thiết Ho bị bác bồ, thừa nhãn H|,
nghĩa phân bón( thuốc trừ sâu) ảnh hưởng đến năng suất giống cây trên.
c. Khoảng tin cậy cho các hệ số hổi quy riêng được cho bỏi công thức sau:
( Pi - torc (n - k) Se (Pi) < p ể < Pi + W ( n - k ) S e ( p i) ) ,V i = T J c .
( Â - t a f l ( n . - 3 ) S e ( Ẵ ) < p2 < p 2 + - 3) Se ( 0 2 ) )
0,65- 2,365*0,24 < P2 < 0,65+ 2,365*0,24 0 ,0824 < P2 < 1,2176
( /?3 - t„/2(n - 3) Se ( Â 3) <03 < /?3 + t a* ( n - 3 ) S e ( /Â3) )
1,11-2,365*0,27 < Pj < 1,11+2,365*0,27 0 .461 < p3 < 1,738
d. Hệ số xác định bội và hộ số xác định bội đã hiệu chinh.
R = 1- RSS/TSS = 1- 13,6704/ 1634 = 0,9916.
" F = 1 - ( l - R J ) (n - l)/(n -k ) = l - (1-0,9916) (10-1)/(10-3) = 0,9892.
e. Cả hai yếu tố phân bón và thuốc trừ sâu đều không cùng ảnh hường tới năng suất: H o: P2 = p 3 = 0 hay R2 = 0
H t : có ít nhất một trong hai hệ số khác 0 hay R2 > 0. p_ R ’ / Q c - l ) _ 0 , 9 9 1 6 / ( 3 - 1 ) (1 - R 2 ) / (n - k)
( 1 - 0 , 9 9 1 6 ) 7 ( 1 0 - 3 ) " ’
Trong khi đó F0i05(2,7) = 4,47, do đó Ho bị bác bỏ. Ta kết luận rằng có ít nhất môt
yếu tố ảnh hường đến nang suất.
g. 0 5 thể bò biến x3 ra khỏi mô hình được không?
Để trả lời câu hòi này cần phải dùng kiểm định hổi quy có điéu kiện Tàng
buộc. Ước lượng mồ hình có cả hai biến x , và Xj ta có R’-ur = 0,9916. Khi bỏ biến
X chúng ta thu được mô hình ở ví dụ 2.2, R2r = 0,971.
H o : p 3 = 0 ; H , : P j * 0 . 73 (J?2W - R * R ) /m
(0 ,9 9 1 6 - 0 ,9 7 1 )/!
( J L - R ' u r t / i n - k )
( l - 0 ắ9 9 1 6 ) / ( 1 0 - 3 )
Fftos<1.7) = 3.59. F > Fojb( 1,7), giả thiết Ho bị bác bỏ. 1. Phương pháp ma trận 1 6 4 1 10 4 1 12 5 1 14 7 ì 1 1 1 1 1 1 1 1 1 1 16 9 X'X=
6 10 12 14 16 18 22 24 26 32 118 12 4 4 5 7 9 12 14 20 21 24 1 22 14 1 24 20 1 26 21 1 32 24 10 180 120 180 3816 2684 120 2684 1944 ' 1.363 -0.177 0.1602' 570' (X’X)-'= -0.18 0.032 -0.033 X’Y = 11216 0.16 -0.03 0.0366 7740 31.98067
P = (X ,X )-'(X ’Y) =
0.6500Ĩ ,Y'Y = 34124. 1.10986
e ’e = RSS = Y'Y - ~p ’(X’Y) = 13,6704. .
ỡ 1 = R S S /(n -3 )= 1 3,6704/7= 1,952914.
• 2.662$ -Q.S456 0.3129
Cov( p ) = ở 1 (X’X)'1 = -0.3456 0.06258 - 0.065
0.3129 - 0.065 0.0715
TSS= Y’Y — n y 2 = 34124 - 10* 572 = 1643. 74
ESS = TSS-RSS= 1643- 13,6704= 1629,3296. R2 = 0,9916.
Các phần tử dọc đường chéo chính cùa ma trận Cov( P ) trên là phương sai của
các p tương ứng. Từ ma trận này biết được Cov( p i , P ) , chằng hạn Cọv( p J ,
P j) = -0,065 và tính được:
Vai?2- iổ 3) = Vai(yớ 3) + V a K ^ 3)-2C cA <^2, pỉ>
= 0,063 + 0,0715 - 2(-0,065) = 0,2645. SeCyffj-/?,) = 0,514.
Đến đây có đủ thổng tin để thực hiện các phin tích đã nói ò trẽn. i.
Phải chãng phán bốn và thuốc trừ sâu đều có ảnh hưỏng như nhau đến năng
suất giống cây trồng trên. Để trả lỀri, ta phải kiểm định giả thiết sau đây: Ho: (ì> =
Pj hay ỊỊí - p3 = 0 ; H,: p2 * p j .
t = - Ề l Z Ì ẼỊ Z Ễ ủ = Ấ - 4 _ t(n_3) 5 e ( Â - Â ) ^ SeCp2 - p J t =
~ f t , - = - - ị — % = (0,65-1,11) /0 ,5 1 4 = - 0,895.
S c ( Â - Â ) S e ( Â - Â )
Trong trường hợp này ta chua cố đủ cơ sở để bác bỏ Ho vì to 025(7) = 2,36.
k. Dự b á o : Với x 2 = 20; x 3 = 15, một ước lượng điểm tương ứng là:
ỹ0= (X, = 20; X, = 15) = 31,98 + 0,65*(20) + 1,11*(13) = 61,63.
Phương sai của giá trị trung bình:
Var(ý„1 x ° ) = o 2X°'(X'X)-'X° 2.6628 - 0.3456 0.3129 1
= (1 ,2 0 ,1 5 ) -0.3456 0.06258 - 0.065 20 = 0,308533 0.3129 - 0.065 0.0715 15 S e(ỹ0 l Ar 0 ) = 0 ^55.
Khoảng tin cậy 95% cho giá trị trung bình:
To - tỊ ị( n - k) sc (Ỷ 0 1 x ° ) á E(YI x>) í Ỷo + t ^ ( n - k) se (ý „ I x°)
61 63 - 2,365*(0,555) á E(YI Xo) á 61,63 + 2,365*(0,555)
60,317 <; E(YIXo) < 62,943
Phương sai cùa giá trị cá b iệ t: » . . Var(Yo Ix°) = Ớ t 1 + ]= var(KoI * ° ) + ố 2 75 = 0,308533+li95= 2.2585
Se(Yo I x°) = ýVar(Y0|X a) = 'I ^ íẽ'
Khoảng tin cậy cua giá trị cá biêt:
?0 - ty (n - k) se(Yo I x°) £ (Yo I x°) <; ỹ 0 +
■ ^íV ỷ Ũ ỊỴ Ị l^ o ) •
61,63 - 2,365*(2,2585) s E(Y I Xo) á 61,63 ị 2,365*(2,2585)
56,289 ắ EỌÍ IXo) 66,971 lệ
Dọa ơên kết quả tính bằng MFIT3, đối chiếu lại với các kết quả tính toái ờ trên.
Ordinary Ix a st Squares Estimation
Ạ*********************************************************** Dependent variable is Y
10 observations used for estimation from 1 to 1 0 1 Regressor Coefficient Standard Error Í T-Ratio[Prob] INPT 31.9807 " 1.6318 19,5985[.000] X2 _ .65005 f , .25016 . 2.5985[.036] X3 : 1.1099 : .26743 ■ - < u 501 [.004] R-Squared
.99163. F-statistic F( 2, 7) 4J4.8492[.000].
R-Bar-Squared .98924 S.É. of Regression 1.3975
Residual Sum of Squares 13.67Ọ4
Mean of Dependent Variable 57.0000
S.D. o f Dependent Variable 13-4743 Maximum o f Log-likelihood -15.7526 DW-statistic 2.1141
3.18. MỘT S ố DẠNG CỦA HAM H ồ i QUY
Mô Mnh hồi quy tuyến tính đuọc hiểu theo nghĩa tuyến tính đối với các tham
số. Nó có thể tuyến tính hoặc không tuyén tính đối với các biến. Dạng của hàm hồi
qui là một ván dồ quan trọng, một trong những nhân tố có tính chất quyết định đốì
với két quả nghiên cứu. Tuy vậy, ván đề "dạng cùa hàm hồi quy" lại không có một
cơ sở lý thuyết đủ mạnh để có. thể khlng định dạng cùa hàm hồi quy là dạng này
mà khOng phải là dạng khác. Dạng hàm của mô hình hồi quy là m ột vấn dề thạc nghiệm. , v y : f . . . V.,
Một trong những phưong pháp thuờng đuợe dùng-là biểu -diẻn c íc số liệu len
hộ tọa độ. Nếu như dô thị chỉ ra quan hệ giữa hai biến l à tuyến ttoh thì dạng .hỉm 76
của mô hình là tuyến tính, nếu quan hê được chì ra là hàm bạc 2,3 (phi tuyến)... thì
dạng hàm cùa mô hình được chọn một cách tương úng. Phương pháp này đuợc sử
dụng trong mô hình hồi quy giản đơn. Nó sẽ là không hữu ích nếu chúng ta có mô hình hồi quy bội.
Ở đây sẽ trình bày một số dạng hàm đơn giản mà hay gãp trong ứng dụng thực tiễn.
1. H àm có hệ số co giãn khống đổi - hàm Cobb - Douglas
Hàm Cobb - Douglas có dạng Y= p |X P2
Hàm này là phi tuyến đối với X và phi tuyến đối vãi tham số Ps- Tuy nhiên có
thể biến đổi về dạng tuyến tính đối với tham số. Lấy ln hai vế, ta có: lnY = ln 13, + p2 lnX Đặt (V = ln P i ; Y ' = lnY ■ X ' = lnX Ta Ỵ ' = p,' + f e X '
Đây là mò bình giản đơn đã biết. Ta cố thể minh họa hàm ban dầu và hàm sau
khi biến dổi Y bằng dồ thị sau: Hình 3.1 Hình 3.2
Hàm Cobb - Douglas có thể mở rộng cho trữỉmg hợp có nhiều biến giải thích:
Y = p 1x > x 3p’ .. . x mp" Bằng phép biến đổi:
l n Y = l n P i + P 2 ln X j+ P 3 ln )Q + ... PolnXm
chúng ta dễ Hang có hàm tuyến tínỉi đối với các tham số. Trong hàm Cobb -
Douglas, hệ số co dãn cùa Y đối với X; bằng P i. 77 2. H àm có dạng: Ys= P ( l + r ) '
Hàm có dạng Y, = p (1+ r)‘, trong dó t là thời gian. Hàm này tbuờng dùng dể
do sự tăng trưởng của yếu tố Y| theo thời gian, r là tỷ lê tin g trường.
Ở năm (thời kỳ) t = 0, ta có Y0 = p , do đổ Y, = Yo (1 + r)‘
Biến dổi hàm về dạng tuyến tính đối với tham số:
lnY, = inY„ + t l n ( l + r ) Đạt
Y|' = In Y ,; Po = ln Yo; pi = In (1 + r) Khỉ đó Y |'= Ị3o + Pi t
Dẻ dàng ước luạng dược hàm này và từ đó tìm được Yo và r
3. Hàm dạng Hypecbol: Y = p , + — X
Hàm này là phi tuyến đối với X, nhưng tuyến tính đối với các tham số. Sau
đây là một số tniờng hợp quan trọng của hàm này
a) P i »p2 > 0, khi đó dồ thị có dạng: Y
Truờng hạp này có mức tiệm cận duới, dù X
có tảng đến d iu, Ykhông thể nhỏ han pi.
Hàm này thường được dùng khi phân
tích chi phí trung bình để sản xuất ra một sản phẩm. b) Pi >0, P2<0
Truờng hạp này cố múc tiệm cận
trên. Engel (Ỉ821 - 1896) khi nghiên
cúu mức chi tiẽu phụ thuộc vào thu
nhập đã đẽ xuất hãm này. 78
4. H àm có dạng đa thức: Y = p, + (5j X + Pj X2 + Ps X3
Hàm này thường được sử dụng để nghiên cứu quan hộ giữa chi phí và số lượng
sản phẩm được sảit xuất ra. Chẳng hạn Y - tổng chi phí, X - số lượng sản phẩm
đuợc sản xuất ra. Nếu như xây dựng được hàm này thì ta đễ dàng tìm được chi phí
trung bình và chi phí biên.
T C : Tổng chi phí; MC: Chi phí biên; AC: Chi phí trung bình.
Trôn đây đã trình bày một số dạng mô hình hồi quy. Tất nhiên rằng còn rất
nhiều dạng khác mà ở đây cũng chi giới thiệu được vằi mô hình giản đcm.Trong
thục tế để vân đụng mô hình này hay mô hình khác tnrớc hết phải hiểu đuợc mối
quan hộ giữa các biến, tính chất cùa các mô hình (các dạng hàm) muốn vận dụng. 79 BÀI TẬP
3.1. Hãỵ giải thích l õ : „
a. Hệ số hói quy riêng. .
b. Hệ số xác định bội và hệ số xáp định bội đã hiệu chình. c. Đa công tuyến. ’ ■
d. Kiểm định vể sự bằng không đổng thời , cùa tá t các hệ số>hổi quyứng với
biỂn độc lập và kiếm định riêng rê từng hệ số hổi quy.
3.2. Bảng' duới đây cho: Ỷ- Thu iibập/đầu nguìriOO tính bằng USD; X ,-T ỷ lệ
phẩn' trăm của' ladđộng nông nghiệp; X* - Số nănvtrung bình đừợc đào tạo đối vói
những người trên 25’tuổi. Cho a = 5%. '-'Ạ- -í-' ì •• •'-■■■■ n 1 2 3 4 5 6 7 8 9 10 i l 12 13 14 15 Y 6 8 8 7 .7 12 9 8 9 10 10 11 9 10 11 X, 9 10 8 7 10 4 5 5 6 8 7 4 9 5 8 Xí 8 13 11 10 12 16 10 10 12 14 12 16 14 10 12
Từ các số liệu trên tính được: Y = 9; X I = 7; X 2 = 12; ĨXii y-, =;-28; Zxa Ỵi =•
-Í2; Zxu Xa =-12; Sx2ii = 60; 2x2a = 74.
a. Giả thiết rằng; Ẹ(Y/ XÊt X , ) = Po + Pi x ,,+ P2X2 . Dựa vàomẫutrêivhãy tìm đườnghổi.quy mỉu.
b. Tim ước lưcmg phương sai ,của yếu tố ngẫu nhtèn. c. Tun
lượng phương sai của các hê số hổi quy mẫu.
d. Hãyikiểm định sự bằng không của từng hệ số hồi quy và ý rig h larủ t ra từ các kiểm định ấy.
e. Hãy tìm khoảng tíu cậy đối xứng cho các hệ sốhồi quy. f. Tim hệ số R2 và R2 .
g. Phải chăng cả hai yếu tố "Tỷ lệ lao dộng nông nghiệp" và "Số năm đuọc
đào tạo" đéu không cùng ảnh hưởng đến Thu nhập theo đẩu người. 3.3Ỗ
Trờ lại bài tập 2.11, chương n , khi hổi quy biến Sản lượng (S) theo Lao động
(L: nguòi), vì thấy hẹ số xác định (r* = 0,3029) cùa mô hình s phụ thuộc L và hê số
chặn khá nhỏ, nên người ta đưa thêm biến K là vốn (triệu đồng) vào và hổi quy
được mô hình duới đây. Cho a = 5%. 80
Ordinary Least Squares Estimation
****^^*^*^ + + + + + + ^ + + ^ ^ + + + ^++^^^ + ^JjfS|cỉị|í|Dependent variable is s
20 observations used for estimation from 1 to 20 Regressor Coefficient Standard Error T-Ratio[Prob] INPT -20.6583 22.0029 -,93889[.361] K 10.7720 2.1599 4.9874[.000] L 17.2232 4.5279 3.8038[.001] R-Squaréd
F-statistic F( 2, 17) 21.5343[.000] R-Bar-Squared .68369 S.E. of Regression 32.4717 Residual Sum of Squares
17925.0 Mean of Dependent Variable 109.4666
S.D. o f Dependent Variable 57.7367 Maximum of Log-likelihood -96.3610 DW-statistic 2.3574
a. Viết hàm hổỉ quy tổng thể, hồi quy mẫu.
b. Các ước lượng nhận đuợc có phù hợp về lý thuyết không?
c. Tìm ước lượng điểm mức sản lượng doanh nghiệp có 20 lao động, nguồn vốn 300 triệu đồng.
đ. Các giá trị ước lượng có ý nghĩa thống kê không?
e. Tính hệ số xác định bội bằng các cách. f.
Phải chăng các biến độc lập không giải thích được cho sự biến động của sản lượng?
g. Có thể nói vốn, lao động cùng tác động thuận chiều đến sản lượng không?
h. Khi lao động không đổi, nếu thêm vốn 1 triệu thì sàn lượng tang trong khoảng nào? j.
Có thể nói khi lao động không đổi, tăng vốn thêm 1 triệu thì sản lượng
tăng ít hơn 10 đơn vị được không? j.
Nguồn vốn không đổi, thêm 1 lao động thì sản lượng tăng có bằng 20 đơn vị không" k
Giá trị đ6 tối thiểu bằng bao nhiêu? lệ
Dùng liể m định thu hẹp hổi quy để xem xét có nên đưa thêm biến K vào
mô hình hay không nếu biết với mô hình s phụ thuộc L có hệ số chặn hệ sô'
xác định bằng 0.3029 và RSS bằng 44152.1
3 4 Với bài tập (3. 2), một người đưa ra dạng khác của mô hình và hổi quy được
kết quả sau, với LS, LK, LL làlogarit cơ sđ tự nhiên cùa các biến tươhg ứng. 81
Ordinary Least Squares Estimation Dependent variable is LS
20 observations used for estimation from 1 to 20
***************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] INPT 2.8749 .22746 12.6390[.000] - LK .52178 .093498 5.5806[.000] LL .68225 .14080 4.8457[.000] R-Squared
.78117 F-statistic F( 2, 17) 30.3438[.000] R-Bar-Squared .75543- S.E. of Regression .28222 Residual Sum of Squares
1.3540 Mean of Dependent Variable 4.5516
S.D. o f Dependent Variable .57067 Maximum of Log-likelihood -1.4523 DW-statístic 1.9062
Cho hiệp phương sai của các ước lượng úng với các biến LK và LL bằng 0,0127.
a. Viết hàm số kinh tế ban đầu với các biến S,K , L.
b. Viết hàm hổi quy mẫu. Cho biết ý nghĩa cùã các ước lượng nhận được.
c. Các uớc lượng nhận dưọc có phù hợp lý thuyết không?
d. Các biến giải thích giải thích được bao nhiêu phẩn ữăm sự biến động của biến phụ thuộc.
e. Kiểm định sự phù hạp của hàm hổi quy.
f. Khi lao động tăng 1 % thì sản lượng tăng trong khoảng'bao nhiêu%?
g. Khi vốn giảm 1% thì sản lượng giảm tối đa bao nhỉẽu %?
h. Nguổn vốn tăng lén bằng 1,2 lần so vdi trước thì sản lưcmg có tăng tưong úng bằng 1,2 lẩn kh0ng7 i.
Khi yếu tố khác không đổi, nếu nguổn vốn tăng lên t lần mà sản luợng tâng
nhỏ hon t lần thì ta nòi sản lưạng tăng chậm hon vói tăng nguổn vốn, nếu
sản lượng tăng lổn h MI t lẩn ta gọi là tăng nhanh hon so với tãng nguồn
vốn và bằng đúng t thì IỊỌÍ là tăng bằng với tăng nguồn vốn. Theo kết quả
hổi quy trên thì sản lượng tăng là nhanh, châm hay bằng so với tăng nguồn vốn?
k. Sản lượng tăng bằng vói tăng lao đông? 82 CHƯƠNG IV HỐI Q ur VỚI BIẾN GlÂ
Trong các mô hình hồi quy tuyến tính mà chúng ta đã xem xét lừ các chương
trước cho đến nay thì các biến giải thích đêu là các biến số lượng. Các biến đó có
thể nhận giá trị bằng số. Chẳng hạn, tiền lương cùa cán bộ, doanh số bán ra cùa
một cửa hàng, chi tiêu cho quảng cáo, cung tiền,... là những biến số iượng. Nhưng
trong thực tế có nhiều trường hợp các biến giải thích (hoặc thậm chí cả biến phụ
thuộc) là biến chất luợng. Trong chương này ta sẽ nghiên cứu hồi quy khi biến giải
thích là biến chất lượng.
4.1. BẢN CHẤT CỦA BIẾN GIẢ- MÔ HÌNH TRONG ĐÓ BIEN g iả i t h íc h LÀ BIẾN GIẢ
Biến chất lượng như đã nói ở ưên thường chi ra có hoặc không có một thuộc
tính nào đó, chẳng hạn nam hay nữ; khu vực tư nhân hay nhà nước... Vấn đề đạt ra
là làm thế nào để lượng hóa được những thuộc tính như vậy. Trong phân tích hồi
quy người ta sử dụng kỹ thuật gọi là kỹ thuật biến giả. Kỹ thuật này cho phép ta
lượng hóa đuợc nhũng thuộc tính nhu vậy. Chặng hạn để giải thích cho việc một số
thanh niên vào trường đại học, một số khấc thì không, chúng ta tạo rạ biến giả mà
nhận giá trị là 1 nếu thanh niên vào đại học và nhận giá trị là không nếu thanh niên
đó khồng vào đại học. Chúng ta cũng sẽ chì ra biến giả có thể được sử dụng như
thế nào trong phạm vi hồi quy để giải thích cho sự kiện là có những quan sát trong
phạm trù (thuộc tính) đã cho gắn với một tập các tham số h'ổi quy còn các quan sát
khác ưong phạm trù thứ 2 (hoặc thứ 3) lại gắn với những tham số hồi quy khác.
Biến giả được sử dụng trong mô hình hồi quy giống như biến số lượng thông thường.
Giả sử một công ty sử dụng 2 quá trình sản xuất (kí hiẹu quá trình sản xuất A
và quá trình sản xuất B) để sản xuất ra một loại sản phẩm. Giả sử sản phẩm thu
được từ mỗi một quá trình sản xuất là đại lượng ngẵii nhiên có phân phối chuẩn và
cí> kỳ vọng khác nhau nhưng phương sai như nhau. Chúng ta có thể biểu thị quá
t r ì n h sản xuất đ ồ như m ột phương trình h ồ i quy Y, = p, + PJ>, + u (4.1)
trong đó Yi là sản lượng sản phẩm gắn với quá trình thứ i.
0 là biến giả nhạn 1 trong 2 giá trị: 83
1 nếu sản lượng sản phẩm thu được từ quá trình sản xuất A. Di =
0 nếu sản lượng sản phẩm thu được từ quá trình sản xuất B.
Mô hình hồi quy trên đây giống như mo hình hồi quy 2 biến mà chúng ta gập
trước đây chi khác là biến số luợng X được thay bằng biến giả D. Cân cứ vào mô
hình này chúng ta có thể biết duợc sản lượng trung bình do quá ưình sản xuất A có
khác với sản lượng trung bình do quá trinh sản xuất B tạo ra hay khống?
Hệ số chặn Pi của hồi quy tuyến tính đo sin lượng trung bình gắn với quá
trình sản xuít B, trong khi đố độ dđc P2 của dL\'rug ìj'0i quy đo sự khác nhau vồ sản
lượng sinh ra do việc thay đổi từ quá trình sản xuất B đến quá trình sản xuất A
Điều nàý có thể thấy bằng cách lấy giá trị kỳ vọng cả 2 vế cùa phuong
trình(4.1) ứng với D| = 0 và D| = 1: E(Yj I Di = 0) =Pi E(Yi I Di = 1) =p! + p2
Kiểm định giả thiết Ho: pỉ = 0 cung cấp kiểm định về giả thiết là khổng có sụ
khác nhau v i sản lượng.do quá trình sản xuất A và B tạo ra. Điều này dẻ làm đuợc
như dã chi ra iruớc dây. •
Thù tục biến giả có thể dễ đàng m í rộr>ir cho’ trường li'ip biến định tín;) có
nhiều hen 2 phạm lrù. Chẳng hạn Uorig ilú dụ ò Irêa ta gi'ả thiết có 3 quá trìuh sản
xuất khác nhau có thể sử dụng á i sản xuất ra úi', pkíừn và ngnời ta hv vọng giải
thíc.1 cho vấn dề là sản lượng duợc sản xuất ra cho mỗi quá Irình có thể xhông Ẹhir
nhau. Trong trường hợp này ta sẽ đita v\o 2 biến giả là Di và D2. Chúng ta sẽ xét mô hình': Yi = Pi +P2D11 +P.1D21 + Ụ (4.2) trọng dó :
1 nếu sản lượng sàn phẩm thu được từ quá trình sản xiiất D] -
0 nếu sản lưọiig sàn phẩm.tlui được từ q -á trìnl khác. ■
1 nếu sản lượn3 ĩàn phẩm thu đuợc lir quá trình sả>.\ xu i: 'Jể I " O 2 - '
0 uếu sản iuợr<5 ràâ phếm thu ù u ạ c .ư quá trình khác.
, Nhu vậy 3 quá trình sản su it này Uược biểu tlụ dưới dụng Jác kếi hỢi sao ù a
các giá trị của các biến giả: ! Quá trìnii sản xuất D, Di i A 1 0 B 0 1 c 0 0 . 84
Bằng viộc lấy kỳ vọng cho mỗi một trong 3 trường hợp này chúng ta cố thể
giải thích kết quả hồi quy: E ( Ỵ I D ã= l ; . D ĩ = 0) =Pi + 0 2 ; E(Ỵ I D, = 0; Dj = 1) =p, + p3 E(Y |ID , = 0; D2 = 0)=(3,.
Hệ số chặn của hồi quy biểu thị giá trị kỳ vọng của sản lượng do quá trình sản
xuất c tạo ra. Hê số góc thứ nhất do sự thay đổi trung bình v'ê sản luợng do việc
chuyển từ quá trình sàn xuất c sang quá trình sản xuất A và hộ số góc thứ 2 tức là
p3 đo thay đổi trung bình về sản lượng khi thay đổi từ quá trình sản xuất c sang quá trình sản xuất B.
Kiểm định giả thiết Ho: P2 = 0 có nghĩa là không có sự khác nhau giữa quá
trinh sản xuất A và quá trình sản xuất c . Giả thiết Ho: P3 = 0 cũng có ý nghĩa
tương tự nhưng lại so sánh 2 quá trình sản xuất B và c.
Thí dụ: Để xem xét kết quả sản luợng do 2 quá trình sản xuất A và B có khấc
nhau hay không người ta tiến hành lấy một mẫu được cho trong bảng dưới đây.
Hãy phân tích kết quả tíồi qui thu được.
Dựa vào các k ít quả dưới đây ta thấy ràng sản lượng trung binh 1 ca của quá
trình sản xuất B ước lượng là 18000 kg = P i, còn sản lượng trung bình 1 ca đã
duọc ước luợng của quá trình sản xuất A là 21,280 kg = + P 2 . B ảng 4.1
Quá trình sản xuất A là 1, .Sản lượng trong 1 ca
quá trình sản xuất B là 0. hoạt động 1 2 2 ,0 0 19,0 0 18,0 1 2 1 ,0 0 18,5 1 21 0 1 20,5 , 0 17,0 0 17,5 1 2 1 ,2
Kết quả hồi quy như sau: Ỳj = 18 + 3,2 Di 85 (Se) = (0,44) (t) = (7,439) (p) =• (0,000)
R2 = 0.8737. p 2 có ý nghĩa về mặt thống kê, kết quả chỉ ra rang sản lượng trung bình cùa
2 quá trinh đó là khác nhau. Hôi quy trẽn có thể mô tả trên hình 4.1. 3i + p 2 PỆ ---------- Quá tiình Quá trình sản xuất B sản xuất A Hình 4.1
Trước khi chuyển sang mục sau ta cần một số chú ý:
l ề Để phân biệt 2 phạm trù nam hoặc nữ hay quá trình sản xuất À hoặc B
ngưỉri ta dùng một biến giả. Để phân biệt 3 phạm trù nguời ta dùng 2 biến giả. Một
cách tổng quát để phân biệt N phạm trù người ta dùng N -l biến giậ. Số biến giả
thấp hơn số phạm trù là 1 dể tránh tính đa cộng tuyến hoàn hảo. Để phãn biệt 3
quá trình sàn xuất A, B và c ta chỉ sử dụng 2 biến giả Di và E>2 nếu ta đua thêm 1
biến giả D3 nữa chảng hạn.
■ 1 nếu sản ỉượng săn phẩm thu được từ quá trình sản xuất c.
D3 = ' 0 nếu sản lượng sản phẩm thu được từ quá trình sản xuất khácế
Thì việc đua thêm Dj vào không cho thêm thôag tin mà lại gặp đa cộng
tuyến hoàn hảo (xem chương VI). Trong trường hợp này thì ước lượng bình phuơng
bé nhất cùa các tham số hồi quy không thể thu được. Có hiện tượng đa tuyến tính hoàn hảo vì: Dj = 1 - D ,-D 2 2.
Phạm trù đuợc gán giá trị 0 được coi li phạm trù cơ sở. Phạm trù được gọi là co sở
theo nghĩa việc so sánh đuợc tiến bành với phạm trù này. Như vậy trong mô Kinh trên quá
tình sản xuất c là phạm trù cơ sở, nghĩa là nếu ta uớc lượng hồi quy (4.2) vổi Di = ữ, P 2 =
0, thì chi có quá trinh sản xuất c, hệ số chăn sẽ là P |. 86
3 ể Hẹ số P 2 gắn với biến giả Dj được gọi là hộ sổ chặn chêch lệch, vì nó cho
biết giá trị của hệ sõ chặn của phạm trù nhận giá trị bằng 1 sẽ khác bao nhiêu với
hệ số chặn cùa phạm trù cơ sở.
4.2. HỒI QUY VỚI MỘT BIỂN LUỢNG VÀ MỘT BIẾN CHẤT
Trong mục này ta sẽ xét mô hình hồi quy chì có một biến lượng và một biến
chất vói sổ phạm trù nhiều hơn hoặc bàng 2. Trường hợp có nhiều biến lượng và
một biến chất thì thủ tục cũng được xét tương tự như ta sẽ làm dưới đây chỉ khác là
số biến luợng sẽ tăng lên. Để đễ theo dõi trong mục này ta chia ra, làm 2 trường
hợp: trường hợp 1 khi biến chất chỉ có hai phạm trù, trưcmg hợp 2 khi biến chất có nhiều hơn 2 phạm trù.
1. T rường hợp khi biến chất chỉ có 2 phạm trù
Trong trường hợp này, mô hình hồi qui sẽ đơn giản vì theo chú ý trên khi
biến chất có 2 phạm trù thì chì cần đạt 1 biến giả là đủ. Thí dụ ta xét mô hình sau: . Y, = p, + p2Di + p3JÍ + ụ (4.3) Trong đó:
Yj: Là tiền lương hàng tháng cùa một công nhân cơ khí i,
X i : bậc thợ cùa công nhân i,
D i = 1 nếu công nhân i làm việc trong khu vục tư nhân,
D I = 0 nếu công nhân i ỉàm việc trong khu vực quốc doanh.
Mô hình có một biến luọng đó là bậc thợ cùa người cổng nhân và một biến chất chỉ
lỗ cồng nhân đó làm việc thuộc khu vực nào. Nếu ta già thiết E(UÍ) = 0 ttó (4.3) có thể cho
ta thấy liệu tiền Iutmg của nguời công nhân làm việc ờ khu vực tư nhân có khác tiền lương
của người 'công nhân làm việc khu vục nhà nước không nếu các điều kiện khác không
thay đổi. Bằng'cách lấy kỳ vọng cả 2 vế (4.3) ta đuạc:
Tiền lương trung bình cùa nguời công nhân cơ khí làm việc trong khu vục nhà nuức: E(Yi I Xj, Di = 0) = Pi +p3Xj (4.3.1)
Tiên lương tu n g bình của người công nhân cơ khí làm việc trong khu vực tư nhân:
E(Yj I X , Di—1) - (Pi + P2) + IỈ3XÌ (4.3.2) 87 Hình 4.2
Hình 4.2 chỉ cho chúng ta thấy ràng tiền lương của công nhân cơ khí làm việc
trong khu vực tư nhân và nhà nước tính theo bậc thợ có cùng độ dốc p3 nhung lại
khác nhau về hệ số chặn. Nói một cách khác mô htah này giả thiết rằng mức tiền
lương trung bình của người công nhân ngành cơ khí làm việc ò khu vực tu nhân
khấc với mức tiền lương trung bình cùa công nhân cơ khí làm việc ở khu vục nhà
nước nhung tốc độ tăng luong trung bình theo bậc thì như nhau.
NẾU giả thiết về tốc đồ đã nêu trẽn là cố giá trị thì kiểm định giả thiết răng 2
hồi quy (4.3.1) và (4.3.1) có cùng bệ s6 chặn có thể tiến hìn h dễ dàng bằng cách
uớc lượng tò i quy (4.3) và chú rằng ý nghĩa về mặt thống kê của Pj đã được ước
lượng trẽn cơ sở của kiểm định t Nếu t chi ra rằng jj 2 là có ý nghĩa vầ mật thổng
kê thì chúng ta từ bỏ giả thiết Hũ là tiền lương của cổng nhằn cơ khí ở 2 khu vục kinh tế là như nhau.
2. Trường họp khi biến chất có nhiều hơn 2 phạm trù
Khi biến ch ít có nhiều hơn 2 phạm trù thì vấn dề cũng khổng phức tạp hon
nhiêu bởi vì theo chú ý ở trẽn nếu sô' phạm trù là N thì ta đưa vào mô hình hồi quy
N - 1 biến giả làm biến giải thích..
Thí dụ căn cứ vào số liệu chéo người ta muốn hồi quy thu nhập hàng năm của
một cán bộ giảng dạy đại học đối với tuổi nghề giảng dạy và vùng mà,anh ta giảng
dạy. Vì biến vùng là biến chất, trên thực tế chúng ta có thể căn cứ vào 3 vùng khác
nhau trong cả nước, là Bắc, Trung, Nam. Như vây trong trường hợp này, biến chất
của ta có 3 phạm trù, theo chú ý trên ta sẽ đưa vào mồ hình hồi quy 2 biến giả.
Giả sử rằng cả 3 hồi quy có cùng độ dốc nhưng khác nhau hệ số chăn, chúng ta có mổ bình sau:
Yj = Pi + PjDiì +P3D2Ì + P4XÌ + l í (4.4)
Trong đó Y| thu nhập hàng Dăm cùa một giảng viên đại học
Xị: tuổi nghề của giảng viên
l nếu giảng viên i thuộc một truỉrng đại học ở miền Bắc.
1 - I 0 nếu giảng viên thuộc một trường không phải miền Bắc
1 nếu giảng viên i thuộc một truờng dại học miền Nam.
0 nếu giảng viên thuộc một trưèmg không phải miền Nam.
Như vậy, ta coi giảng viên thuộc một trường đại học ở miên Trung là phạm trù
cơ sở, hệ số chặn chênh lệch p2 và
cho chúng ta biết hệ số chặn cùa các phạm
trù khác với hệ số chặn của phạm trù ca sà bao nhiêu. Chúng ta có thể tính được
. nếu giả thiết E(Ụ) = 0 thì từ (4.4) ta có:
Thu nhập tnmg bình cùa một cán bộ giảng dạy ờ một truờng đại học miên Thing:
E(Yi ID, = 0 ,D 2 = 0 , J i ) = p 1 + p4Xi (4.4.1)
Thu nhập trung bình cùa một cán bộ giảng dạy ở một trường đại học miên Bắc:
E(Yi I D, = 1, Da = 0, X,) = (p, + p2) + p4xi (4.4.2)
Thu nhập trung bình của mộl cán bộ giảng dạy trường đại học miền Nam:
E(Yi I D, = 0, Dj = 1, x ;) = (Pi + p3) + P,Xi (4.4.3)
Giả sử pi > 0 ta có minh họa sau:
Hình 4.3. Thu nhập của một cán bộ giảng dạy đại học trong
mối quan.hộ với tuổi ngh'ê và vùng mà anh ta giảng dạy.
Sau khi ước lượng hồi quy (4.4) chúng ta dễ thấy rằng liệu có sự khác nhau v'ê
thu nhập của cán bộ giảng dạy các miền khác nhau cùa đất nước không.
Thí dụ : Cãn cú vào số liệu chéo về doanh thu trên đầu người từ các tỉnh và
thu nhập quốc dân tính theo dâu người của các tình đó. Người ta muốn hồi qui
logarit R (log thu nhập/ngưòi) đối với logarit G (log thu nhập quốc dân/ngưòi) và
tính vùng của mỗi tỉnh. Theo cách phân chia đã biếl 1 tỉnh thuộc 1 trong 3 vùng
Bắc (N) Trung (Q hoặc Nam (S). Số liệu cho trong bảng 4.3. 89 Mô hình hồi quy l à :
L og Rị = Pi + P2D1Ì +P3D2Ì + P4 logG i + l í Trong đó: Log R: ln(thu nhập/người)
Log G: ln ( thu nhập quốc dân /người).
1 nếu tỉnh đó thuộc mièn Bắc D , i = 0
nếu tỉnh đó không phải là tỉnh miền Bác. 1
nếu tỉnh đó thuộc miền Nam ^ =
0 nếu tinh đó khổng phải là tinh miền Nam.
Kết quả hồi quy như sau: Bảng 4.3 Tinh Vùng G R Tinh Vùng G , R H.Gìang N 53099 15433 Q.Ngãi c 921501 51778 T.Q. N 1026246 32534 B.Định c 974381 71581 C.Bằng N 939592 25915 P.Yên c 1162995 69315 L.Sơn N 1105916 79225 K.Hoà c 2195192 204879 L.Châu N 1173320 27660 N.Thuận c 506939 44556 L.Cai N 819802 35570 B.Thuận c 1825380 105927 Y.Bái N 1506025 46Ữ10 K.Tum c 1181003 65642 B.Thái N 1565816 48172 G.Lai c 1024570 69518 S.La N 643444 29338 Đ.lắc c 1725293 83590 Q.Ninh . N 2195642 311755 L.ĐỔng c 1493055 107289 H.Bình N 2040215 72890 HCM s 4997041 962414 V.Phú N 1229249 74594 Đ.Nai s 2370994 239017 H.Bắc N 1021338 47667 VT-BR s 1991269 907834 H-Nội N 3631625 1062935 S.Bc s 1491414 192057 H.Phòng N 2070000 160291 T.Ninh s 1553681 204342 H.Tây N 1142000 45778 L.An s 1762790 147537 H.Himg N 1303451 105546 T. Giang s 1057203 109833 T.Bình N 1162747 51436 A. Giang s 1760437 142684 N.Hà N 1181747 53902 Đ.Tháp s 1370071 100655 N.Bình N 1062831 42545 B.Tre s 1532974 82319 T.Hoá c 1200650 102550 V.Long s 2021798 116666 Ng. An c 930844 59498 T.Vinh s 2024467 66530 H/Tĩnh c 910650 30163 Sóc trang s 1571656 84334 Q.Blnh c 992594 41673 Cần Thơ s 1760304 121340 Q.Trị c 943805 70579 K.Giang s 2329861 154636 T.T.Huế c 1009223 90856 M.Hải s 1736902 142079 QN-ĐN c 1367673 198297 90
logRi = -15,040082 - 0,42196 D, - 0,337541)2 + 1,94474 log G|
Ta có thể viết 3 phương trinh hồi quy: Miền Trung:
log Rị = -1 5 ,0 4 + 1,93 log Gi Miên Bắc:
log R| = -15,46 + l,91i log Gi Miền N am :
log Rị = - 15,83 + 1,9.') log G i.
Theo chú ý trên p2 cho ta biết log (doanh thu) thay dổi khi chuyển từ tình
miền Trung đến một tinh miền Bắc.
P 3 cho ta biết doanh thu thay đổi khi chuyển từ miền Trung đến một tình miền Nan*.
4.3. HỒI QUY VỚI MỘT BIỂN LUỢNG VÀ HAI BIẾN CHẤT
Trong mục này ta xét hồi quy với 1 biến lượng và 2 biến chất. Nguyên tắc đã
trình bày à trên duợc mở rộng cho trường hợp này. Số biến giả được đưa vào mô
hình hồi quy phụ thuộc vào số biến chất và các phạm trù mà mỗi biến chất có.
Thí dụ: Chúng ta hãy quay lại thí dụ vê thu nhập cùa một giảng viên đại học,
bây giờ chúng ta giả thiết thêm rằng giới tính của giảng viên cũng là nhân tổ quan
trọng để xác định thu nhập của giảng viên. Như vậy ta có 2 biến chất: - Vùng có 3 phạm trù
- Giới tính có 2 phạm trù. Mồ hình sẽ có dạng
Yi = P i +P2D11 + P3D2Ì +P4D3Ì +psX ị + Ư1 (4.5) trong đó:
Yi là thu nhập hàng nẫm của giảng viên đại học
Xi là tuổi nghề của giảng viên i.
1 nếu giảng viên thuộc tiirờng đại học miền Bắc.
D ii = • 0 nếu giảng viên không thuộc trường đại học miền Bắc.
1 nếu giảng viên thuộc trường đại học miền Nam. D 2i =
0 nếu giảng viên không thuộc trường đại học miền Nam.
• 1 nếu giảng viên là nam D 3i = 0 nếu giảng viên là nữ
Phạm trù cơ sở bây giờ ỉà giảng viên nữ thuộc một trường đại học miền Trung.
Già sử E(U) = 0 chúng ta có thể thu được kết quà sau bằng cách lấy kỳ vọng có
điều kiên cả 2 vế (4.5).
Thu nhập trung bình cùa 1 giảng viên nữ ở một truờng đại học miền Trung 91
E(Y, I D,= 0 , Dj = 0 , Dj = 0, x,).=p, + PsX;
Thu nhập trung bình của 1 giảng viên nam ở một truờng đại học miần Trung
E(Yi I D,= 0, E>2 = 0, D, = 1. Xi) = (Pi +P4) + p3x>
Thu nhập trung bình của 1 giảng viên nữ ở một truờng đại học miền'Bắc
E(Yi I D,= 1, D ĩ= 0, Ds = 1. Xi) =(pẵ +Pj) + PsX
Thu nhập trung bình của.l giản? viên nam ở một truờng đại học miền Bắc E(Ỵ I D,= 1,
= 0, D3 = 1, X,) =(P, +p2+ p4) + PsX,
Thu nhập trung bình cùa 1 giảng viên nữ ở một truờng đại học m iln Nam
E(Yi I D,= 0. I >2 = 1, Dj = 0, Xị) =(p, +p3) + p3X;
Thu nhập trung bình của 1 giảng viên nam một tniờng đại học miền Nam
E(Y, I D,= 0, Dj = 1, D, = 1, Xi) =(p, + p 3 + M + p 5X, 4.4. SO SÁNH HAI H ồ i QUY l ễT u tu d n g c ơ b ả n
Tất cả các mô hình hồi quy đã xét đến nay, chúng ta đốu giả thiết ràng biến
lượng ảnh hưởng đến hệ số cbặn nhưng khổng ảnh huởng đến hệ số góc các hồi
quy của I'.áe»nhóin con khác nhau. Nhung nếu hệ số góc khác nhau thì việc kiểm
định về tính* khác nhau của hệ số chặn sẽ ít có ý nghĩa. Một khía cạnh khác nữa là
các tập số liệu mà chúng ta sử dụng là các tập số liệu (fan nhưng liệu môt mô bình
đã cho có thổ áp dụng cho hai tập số hay không? Chẳng hạn khi nghiên cứu mối
q’lan hẹ giũa tiết kiẽm và thu nhập trước và sau chuyển đổi kinh tế cùa nước ta. Vì
thế chúng ta cần phát triển phương pháp chung để ứm xem liệu 2 hồi quy có khác
nhau hay không? Sự khác nhau nếu có thì hệ số chặn, hệ số góc híiy cả hai. Thí dụ: Ta có hồi quy:
Thời kỳ irước cải tổ:
Yi = Xi + XịXì + Uii (4.5a) với i = l,n, Thời kỳ sau cải tổ:
Yj = yi + Ỵ2*j + U i Cj = T T « 7 ) (4.5b)
t-ong đó X thu nhập; Yià tiết kiệm; Ưii, U i là các ĩihiẽu trong 2 hồi quy.
Có 4 khà năng xảy ra đối với 2 hồi quy này: I. X| =
x 2 = 72, nghĩa là 2 hồi quy đòng nhất, írên đồ thị chúng chồng
khlt ìin nha-., điều ní.y chỉ ra ở hình 4 /m 92
2. Xi * 7i và Xa = 72, nghĩa là 2 hồi quy có cùng hộ số góc, điều này chì ra hình 4.4b 3. A., = Ỵ, và Ằ.2
y2, nghĩa là 2 hồi quy có cùng hệ số chặn nhung khác nhau
về hạ sổ góc, điều này chỉ rạ hình 4 .4c
4. Xị * y, và X-2 * y2, nghĩa là 2 hồi quy hoàn toàn khác nhau, điều này chì ra hình 4.4d. Hình 4.4.
a. Hai hồi quy trùng nhau; b. Hai hồi quy song song;
c. Hai hồi quy cócùpg hệ số chặn; d Hai hồi quy hoàn toàn khác nhau.
Để kiểm định sự bằng nhau của hệ số hồi quy chúng ta có thể sử dụng một
trong hai kỹ thuật: kiểm định Chow và sử dụng biến già. Sau đay chúng ta xét cả hai kỹ th u ậ t.
2. So sánh 2 hồi quy - kiểin định Chow
Một trong những phucmg pháp phổ biến để kiểm định sự khác nhau giũa hai
hôi quy là kiểm định của Chow. Kiểm định này dựa trôn những giả thiết sau: 93
a. Các nhiễu H i và Uy có phân phối chuẩn có kỳ vọng bằng 0 và phuơng sai
khổng dổi và dều bàng ơ 2: Uii ~ N (0,ơ2) l i j - N ( 0 ,ơ 2).
b. Cấc Uii và XẶj có phân phối độc lập.
Với giả thiết đã cho thì thù tục kiểm định Chow là như sau:
Bước 1. Kết hợp tấi cả các quan sất của 2 thời kỳ lại ta được n = n, + n2 quan
sát rồi ước luợng hồi quy gộp. Mô hình gộp của (4.5a) và (4.5b) lúc này có thể viết dưới dạng: Y i= P ,+ (325Q + U (4.6)
Từ hồi quy này chúng ta thu đơợc tổng bình phuơng cấc phần dư là RSS với số
bậc tự do n, + n2 - k (trong đó k là số tham số duợc ước lượng, trong mô hình (4.6) tM k=2 .
Bướcĩ. uồc luợng riêng từng hồi quy (4.5a) và (4.5b) và thu được tổng bình
phuong các phần dư tuơng ứng từ mô hình (4.5a) là RSS| và tù mô hình (4.5b) là
R S S í và bậc tự do tucmg ứng n, - k và n2 - k.
Đặt RSS = RSS| +RSS2 với bậc tự do ni + n2 - 2k
Bước 3. Sử dụng tiêu chuẩn F như sau : n _ ( R S S - R S S " ) / k , A n s F = — 7/ --------- -T (4 -7) R S S / ( n , + n 2 - 2 k )
Với bậc tự do là k và ni + n2 -2k. Nếu giá trị F tính đuợc vượt giá trị F tới hạn
thì ta tù bỏ giả thiết rằng hai hồi quy là như nhau. Điều này có nghĩa là hai tập số
liệu là khổng gộp được.
3. So sánh hai hồi quy ■ thủ tục biến giả
Kiém định Chow cho phép ta so sánh 2 hồi quy. Sau dây ta sẽ trinh bày thù
tục biến g iỉ mà cũng sẽ cho ta gộp ỉất cả Di và n2 quan sát lại với nhau và uớc luợng hồi quy sau:
Yi= p ,+ Pj Dì + p3Xi + P«(D|Xi) + Ụ (4.8)
Giả sử Y| và Xị là tiết kiệm và thu nhập trước và sau khi chuyển đổi kinh tế. 94
0 đối với quan sát thuộc vào trước thời điểm chuyển đổi D , =
1 đối với quan sát thuộc vào sau thời điểm chuyển đổi.
Để thấy được ứng dụng của mô hình (4.8) ta lấy kỳ vọng có dĩèu kiện cả hai
vế cùa phương trình này với già thiết E(Ụ) = 0 chúng ta thu đurợc:
E(Yi I Di = 0, Xi) = Pi + P3XÌ (4.8a)
E(Y, ID, = 1. Xi) = O i + k ) + (P3 + PO X, (4.8b)
Với ỷ nghĩa các kí hiộu đã cho ờ trên ta có thể giải thích như sau:
(4.8a) là hàm tiết kiêm trung bình cho thời kỳ trước chuyển đổi kinh tế diễn
ra.(4.8b) là hàm tiết kiêm trung bình từ khi chuyển đổi kinh tế vê sau. Hai hàm này
hoàn toàn giống như hai hàm đã cho (4.5a) và (4.5b) cho nên uớc lượng (4.8) cũng
tương đứơng với việc uớc lượng hàm (4.5a) và (4.5b).
Trong (4.8) thì p2 chính là hệ số chặn biểu thị sự khác nhau cùa tiết kiệm giữa
2 thời kỳ còn (3* chính là hệ sô' độ dốc khác nhau nó chỉ ra rằng hệ số góc cùa hàm
tiết kiộm trước khi chuyển đổi khác với hộ số góc cùa thời kỳ từ khi chuyển đổi kinh tế là bao nhiều.
4.5. ẢNH HUỞNG CỦA TUƠNG TÁC GIỮA CÁC B Ế N g iả Chúng ta xét mô hình sau:
Y| = p!+ P2D2Ì + P3D 3Ì+ p4 Xj + t í (4.9)
trong đó: Ỵ là chi tiêu hàng năm v‘ê quần áo, X là thu nhập 1 nếu là nữ D2 = 0 nếu là nam 1 nếu là sinh viên d 3= 0 nếu là công nhân viên
Ngụ ý cùa mô hình trên đây là ảnh hưởng chênh lệch của biến giả giới tính D2
là hằng SỐ qua 2 tầng lớp sinh viên và công nhân viên và ảnh hường chênh .lệch D,
cũng là hàng số qua 2 giới. Điều này có nghĩa là nếu chi tiêu trung bình về quần áo
của nữ cao hơn của nam tw điều này cũng đúng với cả hai tầng lớp. Tương tự cõng
có thể nói ràng chì tiêu trung bình v'6 quần áo của sinh viên nhiều hơn cùa công
nhân viên thì đi'êu đó cũng đúng dù nó là nam hay tiữ. 95
Trong nhiều áp dụng thi giả thiết như vây khống duy trì đuọc. Nữ sinh có thể
tiêu dùng nhiều quần áo hcm nam công nhăn viên. Nói một cách khác có thể có ảnh
hường tương tác giữa 2 biến chất D2 và Dj và do đó ảnh huỏng của chúng lên frung
bình Y có thể không phải là phép cộng đem giản như trôn mà là nh ìn như mổ hình sau:
Y; = Pi + P2 P 21 + P j D j ì + P*(D2ìDjì) + PsXị + u (4.10)
Từ (4.10) ta thu được chi tiêu trung bình về quần áo cùa một nữ sinh sẽ là
E(YI D2 = 1, Dj = 1, Xi) = (Pi + p2 + + P4) + p 5x;
Trong dó p2 là ảnh hưồng chênh lệch của nfc, p 3 là ảnh hưởng chênh lệch cùa
sinh viên, còn p< là ảnh hưởng chẽnh lệch của nữ sinh. p4 cho ta biết chi tiêu trang
binh về quần áo của một nữ sinh khác khác với chi tiêu trung bình của nam và nữ
công nhân viên. Điều này cho biết sự tuơng tác giữa các biến giả làm thay đổi ảnh
hưởng cùa 2 thuộc tính đã đuợc xem xét 1 cách riêng rẽ như tbế nào.
Để kiểm dinh hệ số P4 - tuong tác của các biến giả - có ý nghiã về mặt thống
kẽ hay khổng, có thể kiểm định t.
4.6. SỬDỤNG BIẾN GIẢ TRONG PHÂN TÍCH MÙA
Như chúng ta đã biết nhiều chuỗi thời gian trong kinh tế có tính chất thời vụ rít rõ,
chẳng hạn doanh số bán của các cửa hàng bán quần áo vào 10 ngày trưóc lết hàng
năm, doanh số bán ra của cửa hàng văn phòng phẩm vào dầu năm h ọ c ,... Thông
thường người ta muốn loại nhãn tố mùa khỏi chuỗi thời gian để người ta cố thể tập
trung vào các thành phần khác của chuỗi thời gian nhu khuynh hướng tăng hoặc
giảm hoàn toàn đều đặn theo một thời kỳ thối gian dài. Quá trình loại thành phần
khỏi chuỗi thời gian thu được như vây gọi là chuỗi thời gian dã được điều chình
theo mùa. Có một số phương pháp điều chinh theo mùa của chuỗi thời gian, trong
mục này ta xét phương pbáp biến giả.
Hoàn toàn như đã trình bày ở trên việc đưa biến giả vào đề loại yếu tố kbỏi
chuỗi thời gian được thực hiện, dựa ưẽn các giả thiết: 1.
Yếu tố thòi vụ chỉ ảnh hưởng đến hệ số chặn của hồi qui, hoặc:
2. Yếu tố thòi vụ ảnh huởng đến cả hệ số góc. 96
Ung với mỗi giả thiết, mô hình được xem xét cũng khác nhau. Để thuận tiện trình bày, ta xét:
Nghiên cứu mối liên hệ giữa thu nhập với chi tiêu cho quần áo, dụng cụ gia
đình, người ta thu thập được một mẫu ngỉu nhiên kích thước n và cho ràng mỏi
một quí có thổ biểu thị mẫu theo mùa. Khi đó mô hình như sau:
Yi = P 1 + p2p 2i + 33D 3l+ p4D Ji + P 5X + IÍ (4.11) Trong đó:
Y| biểu thị chi tiêu của nguời tiêu đùng v ỉ các loại hàng nói trên .
Xj là thu nhập người tiêu dùng i
1 nếu quan sát nằm ồ quí 2 D2 = 0
nếu quan sát nằm ồ quí khác.
1 nếu quan sát nàm ở quí 3 Dj =
0 nếu quan sát nằm ở quí khác
1 nếu quan sát nấm ở quí 4 D 4 =
0 nếu quan sát nằm ở quí khác.
Trong mô hình trên la giả thiết biến có 4 phạm trù, nên ta dùng 3 biến giả,
phạm trù cơ sờ là quí I. N ha vậy nếu có ảnh hưởng theo' mùa của từng quí khác
nhau thì hê số chặn p2, 03 và p4 khác nhau có ý nghĩa v í mặt thống kê. Mỗi một hệ
sơ chặn cho ta biết chi tiêu trung bình ở mỗi quí khác vối quí I như thế nìo. Với giả
thiết E(Ụ) = 0 ta có: Chi tiêu trung bình về các khoản đã kể trền trong quí I là:
E(Y| I D2 = 0, E>3 - 0, D4 = 0, XI) = Pi + PsXị
chi tiêu trung bình v ỉ các khoản đã kể trên trong quí n là:
E(Yi I D2 = 1, D3 = 0, D4 = 0, Xị) = (pi +pĩ) +PsXi
chi tiêu trung bình về các khoản dã kể trên trong quỉ m là:
E(Yi I Eh = 0, Dj = 1 , ^ = 0, Xi) = (p ,+ p 3) + p 5X,
chi tiêu trung bình về các khoản đã kể trên trong quí IV là:
E(Y| I D2 = 0, D j = 0, D4 = 1, JQ) = (Pi +P4) + PsX
Bây giờ ta giả sử rằng có sự ảnh hưởng tương tác giữa mùa và thu nhập 16n chi
tiêu nói cách khác là có sự ảnh hưởng 16n cả hệ sổ góc của hồi qui. Sử dụng
phường pháp tương tự như tr đã tìn h bày trên ta di đến mô hình:
Yi= p, + 02 Díi + Pj D Ji+ p4 D« + p5Xi + p6(D,,Xi) +
+37(D3iXÍ) + Ps(D4jXi) + \jỊ (4.12) 97
Nhu vậy viộc phân tích thời vụ có thé sử dụng 2 mô hình (4.11) và (4.12). Tuy
nhiẽn mô lủnh (4.12) tổng quát hơn, để tránh sự khổng thích hợp ta nên sử dụng
mô hỉnh (4.12). Qua việc ước lượng hồi quy (4.12) chúng ta có thể biết được hẹ số
góc nào có ý nghĩa, hệ số góc nào khỗng có ý nghĩa.
4.7. HỒI QUY TUYẾN TÍNH TÙNG KHỨC
Hầu hết các mổ hình kinh tế luợng mà chúng ta nghiên cứu cho đến nay hần
tíết đều là các mô hình liên tục theo nghía là cả biến độc lập và biến phụ thuộc lấy
một s6 lớn giá trị và sự thay đổi nhỏ trong một biến này có ảnh hưởng do đuợc đến
biến khác. Điều này đã được cải biên khi chúng ta sừ dụng thù tục biến giả để giải
thíctì cho sụ khác nhau về hê số chăn hay độ dốQ hoặc cả hệ số chặn và độ dốc.
Bây giờ chúng ta mò rộng sự phân tích cho phép thay đổi độ dốc, nhưng hạn chế
ràng đoạn thẳng đuợc uớc lượng vẫn là liên tục. Thí dụ chi ra ở hình 4.5, mô hình
đúng là một mô hình liên tục hay có sự thay đổi về kết cấu. Y' A
Nếu chúng ta xẹm xét tiêu dùng của nước ta trước và san khi chuyển dổi thì
chúng ta thấy mỡ hình có dạng như hình 4.5.
ở đây cần nhấn mạnh rằng mộ hình đang xem xét khác với các mô hình có
biến già đă được bình bày trong mục truớc bời vì chúng ta giả thiết rằng không có
sự m ít liên tục hoặc sụ dịch chuyển trong múc tiêu dừng từ năm này qua năm
khác. Mô hình nhừ vậy chúng ta gọi là mô hình tuyến tính từng khúc, ở hình 4.5
mô hình gồm 2 đoạn. Chúng ta sẽ thấy mô hlnh có thể ước lượọg được bằng
phương pháp bình phương nhỏ nhất với việc sừ dụng biến giả thích hợp.
Để ước lượng mô hình đã cho trong hình 4.5, chúng ta giả thiết Ang tiêu dùng
nước ta trong 2 thời kỳ trước và sau chuyển đổi khác nhau. Gọi năm chuyển đổi
kinh tế (từ cơ chế kế hoạch sang cơ chế thị trường) là to. Ta xét mô hình sau:
Ỵ = p 1+(32X, + p3(Xt - X tt)Dl + U , (4.13)
Y,: tiêu d ù n g ; X: thu nhập 98
X ị : thu nhập trong năm bắt đầu chuyển giai đoạn từ cơ chế có kế hoạch
sa n g tơ chế thị trường. 1 nếu t > to
D| = • 0 nếu là giá trị khác cùa t
Với giả thiết E(U) = 0 chúng ta thấy ngay ràng: trung bình của tiẽu dùng trong
những năm trước khi chuyển đổi kinh tế là:
E(Y, I D| = 0, Xi) = Pi +(32X, (4.14) và vói D, = 1 thì ta có
E(Y, I D, = 1, X) = (B, - Pj X , ^ (P2 + P,)X, (4.15)
Vậy 02 cho độ đốc của đường hồi quy trước khi chuyển đỏi. (p 2 + pj) cho đô
dốc cùa đường hồi quy sau khi chuyển đổi.
Chú ý rằng không có sự gián đoạn vì
E(Yị ) = (3, + p2X ị , theo phương trình (4.14)
. = 0i-3.iXti) + (p3 + P3)X,0 = P i+ P2 X ,
Ta cũng chú ý rằng khi p3 = 0 Ihì phuong trình (4.13) sẽ trờ thành phương
tìn h của đường thẳng, vậy kiểm định p3 = 0 sẽ cung cấp cho ta kiểm định đơn giản
về sự thay đổi cấu trúc.
Nhung vấn dề sẽ như thế nào nếu mô hình có nhiều Ihay đổi vê cấu trúc ứng
vái to và t|, thi mô hình thich hợp sẽ là:
v,= (3, + p2X + pj(X, -x,0 )D| +p4(X, - xti )D2+U (4.16) trong đ ó r 1 nếu t > t| D2 =
0 nếu t nhận giá trị khác 1 nếu t > t„ d 4 =
0 nếu t nhận giá trị khác
Vậy phuơng trình c 10 mõi một ưong 3 giai đoạn là như sau: Pi + P2X; với 0 < t < t,, ECO = Pi - P3 X , ) + (p2 + pi) X v<^ to < t ^ t| Pi - P j^ („ ■ ) + (P2 + p 3 + P4) X| • vói t > t| . 4.8. THÍ D ự
a ẽT hì dụ 4.1: Cho mức tiêu dùng theo đẩu người và thu nhập sau thuế của
Mỹ trong thời kỳ 1929-1970. Trong thời gian này có xảy ra chiên tranh thế giđri thứ
hai từ 1941- 1946. Dựa vào kết quả sau đây hãy cho biết " chiến tranh" có ảnh 99
hưởng đên tiêu dùng không? Trong đó D= 1 trong thời kỳ 1941-1946 và bằng khổng trong các năm khác.
Ordinary Least Squares Estimation Dependent variable is c
42 observations used for estimation from 1929 to 1970 Regressor Coefficient Standard Error T-Ratio[Prob] INPT 101.5147 25.4574 3.9876[.000] D -204.9233 18.7856 -10.9085[.000] Y .86363 .014718 58.6788[.000] R-Squaied
.98940 F-statistic F( 2, 39) 1820.4[.000] R-Bar-Squared .98886 S.E. of Regression 42.5410 Residual Sum of Squares
70S79.9 Mean of Dependent Variable Ỉ498.S
S.D. of Dependent Variable 403.0243 Maximum of Log-likelihood -215.558 DW-statistic 1.6342
Theo kết quả trên p J = -20,4,92 < 0; tj = -10,90, p-value = 0,000. Do dó ta kết
luận: Chiến tranh thế giới thứ n có ảnh hưòng đến tíea dùng/ đẩu người Mỹ và lim giảm mức này. Trên dồ thị cho hỉnh ảnh trực giác vẻ mức tiêu dùng giảm trong thời kỳ chiến tranh thế giới thứhaiằ b.
Thí dụ 4.2: Cho tỷ số giũa chỉ số giá các mạt hàng ché*ờ các nước
kém phát triển và chì số giá các mặt hàng chế biến nhập từ các nuớc công nghiệp
trong khoảng thời gian 1950-1986. Trong khoảng thời gian này, từ 1973- 1974,
người ta thấy có biéh động lón vể tỳ số này. Dựa vào đổ thị dưới đây, người ta thấy 100
có bước nhẩy và xu thế của tỷ số này đã thay đổi. Bằng kiểm định Chow và kỹ
thuật biến giả hãy xem xét vấn đề trên.
Các biến sđ: TOT - Tỳ số giữa chỉ số giá các mặt hàng sơ chế các nước kém phát
triển và chì số giá các mặt hàng chế biến nhập từ các nước công nghiệp. T- biến xu
thế( T|950 — 1... T„ 86 = 37).
i ể Kiểm định Chow
ú ớ c lượng m ô hình trong suốt thòi kỳ 1950-1986
Ordinary Least Squares Estimation Dependent variable is TOT
37 observations used for estimation from 1950 to 1986
9f( * * * * * * * * * * * ** * ** ** * *** *** ** * * * * * ** * *»H
* ** * * + ** * * * *** * ** +* * * * * * * * * Regressor Coefficient Standard Error T-Ratio[Prob] INPT 1.1737 .041617 28.2027[.000] T -.0072022 .0019095 -3.7717[.001]
***************************************************************** R-Squared
.28899 F-statistic F( 1, 35) 14.2256[.001] R -B ar-Squared .26867 S.E. of Regression .12402
R e s i d u a l Sum o f Squares
.53831 Mean of Dependent Variable 1.0369
S.D. of D ependent Variable .14502 Maximum of Log-likelihood 25.7588 D W -statistic .86906
***************************************************************** 101 •
ứ ớc lượng mô hình trong suốt thời kỳ 1950-1972
Ordinary Least Squares Estimation
****************************************************** *********** Dependent variable is TOT
23 observations used for estimation from 1950 to 1972 Regressor Coefficient Standard Eưor T-Ratio[Prob] INPT 1.2269 .031119 39.4271[.000] T -.014305 .0022696 -6.3031[.000] R-Squared
.65420 F-statistic F( 1, 21) 39.7295[.000] R-Bar-Squared .63774 S.E. of Regression .072199 Residual Sum of Squares
.10947 Mean of Dependent Variable 1.0553
S.D. of Dependent Variable .11996 Maximum of Log-likelihood 28.8621 DW-statistic .95185
* * * * * + afr 4* * * * * * * * * * * * * * a*e 4c $ 4c 4c * * % * * * * * * * * * * $ % * % sfc 4c 9fc * 3fc * * * * * * * * * % * * * * * •
ứ ớ c lượng mổ hình trong suốt thời kỳ 1973-1986
Ordinary Least Squares Estimation
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * ** * 9|( * * % * afc * % * % * 3fc * 9fc * * * * 3fc * afe * * * * * * Dependent variable is TOT
14 observations used for estimation from 1973 to 1986 Regressor Coefficient Standard Error T-Ratio[Prob] INFT 2.0906 .21450 9.7465[.000] T -.035538 .0069721 -5.0971L 000]
***************************************************************** R-Squared
.68405 F-statistic F( 1, 12) 25.9806[.000] R-Bar-Squared .65772 S.E. of Regression .10516 Residual Sum of Squares Mean of Dependent Variable 1.0067
S.D. o f Dependent Variable .17975 Maximum of Log-likelihood 12.7456 DW-statistic 2.2306
Theo các kết quả trên: RSS = 0,53831;
RSS =RSS, + RSS; = 0.10947 + 0,13271= 0.24218Ệ p _ (R S S - R S S ) / k (0,53832 - 0 ,2 4 2 1 8 )/2
~ R S S /(n l + n2 - 2 k ) ~ 0 ,2 4 2 1 8 /( 3 7 - 4 )
Fo,oj(2i33) = 3,3. F > Fũi0j(2,33) diều này chứng tỏ có thay đổi của hê số chăn hoặc
hệ số gốc hoặc cả hai. 102
2. K ỹ thuật biến giả
Các biến D = 1 trong thời kỳ từ 1973-1986; TD = T*D.
Ordinary Least Squares Estimation Dependent variable is TOT
37 observations used for estimation from 1950 to 1986 Regressor Coefficient Standard Eưor T-Ratio[Prob] INPT 1.2269 .036923 33.2293[.000] T -.014305 .0026929 '-5.3123[.000] D .86368 .17859 4.8361 [.000] TD -.021232 .0062856 -3.3779[.002] R-Squared .68013 F-statistic F( 3, 33) 23.3891 [.000] R-Bar-Squared .65105 S.E. of Regression .085665 Residual Sum of Squares
.24217 Mean of Dependent Variable 1.0369
S.D. of Dependent Variable .14502 Maximum of Log-likelihood 40.5362 DW-statistic 1.7080
Từ kết quả trên, các kiểm định t về hệ số của D và TD đéu cho biết chúng
khác không. Nghĩa là đã có đặ có thay đổi về hệ số chặn và hệ số góc.
v ể mặt kinh tế, phép kiểm định trên cho biết trong khoảng thời gian 37
năm 1950-1986, tỷ lệ giữa chỉ số giá các mặt hàng sơ chế ờ các nước kém phát
triển và chỉ số giá các măt hàng chế biến nhập từ các nước công nghiệp có xu
hướng giảm. Một đô la xuất các mặt hàng sơ chế ngày càng mua được ít hàng chế biến hơn. 103 BÀI TẬP
4.1. Các biến số sau đây là định lượng hay định tính: a. GDP
b. Khủng hoảng dầu mỏ 1973.
c. Xuất khẩu của Việt nam sang các nước ASIAN.
d. Thành viên cùa Tổ chức thương mại thế giới. WTO.
e. Cán bộ tốt nghiẹp ĐH. Kinh tế quóc dân.
f. Học sinh diện chỉnh sách.
4.2. Nghiện cứu sự biến động của lượng gas bán ra (Q: bình) phụ thuộc vào giá gas
(PG: nghìn đ/bình), có người cho rằng chất lưọng gas là quan trọng, người đố cho
rằng Trong những tháng đại lý nhộp binh gas mới thì lượng bán ra khổng giống vãi
nhãng tháng nhập bình gas cũ, do dó dã hổi quy mổ hình có các biến như sau:
D = 1 với những tháng nhập bình mới, D = 0 với những tháng khác, DPG = D*PG. Cho a = 5% .
Ordinary Least Squares Estimation Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
***************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] PG -7.0673 .20832 33.9252[.000] D 106.0104 98.5409 1.0758[.293] DPG .278299 .078845 2.6307[.012] INPT 2403.548 564.094 4.2609[.000] R-Squared .99252 F-statistic F( 3,23) 1016.28[.000] R-Bar-Squared .99154 S.E. of Regression 41.5680 Residual Sum o f Squares
39741.7 Mean of Dependent Variable 1831.4
S.D. of Dependent Variable 451.9370 Maximum of Log-likelihood -136.78 DW-statistic 1.9506
a. Viết hàm hồi quy tổng thể, hàm hồi quy mẫu cho từng trường họp tháng bán bình gas mới và cũ?
b. Tìm ước lượng điểm mức chênh lệch của hê số chặn trong 2 trường hợp trên.
c. Trong tháng bấn bình gas mới nếu giá gas là 110 nghìn thì ước luợng điểm
lượng bán là bao nhiéu? Với tháng bán bình cũ thì giá trị đó bằng bao nhiều?
d. Vẽ đổ thị cùa hàm hổi quy mẫu trong 2 trường hợp. 104
e. Các hệ số của mô hlnh có khác 0 một cách có ý nghĩa không?
f. Hệ số chặn của mô hình trong những tháng nhập bình mới và bình cO có thực sự khác nhau không?
g. Đổ thị thực tế của hàm hổi quy tổng thể có thể có dạng nhữ thế nào?
h. Khi cùng giảm giá 1 nghìn thì khả năng bán thẽm của những binh gas cũ
và mới chênh lệch nhau trong khoảng nào? i.
Một người cho rằng do binh ga luôn có giá cao và an toàn nên lượng bán
không chịu ảnh hưỏng của chất lượng bình gas mà chịu ảnh hưởng cùa việc
quàng cáo. Ajih ta cho ràng trong những tháng có quảng cáo tích cực thl
lượng bán tâng hơn so với những tháng khống tích cực quảng cáo. Hãy xây
dựng mô hình và nều cách kiểm tra. j.
NẾU m uốn xem xét ảnh hưồng đổng thời của cả việc tháng nhập bình gas
• mới hay cũ và có quảng cáo tích cực hay không thì phải xây dựng mô hình
và thực hiện các kiểm định như th ế nào?
4.3. M ột cơ quan nghiên cứu mối quan hê giữa sản lượng đầu ra cùa các cơ sờ sản
xuất và nguồn lực đầu vào (Vốn : K ; Lao động :L) cho rằng cơ sở sản xuất thuộc
sờ hữu nhà nước và không thuộc sở hữu nhà nước thì hiệu quả của nguồn vốn và
lao động không như nhau, do đó xem xét sự biến động của sàn lượng khống chì
phụ thuộc vào vốn và lao động mà còn cả yếu tố thuộc sở hữu nhà nưóc hay khổng.
Khi đặt thêm biến D: D =1 nếu cơ sở sản xuất không thuộc nhà nước v àD = 0 nếu
nguọc lại, và hổi quy mô hình sau với DL = D*L; DK = D*K. Cho a = 5%.
Ordinary Least Squares Estimation Dependent variable is s
20 observations used for estimation from 1 to 20
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * Regressor Coefficient Standard Error T-Ratio[Prob] INPT 19.0034 26.9511 .70511[.492] L 16.9695 6.4600 2.6268[. ] K 9.7180 3.3396 2.7482[. ] DL 5.7866 1.7489 3.3086[. ] DK 2.8915 1.7838 1.6209[.126]
***************************************************************** R-Squared
.79542 F-statistic F( 4,15) 14.5806[.000] R - B a r - S q u a r e d .74087 S.E. of Regression 29.3907
R e s i d u a l Sum o f Squares
12957.2 Mean of Dependent Variable 109.4666
s D. of D ependent Variable 57.7367 Maximum of Log-likelihood -93.1155 DW-statistic 2.4750
if**************************************************************** 105
a. Viết hàm hồi quy tổng thể. Người nghiên cứu xem xét yếu tố thuộc và
không thuộc sở hữu nhà nước tác động đến những hệ số hồi quy nào? Có
xem xét tác động đến hệ số chặn không?
b. Viết hàm hồi quy mẫu cho các cơ sở sản xuất thuộc sở hữu nhà nước và không thuộc nhà nước. : <■' !
c. T im ước lượng điểm của s in lượng của doanh nghiệp thuộc nhà nước và
khống thuộc nhà nuớc khi có 30 công nhãn và nguồn vốn 350 triộụ.
d. Tìm ước lượng điểm mức chênh lêch sản lượng c ù á c ơ số thuộc ivà khổng
thuộc sở hữu nhà nước khi thay đổi một lao động và nguổn vốn thay dổi 1 triệu.
e< Khi cùng thay đổi nguổn vốn, lao động khống đổi thì cơ sở thuộc và không
thuộc nhà nước mức sản lượng thay đổi có khác nhau khống? Nếu cùng
thay đổi lao động, vốn không đổi thì mức thay, đổi sản lượng trong hai
troâmg hợp trên có giống nhau không?
f. Việc đưa thêm biến giả vào có thực sự cán thiết và làm tăng ý nghĩa mô
hình khổng? Dùng kiểm định thu hẹp hổi quy để đua ra kết luận nếu biết
với mô hình s phụ thuộc vào K, L có hệ số chăn RSS bằng 17925,0
g. Nếu có người quan tâm khổng phải là việc cơ sở sản xuất đó thuộc hay
không thuộc sờ hữu nhà nưóe mà là cơ sờ sản xuất thuộc loại lớn (nguổn
vốn trên 1 tỷ) hay loại nhỏ (nguồn vốn dưới 1 tỷ) vì cho rằng cơ sở loại lớn
thì hiệu quả nguổn vốn và nguồn lao động lón hơn cơ sở loại nhỏ. Khi đó
muốn kiểm tra phải làm như thế nào.
h. Nếu muón xem xét tác động của cả yếu tố thuộc và không thuộc sở liữu
nhà nước và yếu tố cơ sờ lớn và nhỏ thì phải làm như thế nào ? 106 CHƯƠNG V BACỆNSĨOTẾH
Trong mô hình phân tích hồi quy bội, chúng la đã già thiết giữa các biến giải
thích của mô hình không có đa cộng tuyến. Nhưng già thiết đó bị vi phạm thì hận
quả sẽ như thế nào và làm th ế nào để phát hiện ra rằng giả thiết này bị vi phạm và
biộn pháp khắc phục nó. Đó là nội dung của chucmg này. Trựớc hết ta cần làm rõ
bản chất và nguyên nhân của đa cộng tuyến.
5.1. BẢN CHẤT CỦA ĐA CỘNG TUYẾN- ĐA CỘNG TUYẾN h o à n h ả o VÀ KHÔNG HOÀN HẢO
Tư tưởng đa cộng tuyến thấm sâu vào mọi khía cạnh của hồi quy bội. Lý do
làm cho “đa cộng tuyến” có ảnh hưởng lớn như vậy là vì khi ta nghiên cứu mối
quan hệ giữa biến Y và các biến giải thích Xi. ta gập quan hệ nào đó giữa các biến Xi vối nhau.
Trường hợp lý tưống là các biến trong mô hủih hồi quy không có tương
quan với nhau; mỗi một biến Xi chứa một thông tin riêng về Y, thông tin không
chứa trong bất kỳ biến Xj khác. Trong thực hành, khi điều này xảy ra ta không gặp
hiện tượng đa cộng tuyến.
ở trường hợp ngược lại, chúng ta gặp đa cộng tuyến hoàn hảo. Giả sử ta phải
ước lượng hàm hồi quy gồm k biến giải thích Xi, X ỉ, x3..... Xk, Yi = P ,X M + p2Xa + .... + p à + ĩ ỉ
Đa cộng tuyến hoàn hảo xảy ra khi một biến giải thích được biểu diẽn dưới
dạng tổ hợp tuyến tính của các biến giải thích còn lại đối với mọi điểm cùa tập số
liệu. Hoặc có thể phất biểu: Đa cộng tuyến hoàn hảo giữa các biến giải thích X|,
X2, X )......Xk xảy ra nếu điều kiện sau được thỏa mãn:
l lX, + X2X2 + .........+ XkXk = 0 (5.1)
trong đó Xi, t a .........A.k, là các hằng số không (Tông thời bằng không.
Thuật ngữ đa cộng tuyến lần dầu tien được Ragnar Frisch sử dụng vào năm
1934 với nội đung trên. Tuy nhiên ngày nay, thuật ngữ này được sử dụng theo
nghĩa rộng hơn. Nó bao g‘ôm cả đa cộng tuyến hoàn hảo và trường hợp trong đó
các biến giải thích có tương quan với nhau theo nghĩa sau:
\) X ii + X ĩXìi + ....... + XkXiá + Vj-= 0 (5.2) 107
trong dó V| là sai số ngẫu nhiên.
Ta hãy minh họa tư tuởng trên bằng dồ thị như sau:
Các biến gidi thích X Biến phụ thuộc Y Các biỂn trục giao cho
thững tin từ những nguồn
độc lập. Không có cộng X, tuyến. Cộng tuyến hoàn toàn. Thông tin dông nhất Không cổ hôi quy. Xj X|
Múc độ cộng tuyến nìo dó * ^
giữa các biến X Những ván
dè hồi quy phụ thuộc v&o X, bạc của công tuyến. Tương quan ngược chiầu N x* giữa các biến X. Cộng tuyến mạnh. \ - - Hình 5.1
Giả sử ta xét mô hình hồi quy trẽn với hai biến giải thích (k = 3). Ta biểu thị
một biến cùng nội dung thông tin của nố bằng một vectơ trong mặt phẳng. Hai
biến khổng cộng tuyến biểu thi bởi 2 vectơ trục giao bong mặt phẳng. Đó là những
vectơ có cùng gốc và tạo thành gốc 90 độ. Các biến cộng tuyến hoàn toàn biểu thị
bằng 2 vectơ nằm trẽn cùng một dường thẳng. Các biến cổng tuyến khong hoằn
toàn nàm giữa hai cạc trên. Góc tucmg ứng giữa hai vecto sẽ hoặc nàm giũa 0 và 90
độ hoặc nằm giữa 90 độ và 180 độ. Gốc giữa các vecto càng gần 0 độ hoặc 180 độ
thì tính cộng tuyến càng lớn.
5.2. UỐC LUỢNG KHI c ó ĐA CỘNG TUYỂN HOÀN HẢO -
Sau đây chúng ta sẽ chỉ ra rằng khi có da cổng tuyến hoàn hảo thì các hê số
hồi quy là khổng xác định còn các sai số tiêu chuẩn là vổ hạn.Để đơn giản về mặt
trình bày, chúng ta xét mổ hình hồi quy 3 biến và chúng ta sẽ sử dụng dạng độ ìẹch ưong đó:
y, = Ỵ - Ỹ ; X, = Xi- X ; ( i = ũ õ (5.3) 108 (5.4) (5.5) (5.6) (5.7)
Giả sử X3| = XXĩi trong đó X là hằng sổ khác không, thay điều kiện này vào (5.6) ta được: % _ ( Y , y , XỊ, ) (
ỳ - Í Ắ ^ y ^ ^ X Ằ ỵ ^ x l ) (5.8)
( ' ỵ ẵ* ỉ i ) ( À ỵ í x ỉ i ) - ( * i ' ỵ l x ĩ i ) i
là biểu thúc khổng xác định, -niơng tự như vậy ta cũng có thể chi ra jj3 không xác định.
Vì sao chúng ta lại thu được kết quả như ở (5.8). Lưu ý đến ý nghĩa của ậ 2 có
thể giải thích điều đó. p 2 cho ta tốc độ thay đổi trung bình cùa Y khi X2 thay đổi 1
đơn vị còn x3 không đổi. Nhung khi Xj = XXì thì điều đó có nghĩa là không thể
tách ảnh huởng của Xỉ và X3 khỏi mảu đã cho. Trong kinh tế luợng thì điều này
phá hủy toàn bộ ý định tách ảnh hưởng riêng của từng biến lên biến phụ thuộc. Thí dụ: X31 =
, thay điều kiên này vào (5.5) ta được: yi =
I + Pj(ÀX2i) + Ci = ( P 2 + xp3)xji + ei = a x ji + ei
Trong đó ă = p2 + ^ p 3 .
Áp dụng công thức tính ước lượng cùa phưcmg pháp bình phương bé nhít thông thường ta được: â = (p J + X p 3) = 2J x 2i2
Như vậy dù a được ước lượng một cách duy nhất thì cững không thể xác định
dươc P và ệ>! từ một phương tìn h 2 ẩn. 109
Như vậy trong trường họp đa cộng tuyến hoàn hảo, chúng ta không thể nhận
được lời giải duy nhất cho các hẹ số hồi quy riêng, nhung trong khi đó ta lại có thể
nhận được lòi giải duy nhất cho tổ hợp tuyến tính của các hệ số này. Chú ý rằng
trong tiucmg đa cộng tuyến hoàn hảo thì phương sai và cấc sai số tiêu chuẩn của
các uớc lượng P i , P ì là vô hạn.
5.3. UỚC LUỢNG TRQNG TRUỠNG HỢP CÓ ĐA CỘNG TUYẾN KHÔNG HOÀN HẦO
Đa cộng tuyến hoàn hảo chỉ là trường hợp đặc biột hiếm xảy ra. Trong các số
liệu liên quan đến chuỗi thời gian, thường xảy ra đa cộng tuyến không hoàn hảo. XẾt mô hình (5.5).
Bây giờ chúng ta già thiết giữa X ì và X3 có cộng tuyến không hoàn toàn theongỉũa: . ' -V X31 = Xx2i + V|
trong đó \ *■ 0, Vị là nhiễu ngẫu nhiên sao cho X xjjV j = 0 .
Trong trường hợp này theo phương pháp bình phương bé nhất ta dẽ dàng thu
được các ước lượng P2 và . /?2 A
6 (i> , xvK ^ J ằĩj+ỵr*)-ỊẲỵ$ylx2l ,ỉ =
( 2 4 x ^ 2 4 + 2 > , 1) - ( ^ Z 4 )2 (5.9)
Trong truỉmg họp này khồng có lý đo gì đổ nói rằng (5.9) là không ước luợng đuọc.
5.4. HẬU QUẢ CỦA ĐA CỘNG TUYẾN
Trong trường hợp có tồn tại đa cộng tuyến gần hoàn hảo thì có thể gặp một số tình huống sau: 1.
Phương sai và hiệp phương sai của các ước lượng bình quân bé nhất lớn
Chúng ta xét mô hình (5.5), theo công thức tính phương sai và hiệp phương
sai của các ước luọng P i p ì (chương hồi quy bội) ta có: v" < f o • ỵ ề = ĩ) (5' 10) 110 v à : COV(ậ2,p 3) = ------ - (5.12) (l — r23)'V^'X2i 2 j x 3i
Trong đó Ĩ23 là hệ số tương quan giữa X2, X3
Từ (5.10) và (5.11) ta thấy khi r23 tăng dăn đến 1 (nghĩa là cộng tuyến tăng)
thì phương sai của 2 ước lượng này tăng dần đến vô hạn. (5.12) chỉ ra ràng khi f23
tăng dần đến 1 thì cov( P 2. P 3) tăng về giá trị tuyệt đối.
2 . K hoảng tin cậy rộng hơn
Như ta đã biết trong chương tnrớc khoảng tin cậy 95% cho (32 và p3 khi ơ2 đã biết là:
Â2 ± 1,96se( P2) và p3 ± l,96se(p3) Trong đó:
s e ( Â ) = Vvar( Â ) - ~ f = T
Cho nên ta có thể viết lại các khoảng túi cậy 95% cho p2 là: P i + 1,96 (5.13) y23 ■Ị í xỉ, và cho P3 là: P i ± 1,96 (5.14) Í P
(5 13) và (5.14) chứng tỏ khi r23 càng gần tới 1 thì khoảng tin cậy cho các tham số càng rộng.
Do đó trong trường hợp có đa cộng tuyến gần hoàn hảo thì số liệu của mẫu có
thể thích hợp vối tập các giả thiết khác nhau. Vì thế xác suất chấp nhận giả thiết sai
tăng lên (tức là tăng sai lầm loại n). 111
3. Tỷ số t m ất ỷ nghĩa
Như dã b iã, khi kiểm định giả thiết H o: Pj = 0, chúng ta dã sử dụng tỷ số t =
Pj/seijjj) và đ a n so sánh gíà trị t dã đwjc uôc Iiwng với giá uị tới hạn t Nhung khi có đa
cộng tuyến gần hoàn hảo thì sai số tiêu chuẩn uớc lượng đuợc sẽ rất cao vì vậy làm cho d
số t nhỏ đi v í giá trị tuyé đối. Kít quả là sẽ làm tăng khả năng chấp nhận giả thiô Ho.
4. R2 cao nhung tì số t it ỷ nghĩa
Đế giải thích điều này. Ta hãy xét mổ hình hồi quy k biến như sau:. Yj = Pi +
+ p3Xái + ••••• + PfcXid + y
Trong trường hợp có đa cộng tuyến gần hoàn hảo, như đã chi ra ồ
trin, ta có thể tìm được một hoặc một số hệ số góc riêng là không có ý nglũa về
mặt thống kê trên cơ sở kiểm định t. Nhung trong khi đó R2 lại
có thể rất cao, nên bàng kiểm định F, chúng ta có thể bác bỏ giả thiết: Ho: P2 = P3
= ...... = pk = 0. Mâu thuẫn này cũng là tín hiệu của đa cộng tuyến.
s . C ác ước lượng bìn h phuong bé n h át và các sai số tiêu chuẩn của chúng
trỏ nên r ấ t nhạy đối với những thay đổi nhỏ trong số liệu
6. Dấu của các uớc lưọng của hệ số hồi quy có thể sai
Khi có đa cộng tuyến gần hoàn bảo thì có thể thu đuợc các ước lượng của các
hệ số hồi quy trái với điều chúng ta mong dại. Chẳng hạn lý thuyết kinh tế cho
rằng đối với hàng hóa bình thường khi thu nhập tâng, cầu hàng hóa lảng, nghĩa là
khi bồi quy thu nhập là một trong các biến giải thích, biến phụ thuôc là luợng cáu
của hàng hóa, nếu xảy ra hiện toọng đa cộng tuyến gần hoàn hảó thì uớc luợng của
hệ sổ của biến thu nhập có thể mang díu am - màu thuẫn với dĩèu ta mong đợi.
7. Thêm vào hay bớt đi các biỂn cộng tuyến với các biỂn khác, mỡ hình se
thay đổi v i độ lớn của các uớc lượng hoặc đấu của chúng
Tóm lại triệu chúng chù yếu của đa cộng tuyến mà ta đã nói ở trên là tăng sai
số tiêu chuẩn. Sai số tieu chuẩn cao hơn có ngụ ý rằng sự biến thiên của bẹ số hồi
quy từ mẫu này đến mẫu khác cao hơn do đó một sự thay đổi nhỏ trong số liệu
hoạc trong mô hình hồi quy (nhu thêm vào hoặc bớt di một biến) sẽ gay ra sự thay
đổi lớn của các hệ số.
Nhu vậy chúng ta đã biết đuợc một sổ bậu quả của đa cộng tuyến. Nhung dù
hậu quà như thế nào đi chăng nữa thì diều quan trọng là làm thế nào để thấy duợc
sự (Ồn tại của nó để ta có thể ngăn ngừa những bậu quà tai hại đối với thủ tục ước
lượng và sử dụng mổ ỉủnh hồi quy đổ dự đoán, điều khiển hoặc hiểu quá tiình liên
quan với nó. Sau đây sẽ trình bày một sổ phương pháp để phái hiện đa cộng tuyỂD
và mổ tả ỉỉhững triệu chứng chủ yếu của nó. 112
5.5. PHÁT HIỆN RA S ự T ồ N TẠI CỬA ĐA CỘNG TUYẾN Theo Kmanta thì ‘m
vấn dề vè đa cộng tuyến là vấn đê v í bậc chứ khống phải
yề loại”, nên việc phân biệt có ý nghĩa khống phải là có hay khống có đa cộng
tuyến mà là bậc khác nhau cùa chúng.
Vì đa cộng tuyến dề cập đến điều kiện cùa các biến giải thích mà được già
định là phi ngẫu nhiên, đó là đặc điểm cùa m ỉu chứ không phải cùa tổng thể.
Do đó chúng ta không kiểm định “tính đa cộng tuyến - mà nếu muốn chúng ta
có thể đo bậc của nó trong một mẫu bất kỳ.”
Sau đây là một vài quy tắc để đo mức đa cộng tuyến.
1. R 2 cao nhung tì số t tbấp
Trong trường hợp R2 cao (thuờng R2 > 0,8) mà tỳ số t thấp như trên đã chú
đó chính là dấu hiộu của đa cộng tuyến.
2ẽ Tương q u an cáp giữa các biỂn giải thích cao
Nếu hộ số tương quan cặp giũa các biến giải thích cao (vượt 0,8) thi cố khả
năng cố tồn tại đa cộng tuyến. Tuy nhiên tiẽu chuẩn này thường khổng chính xác.
Có nhũng trường hợp tương quan cặp khổng cao nhung vẫn cố đã cộng tuyến. Thí
dụ, ta cố 3 biến giải thích Xi, "Xì, và X] nhu sau:
X , = ( 1 , 1 , 1 , 1 , 1 . 0 , 0 , 0 . 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 , 0 )
Xi - ( 0 , 0 , 0 , 0 , 0 , 1 , 1 , 1 , 1 . 1 , 0 ,0 ,0 ,0 ,0 , 0 ,0 ,0 ,0 ,0 )
X, = (1,1,1,1,1,1,1,14,1. 0,0,0,0,0, .0,0,0,0,0)
Rõ ràng x 3 = + X| nghĩa là ta có đa cộng tuyến hoàn hảo, tuy nhiên tuơng quan cặp là: 1
Tiĩ = »1/3 ; r,3 = rjj = 0 ,5 9
Nhu vậy đa cộng tuyến xảy xa mà không có sự báo trước của tương quan cặp
nhưng dầu sao nó cOng cung cấp cho ta những kiểm tra tiên nghiệm có ích.
3ử Xem xét tương q u an riêng ‘
Vì vấn dề được dề cập đến dựa vào tương quan bạc khống. Farrar và Glauber
đã (fô nghị sừ dụng hộ số tirong quan riêng. Trong hồi quy cùa Y đối vói các biến
Xi Xì, x». Nếu tá nhận thấy ràng r2|,234 cao trong khi đó r2,2.34 ; r\ 3.24 ; r214,23 tucmg
đổi thấp thì điều dó có thể gợi ý rầng các biến Xj, Xí, và X* có tương quan cao và
ít nhất một trong các biến này là thừa.
Dù tương quan riêng rất có ích nhưng nó cũng khổng đảm bảo rằng sẽ cung
cấp cho ta hướng dẫn chính xác trong việc phát hiện ra đa cộng tuyến. 113 4. Hồi quy phụ
Một cách có thể tin cậy đuọc để đánh giá mức đọ cửa da cộng tuyến là hồi
quy phụ.HỒi quy phụ là hồi quy mỗi một biến giải thích X; theo các biến giải thích
còn lại. R2 được tính từ hồi quy này ta ký hiẹu R2|
Mối liền hệ giữa Fị và R*i: p _ R? / (k -2 )
i = ( 1 - R ? ) / ( n - k + 1 )
Fj tuấn theo phân phối F với k - 2 và n- k + 1 bậc tự do. Trong đó n là cở mẫu,
k là sổ biến giải thích kể cả hộ số chặn trong mô hình. R2; là hệ số xác định trong hồi quy cùa biến
theo các biến Xkhác. Nếu F| tính được vuợt điểm tới hạn Fi(k-
2, n-k+1) mức ý nghĩa đã cho thì có nghĩa là Xi có liên hộ tuyến tinh với các biến
Xkhác. Nếu Fj có nghĩa về mặt thống kê chúng, ta cũng vẫn phải quyết định liệu
biến Xj nào sẽ bị loại khỏi mổ bình. Một trở ngại củá kỹ thuật hồi quy phụ là gáoh
nặng tính toán. Nhưng ng&y nay nhiều chương trinh máy tính đã cổ thể đảm đương
đuợc công việc tính toán này.
5. N hân tử phóng đại phương sai
Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại
phương s a i gắn với biến 35, ký hiệu là VIF(Xj).
VIF(Xi) đuợc thiết lập trên cơ sở của fiệ số xác định R2j trong hồi quy của biẾn ■
Xj với các biến khác như sau: v n w = (5.15)
Nhìn vào công thức (5.15) có thể giải thích ỶIF(X) bằng tỳ số của phuong sai
thục của Pi trong hồi quy gốc của Y đối với các biến X và phuơng sai của uớc
lượng Pi trong hồi quy mà ở đó Xi Inrc giao với các biến khác.Ta coi tình huđng lý
tuởng là tinh huống mà trong đó các biếa độc lập khổng tương quan với nhau, và
VIF so sánh tình huống thực và tình, huống tưởng. Sụ so sánh này không ích
nhiều và nó khổng cung c ỉp cho ta biết phải làm gì với tinh huống dó. Nố chỉ cho
bi£t rằng tình hỉnh là khổng lý tưỏng.
ĐỒ thị của mối liên hệ eủa R2i và VIF như chỉ ra ỏ hình 5.2 114 0 Hình 5.2
Như hình vẽ chỉ ra khi R2i tăng từ 0,9 đến 1 thì VIF tăng rất mạnh. Khi R2, = 1 thì VIF là vô hạn.
Có nhiều chương trình máy tính có thể cho biết VIF đối với các biến độc lập trong hồi quy. 6. Độ đo Theil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các biến
giải thích. Một độ đo mà xem xét lương quan cùa biến giải thích với biến được giải
thích là độ đo Theil. Độ đo Theil được định nghĩa nhu sau:
m = R2 - Ề ( R 2 - R Ì j ) 1=2
Trong đó R2 là hệ số xác định bội trong hồi quy của Y đối với các biến Xj, x 3,
.... Xk trong mô hình hồi quy:
Y j= Pi + p 2X2i + P3X31 + ....... + PkXki +Ui
R^i là hệ SỐ xác định bội trong mô hình hồi qui của tíiến Y đối với các biến X2 ,
x 3, ... ,X[.1, X +1....... X k '
Đại lượng R2 - J^2.| được gọi là "đóng góp tăng thêm vào" vào hệ số xác định
bội. Nếu X2, X3, ..... Xk không tương quan với nhau thì m = 0 vì những đóng góp
tăng thỗm đó cộng lại bằng R2 . Trong các trường hợp khác m có thể nhận giá trị âm hoặc dương lớn.
Đổ thấy đuợc độ đo này có ý nghĩa, chúng ta xét trường hợp mô hình có hai
biến giải thích Xj và x 3. Theo ký hiệu đã sử dụng ờ chương trước ta có:
m = R2 - (RJ - r212) - (R2 - r213)
Tỷ số t liê .1 hệ với tưcmg quan riêng r2!2.3 , r2i3,2
Trong phần hồi quy bội ta đã biết: R = r 12 + ( 1 - ^ 12) 1^13,2 R = r 13 + (1 - r2ij) ^123
Xhay 2 công thức này vào biểu thức xác định m ta đuợc: 115
m = R2 - [r2i2 + (1 - r212) r213,2 - r^id - [1*13 + (1 - 1* 13) r2i2j - r213 ]
= R2 - K1 - r212) I*1M + (1 - > , 3> r2!2,3 ] (5.17)
Công thức (5.17) cho ta biết điều gì? Để thấy được đíồu đó ta hãy đạt
1 - r*!2 = w2 ; 1 - r2!, = w3 và gọi là các tiọng số. Công thức (5.17) được viết lại duới dạn
m = R2 - [W2 r2|},2 + W3 r*I2jl
Như vậy độ do Theil bàng hiệu giữa bệ số xác định bội và tỏng có trọng số
của các hệ sổ tương quan riêng.
Thí dụ: Giả sử các hộ số tương quan giữa các biến Y và Xì, Xì là nhu sau: Y X í X a Y 1 , 0 0 0 , 9 5 0 , 9 5 * 0 , 9 5 1 , 0 0 . 0 , 9 7 X a 0 , 9 5 0 , 9 7 1 , 0 0
Để tính duợc độ do Theil ta phải tính đuợc R2 và 1*12,3 > r2!3,2 .Theo công thúc
đã biết ở chương hồi quy bội ta cố:
- ị h i z l n h ú í (0.95-0,95 *0,97)2 ' -
(1 - r ỉĩ)(1 - r ả ) ( 1 - 0,9S2X I- 0.972 )
fa » = S i ư ;
r^ế3 - (0.95)2 = 0,9025 R *
= ĩ \ i + ( 1 - I * ,2) 1* 13* = ( 0 . 9 5 ) * + ( 1 - 0 , 9 5 2) 0 , 1 4 * 0,916
Vậy m = 0,916 - 2[1 - 0,9025]’0,14 = 0,888.
Do đó độ đo cùa Theil về mức độ đa cộng tuyến là 0,888.
Tuy nhiên chúng ta vẫn không thể trả lời dược câu hỏi ẵ‘tỉnh cộng tuyến có nghiêm trọng khững?”.
Nhu vậy trên đây chúng ta đã thảo luận một số độ đo đa cộng tuyến nhung tất
cả đều có ý nghĩa sử dụng hạn chế. Chúng chỉ cho ta những thổng báo rằng sự việc
không phải là lý tưởng.
Còn niột sổ độ đo nữa nhung liên quan đến giá trị riêng hoặc thống kẽ Bayes
chúng ta không trình bày ở đá y. 5.6. BIỆN PHÁP KHÁC PHỤC
Vân dề đặt ra là nếu đa cộng tuyến là nghiêm ưọng thì ta có thể lằm gì? cõng
như trong trường hợp trên, chúng ta cũng khống cố những biện pháp hoàn hảo bởi
vì đa cộng tuyến cơ bản là vấn đề mẫu. Tuy nhiên những quy tắc ngón tay cái có
thể đuợc áp dụng đây, còn sự thành cống lại.phụ thuộc vào tính nghiêm trọng của
vấn dề cộng tuyến. Sau đây ta xem xét một số phuơng pháp: U6
1. Sử dụng thông tin tién nghiêm
Một trong các cách tiếp cận để giải quyết vấn đê đa cộng tuyến là phải tận
dụng thông tin tiên nghiệm hoặc thông tin từ nguồn khác để ước lượng các hệ sổ riêng.
Thí dụ: Ta muốn ước lượng hàm sản xuất của một quá ừình sản xuất nào đó có dạng: Q, = AƯYkV * (5.17)
. Trong đó Q, là lượng sản phẩm được sản xuất thời kỳ t; L, lao động thòi kỳ t;
Ki vốn thời kỳ t; ụ là nhiễu; Ạ a , p là các tham số mà chúng ta cần ước lượng.
Lấy ln cả hai vế (5.17) ta được: InQ, = lnA + ctlnL, +PK, u, Đặt
lnQ, = Q \ ; InA = A* ; lnL, = L‘, ta được
Q*. = A* + txL*, + Ị3K*, + Ui (5.18)
Giả sử K và L có tương quan rất cao dĩ nhiên điều này sẽ dẫn đến phương sai
của các ước lượng cùa các hộ số co giãn của hàm sản xụất lớn.
Giả sử từ một ngùốn thông tin khác nào đó mà ta biết được lằng ngành công
nghiệp này thuộc ngành có lợi tức theo quy mô không đổi nghĩa là
a + p = 1. Với thông tin này, cách xử lý của chúng ta sẽ là thay p = 1 - a vào (5.18) và thu đuợc:
Q ’| = A* + a L \ + (1 -a)K*, + u, (5.19) Từ đó ta dược Q*. - K*| = A* + Đặt
Q*, - K*, = y , và L*| - K*| = z ”, ta được
Y , = A' + a Z \ + ut
Thông tin tiên nghiệm đã giúp chúng ta giảm số biến độc lập trong mô hình xuống còn 1 biến z \
Sau khi thu đuợc ước lượng à của a
thì P tính được từ điều kiên p = 1 - â
2. T h u th ập thêm số liệu hoẠc lấy thỀm m ẫu mới
Vì đa cộng tuyến là đặc trưng cùa mẫu nên có thể có mẫu khác- liên quari đến
cùng các biến ữong mẫu ban đàu mà cộng tuyến có thể không nghiêm trọng nữa.
Điều này chỉ có thể làm được khi chi phí cho việc lấy mẫu khác có thể chấp nhận được trong thực tế.
Đ ô i k h i c h ỉ c ầ n t h u t h ậ p t h ề m s ố l i ệ u , tă n g c ỡ m ẫ u c ó th ể là m g i ả m t ín h
nghiêm trọng cùa đa cộng tuyến. 117 3. Bỏ b ỉá i
Khi có hiện tượng đa cộng tuyến nghiêm trọng tỉử cách “ đơn giản nhất” là bỏ
biến cộng tuyến ra khỏi phương trình. Khi phải sử dụng biện pháp này thì cách thức tiến hành như sau:
Giả sử trong mô hình hồi quy của ta có Ylà biến được giải thích còn X2, Xa,....
là các biỂn giải thích. Chúng ta thấy rằng Xỉ tương quan chặt chẽ vói X3 . Khi đó
nhiều thông tin về Y chứa ở Xi thì cũng chứa X3 . Vậy nếu ta bỏ một trong hai
biến Xị hoặc x 3 khỏi mô hình hồi quy, ta sẽ giải quyết được vấn đề đa cộng tuyến
nhung sẽ mất đi một số thững tin về Y.
Bằng phép so sánh R2 và R 2 trong các phép hồi quy khác nhau mà có và
khổng có một trong hai biên chúng ta có thể quyết định nền bỏ biến nào trong 2
biến x 2 và x 3 khõi mô hình.
Thí dụ: R2 đối với hồi quy của Yđối với tất cả cấc biến Xi, X2, ...,Xk là 0,94;
R2 khi loại biến là 0,87 và R2 khi- loại X) là 0,92 ; Nhu vậy trong trường hợp này ta loại X a.
Chúng ta lưu ỷ một bạn chế của biẹn pháp này là trong các mỡ hình kinh tế cổ
nhâng trường hợp đòi hỏi nhất định phải có biến này hoặc biến khác trong mồ
hình. Trong những trường hạp như vậy việc loại bỏ 1 biến phải được cân nhác cẩn
thận giữa sai lệch khi bỏ một biến cộng tuyến với việc tăng phương sai của các uớc
luợng hộ số khi biến đó ở ưong mồ hình. Điều này sẽ đuợc xem xét ở chương XL
4. Sử dạng sai phân cấp một
Thù tục này đuợc trình bày trong chuơng v i n - “Tự tương quan”. Mặc dần
biện pháp này có thể giảm tương quan qua lại giữa các biến nhung chứng cũng có
thể dược sử dụng như một giải pháp cho v in dề đa cộng tuyến.
Thí dụ: Chúng ta có số liệu chuõi thời gian biểu thị liên hệ giữa biến Y và các
biến phụ thuộc Xi và X3 theo mô hĩnh sau: Y| = Pi + IW&I + P A + Ụ (5.20)
Trong đó t là thời gian. Phương trình trên đúng vói t thì cũng đúng với t - 1 nghĩa là:
Y|-1 - Pi + PXjM + P3X31-1 + IỊ-I (5.21)
Từ (5.20) và (5.21) ta đuợc:
Y| - Y|.1 = PỉCXii - Xỉ,.]) + P3CX3, + Xji-i) + I Ị - H-I (5.22) Đặt
y, = Y[ - Y|_1 ; X21 = Xj| - Xjt-|; X31 = Xìt + X31.1 ; ■ . V, = u - ụ . , . ta được: y, - P2X2, + £ 3X3, + V, (5.23) 118
Mô hình h'ôi quy dạng (5.23) thường làm giảm tính nghiêm trọng của đa cộng
tuyến vì dù x 2 và Xj có thể tương quan cao nhung không có lý do tiên nghiêm nà<>-
chắc chắn rằng sai phân cùa chúng cũng tương quan cao.
Tuy nhiên biến đổi sai p h in bậc nhất sinh ra một số vấn dề chẳng hạn như số
hạng sai số V| trong (5.23) có thể không thỏa mãn giả thiết của mô hình hồi quy
tuyến tính cổ điển là các nhiễu không tương quan. Vậy thì biện pháp sửa chữa này
có thể lại còn tồi tê hơn căn bệnh.
5. G iảm tưong quan trong hồi quy đa thức
N ét đặc biệt của hồi quy đa thức là các biến giải thích xuất hiện với lũy thừa
khác nhau trong mô hình h'ôi quy. Trong thực hành, để giảm tương quan trong hồi
quy đa thức, người ta thường sừ dụng dạng độ lệch (lệch so với giá trị trung bình).
Nếu viộc sử dụng dạng độ lệch mà vẫn không giảm da cộng tuyến thì người ta có
thể phải xem xét đến kỹ thuật “đa thức trục giao”.
6 . M ột số biện p h áp khác
N goài các biện pháp đã kể trên, người ta còn sử dụng một số biên pháp khác
nữa để cứu chữa căn bộnh Ị}ày như sau:
- Hồi quy thành phần chính.
- Sử dụng các ước lượng từ bên ngoài...
Nhưng tất cả các biện pháp đã trình bày trên có thể làm giải pháp cho vấn
dề đa cộng tuyến như thế nào còn phụ thuộc vào bản chất của tập số liệu và tính
nghiêm trọng của vấn đề đa cộng tuyến. 7 /T h í dụ
Cho các biến số c - Tiêu dùng; Y- Thu nhập sau thuế; L- Tài sản dễ chuyển
thành tiền. Dựa trên 38 quan sắt, ta ước lượng được các m ô hình sau đây: c = -7 ,1 6 0 + 0,95213Y + e RJ = 0,9933 (5.24) (t) ( 1,93) (73,25)
C = -10,627 + 0,68166Y + 0.37252L + e R- = 0,9953. (5.25) (t) (-3,25) (9,60) (3,96) L = 9,307 + 0,76207 Y + e R2 = 0,9758 (5.26) (t) (1,8) (37,2)
(5 26) cho ta thấy giữa L và Y có tương quan khá cao với nhau. Điểu này chứng tỏ
có đa cộng tuyến. Nếu thay L trong (5.26) vào (5.25) sẽ được (5.24). Tuy nhiên
nếu chỉ nhìn vào (5.25) thì ta không phát hiện ra điều đó. Bởi vì các tỷ số t trong
(5 25) đều cao, dấu của các hệ số đều phù hợp. Dựa trên (5.24) và (5.25), bằng
kiểm định F, ta thấy không thể bỏ L đi được. 119
Bay giờ sẽ xem xét kỹ hon vắn dề này. Ta sẽ ước luợng lại mô hình (5.24),
(5.25) và (3.26) sau khi bỏ di hai quan sát cuổi cùng. Ta cồ ieết qúả sau đay:
c = -6,980 + 0,95145Y + e RJ = 0,9925 (5.27) (t) (-1,74) (67,04)
c = -13,391 +0,63258Y + 0,45065L + e RJ = 0,9951. (5.28) (t) (-3,71) (8,12) (4,24)
L = 9,307 + 0,76207 Y + e R2 = 0,9758 (5.29) (t) (2,69) (37,80)
Bằng cách so sánh từng hộ số (5.24) với (5.27); (5.25) với (5.28) và (5.26) với
(5.29), sẽ thấy ràng dù chỉ thay đổi chút ít số liệu nhung kết quả khác biệt rít
nhiều. Điẻu này cho thấy đa cộng tuyến ở đây là nghiêm trọng. 120 B À I TẬP
5.1. Hãy giải thích các văn đề sau:
a. Đ a cộng tuyến, đa công tuyến hoàn hảo và đa cộng tuyến không hoàn hào.
b. H àm hổi quy phụ, mục đích cua việc đust vào hàm hổi quy phụ là gì?
c. Hàm tổng chi phí có dạng: TCOST = p, + Pọ Q + PjQ2 + P„Q3. Trong hàm
này có chứa cả Q, Q2 và Q3 . Bạn có chó rằng có đa cộng tuyến trong mô hình này không?
5. 2. Vổri Q là lượng bán gas, PG là giá một blah gas, PE là giá điện sinh hoạt, PC là giá bếp gas.
a. Khi hổi quy Q phụ thuộc PG và hộ số chăn, có thể có hiện tượng đa cộng tuyến không? b. Cho mô hình [1]
[1] Ordinary Least Squares Estimation Dependent variable is Q
27 observations used for estimation from 97M1 to 99M3
***************************************************************** Regressor Coefficient Standard Error T-Ratio[Prob] INPT 1053.6 123.052 8.5615[.000] PG -6.9435 .626036 -11.09i2[.000] PC -.001737 .001815 -.95682[.349] PE 338.15 128.23 2.6371[.015]
**************************************************************** R-Squared .99406 F-statistic F( 3,23) 1284.9[.000]
Nghi ngờ trong mô hình [1]: Q phụ thuộc PG, PC, PE và hộ số chặn có thể có hiộn
tượng đá cộng tuyến, vì thống kê T của hệ số ứng với biến PC nhỏ mà R5 lớn. Hãy
nêu một cách kiểm tra hiện tượng đó.
c. Tiến hành hổi quy được kết quả sau đay:
[2] Ordinary Least Squares Estimation Dependent variable is PC
27 observations used for estimation from 97M1 to 99M3 Regressor Coefficient Standard Errol- T-Ratio[Prob] P E - 7 . 3 6 0 8 3 .6 7 3 0 - 2 .0 0 4 0 [ .0 5 6 ] p 5 .34168 .020910 16.3406[.000] TxJ-pT 5 5 5 .7 0 8 2 50.9517 10.9066[.000]
***************************************************************** R Sauared
.93617 F-statistic F( 2 ,2 4 ) 176.0110[.000]
**************************************************************** 121
d. Mô hình [2] nhằm mục đích gì?
e. Biến PC có phụ thuộc tuyến tính vào biến PE không? Có phụ thuộc tuyến tính vào biến PG không?
f. M ô hình [1] có khuyết tật đa cộng tuyến không? Đa cộng tuyến này là
hoàn hảo hay không hoàn hảo? Các ưóc luạng cua mô hình [1] còn là uớe lượng tốt nhất khổng?
g. Nêu một cách khắc phục đơn giản khuyết tật trong mô hình [1]
h. Khi bò biến PC khỏi mô hình [1], tiến hành hồi quy Q theo PG, PE có hê
số chận thu được R2 = 0,9821. Có nên bỏ biến PC không? i.
Để kiểm tra mô hình Q phụ thuộc PG, PE và hệ số chặn có khuyết tạt
không, người ta hồi quy PG theo PE có hệ số chặn thu được hệ số xác định
bằng 0,1215. Mô hình đó dùng để làm gì, có kết luận gì thu dược? j.
Khi hổi quy mô hình : Q phụ thuộc PG, D, DPG có hệ số chặn với D là
biến giả nhận giá trì bằng 1 nếu là tháng đại lý bán bình gas mới, D = 0
với các thấng bán bình gas cũ, DPG = D*PG. Các biến D và DPG cố thể
có quan hệ cộng tuyến với nhau hay không?
5.3. Với s là sản lượng của một cơ sở sản xuít, K là nguổn vốn, L là lao động, D là
biến giả với D = 1 nếu cơ sờ sản xuất khổng thuộc sò hữu nhà nước và D = 0 nếu
cơ sở thuộc sỏ hữu nhà nước, a = 5%.
a. Khi hổi quy mô hình: s phụ thuộc L có hệ số chận có thể có hiện tuọng đa cộng tuyến không?
b. Khi hổi quy mô hình [1]:
[1] Ordinary Least Squares Estimation * * % % * * * %
% * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * %
* * * * * * * sệt * * * * * * * 4c Dependent variable is s
20 observations used for estimation from 1 to 20 Regressor Coefficient Standard Eưor T-Ratio[Prob] INFT -20.6583 22.0029 -,93889[.361] K 10.7720 ế 2.1599 4.9874[.000] L 17.2232 4.5279 3.8038[.00I] R-Squared .71699
F-statistic F ( 2 , 17) 21.5343[.C00]
***************************************************************** 122
Nếu nghi ngờ mô hình [1] trên có hiện tượng đa cộng tuyến, hãy nêu m ột cách kiểm định.
c. Cho biết bàng kết quả hồi quy [2] dưới đây dùng để làm gì? Kết luận gì thu
được về hiện tượng đa cộng tuyến trong mô hình [1]?
[2] O rdinary L east Squares Estimation D ependent variable is K
20 observations used for estim ation from 1 to 20 R egressor Coefficient Standard Error T-Ratio[Prob] L .18696 .07589 2.4634[.024] INPT 5.1153 13.4659 -37987[ế708]
***************************************************************** R-Squared
.254482 F-statistic F( 1,18) 6.1443[.024]
d. Khi hổi quy s phụ thuộc vào L, K, T có hệ số chặn, trong đó T là biến số
công nghệ, người ta thu được hệ số của T bằng 5.8332 vói độ lệch chuẩn
bằng 4.9235. Biến số T đua vào có ý nghĩa không?
e. Nghi ngờ trong mô hình nói ờ câu (d) có hiện tượng đa cộng tuyến, người
ta hổi quy T theo L, K có hệ số chặn thu được R2 bằng 0,6213. Kết quả đó
cho biết điều gì? Khi đó có nên đưa biến T vào mô hình không? f.
Nếu muốn kiểm tra mô hình LS phụ thuộc vào LL, LK - L. là logarit cơ
số tự nhiên của các biến tương ứng - có hệ số chặn, để biết có hiện tượng
đa cộng tuyến hay không, ta co thể làm thế nào?
g. Khi hổi quy LK theo LL có hệ số chận thu được ước lượng hệ số góc bằng
1,928 và độ lệch ehuẩn bằng 1,437. Kết quả đó dùng để làm gì, kết luận gì thu được.
h. Khi đặt biến DL = D*L với D là biến giâ, khi đó D và DL có quan hộ cộng tuyến không? 123