Bài 4: Phân tích hi quy và tương quan
v1.0 69
N Mi dung c tiêu
Nhim v ca phân tích hi quy và
tương quan.
M t s mô hình h i quy và cách xác
đị nh các tham s c a mô hình.
Cung cp ph ng kê ương pháp phân tích th
nghiên c u m i liên h nhân qu gia các
hin t i. ượng kinh tế – xã h
Thi lượng hc c Hướng dn h
7 tiết Đọc bài gi ng và tho lu n.
Tr l m i câu hi ôn tp, câu hi trc nghi
và làm bài tp.
BÀI 4: PHÂN TÍCH HI QUY VÀ TƯƠNG QUAN
Bài 4: Phân tích hi quy và tương quan
70 v1.0
TÌNH HUNG D N NH P
Tên tình hung: Phân tích th trường xe máy
Gi s b n v n đang nghiên c u v đề mua bán xe máy
Honda Wave đã qua s d a ng. Bn nhn thy giá bán c
chiếc xe do rt nhiu nhân t quyết nh. đị Đó có th là s
năm s d c, ng xe, màu s đối tượng mua, đối tượng bán,
thm chí c nhu cu mua, nhu cu bán cũng có nh hưởng
đế đ n giá c c a nó... Bn th c hin m t iu tra th ng kê trên
11 chiếc xe để tìm hiu m i liên h gi a các nhân t nh
hưởng và giá bán ca nó. S liu cho thy, d ng nhườ ư đúng
là có mi liên h gia các nhân t nêu trên vi giá ca chiếc
xe. Nhưng b n l u di n m ó nh i không biết bi i liên h đ ư thế nào.
Câu hi
Bài hc này s giúp bn cách thc xây dng m i liên h ph thu c qua li gia các hin tượng
kinh tế – xã hi, h c cđồng thi cũng s ướng d n b n cách đánh giá m độ cht ch a mi liên
h ó nhđ ư thế nào?
Bài 4: Phân tích hi quy và tương quan
v1.0 71
4.1. Nhim v ca phân tích hi quy và tương quan
4.1.1. M i liên h gia các hin tượng kinh tế xã hi
Các hi ng kinh tn tượ ế – xã hi tn t phi trong mi liên h thuc ln nhau. Các mi
liên h này có th din ra theo thi gian hay không gian nht định. Các mi liên h
din ra theo th a các i gian ngh c vào nhau cĩa là s tác động qua li và s ph thu
hi on tượng khi chúng các giai đ n và quá trình ca s phát trin. Các mi liên h
din ra theo không gian nghĩa là s tác động qua li và s ph thuc vào nhau ca các
hin t ng khi chúng n tượ cùng mt thi gian. Thm chí ngay trong cùng mt hi ượng
nghiên cu bao gm nhiu tiêu thc khác nhau, thì nhng tiêu thc này cũng có mi
liên h qua li nht định. Tu theo m độ c cht ch, mà người ta chia m i liên h
thành các loi dưới ây. đ
4.1.1.1. Liên h hàm s
Khái nim: Liên h hàm s là mi liên h hoàn
toàn cht ch. S n t thay đổi ca hi ượng này có
tác dng quyết nh ng đị đến s thay đổi ca hin tượ
liên quan theo mt t l xác định.
Liên h hàm s được viết d i dướ ng: y = f(x), có
nghĩa là c m ci giá tr a x thì theo mt hàm nào
đ ó có m t giá tr c a y tương ng.
Mi liên h này thường có trong t nhiên. Ví d
trong vt lý: S = v t...
Đặc đim: Liên h hàm s không nhng n t c được biu hi ng th mà còn đượ
biu hi ng n v t. n trên t đơ cá bi
4.1.1.2. Liên h tương quan
Khái nim: Liên h tương quan là mi liên h không hoàn toàn cht ch. S thay
đổ đổ ưi c a hin tượng này có th làm hin tượng liên quan thay i theo nh ng không
nh h t nh. ưởng hoàn toàn quyế đị
Mi liên h này rt ph biến và thường gp trong các hin tượng kinh tế – xã hi.
Đặc đim: Liên h t ng ương quan không được biu hin trên t đơn v cá bit mà
phi thông qua hin t l ). ượng s n (là tng th
Ví d: M ng i liên h gia tui ngh và NSLĐ. Tui ngh có tác độ đến NSLĐ
nhưng NSLĐ không ch chu nh h ng cưở a tui ngh mà còn chu a nh h ng cưở
các nhân t khác. Mt khác, nếu nghiên cu riêng l t ng đơn v cá bit, có nhng
đơ Đ đển v, tu i ngh hoàn toàn không nh hưởng t i NSL . Vì vy, có th nêu lên
được mi liên h tương quan cn ph i nghiên cu hin tượng s l n.
4.1.2. Nhi m v ca phân tích hi quy và tương quan
Phương pháp phân tích hi quy và tương quan gii quyết hai nhi ym v ch ếu sau:
4.1.2.1. Xác định mô hình hi quy phn ánh mi liên h
Nhim v đầu tiên ca phân tích hi quy tương quan là xây dng mô hình (hay
phương trình) hi quy và xác định tính cht (thun – ngh ng nhch) cũ ư hình thc ca
mi liên h (loi mô hình).
Bài 4: Phân tích hi quy và tương quan
72 v1.0
Để gi i quyết nhi m v này, cn ph i thc hi n 4 bước sau:
Bước 1: Gii thích s t bn ti thc tế và bn cht ca mi liên h ng phân tích lý
lun. Tu theo m đ c ích nghiên c u c th mà xác định trong mi liên h đó, âu đ
là nguyên nhân, đâu là kết qu.
Ví d: Tui nghnh hưởng ti NSLĐ. Như vy, tui ngh là nguyên nhân có
nh hưởng đế Đn NSL .
Nhưng n n ph n xuếu xét trong mi liên h vi khi lượng s m s t và giá thành
đơ Đ đn v, ta thy: NSL tăng dn ti kh i lượng sn phm sn xut tăng. Khi ó,
NSLĐ l n i là nguyên nhân, khi lượng s n ph ng s m là kết qu. Khi khi lượ
phm sn xut tăng thì giá thành gim. Khi lượng s n ph n xu m s t li đóng vai
trò là nguyên nhân, giá thành là kết qu.
Ví d: M i liên h gia chi phí qung cáo và
doanh thu. Khi nghiên cu các nhân t tác động
đế n doanh thu thì chi phí qung cáo là m t nguyên
nhân. Nhưng khi nghiên cu nhân t tác động n đế
chi phí qung cáo thì doanh thu cũng li là mt
nguyên nhân. Trong trường hp này phi chú ý đến
mc nh đích nghiên cu là gì để xác đị đâu là tiêu
thc nguyên nhân, đâu là tiêu thc kết qu.
Trong mi liên h này, th có nhiu nguyên
nhân nhưng ch có mt kết qu.
Bước 2: Thăm dò mi liên h b ng các phương pháp th ng kê: ph ương pháp đồ
th, phân t, s bình quân, phương pháp quan sát 2 dãy s song song…
Bước 3: L p ph u hi n m . ương trình hi quy bi i liên h
Ví d: Các phương trình y = a + bx; y = a + bx + cx2
Bước 4: Tính toán các tham s và gii thích ý nghĩa ca chúng.
4.1.2.2. Đánh giá mc c tđộ cht ch a mi liên h ương quan
Sau khi đã xây dng được phương trình h i quy biu din m i liên h gi a các hin
tượng kinh tế – xã hi, nhim v th hai ca phân tích hi quy tương quan là đánh giá
mc cđộ cht ch a mi liên h tương quan và s phù h p c a mô hình thông qua h
s tương quan (tuyến tính) và t s t ương quan (phi tuyến tính).
4.1.3. Ý nghĩa ca phân tích hi quy và t ng quan ươ
Phân tích hi quy và tương quan là phương pháp thường d ng u được s để nghiên c
mi liên h t nh ương quan gia các hin tượng kinh t – xã hế i. Bên c đó, nó còn
được s dng nhiu trong nghiên c ư u th ng kê, nh phân tích dãy s thi gian, d
đ oán th ng kê...
Trong phn tiếp theo, bài ging s đi vào trình bày cách thc xây dng và phân tích
mt mô hình hi quy th hi n m i liên h gi a m t tiêu th c nguyên nhân và mt tiêu
thc kết qu.
4.2. Hi quy và tương quan gia hai tiêu thc s l ng ượ
Trước hết là dng mô hình n giđơ n nht, mô hình hi quy tuyến tính.
Bài 4: Phân tích hi quy và tương quan
v1.0 73
4.2.1. Mô hình hi quy tuyến tính gia hai tiêu thc s l ng ượ
4.2.1.1. Mô hình hi quy
Trước khi đi vào xây dng mô hình hi quy, chúng ta hãy xem xét mt s khái ni m
có liên quan.
M t s khái nim liên quan
o Đường hi quy thc nghi m: là đườ đượng c hình thành bi các tài li u thc tế.
o Đường hi quy lý thuyế t: là đường đi u chnh bù tr các chênh l ch ng u nhiên
vch ra xu hướng c b ng. ơ n ca hin tượ
o Mô hình hi quy là mô hình xác đị đườ nh v trí c a ng h i quy lý thuyết sao cho
mô t g n úng nh đ t mi liên h thc tế.
Xây dng mô hình hi quy tuyến tính đơn
o Mô hình hi quy tuyến tính biu din mi liên h gia 2 tiêu thc s l ng ượ
có dng:
x
ˆy = b0 + b1x
Trong đó:
x: Tr s c nh h a tiêu thc gây ưởng (nguyên nhân) (biến độc lp).
x
ˆ
y : Tr s điu chnh ca tiêu thc chu nh h n phưởng (kết qu) (biế
thuc) theo quan h vi x.
b0: H s t s do (h chn), là đim xut phát ca t, đường hi quy lý thuyế
nêu lên nh hưởng c c nguyên nhân khác) ngoài a các nhân t khác (tiêu th
x t bi n ng ci s ế độ a y.
b1: H s h s d nh h i quy (h góc, độ c), phn ánh ưởng trc tiếp ca tiêu
thc nguyên nhân x đến tiêu thc kết qu y. M n vi khi x tăng lên 1 đơ thì
y s n v . thay đổi trung bình b1 đơ
b1 nói lên chiu hướng ca mi liên h: b1 > 0: Mi liên h thun; b1 < 0:
Mi liên h nghch.
o Cách xác định tham s:
b0, b ph1 i được xác định sao cho đường hi quy lý thuyết mô t g n t đúng nh
mi liên h thc tế. Trên hình v, khong cách t đim thc tế đến c đim thu
đường h nhi quy lý thuyết nh t s là tt nht.
S dng ph ng nh nhương pháp bình phươ t (OLS – Ordinary Least Square)
vi ni dung: tng bình phương các độ lch gia giá tr thc tế và giá tr
thuyết c a biến ph thuc (tiêu th c kết qu) là nh nht.
Đường hi quy
thc nghim
Đường hi quy
lý thuyết
Bài 4: Phân tích hi quy và tương quan
74 v1.0
2
i x
ˆ
S (y y ) min
Hay 2
i 0 1
S (y b b x) min
Để th đ đạa mãn iu ki n trên, c n tính o hàm riêng theo 2 tham s cn tìm.
T ó, b phđ 0 và b1 i tha mãn h phương trình:
0 1
2
0 1
y nb b x
xy b x b x




H ph ương trình chun
T h n phương trình trên, sau khi biế đổi, b0 và b1 có th được tính đơn gin
hơn theo công thc:
12
x
xy xyb

b0 = y – b1x
Trong ó: đ i
x
xn
i
y
yn
xy
xy n
2
2
2 2 2
x
x x x (x)
n n






Chú ý:
Nên s d n ng công thc rút g trên để tính b0 và b1 ch không nên gii h phương
trình chun.
Ví d: Có tài liu v ng nh 11 xe máy Honda Wave đã qua s d ư sau:
Stt S năm s dng
(năm) x
Giá bán
(triu đồng) y xy x2 y2
1 5 8,5 42,5 25,0 72,25
2 4 10,3 41,2 16,0 106,09
3 6 7,0 42,0 36,0 49,00
4 5 8,2 41,0 25,0 67,24
5 5 8,9 44,5 25,0 79,21
6 5 9,8 49,0 25,0 96,04
7 6 6,6 39,6 36,0 43,56
8 6 9,5 57,0 36,0 90,25
9 2 16,9 33,8 4,0 285,61
10 7 7,0 49,0 49,0 49,00
11 7 4,8 33,6 49,0 23,04
Tng 58 97,5 473,2 326,0 961,29
Trung bình 5,273 8,864 43,018 29,636 87,390
Yêu cu: Lp mô hình hi quy tuyến tính biu din m gii liên h a s năm
s dng xe và giá bán ca xe.
Hướng dn:
đ đ ây chúng ta ang nghiên c u các nhân t nh hưởng đến giá bán xe máy
nên s năm s d c ng s là tiêu thc nguyên nhân x, còn giá bán s là tiêu th
kết qu y.
Bài 4: Phân tích hi quy và tương quan
v1.0 75
Mô hình hi quy có dng: x
ˆ
y = b0 + b1x
Xác định các tham s:
2 2 2 2
xx (x) 29,636 5, 273 1,831
12
x
xy xyb
 = 43,018 5, 273 8,864 2,03
1,831
 < 0 m ch i liên h ngh
b0 = y – b1x= 8,864 – (–2,03 5,273) = 19,57
Vy phương trình hi quy tuyến tính biu din mi liên h gia s năm s
dng và giá bán có dng:
x
ˆy = 19,57 – 2,03x
Trong đó:
b0 = 19,57 nêu lên nh h ng cưở a các nhân t khác ngoài s năm s d i ng t
s thay đổi ca giá bán.
b1 = – 2,03 nêu lên nh hưởng trc tiếp ca s năm s d a ng ti s i c thay đổ
giá bán. Khi s n dăm s ng tăng thêm 1 năm thì giá bán ca chiếc xe s gi m
đi trung bình 2,03 triu đồng.
Cách kim tra kết qu:
x t 2 ăng t đến 7 năm làm y gi m t 16,9 xung còn 4,8 triu đồng; vy x
tăng làm y gim, ta có mi liên h nghch, tc b1 < 0.
Thay bt k g tr nào ca x o phương tnh hi quy phi ra giá tr x
ˆ
y yx.
Lưu ý:
T phương trình hi quy trên, nếu ta có mt giá tr ca x, thay vào phương
trình ta s tính được giá tr ca y tương ng và ngược li.
Trong trường hp trên, khi x = 0, x
ˆ
y = b0 = 19,57 (tri đu đồng), ây chính là
mc giá ca 1 chiếc xe Honda Wave mi.
Sau khi đã xây dng xong mô hình hi quy phn ánh m i liên h gi a các hi n tượng
kinh tế – xã hi, nhim v tiếp theo ca phân tích hi quy và tương quan là phi ánh đ
giá được trình độ ch t ch c a m đ ũi liên h ó c ng như s phù h p c a mô hình đã có.
4.2.1.2. H s t ương quan
Khái nim: H s t ương quan là ch tiêu đánh giá mc cđộ cht ch a mi liên h
tương quan tuyến tính đơn.
Tác dng:
o Xác ng cđịnh cườ độ a mi liên h t đ ó ch n ra nguyên nhân ch y c ếu ho
th y u ế đối vi hin tượng nghiên cu.
o Xác định chiu h ng cướ th ca m i liên h (thu n – nghch).
o H s t ương quan còn dùng trong nhiu trường hp d đ oán th ng kê và tính
sai s c a d oán. đ
Công thc tính:
x
1
x y y
xy xy
r b


Bài 4: Phân tích hi quy và tương quan
76 v1.0
Như v s t s by, du ca h ương quan r ph thu a hc vào du c 1 vì phương sai
luôn mang du dương.
Các tính ch t c a h s tương quan: Min xác định: –1 r 1.
o r > 0: Mi liên h tương quan tuyến tính thu n.
o r < 0: Mi liên h tương quan tuyến tính nghch.
o r = ± 1: Mi liên h hàm s hoàn toàn ch . t ch
o r = 0: Không có m ti liên h ương quan tuy a x và y. ến tính gi
o r càng gn 1: Mi liên h càng cht ch (cường mđộ i liên h).
o r r . 0,9: Mi liên h t ch t ch
o 0,7 r t ng . 0,9: Mi liên h ươ đối ch t ch
o 0,5 r 0,7: Mi liên h bình thường (trong d đoán thường không s dng r
này đối vi tiêu thc s lượng nhưng vi tiêu thc thuc tính thì vn s dng).
o r < 0,5 : Mi liên h h o. ết sc lng l
Vn dng vào ví d trên, ta có: 2
2 2 2
y y y y 87,390 8,864 2,97
r = (–2,03) 97,2
353,1 = – 0,925
Kết lun: Mi liên h gia s n dăm s ng và giá bán xe Honda Wave cũ là mi liên
h t . ương quan tuyến tính nghch và rt ch t ch
4.2.1.3. H s nh xác đị
Khái nim: H s xác định dùng để đánh giá s phù hp ca mô hình, nó cho biết t
l % thay đổi ca y được gii thích bi mô hình.
ví d trên, ta có: r2 = (– 0,925)2 = 0,8556.
Như v i y, 85,56% s thay đổi ca giá bán xe máy Honda Wave cũ được gii thích b
mô hình đã nói trên trong mi quan h vi s n d ng. u ăm s Đi đó nói lên rng,
s n dăm s ng là hoàn toàn hu ích khi d . đoán mc giá bán ca mt chiếc xe cũ
4.2.1.4. Ki m c n định các tham s a phương trình hi quy tuyến tính đơ
Trong mi liên h t m c c ương quan gia x và y, c i giá tr a x ta có th thu đượ
nhiu giá tr c a y. Khi đó, chúng ta phi có mt s gi định sau:
o Đường hi quy tng th chung: vi phương trình tuyến tính x yˆ= + 0 1x, thì
mi giá tr c a x s có nhiu giá tr t ng ươ ng ca y, khi đó s bình quân ca các
giá tr này s n m trên mt đường thng. Đường th đ ng ó g i là đường hi quy
tng th chung và phương trình ca nó là phương trình hi quy tng th chung.
o Độ l ch tiêu chu n: độ l ch tiêu chu n
ca tng th chung gm các giá tr y
tương ng vi mt giá tr c c th a x là như nhau, bt k x là bao nhiêu.
o Phân phi chu i mn: v t giá tr c ng a x, tng th chung gm các giá tr y tươ
ng có phân ph i chun.
Bài 4: Phân tích hi quy và tương quan
v1.0 77
Nói cách khác, các gi định trên cho rng, nếu có các tham s không đổi là 0 1,
thì vi mi giá tr ca x, tng th chung gm các giá tr ca y tương ng s
có phân phi chun vi s bình quân là 0 + 1xđộ lch tiêu chun .
Kim s hđịnh h i quy ca phương trình tuyến tính đơn: Bài toán đặt ra như sau:
Gi s n , phương trình hi quy tuyến tính đơ xyˆ= 0+ 1x, bi u di n m i liên h
ph thuc gi c k t qua tiêu thc nguyên nhân x và tiêu th ế y. T phương trình
đó, chúng ta cho rng có th dùng x để d đoán giá tr ca y. Nhưng có tht s
như vy hay không?
Chúng ta đã biết, trong mô hình hi quy, h s h i quy th hin m gii liên h a x
và y, nó cho biết nh h p c n k y. Chính vì ưởng trc tiế a nguyên nhân x đế ết qu
vy, để tr l m s h ng i câu hi trên, người ta thc hin ki định h i quy ca phươ
trình tuyến tính đơn.
Trình t c hi th n ki nh nhm đị ư sau:
o Bước 1: Phát biu gi thi thiết không và gi ết đối ca nó.
Gi thiết không là: H0: v1 = 0 (x không có mi liên h i y)
Gi thi tuyết : đối là: H1 1 0 (có mi liên h ến tính gia x và y)
o Bước 2: Xác định mc ý nghĩa s y). α (vi 1 – α là h tin c
o Bước 3: Chn tiêu chun kim c m định và tính giá tr a tiêu chun ki định t
mu quan sát.
Trên thc tế, các giá tr 0, ng 1 là không biết nhưng chúng ta có th ước lượ
được qua m t mu c th.
Gi s r nh u ng vi mt mu c th, chúng ta xác đị được phương trình hi quy m
vi h s h i quy là b1, b1 có phân phi chun vi s bình quân 1
b 1
độ l ch
tiêu chun 1
b2
i
S
(x x)

. Khi đó, biến ngu nhiên chun hoá z cũng có phân
phi chun.
1
1 1
b
b
zS

Nhưng trong phương trình trên, chúng ta chưa biết , nên có th dùng sai s tiêu
chun
2
i x
e
ˆ
(y y )
Sn 2

c u a m để thay thế. Khi đó, biến ngu nhiên kết qu
có phân phi t-student vi bc t do df = n – 2.
1 1
e
2
i
b
tS
(x x)
Vi gi thiết không H0: m 1 = 0, tiêu chu n ki định là:
1
e
2
i
b
tS
(x x)
Bài 4: Phân tích hi quy và tương quan
78 v1.0
o Bước 4: Xác định min bác b kết lun bác b gi thiết không hay không.
Giá tr ti hn là tα/2, vi bc t do là n 2. Tra bng t để xác định giá tr ti hn đó.
Nếu giá tr tuyt t đối ca t tính được mà ln hơn giá tr i hn t tra bng thì bác b
gi thiết H0. Ngược li, thì chưa có cơ s . để bác b gi thiết H0
Ví d :
Vi s liu s s n ví d trên, gi có cơ cho rng s ăm s d nh ng không có
hưởng m đến mc giá bán ca chiếc xe Honda Wave cũ. Khi đó, ta s thc hin ki
định gi thiết sau:
Gi thiết không: H0: 1 = 0 (s năm s dng không có mi liên h vi mc gbán).
Gi thiết : n d c đối là: H1 1 0 (có mi liên h tuyến tính gia s ăm s ng và m
giá bán).
Chúng ta thc hin ki nh gim đị thiết trên vi mc ý nghĩa = 0,05.
Giá tr c t t t = t , vi hn là α/2 0,025 i b do là n – 2 = 11 – 2 = 9.
Tra bng ta tính i hđược giá tr t n ± t0,025 = 2,262.
T m u m đã cho, tính tiêu chun ki định t:
1
e
2
i
b2,03
t 7, 25
S 1, 2577
20,182
(x x)

Trong đó:
Stt S năm s d ng
(năm) x
Giá bán
(triu đồng) y ˆ
x
y
2
i
(x - x) ˆ2
i x
(y -y )
1 5 8,5 9,42 0,075 0,846
2 4 10,3 11,45 1,621 1,323
3 6 7,0 7,39 0,529 0,152
4 5 8,2 9,42 0,075 1,488
5 5 8,9 9,42 0,075 0,270
6 5 9,8 9,42 0,075 0,144
7 6 6,6 7,39 0,529 0,624
8 6 9,5 7,39 0,529 4,452
9 2 16,9 15,51 10,713 1,932
10 7 7,0 5,36 2,983 2,690
11 7 4,8 5,36 2,983 0,314
Tng 58 97,5 20,182 14,236
Trung bình 5,273 8,864
2
i x
e
ˆ
(y y ) 14, 236
S 1, 2577
n 2 11 2


Vy ta có t> ± t0,025, bác b gi thiết H0.
Kết lun: Vi mu m k n đã cho, c ý nghĩa 5%, có th ết lun rng: s ăm s
dng xe máy Honda Wave có nh h ng tưở i giá bán ca chiếc xe đó.
Bài 4: Phân tích hi quy và tương quan
v1.0 79
Kim s t n định h ương quan ca phương trình tuyến tính đơ
Tương t i hai bi v s vi bài toán trên, gi ến x và y, chúng ta nhn thy chúng có
mi liên h tuyến tính vi nhau. Tuy nhiên, có cơ s để gi định rng không có
mi liên h t chung. ương quan tuyến tính đó trong tng th
Khi m s t t đó chúng ta thc hin ki định h ương quan tuyến tính ca c ng th
chung m . Gi thiết cn ki định:
= 0 (không có mi liên h t n ương quan tuyế
tính gia x và y).
Để ki ế m định gi thi t này, l y m u n t tng th chung, khi đó xác định được h
s tương quan mu r.
Tiêu chun kim nh đị được chn là thng kê:
2
r
t
1 r
n 2

có phân phi t – student vi bc t do n – 2.
Vi mc ý nghĩa t α cho trước, tu thuc vào dng ca gi thiế đối mà min bác b
được xây d ưng nh sau:
H0: m i) = 0 nếu t > tα, bác b gi thiết H0 (ki định ph
H1: > 0
H0: u = 0 nế t> tα, bác b gi thiết H0 (kim định trái)
H1: < 0
H0: u = 0 nế t> tα/2, bác b gi thiết H0 (kim định hai phía)
H1: 0
Ví d: V u s n di s li ví d trên, có cơ cho rng gia s ăm s ng và giá
bán xe Honda Wave cũ không có m i liên h tương quan tuyến tính v i nhau. Vi
là h s t ương quan tuyến tính ca tng th chung, ta thc hin ki m định gi
thiết sau:
H0: n d= 0 (s ăm s ng và giá bán không có mi liên h tuyến tính)
H1: < 0 (s năm s dng g bán có mi liên h tương quan tuyến nh nghch)
Vi mc ý nghĩa t do n – 2 = 9. α = 0,05, giá tr i hn t = 1,833 khi b c t
T m u m đã cho, tính tiêu chun ki định t:
2 2
r 0,925
t 7,303
1 r 1 ( 0,925)
n 2 11 2



Ta thy t> tα = 1,833, bác b gi thiết H0.
Vi mu mđã cho, c ý nghĩa 5%, có th k n dết lun r ng s ăm s ng xe và giá
bán ca chiếc xe Honda Wave có mi liên h tương quan tuyến tính vi nhau, và
đ ây là m i liên h nghch.
Tuy nhiên, trên thc tế, không phi mi liên h nào cũng là mi liên h tương quan
tuyến tính. Vì vy, chúng ta nghiên cu tr p tiường h ếp theo (mô hình hi quy phi
tuyến tính), mi liên h này thường gp nhi u h ơn trong thc tế.
Bài 4: Phân tích hi quy và tương quan
80 v1.0
4.2.2. Mô hình hi quy phi tuyến gia hai tiêu thc s l ng ượ
4.2.2.1. M t s d p ng mô hình hi quy phi tuyến thường g
Phương trình parabol (bc 2)
o Vn dng khi tiêu thc nguyên nhân tăng hay gim vi 1 lượng đều nhau thì tiêu
thc kết qu biến động vi 1 lượng không đều nhau (nhanh hơn hoc chm hơn).
Ví d: Chi phí qung cáo và doanh thu.
o Mô hình hi quy:
2
x 0 1 2
ˆ
y b b x b x
b0, b , b1 2 là các tham s ca mô hình hi quy, được xác định bng phương pháp
bình phương nh nh t và ph ph i tha mãn h ương trình:
2
0 1 2
2 3
0 1 2
2
2 3 4
0 1 2
y b n b x b x
xy b x b x b x
x y b x b x b x






Phương trình hypebol
o Vn d ging khi tiêu thc nguyên nhân tăng thì tiêu thc kết qu m vi tc độ
không u nhau. đề
o Mô hình hi quy:
1
x 0
b
ˆy b x

b0, b1 là tham s ca mô hình hi quy, được xác định b ng ph ương pháp bình
phương nh nh ph t và phi tha mãn h ương trình:
0 1
0 1 2
1
y b n b x
1 1 1
y b b
x x x




Bài 4: Phân tích hi quy và tương quan
v1.0 81
Phương trình hàm mũ
o Vn d p sng khi tr s c a tiêu thc k i theo cết qu thay đổ nhân.
o Mô hình hi quy:
x
x 0 1
ˆ
y b b
hay: lny = lnb0 + x lnb1
lnb0, lnb1 ph phi tha mãn h ương trình:
0 1
2
0 1
ln y n ln b ln b x
x ln y ln b x ln b x




4.2.2.2. T s t ương quan
Khái nim: T s t c ương quan là ch tiêu ánh giá trình đ độ cht ch a mi liên h
tương quan phi tuyến.
Công thc:


2
i x
2
i
ˆ
y y
1
y y

Tính cht:
o T s t ng quan n ươ m trong khong [0,1].
o η = 0: Không có mi liên h tương quan phi tuyến.
o η = 1: Mi liên h tương quan phi tuyến hoàn toàn cht ch.
o η càng g n 1: Mi liên h càng cht ch .
Nhn xét
η luôn > 0 do đ ó t s đ tương quan ch có th ánh giá trình độ ch t ch c a m i liên h
ch không nói được chiu h ng cướ a mi liên h.
η có th ế ế dùng cho c phi tuy n và tuy n tính (khi r 0).
Bài 4: Phân tích hi quy và tương quan
82 v1.0
TÓM LƯỢC CUI BÀI
Các hin tượng kinh tế – xã hi luôn tn ti trong mt mi liên h ràng buc ln nhau.
Tu theo mc cđộ cht ch a mi liên h mà có th phân ra thành hai loi: liên h hàm s
liên h tương quan.
Phân tích h i quy và t ương quan thc cht là phương pháp phân tích mi liên h ph thuc
vi hai nhim v ch yếu: xây d i quy bing phương trình h u di n m i liên hđánh giá
mc c . độ cht ch a mi liên h
Vi mi liên h đơn gi n nh t gia hai tiêu thc s lượng, tu theo vic thăm dò d ng c a
mô hình hi quy mà ta có th xây dng phương trình tuyến tính hoc phi tuyến. Các h s
ca mô hình hi quy được xác định theo phương pháp bình phương nh nh t. H s t ương
quan và t s t d ng c c ương quan được s để đánh giá m độ cht ch a mi liên h tương
quan gia hai tiêu thc s l ng. ượ
Bài 4: Phân tích hi quy và tương quan
v1.0 83
CÂU HI ÔN TP
1. Thế nào là liên h t hàm s và liên h ương quan?
2. Nêu nhim v ca phân tích hi quy và tương quan.
3. Nêu ý nghĩa c a h s t s h do và h i quy trong mô hình hi quy tuyến tính gia hai tiêu
thc s l ng. ượ
4. Trình bày tác dng và tính cht ca h s t ương quan.
5. Trình bày tác dng và tính cht ca t s t ương quan.
Bài 4: Phân tích hi quy và tương quan
84 v1.0
BÀI TP
1. Có tài liu v chi tiêu cho nghiên cu và phát trin (R&D) và li nhun thu được hàng năm
ca mt doanh nghip như sau:
Năm Chi cho R&D (t ng) Lđồ i nhun hàng năm (t ng) đồ
2003 2 20
2004 3 25
2005 5 34
2006 4 30
2007 11 40
2008 5 31
a) Hãy xác định trong hai ch tiêu trên, đâu là tiêu th đc nguyên nhân, âu là tiêu thc kết
qu. Gii thích.
b) Trình bày bng mđồ th i liên h gia chi cho R&D và li nhun hàng năm ca doanh
nghip trên và cho nhn xét.
c) Xây dng phương trình hi quy tuyến tính đơn biu di n m gi i liên h a chi cho R&D
và li nhun hàng năm ca doanh nghip trên. Gii thích ý nghĩa ca các tham s.
d) Đánh giá trình độ cht ch c . a mi liên h
2. Mt nhà kinh tế đ ang quan tâm đến m i quan h gi p kha thu nh d ng ng và chi cho lươ
thc thc phm hàng năm ca các h gia đình nông thôn nước ta. Để nghiên cu ông ta
tiến hành hi ng gia u nhiên 8 h đình có cùng quy mô h (cha, m và 2 con) và có mc thu
nhp trung bình. Kết qu như sau:
Thu nhp kh d ng
(triu ng) đồ
Chi cho lương thc thc phm
(triu ng) đồ
30 5,5
36 6,0
27 4,2
20 4,0
16 3,7
24 2,6
19 3,9
25 4,3
a) V đồ th bi u di n m gi p kh i liên h a thu nh d m ng và chi cho l c phương thc th
ca các h trên.
b) Xác định phương trình hi quy biu din mi liên h đó. Gii thích ý nghĩa ca các tham s.
c) S d ng phương trình hi quy để d đoán chi cho lương thc thc phm hàng năm ca h
gia dđình có mc thu nhp kh ng là 25 triu ng. đồ
Bài 4: Phân tích hi quy và tương quan
v1.0 85
3. Có kết qu điu tra mt mu gm 8 sinh viên v thi gian t hc trong hai tun và đim kim
tra môn hc đó sau hai tun như sau:
Thi gian t hc (gi Đ ) i m kim tra
10 9,2
15 8,1
12 8,4
20 7,4
8 8,5
16 8,0
14 8,4
22 8,0
a) Xây dng phương trình hi quy tuyến tính đơn bi u di n m gi i liên h a thi gian t h c
đim kim tra ca các sinh viên trong mu nói trên. Gii thích ý nghĩa ca các tham s.
b) Đánh giá trình độ cht ch c trên. a mi liên h
c) Hãy cho biết phương trình va xây dng p a được có phù h để gii thích mi liên h gi
hai biến trên không?
4. Có tài liu v chiu cao và cân nng ca 11 ph n trong độ tui 18 – 24 được l a ch n ngu
nhiêu như sau:
Cân nng (kg) Chiu cao (cm)
65 175
67 133
71 185
71 163
66 126
75 198
67 153
70 163
71 159
69 151
69 155
a) Khi chiu cao tăng thêm 1 cm thì cân nng thay đổi như thế nào.
b) Đánh giá trình độ cht ch gi a cân n ng và chiu cao ca nhóm người trên.
5. Có s liu v giá tr s n xu t và lượng nhiên li u tiêu th các phân xưởng c a m t nhà máy
như sau:
Phân xưởng Giá tr sn xut
(triu ng) đồ
Nhiên liu tiêu th
(triu ng) đồ
A 520 23
B 595 20
C 945 25
D 640 19
E 500 10
G 720 18
Bài 4: Phân tích hi quy và tương quan
86 v1.0
a) Xây dng phương trình hi quy tuyến tính đơn bi u di ng c n nh hưở a giá tr s t n xu
ti lượng nhiên liu tiêu th. Gii thích ý nghĩa các tham s.
b) Li y b ng k s hu có đầ đủ ng ch để ết lun r ng h i quy trong phương trình nói trên là
khác 0 và vì vy có th s d ng giá tr s t dn xu để đoán l hay ượng nhiêu liu tiêu th
không? Hãy thc hin kim định gi thiết c t v i mn thiế c ý nghĩa 5%.
6. Công ty Coca Cola đang nghiên cu nh hưởng ca chiến dch qung cáo gn nht. H tiến
hành phng vn ngu nhiên 10 người để biết xem nhng người này đã đọc hay xem qung cáo
ca hãng bao nhiêu ln và s lon Coca Cola mà h đã mua trong tun qua. Kết qu như sau:
S ln xem hay đọc qung cáo lon S đã mua
4 12
9 14
3 7
0 6
1 3
6 5
2 5
5 10
a) Hãy xây dng phương trình hi quy tuyến tính đơn biu di n m i liên h gia hai biến trên.
b) Đánh giá trình độ cht ch c . a mi liên h
c) Vi kết qu điu tra trên, có th k ã ết lun r ng s qu ng cáo đ đọc hay xem có mi liên
h t n ương quan tuyến tính thun vi s lon Coca Cola đã mua hay không? Hãy thc hi
kim định gi thiết vi mc ý nghĩa 0,05.
7. Có s liu v độ tui và nhp tim ca mt m u gm 10 người được chn ng u nhiên như sau:
Tui Nhp tim (ln)
30 186
38 183
41 171
38 177
29 191
39 177
46 175
41 176
42 171
24 196
a) Gia hai biến trên liu có m đi liên h vi nhau không? Nếu có, hãy xác định âu là
nguyên nhân, đâu là kết qu.
b) Khi tăng thêm 1 tui thì nhp tim s thay đổi thế nào?
c) th dùng tui dđể đoán nhp tim ca m t ng ười hay không? Vi mc ý nghĩa 0,05,
hãy gii thích ti sao?
Bài 4: Phân tích hi quy và tương quan
v1.0 87
8. Mt nghiên c u c a cơ quan giao thông Atlanta v nh h ng c n sưở a giá vé xe buýt đế
lượng hành khách thu được k t quế như sau:
Giá vé (Cents) S hành khách trên 100 dm
15 440
20 430
25 430
30 370
35 360
40 340
45 350
50 350
a) V trên. đồ th bi u di n m i liên h
b) Xây dng phương trình hi quy biu din mi liên h trên.
c) Vi mc ý nghĩa 5%, có th kết lun rng, gi ng hành khách có a giá vé xe buýt và s lượ
mi liên h tương quan tuyến tính âm hay không?
9. Để d đoán v nhng chi phí qu n lý ph i tr d la trên s ượng s n ph m sn xut ra, mt
nhà qun lý đã thu th c kp thông tin các n vđơ khác nhau và thu đượ ết qu sau:
Chi phí qun lý phi tr (triu ng) Sđồ lượng s n phm
191 40
170 42
272 53
155 35
280 56
173 39
234 48
116 30
153 37
178 40
a) Xây dng phương trình hi quy biu din mi liên h trên.
b) D m đoán chi phí qun lý phi tr khi có 50 sn ph được s n xu t ra.
c) Tính sai s đ tiêu chun c a mô hình d oán trên.
10. Liu có phi có đim cao khi hc thì ra trường s n? M có vic làm vi mc lương cao hơ t
sinh viên th đ đng kê doanh nghip ã th c hin iu tra ngu nhiên mt mu gm m t s người
Bài 4: Phân tích hi quy và tương quan
88 v1.0
bn mi tt nghip ca anh ta v mc lương khi đim đim trung bình khi hc c đại h
ca h. Kết qu như sau:
Mc lương kh đ i i m (triu ng) đồ Đim trung bình hc c đại h
3,1 7,0
2,5 6,0
2,5 6,5
1,9 5,0
2,2 6,0
2,8 6,5
1,6 5,5
2,2 5,5
a) V đường hi quy thc nghim và đường hi quy lý thuyết bi u di n mi liên h trên.
b) c trên. Đánh giá trình độ cht ch a mi liên h
c) D m cho sinh viên có i đoán mc lương kh đi đim trung bình khi hc đại hc là 8,0.
d) Tính sai s tiêu chun ca mô hình d đoán trên.

Preview text:

Bài 4: Phân tích hồi quy và tương quan
BÀI 4: PHÂN TÍCH HI QUY VÀ TƯƠNG QUAN Ni dung Mc tiêu
 Nhiệm vụ của phân tích hồi quy và
 Cung cấp phương pháp phân tích th ng kê ố tương quan.
nghiên cứu mối liên hệ nhân quả giữa các
 Một số mô hình hồi quy và cách xác
hiện tượng kinh tế – xã h i. ộ
định các tham số của mô hình.
Thi lượng hc
Hướng dn hc  7 tiết 
Đọc bài giảng và thảo luận.
 Trả lời câu hỏi ôn tập, câu hỏi trắc nghiệm và làm bài tập. v1.0 69
Bài 4: Phân tích hồi quy và tương quan
TÌNH HUNG DN NHP
Tên tình hung: Phân tích th trường xe máy
Giả sử bạn đang nghiên cứu về vấn đề mua bán xe máy
Honda Wave đã qua sử dụng. Bạn nhận thấy giá bán c a ủ
chiếc xe do rất nhiều nhân tố quyết định. Đó có thể là số
năm sử dụng xe, màu sắc, đối tượng mua, đối tượng bán,
thậm chí cả nhu cầu mua, nhu cầu bán cũng có ảnh hưởng
đến giá cả của nó... Bạn thực hiện một điều tra thống kê trên
11 chiếc xe để tìm hiểu mối liên hệ giữa các nhân tố ảnh
hưởng và giá bán của nó. Số liệu cho thấy, dường như đúng
là có mối liên hệ giữa các nhân tố nêu trên với giá của chiếc
xe. Nhưng bạn lại không biết biểu diễn mối liên hệ ó nh đ ư thế nào. Câu hi
Bài học này sẽ giúp bạn cách thức xây dựng mối liên hệ ụ
ph thuộc qua lại giữa các hiện tượng
kinh tế – xã hội, đồng thời cũng sẽ hướng dẫn bạn cách đánh giá mức độ chặt chẽ của mối liên hệ ó nh đ ư thế nào? 70 v1.0
Bài 4: Phân tích hồi quy và tương quan
4.1. Nhim v ca phân tích hi quy và tương quan
4.1.1. Mi liên h gia các hin tượng kinh tế xã hi
Các hiện tượng kinh tế – xã hội tồn tại trong mối liên hệ phụ thuộc lẫn nhau. Các mối
liên hệ này có thể diễn ra theo thời gian hay không gian nhất định. Các mối liên hệ
diễn ra theo thời gian nghĩa là sự tác động qua lại và sự phụ thu c ộ vào nhau c a các ủ
hiện tượng khi chúng ở các giai o
đ ạn và quá trình của sự phát triển. Các mối liên hệ
diễn ra theo không gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các
hiện tượng khi chúng ở cùng một thời gian. Thậm chí ngay trong cùng một hiện tượng
nghiên cứu bao gồm nhiều tiêu thức khác nhau, thì những tiêu thức này cũng có mối
liên hệ qua lại nhất định. Tuỳ theo mức độ chặt chẽ, mà người ta chia mối liên hệ
thành các loại dưới ây. đ
4.1.1.1. Liên h hàm s
Khái nim: Liên hệ hàm số là mối liên hệ hoàn
toàn chặt chẽ. Sự thay đổi của hiện tượng này có
tác dụng quyết định đến sự thay đổi của hiện tượng
liên quan theo một tỷ lệ xác định.
Liên hệ hàm số được viết dưới dạng: y = f(x), có
nghĩa là cứ mỗi giá trị của x thì theo một hàm nào
đó có một giá trị của y tươ ứ ng ng.
Mối liên hệ này thường có trong tự nhiên. Ví dụ
trong vật lý: S = v  t...
 Đặc đim: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được
biểu hiện trên từng đơn vị cá biệt.
4.1.1.2. Liên h tương quan
Khái nim: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ. Sự thay
đổi của hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng không
có ảnh hưởng hoàn toàn quyết định.
Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội.
 Đặc đim: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà
phải thông qua hiện tượng s l ố ớn (là tổng thể).
Ví d: Mối liên hệ giữa tuổi nghề và NSLĐ. Tuổi nghề có tác ng độ đến NSLĐ
nhưng NSLĐ không chỉ chịu ảnh hưởng của tuổi nghề mà còn chịu ảnh hưởng c a ủ
các nhân tố khác. Mặt khác, nếu nghiên cứu riêng lẻ từng đơn vị cá biệt, có những
đơn vị, tuổi nghề hoàn toàn không ảnh hưởng tới NSLĐ. Vì vậ để y, có thể nêu lên
được mối liên hệ tương quan cần phải nghiên cứu hiện tượng s l ố ớn.
4.1.2. Nhim v ca phân tích hi quy và tương quan
Phương pháp phân tích hồi quy và tương quan giải quyết hai nhiệm vụ ch y ủ ếu sau:
4.1.2.1. Xác định mô hình hi quy phn ánh mi liên h
Nhiệm vụ đầu tiên của phân tích hồi quy tương quan là xây dựng mô hình (hay
phương trình) hồi quy và xác định tính chất (thuận – nghịch) c ng nh ũ ư hình thức của
mối liên hệ (loại mô hình). v1.0 71
Bài 4: Phân tích hồi quy và tương quan
Để giải quyết nhiệm vụ này, cầ ả
n ph i thực hiện 4 bước sau:
Bước 1: Giải thích sự tồn tại thực tế và bản chất của mối liên hệ bằng phân tích lý
luận. Tuỳ theo mục đích nghiên cứu cụ thể mà xác định trong mối liên hệ đó, âu đ
là nguyên nhân, đâu là kết quả.
Ví d: Tuổi nghề có ảnh hưởng tới NSLĐ. Như vậy, tuổi nghề là nguyên nhân có ảnh hưởng đến NSLĐ.
Nhưng nếu xét trong mối liên hệ với khối lượng sản phẩm sản xuất và giá thành
đơn vị, ta thấy: NSLĐ tăng dẫn tới khối lượng sản phẩm sản xuất tă đ ng. Khi ó,
NSLĐ lại là nguyên nhân, khối lượng sản phẩm là kết quả. Khi khối lượng sản
phẩm sản xuất tăng thì giá thành giảm. Khối lượng sản phẩm sản xuất lại đóng vai
trò là nguyên nhân, giá thành là kết quả.
Ví d: Mối liên hệ giữa chi phí quảng cáo và
doanh thu. Khi nghiên cứu các nhân tố tác động
đến doanh thu thì chi phí quảng cáo là một nguyên
nhân. Nhưng khi nghiên cứu nhân tố tác động đến
chi phí quảng cáo thì doanh thu cũng lại là một
nguyên nhân. Trong trường hợp này phải chú ý đến
mục đích nghiên cứu là gì để xác định đâu là tiêu
thức nguyên nhân, đâu là tiêu thức kết quả.
Trong mối liên hệ này, có thể có nhiều nguyên
nhân nhưng chỉ có một kết quả.
Bước 2: Thăm dò mối liên hệ bằng các phương pháp th ng kê: ph ố ương pháp đồ
thị, phân tổ, số bình quân, phương pháp quan sát 2 dãy số song song…
Bước 3: Lập phương trình hồi quy biểu hiện mối liên hệ.
Ví d: Các phương trình y = a + bx; y = a + bx + cx2…
Bước 4: Tính toán các tham số và giải thích ý nghĩa của chúng.
4.1.2.2. Đánh giá mc độ cht ch ca mi liên h tương quan
Sau khi đã xây dựng được phương trình hồi quy biểu diễn mối liên hệ giữa các hiện
tượng kinh tế – xã hội, nhiệm vụ thứ hai của phân tích hồi quy tương quan là đánh giá
mức độ chặt chẽ của mối liên hệ tương quan và sự phù hợp của mô hình thông qua hệ
số tương quan (tuyến tính) và tỷ số tương quan (phi tuyến tính).
4.1.3. Ý nghĩa ca phân tích hi quy và tương quan
Phân tích hồi quy và tương quan là phương pháp thường được sử d ng ụ để nghiên cứu
mối liên hệ tương quan giữa các hiện tượng kinh tế – xã hội. Bên cạnh đó, nó còn
được sử dụng nhiều trong nghiên cứu thống kê, như phân tích dãy số thời gian, dự đoán thống kê...
Trong phần tiếp theo, bài giảng sẽ đi vào trình bày cách thức xây dựng và phân tích
một mô hình hồi quy thể hiện mối liên hệ giữa một tiêu thức nguyên nhân và một tiêu thức kết quả.
4.2. Hi quy và tương quan gia hai tiêu thc s lượng
Trước hết là dạng mô hình đơn giản nhất, mô hình hồi quy tuyến tính. 72 v1.0
Bài 4: Phân tích hồi quy và tương quan
4.2.1. Mô hình hi quy tuyến tính gia hai tiêu thc s lượng
4.2.1.1. Mô hình hi quy
Trước khi đi vào xây dựng mô hình hồi quy, chúng ta hãy xem xét một số khái niệm có liên quan.
Mt s khái nim liên quan
o Đường hồi quy thực nghiệm: là đườ đượ ng
c hình thành bởi các tài liệu thực tế.
o Đường hồi quy lý thuyết: là đường điều chỉnh bù trừ các chênh lệch ngẫu nhiên
vạch ra xu hướng cơ bản của hiện tượng. Đường hồi quy thực nghiệm Đường hồi quy lý thuyết
o Mô hình hồi quy là mô hình xác định vị trí của đườ ồ
ng h i quy lý thuyết sao cho
mô tả gần đúng nhất mối liên hệ thực tế.
Xây dng mô hình hi quy tuyến tính đơn
o Mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa 2 tiêu thức số lượng có dạng: ˆy = b0 + b1x x Trong đó:  x: Trị s c
ố ủa tiêu thức gây ảnh hưởng (nguyên nhân) (biến độc lập).
 x ˆy : Trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) (biến ph ụ
thuộc) theo quan hệ với x.  b0: Hệ s
ố tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết,
nêu lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài x tới sự biến ng c độ ủa y.  b1: Hệ s h
ố ồi quy (hệ số góc, độ dốc), phản ánh ảnh hưởng trực tiếp của tiêu
thức nguyên nhân x đến tiêu thức kết quả y. Mỗi khi x tăng lên 1 đơn vị thì
y sẽ thay đổi trung bình b1 đơn vị.
b1 nói lên chiều hướng của mối liên hệ: b1 > 0: Mối liên hệ thuận; b1 < 0: Mối liên hệ nghịch.
o Cách xác định tham số:
b0, b1 phải được xác định sao cho đường hồi quy lý thuyết mô tả gần đúng nhất
mối liên hệ thực tế. Trên hình vẽ, khoảng cách từ điểm thực tế đến điểm thu c ộ
đường hồi quy lý thuyết nh nh ỏ ất sẽ là tốt nhất.
Sử dụng phương pháp bình phương nh nh ỏ
ất (OLS – Ordinary Least Square)
với nội dung: tổng bình phương các độ lệch giữa giá trị thực tế và giá trị lý thuyết của biế ụ
n ph thuộc (tiêu thức kết quả) là nhỏ nhất. v1.0 73
Bài 4: Phân tích hồi quy và tương quan 2 S  (y ˆy ) min  ix Hay 2 S    (y b b x) min  i 0 1
Để thỏa mãn điều kiện trên, cần tính đạo hàm riêng theo 2 tham số cần tìm. Từ ó, b đ
0 và b1 phải thỏa mãn hệ phương trình:  y nb b x  0 1 
 Hệ phương trình chuẩn 2 xy b x b x  0 1 
Từ hệ phương trình trên, sau khi biến đổi, b0 và b1 có thể được tính đơn giản hơn theo công thức: b xy xy  12 x b0 = y – b1x x  y  Trong đó: x i in yn 2 xy  2 x  x x (x)  xy n 2 2 2      x n n   Chú ý:
Nên sử dụng công thức rút gọn ở trên để tính b0 và b1 chứ không nên giải hệ phương trình chuẩn.
Ví d: Có tài liệu về 11 xe máy Honda Wave đã qua sử d ng nh ụ ư sau: Stt
S năm s dng Giá bán
(triu đồng) y xy x2 y2 (năm) x 1 5 72,25 8,5 25,0 42,5 2 4 106,09 10,3 16,0 41,2 3 6 49,00 7,0 36,0 42,0 4 5 67,24 8,2 25,0 41,0 5 5 79,21 8,9 25,0 44,5 6 5 96,04 9,8 25,0 49,0 7 6 43,56 6,6 36,0 39,6 8 6 90,25 9,5 36,0 57,0 9 2 285,61 16,9 4,0 33,8 10 7 49,00 7,0 49,0 49,0 11 7 23,04 4,8 49,0 33,6 Tổng 58 97,5 473,2 326,0 961,29 Trung bình 5,273 8,864 43,018 29,636 87,390
Yêu cu: Lập mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm
sử dụng xe và giá bán của xe.
Hướng dn: Ở đ đ ây chúng ta ứ
ang nghiên c u các nhân tố ả
nh hưởng đến giá bán xe máy
nên số năm sử dụng sẽ là tiêu thức nguyên nhân x, còn giá bán sẽ là tiêu thức kết quả y. 74 v1.0
Bài 4: Phân tích hồi quy và tương quan
Mô hình hồi quy có dạng: ˆ x y = b0 + b1x
Xác định các tham s: 2 2 2 2  xx  (x  ) 29,  636 5  , 273 1,831 b xy xy  = 43,018 5, 273 8,864 2,03
< 0  mối liên hệ nghịch 12 1,831 x
b0 = y – b1x= 8,864 – (–2,03  5,273) = 19,57
Vậy phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm sử
dụng và giá bán có dạng: ˆy = 19,57 – 2,03x x Trong đó:
b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số năm sử dụng tới
sự thay đổi của giá bán.
b1 = – 2,03 nêu lên ảnh hưởng trực tiếp của số năm sử dụng tới sự thay đổi của
giá bán. Khi số năm sử dụng tăng thêm 1 năm thì giá bán của chiếc xe sẽ giảm
đi trung bình 2,03 triệu đồng.
Cách kim tra kết qu:
 x tăng từ 2 đến 7 năm làm y giảm từ 16,9 xuống còn 4,8 triệu đồng; vậy x
tăng làm y giảm, ta có mối liên hệ nghịch, tức b1 < 0.
 Thay bất kỳ giá trị nào của x vào phương trình hồi quy phải ra giá trị x ˆy≈ yx. Lưu ý:
 Từ phương trình hồi quy trên, nếu ta có một giá trị của x, thay vào phương
trình ta sẽ tính được giá trị của y tương ứng và ngược lại.
 Trong trường hợp trên, khi x = 0, xˆy = b0 = 19,57 (triệu đồng), đây chính là
mức giá của 1 chiếc xe Honda Wave mới.
Sau khi đã xây dựng xong mô hình hồi quy phản ánh mối liên hệ giữa các hiện tượng
kinh tế – xã hội, nhiệm vụ tiếp theo của phân tích hồi quy và tương quan là phải đánh
giá được trình độ chặt chẽ của mối liên hệ đó cũng như sự phù hợp của mô hình đã có.
4.2.1.2. H s tương quan
Khái nim: Hệ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ
tương quan tuyến tính đơn.
Tác dng:
o Xác định cường độ của mối liên hệ từ đó chọn ra nguyên nhân chủ yếu hoặc
thứ yếu đối với hiện tượng nghiên cứu.
o Xác định chiều hướng cụ thể của mối liên hệ (thuận – nghịch).
o Hệ số tương quan còn dùng trong nhiều trường hợp dự đoán thống kê và tính sai số của dự đoán.
Công thc tính: xy x  y x r b  1   x y y v1.0 75
Bài 4: Phân tích hồi quy và tương quan
Như vậy, dấu của hệ s
ố tương quan r phụ thuộc vào dấu c a h ủ ệ s b ố 1 vì phương sai luôn mang dấu dương.
Các tính chất của hệ số tương quan: Miền xác định: –1 ≤ r ≤ 1.
o r > 0: Mối liên hệ tương quan tuyến tính thuận.
o r < 0: Mối liên hệ tương quan tuyến tính nghịch.
o r = ± 1: Mối liên hệ hàm số hoàn toàn chặt chẽ.
o r = 0: Không có mối liên hệ tương quan tuyến tính giữa x và y.
o r càng gần 1: Mối liên hệ càng chặt chẽ (cường m độ ối liên hệ).
o r  0,9: Mối liên hệ rất chặt chẽ.
o 0,7  r  0,9: Mối liên hệ tương đối chặt chẽ.
o 0,5  r  0,7: Mối liên hệ bình thường (trong d đoán thường không s dng r
này đối vi tiêu thc s lượng nhưng vi tiêu thc thuc tính thì vn s dng).
o r < 0,5 : Mối liên hệ hết sức lỏng lẻo.
Vận dụng vào ví dụ trên, ta có: 2 2 2 2  y  yy y  87,390  8,864 2,97  353 , 1 = – 0,925 r = (–2,03)  97 , 2
Kết luận: Mối liên hệ giữa số năm sử dụng và giá bán xe Honda Wave cũ là mối liên
hệ tương quan tuyến tính nghịch và rất chặt chẽ.
4.2.1.3. H s xác định
Khái nim: Hệ số xác định dùng để đánh giá sự phù hợp của mô hình, nó cho biết tỷ
lệ % thay đổi của y được giải thích bởi mô hình.
Ở ví dụ trên, ta có: r2 = (– 0,925)2 = 0,8556.
Như vậy, 85,56% sự thay đổi của giá bán xe máy Honda Wave cũ được giải thích bởi
mô hình đã nói ở trên trong mối quan hệ với số năm sử d ng. ụ
Điều đó nói lên rằng,
số năm sử dụng là hoàn toàn hữu ích khi dự đoán mức giá bán của một chiếc xe cũ.
4.2.1.4. Kim định các tham s ca phương trình hi quy tuyến tính đơn
 Trong mối liên hệ tương quan giữa x và y, cứ mỗi giá trị của x ta có thể thu được
nhiều giá trị của y. Khi đó, chúng ta phải có một số giả định sau:
o Đường hồi quy tổng thể chung: với phương trình tuyến tính x y ˆ= 0 + 1x, thì
mỗi giá trị của x sẽ có nhiều giá trị tương ứng của y, khi đó số bình quân của các
giá trị này sẽ nằm trên một đường thẳng. Đường thẳng đ ọ
ó g i là đường hồi quy
tổng thể chung và phương trình của nó là phương trình hồi quy tổng thể chung.
o Độ lệch tiêu chuẩn: độ lệch tiêu chuẩn
 của tổng thể chung gồm các giá trị y
tương ứng với một giá trị cụ thể của x là như nhau, bất kể x là bao nhiêu.
o Phân phối chuẩn: với một giá trị của x, tổng thể chung gồm các giá trị y tương
ứng có phân phối chuẩn. 76 v1.0
Bài 4: Phân tích hồi quy và tương quan
Nói cách khác, các giả định trên cho rằng, nếu có các tham số không đổi là 0, 1
và  thì với mỗi giá trị của x, tổng thể chung gồm các giá trị của y tương ứng sẽ
có phân phối chuẩn với số bình quân là 0 + 1x và độ lệch tiêu chuẩn .
 Kiểm định hệ số hồi quy của phương trình tuyến tính đơn: Bài toán đặt ra như sau:
Giả sử, phương trình hồi quy tuyến tính đơn x y
ˆ= 0+ 1x, biểu diễn mối liên hệ
phụ thuộc giữa tiêu thức nguyên nhân x và tiêu thức kết quả y. Từ phương trình
đó, chúng ta cho rằng có thể dùng x để dự đoán giá trị của y. Nhưng có thật sự là như vậy hay không?
Chúng ta đã biết, trong mô hình hồi quy, hệ s
ố hồi quy thể hiện mối liên hệ giữa x
và y, nó cho biết ảnh hưởng trực tiếp của nguyên nhân x đến kết quả y. Chính vì
vậy, để trả lời câu hỏi trên, người ta thực hiện kiểm định hệ s ố hồi quy của phương trình tuyến tính đơn.
Trình tự thực hiện kiểm định như sau:
o Bước 1: Phát biểu giả thiết không và giả thiết đối của nó.
Giả thiết không là: H0: 1 = 0 (x không có mối liên hệ với y)
Giả thiết đối là: H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa x và y)
o Bước 2: Xác định mức ý nghĩa α (với 1 – α là hệ số tin cậy).
o Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát.
Trên thực tế, các giá trị 0, 1 và  là không biết nhưng chúng ta có thể ước lượng
được qua một mẫu cụ thể.
Giả sử rằng với một mẫu cụ thể, chúng ta xác định được phương trình hồi quy mẫu với hệ s h
ố ồi quy là b1, b1 có phân phối chuẩn với số bình quân   và độ lệch 1 b 1  tiêu chuẩn S  1 b2
. Khi đó, biến ngẫu nhiên chuẩn hoá z cũng có phân (x x) i phối chuẩn. b  1 1 zS b1
Nhưng trong phương trình trên, chúng ta chưa biết  , nên có thể dùng sai số tiêu 2 (y  ˆy )
 của mẫu để thay thế. Khi đó, biến ngẫu nhiên kết quả chuẩn i x Sn 2  e
có phân phối t-student với bậc tự do df = n – 2. b   1 1 tS e 2 (x x)   i
Với giả thiết không H0: 1 = 0, tiêu chuẩn kiểm định là: b1 tS e 2 (x x)   i v1.0 77
Bài 4: Phân tích hồi quy và tương quan
o Bước 4: Xác định miền bác bỏ và kết luận có bác bỏ giả thiết không hay không.
Giá trị tới hạn là  tα/2, với bậc tự do là n – 2. Tra bảng t để xác định giá trị tới hạn đó.
Nếu giá trị tuyệt đối của t tính được mà lớn hơn giá trị tới hạn t tra bảng thì bác b ỏ
giả thiết H0. Ngược lại, thì chưa có cơ sở để bác bỏ giả thiết H0. Ví d:
Với số liệu ở ví dụ trên, giả sử có cơ sở cho rằng s
ố năm sử dụng không có ảnh
hưởng đến mức giá bán của chiếc xe Honda Wave cũ. Khi đó, ta sẽ thực hiện kiểm định giả thiết sau:
Giả thiết không là: H0: 1 = 0 (số năm sử dụng không có mối liên hệ với mức giá bán).
Giả thiết đối là: H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa s n ố ăm sử dụng và mức giá bán).
Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa  = 0,05.
Giá trị tới hạn là  tα/2 =  t0,025, với bậc tự do là n – 2 = 11 – 2 = 9.
Tra bảng ta tính được giá trị tới hạn ± t0,025 =  2,262.
Từ mẫu đã cho, tính tiêu chuẩn kiểm định t: b2,03  1  t  7, 25 S 1, 2577 e 2 (x x)  20,182  i Trong đó: Stt
S năm s dng Giá bán
(triu đồng) y y 2
(x - x) ˆ2 (y -y ) (năm) x ˆ x i i x 0,846 0 ,075 1 5 9 ,42 8 ,5 1,323 1 ,621 2 1 4 1 ,4 1 5 0 ,3 0,152 0 ,529 3 6 7 ,39 7 ,0 1,488 0 ,075 4 5 9 ,42 8 ,2 0,270 0 ,075 5 5 9 ,42 8 ,9 0,144 0 ,075 6 5 9 ,42 9 ,8 0,624 0 ,529 7 6 7 ,39 6 ,6 4,452 0 ,529 8 6 7 ,39 9 ,5 1,93 1 2 0 ,713 9 1 2 5 ,5 1 1 6 ,9 2,69 2 0 ,91 80 3 7 5,3 7 6 ,0 0,31 2 4 ,91 81 3 7 5,3 4 6 ,8 14,236 20,182 Tổng 5 8 97,5 Trung bình 5,273 8,864 2 (y ˆy ) 14, 236  ix S   1, 2577 e n  2  11 2
Vậy ta có t> ± t0,025, bác bỏ giả thiết H0.
Kết luận: Với mẫu đã cho, ở mức ý nghĩa 5%, có thể kết luận rằng: s ố năm sử
dụng xe máy Honda Wave có ảnh hưởng tới giá bán của chiếc xe đó. 78 v1.0
Bài 4: Phân tích hồi quy và tương quan
 Kiểm định hệ số tương quan của phương trình tuyến tính đơn
Tương tự với bài toán trên, giả sử với hai biến x và y, chúng ta nhận thấy chúng có
mối liên hệ tuyến tính với nhau. Tuy nhiên, có cơ sở để giả định rằng không có
mối liên hệ tương quan tuyến tính đó trong tổng thể chung.
Khi đó chúng ta thực hiện kiểm định hệ số tương quan tuyến tính của cả tổng thể
chung . Giả thiết cần kiểm định:  = 0 (không có mối liên hệ tương quan tuyến tính giữa x và y).
Để kiểm định giả thiết này, lấy mẫu n từ tổng thể chung, khi đó xác định được hệ số tương quan mẫu r.
Tiêu chuẩn kiểm định được chọn là thống kê: r t 
có phân phối t – student với bậc tự do n – 2. 2 1 r n 2 
Với mức ý nghĩa α cho trước, tuỳ thuộc vào dạng của giả thiết đối mà miền bác bỏ
được xây dựng như sau:
H0: = 0 nếu t > tα, bác bỏ giả thiết H0 (kiểm định phải) H1: > 0
H0: = 0 nếu t> tα, bác bỏ giả thiết H0 (kiểm định trái) H1: < 0
H0: = 0 nếu t> tα/2, bác bỏ giả thiết H0 (kiểm định hai phía) H1: ≠ 0
Ví d: Với số liệu ở ví dụ trên, có cơ sở cho rằng giữa s ố năm sử dụng và giá
bán xe Honda Wave cũ không có mối liên hệ tương quan tuyến tính với nhau. Với  là hệ s
ố tương quan tuyến tính của tổng thể chung, ta thực hiện kiểm định giả thiết sau: H0: = 0 (s n
ố ăm sử dụng và giá bán không có mối liên hệ tuyến tính)
H1:  < 0 (số năm sử dụng và giá bán có mối liên hệ tương quan tuyến tính nghịch)
Với mức ý nghĩa α = 0,05, giá trị tới hạn t = 1,833 khi bậc tự do n – 2 = 9.
Từ mẫu đã cho, tính tiêu chuẩn kiểm định t: r 0,925  t  7,  303   2 2  1  r 1 ( 0,925) n  2  11 2
Ta thấy t> tα = 1,833, bác bỏ giả thiết H0.
Với mẫu đã cho, ở mức ý nghĩa 5%, có thể kết luận rằng s n
ố ăm sử dụng xe và giá
bán của chiếc xe Honda Wave có mối liên hệ tương quan tuyến tính với nhau, và
đây là mối liên hệ nghịch.
Tuy nhiên, trên thực tế, không phải mối liên hệ nào cũng là mối liên hệ tương quan
tuyến tính. Vì vậy, chúng ta nghiên cứu trường hợp tiếp theo (mô hình hồi quy phi
tuyến tính), mối liên hệ này thường gặp nhiều hơn trong thực tế. v1.0 79
Bài 4: Phân tích hồi quy và tương quan
4.2.2. Mô hình hi quy phi tuyến gia hai tiêu thc s lượng
4.2.2.1. Mt s dng mô hình hi quy phi tuyến thường gp
 Phương trình parabol (bậc 2)
o Vận dụng khi tiêu thức nguyên nhân tăng hay giảm với 1 lượng đều nhau thì tiêu
thức kết quả biến động với 1 lượng không đều nhau (nhanh hơn hoặc chậm hơn).
Ví d: Chi phí quảng cáo và doanh thu. o Mô hình hồi quy: 2 ˆy  b   b x b x x 0 1 2
b0, b1, b2 là các tham số của mô hình hồi quy, được xác định bằng phương pháp
bình phương nhỏ nhất và phải thỏa mãn hệ phương trình: 2  y b n b x b x    01 2   2 3  xy b x b x b x  0 1 2  2 2 3 4  x y b x b x b x  0 1 2  Phương trình hypebol
o Vận dụng khi tiêu thức nguyên nhân tăng thì tiêu thức kết quả giảm với tốc độ không đều nhau. o Mô hình hồi quy: b1 ˆy b x x 0
b0, b1 là tham số của mô hình hồi quy, được xác định bằng phương pháp bình phương nh nh ỏ
ất và phải thỏa mãn hệ phương trình:  1 y b n b x  0 1   1 1 1  y b b  0 1 2  x x x 80 v1.0
Bài 4: Phân tích hồi quy và tương quan  Phương trình hàm mũ
o Vận dụng khi trị số của tiêu thức kết quả thay i theo c đổ ấp số nhân. o Mô hình hồi quy: x ˆy  b b x 0 1 hay: lny = lnb0 + x  lnb1
lnb0, lnb1 phải thỏa mãn hệ phương trình:  ln y n  ln b ln b x  0 1  2 x ln y ln b x ln b x   0 1
4.2.2.2. T s tương quan
Khái nim: Tỷ s t
ố ương quan là chỉ tiêu ánh giá trình đ
độ chặt chẽ của mối liên hệ tương quan phi tuyến.
Công thc:   2 y y ˆ i x  1      2 y y i
Tính cht:
o Tỷ số tương quan nằm trong khoảng [0,1].
o η = 0: Không có mối liên hệ tương quan phi tuyến.
o η = 1: Mối liên hệ tương quan phi tuyến hoàn toàn chặt chẽ.
o η càng gần 1: Mối liên hệ càng chặt chẽ. Nhn xét
η luôn > 0 do đó tỷ số tương quan chỉ có thể đánh giá trình độ chặt chẽ của mối liên hệ
chứ không nói được chiều hướng của mối liên hệ.
η có thể dùng cho cả phi tuyến và tuyến tính (khi r  0). v1.0 81
Bài 4: Phân tích hồi quy và tương quan
TÓM LƯỢC CUI BÀI
 Các hiện tượng kinh tế – xã hội luôn tồn tại trong một mối liên hệ ràng buộc lẫn nhau.
Tuỳ theo mức độ chặt chẽ của mối liên hệ mà có thể phân ra thành hai loại: liên hệ hàm số và liên hệ tương quan.  Phân tích h i quy và t ồ
ương quan thực chất là phương pháp phân tích mối liên hệ phụ thuộc
với hai nhiệm vụ chủ yếu: xây dựng phương trình h i quy bi ồ
ểu diễn mối liên hệ và đánh giá
mức độ chặt chẽ của mối liên hệ.
 Với mối liên hệ đơn giả ấ
n nh t giữa hai tiêu thức số lượng, tuỳ theo việc thăm dò dạng của
mô hình hồi quy mà ta có thể xây dựng phương trình tuyến tính hoặc phi tuyến. Các hệ s ố
của mô hình hồi quy được xác định theo phương pháp bình phương nh nh ỏ ất. Hệ s ố tương quan và tỷ s
ố tương quan được sử d ng ụ
để đánh giá mức độ chặt chẽ của mối liên hệ tương
quan giữa hai tiêu thức số lượng. 82 v1.0
Bài 4: Phân tích hồi quy và tương quan
CÂU H
I ÔN TP
1. Thế nào là liên hệ hàm số và liên hệ tương quan?
2. Nêu nhiệm vụ của phân tích hồi quy và tương quan. 3. Nêu ý nghĩa c a h ủ ệ s ố tự do và hệ s
ố hồi quy trong mô hình hồi quy tuyến tính giữa hai tiêu thức số lượng.
4. Trình bày tác dụng và tính chất của hệ s t ố ương quan.
5. Trình bày tác dụng và tính chất của tỷ s t ố ương quan. v1.0 83
Bài 4: Phân tích hồi quy và tương quan BÀI TP
1. Có tài liệu về chi tiêu cho nghiên cứu và phát triển (R&D) và lợi nhuận thu được hàng năm
của một doanh nghiệp như sau: Năm
Chi cho R&D (t đồng)
Li nhun hàng năm (t đồng) 2003 2 20 2004 3 25 2005 5 34 2006 4 30 2007 11 40 2008 5 31
a) Hãy xác định trong hai chỉ tiêu trên, đâu là tiêu thức nguyên nhân, đâu là tiêu thức kết quả. Giải thích.
b) Trình bày bằng đồ thị mối liên hệ giữa chi cho R&D và lợi nhuận hàng năm của doanh
nghiệp trên và cho nhận xét.
c) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa chi cho R&D
và lợi nhuận hàng năm của doanh nghiệp trên. Giải thích ý nghĩa của các tham số.
d) Đánh giá trình độ chặt chẽ của mối liên hệ.
2. Một nhà kinh tế đang quan tâm đến mối quan hệ giữa thu nhập khả dụng và chi cho lương
thực thực phẩm hàng năm của các hộ gia đình ở nông thôn nước ta. Để nghiên cứu ông ta
tiến hành hỏi ngẫu nhiên 8 h gia ộ
đình có cùng quy mô hộ (cha, mẹ và 2 con) và có mức thu
nhập trung bình. Kết quả như sau:
Thu nhp kh dng
Chi cho lương thc thc phm
(triu đồng)
(triu đồng) 30 5,5 36 6,0 27 4,2 20 4,0 16 3,7 24 2,6 19 3,9 25 4,3
a) Vẽ đồ thị biểu diễn mối liên hệ giữa thu nhập khả dụng và chi cho lương thực thực phẩm của các hộ trên.
b) Xác định phương trình hồi quy biểu diễn mỗi liên hệ đó. Giải thích ý nghĩa của các tham số. c) Sử ụ
d ng phương trình hồi quy để dự đoán chi cho lương thực thực phẩm hàng năm của hộ
gia đình có mức thu nhập khả dụng là 25 triệu ng. đồ 84 v1.0
Bài 4: Phân tích hồi quy và tương quan
3. Có kết quả điều tra một mẫu gồm 8 sinh viên về thời gian tự học trong hai tuần và điểm kiểm
tra môn học đó sau hai tuần như sau:
Thi gian t hc (gi)
Đim kim tra 10 9,2 15 8,1 12 8,4 20 7,4 8 8,5 16 8,0 14 8,4 22 8,0
a) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa thời gian tự h c ọ
và điểm kiểm tra của các sinh viên trong mẫu nói trên. Giải thích ý nghĩa của các tham số.
b) Đánh giá trình độ chặt chẽ của mối liên hệ trên.
c) Hãy cho biết phương trình vừa xây dựng được có phù hợp để giải thích mối liên hệ giữa hai biến trên không?
4. Có tài liệu về chiều cao và cân nặng của 11 phụ nữ trong độ tuổi 18 – 24 được lựa chọn ngẫu nhiêu như sau:
Cân nng (kg)
Chiu cao (cm) 65 175 67 133 71 185 71 163 66 126 75 198 67 153 70 163 71 159 69 151 69 155
a) Khi chiều cao tăng thêm 1 cm thì cân nặng thay đổi như thế nào.
b) Đánh giá trình độ chặt chẽ giữa cân nặng và chiều cao của nhóm người trên.
5. Có số liệu về giá trị sản xuất và lượ ệ
ng nhiên li u tiêu thụ ở các phân xưởng của một nhà máy như sau: Phân xưởng
Giá tr sn xut
Nhiên liu tiêu th
(triu đồng)
(triu đồng) A 520 23 B 595 20 C 945 25 D 640 19 E 500 10 G 720 18 v1.0 85
Bài 4: Phân tích hồi quy và tương quan
a) Xây dựng phương trình hồi quy tuyến tính đơn biểu diễn ảnh hưởng của giá trị sản xuất
tới lượng nhiên liệu tiêu thụ. Giải thích ý nghĩa các tham số. b) Liệu có đầy
đủ bằng chứng để kết luận rằng hệ s
ố hồi quy trong phương trình nói trên là
khác 0 và vì vậy có thể sử dụng giá trị sản xuất để dự đoán lượng nhiêu liệu tiêu th hay ụ
không? Hãy thực hiện kiểm định giả thiết cần thiết với mức ý nghĩa 5%.
6. Công ty Coca Cola đang nghiên cứu ảnh hưởng của chiến dịch quảng cáo gần nhất. Họ tiến
hành phỏng vấn ngẫu nhiên 10 người để biết xem những người này đã đọc hay xem quảng cáo
của hãng bao nhiêu lần và số lon Coca Cola mà họ đã mua trong tuần qua. Kết quả như sau:
S ln xem hay đọc qung cáo
S lon đã mua 4 12 9 14 3 7 0 6 1 3 6 5 2 5 5 10
a) Hãy xây dựng phương trình hồi quy tuyến tính đơn biểu diễn mối liên hệ giữa hai biến trên.
b) Đánh giá trình độ chặt chẽ của mối liên hệ.
c) Với kết quả điều tra ở trên, có thể kết luận rằng số quảng cáo ã
đ đọc hay xem có mối liên
hệ tương quan tuyến tính thuận với số lon Coca Cola đã mua hay không? Hãy thực hiện
kiểm định giả thiết với mức ý nghĩa 0,05.
7. Có số liệu về độ tuổi và nhịp tim của một mẫu gồm 10 người được chọ ẫ n ng u nhiên như sau: Tui
Nhp tim (ln) 30 186 38 183 41 171 38 177 29 191 39 177 46 175 41 176 42 171 24 196
a) Giữa hai biến trên liệu có mối liên hệ với nhau không? Nếu có, hãy xác định đâu là
nguyên nhân, đâu là kết quả.
b) Khi tăng thêm 1 tuổi thì nhịp tim sẽ thay đổi thế nào?
c) Có thể dùng tuổi để dự đoán nhịp tim của m t ng ộ
ười hay không? Với mức ý nghĩa 0,05, hãy giải thích tại sao? 86 v1.0
Bài 4: Phân tích hồi quy và tương quan
8. Một nghiên cứu của cơ quan giao thông ở Atlanta về ảnh hưởng của giá vé xe buýt đến số
lượng hành khách thu được kết quả như sau: Giá vé (Cents)
S hành khách trên 100 dm 15 440 20 430 25 430 30 370 35 360 40 340 45 350 50 350
a) Vẽ đồ thị biểu diễn mối liên hệ trên.
b) Xây dựng phương trình hồi quy biểu diễn mối liên hệ trên.
c) Với mức ý nghĩa 5%, có thể kết luận rằng, giữa giá vé xe buýt và số lượng hành khách có
mối liên hệ tương quan tuyến tính âm hay không?
9. Để dự đoán về những chi phí quản lý phải trả dựa trên s ố lượng sả ẩ n ph m sản xuất ra, một
nhà quản lý đã thu thập thông tin ở các đơn vị khác nhau và thu được kết quả sau:
Chi phí qun lý phi tr (triu đồng)
S lượng sn phm 191 40 170 42 272 53 155 35 280 56 173 39 234 48 116 30 153 37 178 40
a) Xây dựng phương trình hồi quy biểu diễn mối liên hệ trên.
b) Dự đoán chi phí quản lý phải trả khi có 50 sản phẩm được sả ấ n xu t ra.
c) Tính sai số tiêu chuẩn của mô hình dự đ oán trên.
10. Liệu có phải có điểm cao khi học thì ra trường sẽ có việc làm với mức lương cao hơn? Một
sinh viên thống kê doanh nghiệ đ p ã thực hiệ đ
n iều tra ngẫu nhiên một mẫu gồm một số người v1.0 87
Bài 4: Phân tích hồi quy và tương quan
bạn mới tốt nghiệp của anh ta về mức lương khởi điểm và điểm trung bình khi học đại học
của họ. Kết quả như sau:
Mc lương khi đim (triu đồng)
Đim trung bình hc đại hc 3,1 7,0 2,5 6,0 2,5 6,5 1,9 5,0 2,2 6,0 2,8 6,5 1,6 5,5 2,2 5,5
a) Vẽ đường hồi quy thực nghiệm và đường hồi quy lý thuyết biểu diễn mố ệ i liên h trên.
b) Đánh giá trình độ chặt chẽ của mối liên hệ trên.
c) Dự đoán mức lương khởi điểm cho sinh viên có điểm trung bình khi học đại học là 8,0.
d) Tính sai số tiêu chuẩn của mô hình dự đoán trên. 88 v1.0