-
Thông tin
-
Hỏi đáp
Chương 3 Mô hình hồi quy 2 biến
Chương 3 Mô hình hồi quy 2 biến, tài liệu gồm 12 trang, gồm các kiến thức cơ bản liên quan đến học phần Kinh tế lượng của Học viện Nông nghiệp Việt Nam giúp bạn ôn luyện và nắm vững kiến thức môn học. Mời bạn đọc đón xem!
Kinh tế lượng (KTL2023) 1 tài liệu
Học viện Nông nghiệp Việt Nam 392 tài liệu
Chương 3 Mô hình hồi quy 2 biến
Chương 3 Mô hình hồi quy 2 biến, tài liệu gồm 12 trang, gồm các kiến thức cơ bản liên quan đến học phần Kinh tế lượng của Học viện Nông nghiệp Việt Nam giúp bạn ôn luyện và nắm vững kiến thức môn học. Mời bạn đọc đón xem!
Môn: Kinh tế lượng (KTL2023) 1 tài liệu
Trường: Học viện Nông nghiệp Việt Nam 392 tài liệu
Thông tin:
Tác giả:
Tài liệu khác của Học viện Nông nghiệp Việt Nam
Preview text:
CHƯƠNG 3 MÔ HÌNH HỒI QUY HAI BIẾN
3.1 Khái niệm
Mô hình hồi quy hai biến mô tả quan hệ giữa một biến phụ thuộc Y và một
biến độc lập có giá trị xác định X. Thông thường nó có dạng tuyến tính sau: Y X
i= β1+ β2 +ε i i (3.1)
Ở đây Y là đại lượng ngẫu nhiên nhận các giá trị Yi và X là đại lượng cố
định không ngẫu nhiên nhận các giá trị Xi , với i = 1, 2, 3, … , n; ồi là đại lượng sai số ngẫu nhiên.
X ở trên có thể là thu nhập của một hộ gia đình, Y có thể là tiêu dùng của hộ
gia đình đó. Ta có mô hình hồi quy biểu diễn mối quan hệ giữa thu nhập và tiêu dùng.
õ1 được gọi là hệ số chặn.
õ2 được gọi là hệ số góc của đường thẳng. Tốc độ tiêu dùng tăng hay giảm phụ thuộc vào õ2 .
ồi là đại lượng ngẫu nhiên biểu hiện sai số giữa giá trị thực tế và giá trị ước
lượng nhất thiết phải có trong mô hình. Sai số này xảy ra khi do yếu tố tâm lý,
hành vi của con người: thu nhập cá nhân thay đổi làm thay đổi nhu cầu về sản
phẩm. Sai số cũng có thể xảy ra trong quá trình tổng hợp số liệu.
Trong phân tích hồi quy thì mô hình hai biến có vị trí rất quan trọng.
3.2 Lập mô hình
Trên thực tế, khi nghiên cứu một vấn đề kinh tế nào đó, chúng ta không có
tổng thể, hoặc có nhưng không thể nghiên cứu được toàn bộ tổng thể (vì nhiều lý
do). Điều này có nghĩa là chúng ta không thể xây dựng được hàm hồi quy tổng thể (PRF).
Nhưng chúng ta lại có mẫu ngẫu nhiên lấy từ tổng thể. Từ mẫu này ta có thể
xây dựng được hàm hồi quy mẫu (SRF) và lấy đó làm cơ sở để ước lượng PRF.
Hay nói cách khác chúng ta có thể ước lượng PRF từ những thông tin thu được
trên mẫu ngẫu nhiên của giá trị Y đối với giá trị X đã biết. Vấn đề đặt ra là từ mẫu
ta phải lập được mô hình hồi quy mẫu, tức là xác định SRF, để từ đó ước lượng
PRF. Mô hình hồi quy mẫu được lập như sau:
Từ một tổng thể ta lấy các mẫu ngẫu nhiên từ X và từ Y, mẫu của X là (X1, X , …, X ), mẫu từ , … ,
). Từ hai mẫu đó ta xây dựng hàm hồi quy 2 n Y là (Y1, Y2 Yn mẫu tuyến tính dạng:
Y^ i= β^ 1+ β^ 2 X i (3.2)
Hàm hồi quy cho bởi 3.2 được gọi là mô hình hồi quy mẫu, trong đó:
Y^ i : là ước lượng của E(Y/Xi ) (hay viết tắt là Y)
β^ 1, β^
2 : là ước lượng của õ và õ . 1 2 Do đó :
Y i= β^ 1+ β^ 2X +e +e i i=Y^ i i e − Y^ Hay: i=Y i i
, e còn gọi là phần dư. i
Cứ mỗi cặp mẫu của X và Y ta có thể xây dựng được những mô hình hồi quy
mẫu tuyến tính khác nhau và ta có các ước lượng khác nhau của õ1 và õ2 . Nhưng
đường hồi quy mẫu nào là thích hợp nhất với PRF. Câu hỏi này khó trả lời vì PRF
chưa biết. Song, toán học đã chỉ ra rằng nếu SRF có tính chất tuyến tính, không
chệch, có phương sai nhỏ nhất thì sẽ là ước lượng tốt nhất cho PRF.
Vấn đề đặt ra là ta có thể đưa ra một phương pháp và một số điều kiện mà
nhờ đó SRF là ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất của β^ , β^ PRF, hay nói cách khác 1
2 gần với giá trị thực õ , õ (mặc dù không bao giờ 1 2
ta biết giá trị thực của õ1 và õ2) hay không?
Toán học chỉ ra rằng: có một phương pháp như vậy, đó là phương pháp
“bình phương nhỏ nhất” hay “bình phương tối thiểu”.
3.3 Phương pháp bình phương nhỏ nhất (OLS)
Phương pháp bình phương nhỏ nhất do nhà toán học người Đức C. F. Gauss
đưa ra. Khi sử dụng phương pháp này phải có một số giả thiết. Ước lượng BPNN
có công hiệu đặc biệt nên được sử dụng rất rộng rãi. a. Nội dung Giả sử: E(Y/Xi) = Y = õ1 + õ2Xi là PRF
Khi đó, giá trị quan sát:
Yi = Y + ồi = õ1 +õ2Xi + ồi
Y^ i= β^ 1+ β^ 2 X i là SRF
Y i=Y^ i+e X +e i= β
^ 1+ β^ 2 i i Vấn đề Y^ X đặt ra là phải tìm: i= β ^ 1+ β^ 2 i
Giả sử ta có n cặp quan sát của X và Y là Xi và Yi với i = 1, 2, …, n. Ta phải Y^ Y^ e − Y^ tìm i sao cho
i gần với giá trị thực tế Y , tức là i=Yi i càng nhỏ i càng tốt.
Vì ei có thể âm có thể dương do đó ta xét: n
∑ e2=∑(Y −Y^ )2 β^ , β^ i i i F( 1 2 )= i=1 Y^
sao cho tổng bình phương các độ lệch giữa Y i là bé nhất. i và n n , i
f ( β^ β^ 2) =∑ e2i ∑ e2 β^ , β^ 1 Ta biết i 1 =1 2 là hàm của , ta ký hiệu i=1 đạt
∂f ( β^ , , 1 β ^
∂f ( β^ β^ 2) 1 2) =0 =0
min. Để cho hàm này đạt cực tiểu thì: ∂ β^ 1 ∂ β^ , 2 .
Tức là ta có hệ phương trình(gọi là hệ phương trình chuẩn): n n
n β^ 1+ β^ 2∑ Xi =∑ Y i i=1 i=1 n n n β^ X 1∑ Xi + β ^ 2∑ X 2=∑ Y i i i i=1 i =1 i=1 β^ , Từ β^
hệ phương trình trên ta có thể giải ra được 1 2 theo công thức:
β^ 1=Y¯ −β^ 2X¯ n ∑ x y i i β^ = i =1 2 n i ∑ x2 i=1 x =Y Trong đó:
i= X i− X ¯ , yi i−Y¯ b. Tính chất β^ , β^ - 1
2 là các ước lượng của õ và õ bằng phương pháp BPNN và có các 1 2 tính chất sau: β^ , β^ + 1
2 được xác định một cách duy nhất với từng cặp quan sát (Xi, Yi).
- Tổng thể --- Khụng cú dữ lieu từ tổng thể 60 (Thu nhõp- chi tiờu) õ 1 và õ2 β^ , β^
- Mẫu ---------- mẫu 10 (thu nhập và chi tiờu) 1 2 β^ , β^ +
1 2 là các ước lượng điểm của õ1 và õ2 và là các đại lượng ngẫu
nhiên, với các mẫu khác nhau giá trị của chúng sẽ khác nhau. Y^ X - i= β
^ 1+ β^ 2 i có các tính chất:
( X¯ , Y¯ ) Y^ X
+ Mô hình hồi quy mẫu đi qua điểm , nghĩa là: i= β ^ 1+ β^ 2 i (SRF) Y¯ = β^ X¯ 1+ β^ 2 ¯ X ( β
^ 1=Y¯ −β^ 2 ) Y^
+ Giá trị trung bình của
i bằng giá trị trung bình của quan sát Y có nghĩa là: i Y¯ =Y¯^ n ∑ Y i Y¯ = i =1 n n n ∑ Y^ ∑( β^ X ) i 1+ β ^ 2 i i=1 i=1 Y¯^ n n
(n β^ 1)/n+ β^ 2 (∑ Xi )/n β^ = = = 1+ β ^ 2 X = = Y¯ n n (∑ x y )/ n=0 i )/ n=0 (∑ i + i=1 , i=1
=+ Giá trị trung bình của các phần dư bằng không, nghĩa là n n ∑ ei ∑( Y i− Y ^ i ) i=1 = i =1 =Y¯ −Y ¯ ^ =0 n n n e Y^ ∑ e Y^ i i=0 + i và
i không tương quan với nhau nghĩa là i =1 n e X ∑ e X i =0 i + i và
i không tương quan với nhau nghĩa là i =1 β^ , β^ Khi ước lượng được 1
2 ta không biết chất lượng của nó ra sao. Ước
lượng tìm được bằng phương pháp BPNN có thể là ước lượng tuyến tính, không
chệch và có phương sai nhỏ nhất. Muốn xem một ước lượng có là tuyến tính không
chệch tốt nhất hay không ta sử dụng định lý Gauss – Markov.
3.4 Định lý Gauss Markove. (MH phai thoa man 5 gt)
a. Các giả thiết cơ bản của phương pháp bình phương nhỏ nhất Y X
i= β1+ β2 +ε i i (3.1)
Trong phân tích hồi quy, mục đích của chúng ta là ước lượng tổng thể hay: Y = õ1 + õ2Xi β^ , 1 β^
2 là các giá trị được tìm bằng phương pháp bình phương nhỏ nhất, là
các ước lượng điểm của õ1 và õ2 . Chất lượng của các ước lượng này phụ thuộc vào:
- Dạng hàm của mô hình được lựa chọn - Các Xi và ei - Kích thước mẫu
Ở đây, chúng ta quan tâm tới các giả thiết về X . Với những giả thiết i và ei
này thì ước lượng tìm được bằng phương pháp bình phương nhỏ nhất là các ước
lượng tuyến tính, không chệch và có phương sai nhỏ nhất.
(1) Biến giải thích (X) là phi ngẫu nhiên, tức là các giá trị của chúng là các
số đã được xác định.
Giả thiết này không mới vì phân tích hồi quy được đề cập ở đây là phân tích
hồi quy có điều kiện, phụ thuộc vào các giá trị của X đã cho.
(2) Kỳ vọng của yếu tố ngẫu nhiên (ồ) bằng không, tức là: E(ồi) = E(ồ/Xi) = 0
Gia tri trung bỡnh của cỏc đại lượng ngẫu nhiên luôn bằng 0 Y ---- X (80=>260) Trung binhg ei = 0
Giả thiết này mang ý nghĩa: các yếu tố không có trong mô hình, được đại
diện bởi ồ , không có ảnh hưởng hệ thống đến giá trị trung bình của i Y.
(3) Đại lượng sai số ồi có phương sai là hằng số, nghĩa là:
Var(ồi) = ú2 với mọi i.
Điều này có nghĩa là phân bố có điều kiện của Y với giá trị đã cho của X có
phương sai bằng nhau, các giá trị cá biệt của Y xoay quanh giá trị trung bình với phương sai như nhau.
(4) Biến ngẫu nhiên ồi là độc lập hay là không có sự tương quan giữa các ồi, nghĩa là: Cov(ồ ,ồ i j) = 0 với i ≠ j.
Giả thiết này có nghĩa ồi là ngẫu nhiên. Về mặt hình học có nghĩa là nếu như
có một giá trị ồ nào đó lớn hơn hay nhỏ hơn giá trị trung bình thì không đồng nghĩa
với việc các giá trị khác cũng lớn hơn hay nhỏ hơn giá trị trung bình.
(5) X và ồ không có tương quan với nhau Cov(ồ,X) = 0
Giả thiết (5) là cần thiết vì nếu ồ và X có tương quan với nhau thì ta không
thể tách ảnh hưởng riêng biệt của chúng đến Y, trong khi đó, ồ đại diện cho các yếu
tố không có mặt trong mô hình. Giả thiết (5) được thực hiện ngay nếu X là phi ngẫu nhiên.
b. Định lý Gauss Markov
Giả sử rằng mô hình hồi quy hai biến 3.2 thoả mãn các điều kiện của giả β^ β^
thiết từ (1) đến (5). Khi đó ước lượng 1 và
2 bằng phương pháp OLS là
ước lượng tuyến tính, không chệch tốt nhất của õ1 và õ2 (tuyến tính, không chệch
và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch). β^ β^ Ta biết rằng 1 và
2 là các đại lượng ngẫu nhiên, có các giá trị khác
nhau nếu mẫu được chọn ban đầu khác nhau. Vì phương sai và độ lệch chuẩn là
thước đo mức độ phân tán của đại lượng ngẫu nhiên nên ta dùng chúng để đo chất
lượng của các ước lượng.
Với các giả thiết của phương pháp BPNN thì phương sai và độ lệch chuẩn
của các ước lượng đó được tính bằng công thức: Phương sai: n i ∑ X2 var( β^ 1 n )= i=1 σ2
n∑ x2 i i=1 var( β^ σ2 2)= n ∑ x2 x ¯ i i=1 với
i=X i−X
Độ lệch chuẩn (sai số chuẩn) được xác định bằng: n ∑ X2 Se i=1
( β^ 1 )=σ √ i n =√var( β 1 )
n∑ x2i i=1 Se σ ( β^ var 2 = = ) ( β^ ) n 2 √ √ i x ¯ i=1 ∑ x2 i=Xi−X với
Trong đó với σ2 chưa biết được ước lượng bằng σ^ 2 như sau: n i ∑ e2 σ^ 2= i=1 (n−k )
Trong đó: n là số quan sát, k là số biến có trong mô hỡnh (k=2)
σ^ gọi là sai số tiêu chuẩn để đo độ lệch của Yi xung quanh đường hồi quy Y^ mẫu i .
3.5 Sử dụng hệ số r2 để đo sự phù hợp của mô hình hồi quy mẫu. Y X +e Y^ X Cho i= β
^ 1+ β^ 2 i i và i= β ^ 1+ β^ 2 i n
TSS=∑ (Y −Y¯ i )2 Ký hiệu: i=1
gọi là tổng bình phương các sai lệch giữa
giá trị quan sát Yi với giá trị trung bình. n
ESS=∑ (Y^ i− Y¯ )2 i=1
gọi là tổng bình phương các sai lệch giữa giá trị
hồi quy mẫu với giá trị trung bình của chúng. n n
RSS=∑ e2=∑(Y − Y^ 2 i i i ) i=1 i =1
gọi là tổng bình phương tất cả các sai
lệch giữa các giá trị quan sát và giá trị ước lượng của nó từ mô hình hồi quy mẫu
(Tổng bình phương sai số). TSS = ESS + RSS
Chia cả hai vế cho TSS ta có: ESS 1 ESS RSS = + r2= TSS TSS TSS đặt ta có: n 2 (∑ x yi i ) RSS r2 =1− = i=1 TSS n n 2 2 ∑ xi ∑ y i
xi=X i−X¯
yi=Y i−Y¯ i=1 i=1 với: ,
Hệ số r2 đo mức độ phù hợp của mô hình hoặc độ sai lệch của Y so với giá
trị của chúng được giải thích bằng mô hình hồi quy. Người ta chứng minh được
những tính chất sau của r:
- r nằm trong đoạn [-1, 1]
- r có thể có dấu âm hoặc dương, đó chính là dấu của Cov(X,Y) hay dấu của hệ số góc.
- r có tính chất đối xứng nghĩa là r(X,Y) = r(Y, X)
- X và Y là hai biến ngẫu nhiên độc lập thì r(X, Y) = 0
3.6 Khoảng tin cậy và kiểm định giả thiết về các hệ số hồi quy.
Kiểm định các giả thiết thống kê là một vấn đề rất quan trọng sau khi lập
được mô hình hồi quy. Kiểm định giả thiết thống kê bao gồm các công việc: Kiểm
định giả thiết liên quan đến các tham số, kiểm định các giả thiết về phân bổ xác
suất của các đại lượng ngẫu nhiên, kiểm định các giả thiết về sự độc lập của các biến …
3.6.1 Lược đồ kiểm định Giả
f ( X , θ)
sử X là một đại lượng ngẫu nhiên với hàm mật độ xác suất là ,
trong đó ố là đại lượng chưa biết trước. Ta giả sử rằng ố = ố0 nào đó, ta cần phải
kiểm định giả thiết này.
Mệnh đề H0 : ố = ố0 được gọi là giả thiết cơ bản hay giả thiết
không. Giả thiết không nói rằng đại lượng ngẫu nhiên X có hàm mật độ xác suất
f(X, ố ). Mệnh đề đối của H 0
0 gọi là giả thiết H1 .
Giả thiết H0 được gọi là giả thiết đơn nếu có thể tìm ra một giá trị cho tham
số của phân phối, chẳng hạn ố = ố0 nào đó. Giả thiết H0 được gọi là hỗn hợp nếu
tìm được một khoảng các giá trị cho tham số của phân phối, chẳng hạn ố > ố0 .
Thông thường H0 là đơn và H1 là hỗn hợp thì được chia ra các trường hợp sau:
H0 : ố = ố0 đối H1 : ố ≠ ố0
H0 : ố = ố0 đối H1 : ố < ố0
H0 : ố = ố0 đối H1 : ố > ố0
Vấn đề là làm thế nào để ta chấp nhận hoặc bác bỏ một giả thiết. Muốn vậy
ta phải xây dựng một lược đồ và đưa ra các quy tắc quyết định. Dựa vào các quy
tắc đó mà ta chấp nhận hay bác bỏ một giả thiết. Dưới đây là lược đồ:
a. Từ đại lượng ngẫu nhiên X, ta lập mẫu gồm n quan sát (X1, X2, …, Xn). b. Nếu giả thiết H , …, X
0 đúng, chọn thống kê S(X, ố) = f(X1, X2 n) sao cho
quy tắc phân bố xác suất của thống kê S được xác định không phụ thuộc vào ố. P(S ∈W c. Tìm miền W α ỏ sao cho xác suất
) = ỏ trong đó ỏ đủ bé và
α∈(0,1) . Bởi vì dù ỏ đủ bé do đó có thể coi S không thuộc miền xác định W . α
d. Lấy mẫu ngẫu nhiên (X1, X2, …, Xn) và tính giá trị của S trên mẫu g(X , …, X , ố). 1, X2 n
- Nếu g ê Wỏ thì bác bỏ H0 và chấp nhận H1. g∉W - Nếu
α thì không có đủ cơ sở để bác bỏ H 0 . Wỏ được gọi là miền
bác bỏ, ỏ là mức ý nghĩa, S là tiêu chuẩn để kiểm định.
Trên một mẫu có thể có nhiều thống kê S khác nhau, do đó phải chọn thống
kê nào tốt theo một tiêu chuẩn hoặc một số tiêu chuẩn nào đó.
Khi kiểm định giả thiết theo các quy tắc trong lược đồ trên một cách ngẫu
nhiên cho nên chúng ta không thể biết chính xác giả thiết H0 là đúng hay sai. Do
vậy có thể xảy ra sai lầm, có hai loại sai lầm:
- Sai lầm loại một: Là sai lầm do giả thiết H0 là đúng nhưng ta lại bác bỏ.
Nguyên nhân mắc sai lầm chính là do ỏ.
- Sai lầm loại 2: Giả thiết H0 sai nhưng lại được chấp nhận. Chúng ta muốn
sao cho xác suất mắc sai lầm loại 2 là tối thiểu. Nếu gọi õ là xác suất mắc sai lầm
loại 2, khi đó xác suất bác bỏ giả thiết H0 sai là 1-õ. Nói khác đi 1- õ là xác suất
không mắc sai lầm loại 2 và được gọi là lực kiểm định.
Để làm rõ các tiêu chuẩn và cách kiểm định giả thiết ta sẽ xét nội dung của
việc kiểm định thống kê các tham số, phương sai, tính phù hợp của mô hình.
3.6.2 Kiểm định giả thiết về các tham số hồi quy.
Trước hết ta xác định khoảng tin cậy của các tham số õ1 và õ2 , đồng thời
kiểm định chúng. Để kiểm định các tham số ta dùng thống kê t.
a. Khoảng tin cậy của õ1 và õ2.
Ta chọn tiêu chuẩn kiểm định: T β^ t 1− β1 =
Se ( β^ 1) ~ T(n-2)
Với hệ số tin cậy là 1 – ỏ , ta tìm được tỏ/2(n-2) thoả mãn. P[ β^ 1− β1
≤tα ( n−2 ) =1−α /2 ) ]
−tα / 2( n−2)≤ Se( β^ Và 1
Khoảng tin cậy 1- ỏ của õ1 là: ( β^ 1−tα ))
/ 2( n−2) Se ( β
^ 1) ; β^ 1+tα / 2( n−2) Se ( β^ 1
Tương tự, khoảng tin cậy của õ2 là : ( β^ 2−tα ); β^ ))
/ 2( n−2) Se ( β
^ 2 2+tα / 2( n−2 ) Se( β^ 2
với xác suất tin cậy là 1 – ỏ.
Sau khi xác định khoảng tin cậy ta sẽ tiến hành kiểm định chúng bằng các β =β¿ β =β¿
giả thiết H0 và H1 . Để tổng quát ta có thể giả sử rằng: 1 1 và 2 2 . Ta có khoảng cách như sau: Bảng Loại giả thiết Giả thiết H0 Giả thiết H1 Miền bác bỏ Hai phía β =β¿ β ≠β¿ i i i i
∣t∣>tα /2(n−2) Bên phải β =β¿ β > β¿ i i i i
t > tα ( n−2 ) Bên trái β =β¿ β ∈ β¿ i i i i
t ∈−tα ( n−2) β =β¿ =0
Trường hợp kiểm định giả thiết H0: 2 2 tương đương với kiểm
định giả thiết rằng X là biến độc lập không phụ thuộc vào Y.
b. Khoảng tin cậy của ú2 2 σ^ 2 χ2 χ =( n−2) χ2 Theo phân phối thì σ2 ~ (n-2)
Do đó khoảng tin cậy 1 - ỏ của ú2 được xác định: P[χ2 σ^ 2 2
1−α/2 ( n−2 )≤( n−2 ) ≤ χ
( n−2 ) =1−α σ2 α / 2 ]
hay nghịch đảo bất đẳng thức trên ta có: P ≤σ ≤ =1−α χ 2 ( n−2) χ2 ( n−2) α / 2 1−α / 2
[ ( n−2 ) σ^ 2 2 ( n−2 )σ^ 2 χ2 (k ) ] α
Trong đó giá trị của phân phối
được cho trong phần phụ lục. Từ đó
ta kiểm định giả thiết đối với ú2 , ta có bảng sau: Loại giả thiết Giả thiết H0 Giả thiết H1 Miền bác bỏ ( n−2 ) σ^ 2 2 > χ σ2 α / 2( n−2) Hai phía σ2=σ 2 σ2≠σ 2 0 0 0 ( n−2 ) σ^ 2 2 ∈ χ ( n−2 ) σ2 1−α / 2 0 ( n−2) σ^ 2 2 Bên phải σ2=σ 2 σ2 >σ2 0 0
> χ ( n−2) σ2 α 0 ( n−2) σ^ 2 2 Bên trái σ2=σ 2 σ2 ∈σ2 0 0 ∈ χ ( n−2) σ2 1−α 0
3.7 Phân tích hồi quy và dự báo
Sau khi đã ước lượng được mô hình hồi quy, chúng ta có thể dựa vào mô
hình để dự báo theo hai hướng:
- Dự báo giá trị trung bình có điều kiện của Y với X = X0
- Dự báo giá trị cá biệt của Y với X = X0
a. Dự báo giá trị trung bình
Giả sử X = X0, ta muốn dự báo E(Y/X0). Đường hồi quy mẫu cho ta ước lượng Y^ X điểm của E(Y/X 0= β^ 1+ β ^ 2 0 0):
Y^ 0 là ước lượng không chệch có phương sai nhỏ nhất của E(Y/X ). Tuy 0 Y^ nhiên
0 vẫn khác so với giá trị thực của nó.
Y^ 0 có phân bố chuẩn với kỳ vọng: õ + õ X và người ta đã chứng minh 1 2 0 rằng: 0 0
Var ( Y^ )=σ2[ 1 ( X + − X ¯ )2 n n ∑ x2 i=1 ]i
Nhưng do σ2 chưa biết nên ta sử dụng ước lượng không chệch của σ2 là σ^ 2 , khi đó: Y^ X ) t 0−( β1+ β2 0 = Se ( Y^ ) 0 ~ T(n - 2)
Với khoảng tin cậy 1 – ỏ của E(Y/X0) là: P( β^ X X X 1+ β ^ 2 )≤β + β +t ))=1−α
0−tα / 2( n−2 ) Se( Y ^ 0 1 2 0 ≤ β
^ 1+ β^ 2 0 α / 2( n−2) Se ( Y^ 0 Ta có: Y^ 0−tα
)≤E (Y / X )≤ Y^ +t )
/2(n−2)Se ( Y ^ 0 0 0
α / 2( n−2)Se ( Y^ 0
b. Dự báo giá trị riêng biệt
Ta muốn dự báo giá trị riêng biệt Y = Y0 với X = X0, khi đó ước lượng của Y X 0 là:
Y^ 0=β^ 1+ β^ 2 0 Và: 0 1 Var ( X − X ¯ )2 ( Y )=σ2 0
[1+ + n n ∑ x2 i=1 ]i Y t 0−Y ^ 0
= Se (Y0 ) ~ T(n - 2)
Khoảng tin cậy của Y0 được xác định bởi:
P ( Y^ 0−tα )≤Y ))=1−α
/ 2( n−2) Se ( Y 0
0 ≤ Y^ 0+tα / 2( n−2) Se ( Y 0 Ví dụ:
Cho số liệu sau về mức tiêu dùng (Y) của các hộ gia đình ứng với mức thu
nhập (X) của họ. Cho biết mối quan hệ này là tuyến tính. Ước lượng mô hình hồi
quy biểu diễn mối quan hệ giữa tiêu dùng và thu nhập đồng thời tính các đặc trưng của nó. Bảng Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260
a. Hàm hồi quy mẫu có dạng:
Y^ i= β^ 1+ β^ 2 X i
Để ước lượng các tham số của hàm hồi quy ta tính toán thông qua bảng sau: Bảng:
Và ước lượng được mô hình hồi quy mẫu có dạng: Yi = 24,46 + 0,51Xi + ei Với: Phương sai: (41,14) (0,001) Độ lệch chuẩn: (6,42) (0,036)
b. Hệ số r2 tính được: r2 = 0,96 chứng tỏ mô hình hồi quy phản ánh chính
xác tới 96% sự biến động của tiêu dùng theo thu nhập. H : β
c. Kiểm định giả thiết 0 2=0
tương đương với kiểm định giả thiết “
tiêu dùng không phụ thuộc vào thu nhập”.
Ta tính được thống kê t = 3,813 > t0,025(8) = 2,306. Như vậy ta bác bỏ giả
thiết H0 và khẳng định tiêu dùng phụ thuộc vào thu nhập.