1. Hồi quy ?
Hồi quy hay phân tích hồi quy liên quan đến việc ta đánh giá mối
quan hệ giữa một biến đã cho gọi biến phụ thuộc (Yi) với một hay nhiều biến
khác gọi là biến độc lập (Xi).
2. hình hồi quy giản đơn
hình hồi quy :
( I = 1,2,3, n)
Trong đó :
Y
i
: Biến phụ thuộc
X
i
: Biến độc lập ( biến giải thích)
B
1
: Hằng số , tham số chặn
B
2
: Tham số ước lượng
3. Kiểm định mức ý nghĩa của tham số thống ( kiểm định t )
Bước 1 : Đưa ra mức ý nghĩa thống kê
- Mức ý nghĩa thống kê ( ) thông thường 5%
- Ta có công thức sau :
Trong đó : : Mức ý nghĩa
P : Xác suất
Như vậy, nếu đề bài đưa ra cho ta xác suất, ta có thể tính được mức ý nghĩa thống
dụ : Cho xác suất 95% vậy mức ý nghĩa thống bao nhiêu ?
Giải : P = 95% =>
Vậy mức ý nghĩa thống 5%
Bước 2 : Đưa ra các giả thuyết
-
H
0
: B
i
= 0 , X Y không tương quan với nhau, hay B
i
không ý nghĩa
thống kê ở mức ý nghĩa
-
H
1
: B
i
0, X và Y có tương quan với nhau , hay B
i
có ý nghĩa thống kê ở mức ý
nghĩa
Bước 3 : Tính giá trị t kiểm định
Ta có :
Nếu giả thuyết H
0
đúng thì B
i
= 0 , lúc đó ta :
Bước 4 : Tìm giá trị tới hạn (t
c
)
Giá trị t
c
trị chúng ta cần tra bng
Trong đó :
n : số quan sát , số mẫu
k : số tham số
: mức ý nghĩa
n k : còn được gọi bậc tự do
Bước 5 : So sánh t
với t
c
- Nếu |t
| t
c
: ta chấp nhận giả thuyết H
0
hay B
i
= 0 X Y không tương
quan với nhau , B
i
không có ý nghĩa thống kê ở mức ý nghĩa .
-
Nếu |t
| t
c
: ta bác bỏ giả thuyết H
0
, chấp nhận H
1
hay B
i
0, X và Y có tương
quan với nhau , hay Bi có ý nghĩa thống kê ở mức ý nghĩa
5. Độ chặt chẽ của nh
- được gọi hệ số xác định, phản ánh mức độ chặt chẽ của mối quan hệ
giữa X Y , về bản chất giải thích sự biến động của Y mà biến động này được
giải thích bởi biến độc lập X.
- 0
1
- dụ ta , ta thể kết luận như sau :
+ hình ước lượng giải thích 95,28% sự biến động của Y
+ Biến X giải thích 95,28% sự biến động của Y
-
Hệ số xác định hiệu chỉnh :
=> Hệ sxác định hiệu chỉnh đánh giá độ chặt chẽ của mô nh tốt hơn hệ sxác
định vì nếu dựa vào hệ số xác định hiệu chỉnh chúng ta có thể quan sát được cả bậc
tự do ảnh hưởng đến mô hình như thế nào.
6.
Kiểm định hình hồi quy ( kiểm định F )
Bước 1 : Chọn mức ý nghĩa thống kê
Bước 2 : Đặt các giả thuyết
, mô hình không có ý nghĩa thống kê ở mức
, mô hình có ý nghĩa thống kê ở mức
Bước 3 : Tìm giá trị F kiểm định
Bước 4 : tìm giá trị
Tra bảng
Bước 5 : Sonh giá trị F
- Nếu F
> , Bác bỏ H
0
, chấp nhận H
1
, hình ý nghĩa thống mức
-
Nếu F
< , Chấp nhận H
0
, mô hình không có ý nghĩa thống kê ở mức
7. Ước lượng khoảng tin cy
- Giả sử ta mô hình sau :
- Ta b
2
= 0,759 ước lượng điểm
- Câu hỏi đặt ra liệu rằng B
2
đúng bằng 0,759 hay không? B
2
nằm trong
khoảng nào thì tin cậy được ?
- Công thức tính khoảng tin cậy :
Trong đó :
t
c
: giá trị tới hạn ( tra bảng)
Se(b
i
) : sai số chuẩn của b
i
*
Các bước tìm khoảng tin cậy :
-
Bước 1 : Chọn mức độ ý nghĩa
- Bước 2 : Tìm giá trị t
c
- Bước 3 : Tính khoảng tin cậy
Áp dụng công thức :
- Bước 4 : Kết luận
+ Với mức ý nghĩa = , giá trị của tham số/hằng số tổng thể B
i
sẽ nằm
trong khoảng từ đến
+ Giá trị của tham số/hằng số tổng thể B
i
sẽ nằm trong khoảng từ
đến , với mức ý nghĩa = …
8. Ý nghĩa của các tham số
lin : tuyến tính ; log : ln
a) hình lin lin :
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi tăng |
Bi| đơn vị
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi giảm |
Bi| đơn vị
b) Mô hình log log
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi tăng |Bi| %
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi giảm |Bi| %
Lưu ý : Trong mô hình log – log thì các tham số Bi chính là hệ số co giãn của mô
hình
c) hình lin log
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi tăng |Bi/100|
đơn vị
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi giảm
|Bi/100| đơn vị
d) Mô hình log - lin
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi tăng |
Bi*100| %
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi giảm |
Bi*100| %
9. Biến giả
Thông thường trong phân tích hồi quy , biến phụ thuộc (Yi) chịu ảnh hưởng
bởi các biến độc lập ( Xi) mang tính định lượng và có đơn vị đo nào đó (Ví dụ : thu
nhập , chi tiêu , số lượng nhân công , …)
Nhưng trong thực tế biến phụ thuộc (Yi) còn chịu ảnh hưởng bởi các biến
định tính ( hay biến chất lượng) . dụ : trình độ học vấn , giới tính, vùng , miền ,
màu sắc …
Như vậy, để thể phân tích hồi quy chúng ta cần gán giá trị nào đó cho các
biến định lượng , các giá trị được gán thường 0,1,2,3,… Những biến được gán
các giá trị này được gọi là biến giả ( ký hiệu : D )
10. Phân tích tham số của biến giả
Giả sử, ta hình sau :
Trong đó :
Yi : thu nhập của ngườin
Xi : số tuổi
Di : trình độ học vấn
D = 1, học vấn cao
D = 0, học vấn thp
Bây giờ ta sẽ đi phân tích thu nhập của người dân :
+) Đối với người có trình độ học vấn cao ( D = 1) , thì hình sẽ có dạng sau :
+) Đối với người có trình độ học vấn thấp ( D = 0 ), t hình sẽ có dạng sau :
So sánh hai hình ta thấy, trong trường hợp các yếu tố khác không thay đổi thì
thu nhập của người học vấn cao sẽ nhiều hơn/ít hơn thu nhập của người học
vấn thấp một khoảng là |B
3
| đơn vị
11. Ảnh hưởng của biến định tính đến biến định lượng
Vẫn lấy dụ từ phần 10 , giả sử chúng ta muốn xem xét mối quan hệ giữa số tuổi (
biến định lượng ) trình độ học vấn ( biến định tính) , như vậy hình snhư
sau :
Phân tích mô hình ta được :
- Thu nhập trung bình của người dân trình độ học vấn cao ( D
i
= 1) :
- Thu nhập trung bình của người dân trình độ học vấn thấp ( D
i
= 0) :
Qua 2 mô hình ta có nhận xét sau :
- Trong trường hợp các yếu tố khác không thay đổi , đối với người học vấn cao
thì thu nhập sẽ nhiều hơn/ít hơn thu nhập của người có học vấn thấp một khoảng
|B
3
| đơn vị. ( B
3
> 0 : Nhiều hơn ; B
3
< 0 : Ít hơn )
- Trong trường hợp các yếu tố khác không thay đổi thì đối với những người học
vấn cao thì số tuổi của họ tăng 1 đơn vị thì thu nhập của họ sẽ tăng / giảm |B
4
| đơn
vị. ( B4 > 0 : tăng ; B4 < 0 : giảm )

Preview text:

1. Hồi quy là gì ?
Hồi quy hay phân tích hồi quy liên quan đến việc mô ta và đánh giá mối
quan hệ giữa một biến đã cho gọi là biến phụ thuộc (Yi) với một hay nhiều biến
khác gọi là biến độc lập (Xi).
2. Mô hình hồi quy giản đơn Mô hình hồi quy : ( I = 1,2,3, …n) Trong đó : Yi : Biến phụ thuộc
Xi : Biến độc lập ( biến giải thích)
B1 : Hằng số , tham số chặn
B2 : Tham số ước lượng
3. Kiểm định mức ý nghĩa của tham số thống kê ( kiểm định t )
Bước 1 : Đưa ra mức ý nghĩa thống kê
- Mức ý nghĩa thống kê ( ) thông thường là 5% - Ta có công thức sau :
Trong đó : : Mức ý nghĩa P : Xác suất
Như vậy, nếu đề bài đưa ra cho ta xác suất, ta có thể tính được mức ý nghĩa thống kê
Ví dụ : Cho xác suất là 95% vậy mức ý nghĩa thống kê là bao nhiêu ? Giải : P = 95% =>
Vậy mức ý nghĩa thống kê là 5%
Bước 2 : Đưa ra các giả thuyết
- H0 : Bi = 0 , X và Y không có tương quan với nhau, hay Bi không có ý nghĩa
thống kê ở mức ý nghĩa
- H1 : Bi 0, X và Y có tương quan với nhau , hay Bi có ý nghĩa thống kê ở mức ý nghĩa
Bước 3 : Tính giá trị t kiểm định Ta có :
Nếu giả thuyết H0 đúng thì Bi = 0 , lúc đó ta có :
Bước 4 : Tìm giá trị tới hạn (tc)
Giá trị tc là gí trị mà chúng ta cần tra bảng Trong đó :
n : số quan sát , số mẫu k : số tham số : mức ý nghĩa
n – k : còn được gọi là bậc tự do
Bước 5 : So sánh tkđ với tc
- Nếu |tkđ| tc : ta chấp nhận giả thuyết H0 hay Bi = 0 và X và Y không có tương
quan với nhau , Bi không có ý nghĩa thống kê ở mức ý nghĩa . - Nếu |tkđ| t , chấp nhận H
c : ta bác bỏ giả thuyết H0
1 hay Bi 0, X và Y có tương
quan với nhau , hay Bi có ý nghĩa thống kê ở mức ý nghĩa
5. Độ chặt chẽ của mô hình -
được gọi là hệ số xác định, nó phản ánh mức độ chặt chẽ của mối quan hệ
giữa X và Y , về bản chất nó giải thích sự biến động của Y mà biến động này được
giải thích bởi biến độc lập X. - 0 1 - Ví dụ ta có
, ta có thể kết luận như sau :
+ Mô hình ước lượng giải thích 95,28% sự biến động của Y
+ Biến X giải thích 95,28% sự biến động của Y
- Hệ số xác định hiệu chỉnh :
=> Hệ số xác định hiệu chỉnh đánh giá độ chặt chẽ của mô hình tốt hơn hệ số xác
định vì nếu dựa vào hệ số xác định hiệu chỉnh chúng ta có thể quan sát được cả bậc
tự do ảnh hưởng đến mô hình như thế nào.
6. Kiểm định mô hình hồi quy ( kiểm định F )
Bước 1 : Chọn mức ý nghĩa thống kê
Bước 2 : Đặt các giả thuyết
, mô hình không có ý nghĩa thống kê ở mức
, mô hình có ý nghĩa thống kê ở mức
Bước 3 : Tìm giá trị F kiểm định
Bước 4 : tìm giá trị Tra bảng
Bước 5 : So sánh giá trị Fkđ và - Nếu Fkđ >
, Bác bỏ H0 , chấp nhận H1, mô hình có ý nghĩa thống kê ở mức - Nếu Fkđ <
, Chấp nhận H , mô hình không có ý nghĩa thống kê ở mức 0
7. Ước lượng khoảng tin cậy
- Giả sử ta có mô hình sau :
- Ta có b2 = 0,759 là ước lượng điểm
- Câu hỏi đặt ra là liệu rằng B2 có đúng là bằng 0,759 hay không? B2 nằm trong
khoảng nào thì tin cậy được ?
- Công thức tính khoảng tin cậy : Trong đó :
tc : giá trị tới hạn ( tra bảng)
Se(b ) : sai số chuẩn của b i i
* Các bước tìm khoảng tin cậy :
- Bước 1 : Chọn mức độ ý nghĩa
- Bước 2 : Tìm giá trị tc
- Bước 3 : Tính khoảng tin cậy Áp dụng công thức : - Bước 4 : Kết luận
+ Với mức ý nghĩa = … , giá trị của tham số/hằng số tổng thể Bi sẽ nằm trong khoảng từ đến
+ Giá trị của tham số/hằng số tổng thể Bi sẽ nằm trong khoảng từ đến
, với mức ý nghĩa = …
8. Ý nghĩa của các tham số
lin : tuyến tính ; log : ln a) Mô hình lin – lin :
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi tăng | Bi| đơn vị
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi giảm | Bi| đơn vị b) Mô hình log – log
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi tăng |Bi| %
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi giảm |Bi| %
Lưu ý : Trong mô hình log – log thì các tham số Bi chính là hệ số co giãn của mô hình c) Mô hình lin – log
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi tăng |Bi/100| đơn vị
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 % thì Yi giảm |Bi/100| đơn vị d) Mô hình log - lin
- Bi > 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi tăng | Bi*100| %
- Bi < 0 : Nếu các yếu tố khác không thay đổi , khi Xi tăng 1 đơn vị thì Yi giảm | Bi*100| % 9. Biến giả
Thông thường trong phân tích hồi quy , biến phụ thuộc (Yi) chịu ảnh hưởng
bởi các biến độc lập ( Xi) mang tính định lượng và có đơn vị đo nào đó (Ví dụ : thu
nhập , chi tiêu , số lượng nhân công , …)
Nhưng trong thực tế biến phụ thuộc (Yi) còn chịu ảnh hưởng bởi các biến
định tính ( hay biến chất lượng) . Ví dụ : trình độ học vấn , giới tính, vùng , miền , màu sắc …
Như vậy, để có thể phân tích hồi quy chúng ta cần gán giá trị nào đó cho các
biến định lượng , các giá trị được gán thường là 0,1,2,3,… Những biến được gán
các giá trị này được gọi là biến giả ( ký hiệu : D )
10. Phân tích tham số của biến giả
Giả sử, ta có mô hình sau : Trong đó :
Yi : là thu nhập của người dân Xi : số tuổi Di : trình độ học vấn D = 1, học vấn cao D = 0, học vấn thấp
Bây giờ ta sẽ đi phân tích thu nhập của người dân :
+) Đối với người có trình độ học vấn cao ( D = 1) , thì mô hình sẽ có dạng sau :
+) Đối với người có trình độ học vấn thấp ( D = 0 ), thì mô hình sẽ có dạng sau :
So sánh hai mô hình ta thấy, trong trường hợp các yếu tố khác không thay đổi thì
thu nhập của người có học vấn cao sẽ nhiều hơn/ít hơn thu nhập của người có học
vấn thấp một khoảng là |B | đơn vị 3
11. Ảnh hưởng của biến định tính đến biến định lượng
Vẫn lấy ví dụ từ phần 10 , giả sử chúng ta muốn xem xét mối quan hệ giữa số tuổi (
biến định lượng ) và trình độ học vấn ( biến định tính) , như vậy mô hình sẽ như sau :
Phân tích mô hình ta được :
- Thu nhập trung bình của người dân có trình độ học vấn cao ( Di = 1) :
- Thu nhập trung bình của người dân có trình độ học vấn thấp ( Di = 0) :
Qua 2 mô hình ta có nhận xét sau :
- Trong trường hợp các yếu tố khác không thay đổi , đối với người có học vấn cao
thì thu nhập sẽ nhiều hơn/ít hơn thu nhập của người có học vấn thấp một khoảng là
|B3| đơn vị. ( B3 > 0 : Nhiều hơn ; B3 < 0 : Ít hơn )
- Trong trường hợp các yếu tố khác không thay đổi thì đối với những người có học
vấn cao thì số tuổi của họ tăng 1 đơn vị thì thu nhập của họ sẽ tăng / giảm |B | đơn 4
vị. ( B4 > 0 : tăng ; B4 < 0 : giảm )