



















Preview text:
Bài 6 PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN Nội dung I II III MỐI LIÊN HỆ PHÂN TÍCH PHÂN TÍCH GIỮA CÁC TƯƠNG QUAN HỒI QUY HIỆN TƯỢNG 1 11/4/2025
Mối liên hệ giữa các hiện tượng Liên hệ hàm số Liên hệ tương quan
Mối liên hệ giữa các hiện tượng KTXH
Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ, sự thay đổi của hiện
tượng này có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ lệ xác định. Có dạng y=f(x)
không những được biểu hiện ở tổng thể mà còn được biểu hiện
trên từng đơn vị cá biệt.
Liên hệ tương quan: là mối liên hệ không hoàn toàn chặt chẽ. Sự thay đổi
của hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng không
có ảnh hưởng hoàn toàn quyết định.
không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua
hiện tượng số lớn (là tổng thể). 2 11/4/2025 Phân tích tương quan
Phân tích tương quan (Correlation Analysis) gồm các kỹ thuật dùng để
khám phá mối liên hệ tương quan giữa hai biến.
• Mô tả bằng đồ thị phân tán (Scatterplot)
• Tính hiệp phương sai (Covariance) (Bài 3)
• Tính hệ số tương quan (Correlation Coefficient) (Bài 3)
Phân tích tương quan chỉ cho biết mối liên hệ đó có tồn tại không chứ
không cho biết mối liên hệ đó có phải là nguyên nhân - kết quả. Phân tích tương quan
Khám phá mối liên hệ tương quan giữa hai biến bằng đồ thị phân tán •
X là biến độc lập, giá trị của X được biểu diễn trên trục hoành •
Y là biến phụ thuộc, giá trị của Y được biểu diễn trên trục tung
→ Scatterplot có thể cho biết cường độ và chiều hướng của mối liên hệ tuyến tính giữa hai biến. 3 11/4/2025 Phân tích tương quan Tương quan hoàn hảo Tương quan một phần Tương quan một phần
(liên hệ hàm số). Mỗi một
(liên hệ tuyến tính chặt chẽ)
(liên hệ tuyến tính kém chặt chẽ)
giá trị của X đưa lại một giá trị của Y. Phân tích tương quan Tương quan thuận chiều Tương quan ngược chiều
Không có mối liên hệ tương
(dương), khi X tăng thì Y tăng
(âm), khi X tăng thì Y giảm
quan. Khi X thay đổi, Y không và ngược lại. thay đổi. 4 11/4/2025 Phân tích tương quan
Hệ số tương quan là số tương đối dùng để đánh giá chiều hướng và
cường độ của mối liên hệ tương quan tuyến tính. R = Cov X, Y SS • Trong đó Cov X, Y = ∑(x− (n x) − (y 1) − y) S x = ∑() S y = ∑() Phân tích tương quan Tính chất:
Không có mối liên hệ tuyến tính Liên hệ hàm số Liên hệ hàm số -1 0 +1 5 11/4/2025 Phân tích tương quan
Liệu X và Y thực sự có mối liên hệ tương quan tuyến tính trong tổng thể?
• Hệ số tương quan tổng thể là ρ
• Thực hiện kiểm định về giá trị của ρ
• Tiêu chuẩn kiểm định là thống kê t có phân phối Student với n-2 bậc tự do t = R 1 − R n − 2 Phân tích tương quan Kiểm định phía trái: Kiểm định phía phải: Kiểm định hai phía: H0: ρ 0 H0: ρ ≤ 0 H0: ρ = 0 H1: ρ < 0 H1: ρ > 0 H1: ρ ≠ 0 Có mối liên hệ tương Có mối liên hệ tương Có mối liên hệ tương quan tuyến tính âm quan tuyến tính dương quan tuyến tính aa a/2 a/2 -ta ta -ta/2 ta/2
Bác bỏ H0nếu t < -t α, n-2
Bác bỏ H0nếu t > t α, n-2
Bác bỏ H0nếu t < -tα /2, n-2 hoặc t > tα /2, n-2 6 11/4/2025
Một số khái niệm liên quan Tương quan hoàn hảo Tương quan một phần Tương quan một phần
(liên hệ hàm số). Mỗi một
(liên hệ tuyến tính chặt chẽ)
(liên hệ tuyến tính kém chặt chẽ)
giá trị của X đưa lại một giá trị của Y.
Một số khái niệm liên quan Tương quan thuận chiều Tương quan ngược chiều
Không có mối liên hệ tương
(dương), khi X tăng thì Y tăng
(âm), khi X tăng thì Y giảm
quan. Khi X thay đổi, Y không và ngược lại. thay đổi. 7 11/4/2025 Phân tích hồi quy
Một số vấn đề chung
Phân tích hồi quy tuyến tính đơn Phân tích hồi quy bội Một số vấn đề chung
Phân tích hồi quy (Regression Analysis) là kỹ thuật phân tích mối liên hệ
giữa một biến phụ thuộc (dependent variable) và một hay nhiều biến độc lập (independent variable).
• Ví dụ: Giá ảnh hưởng như thế nào đến cầu sản phẩm? Khi giá thay đổi,
cầu sản phẩm sẽ thay đổi thế nào?
Mối liên hệ phụ thuộc này được xây dựng bằng một phương trình hồi quy
có thể là tuyến tính hay phi tuyến. 8 11/4/2025 Một số vấn đề chung
Hồi quy tuyến tính đơn xem xét mối liên hệ giữa một biến phụ thuộc và một biến độc lập
• Mối quan hệ giữa hai biến này được biểu diễn bởi một đường thẳng.
Hồi quy bội xem xét mối liên hệ giữa một biến phụ thuộc và nhiều biến độc lập. Một số vấn đề chung
Phân tích hồi quy dùng để:
• Giải thích tác động của những thay đổi trong một biến độc lập đến biến phụ thuộc.
• Dự báo giá trị của biến phụ thuộc dựa trên giá trị của ít nhất một biến độc lập. 9 11/4/2025
Trình tự tiến hành phân tích HQTQ
Bước 1: Phân tích bản chất mối liên hê
Bước 2: Xây dựng mô hình
Bước 3: Ước lượng mô hình
Bước 4: Đánh giá mô hình
Hồi qui tương quan tuyến tính đơn
• Xây dựng mô hình hồi qui
• Ước lượng mô hình hồi qui
• Đánh giá cường độ của mối liên hệ, sự phù hợp của mô hình
• Kiểm định các hệ số của mô hình hồi qui 10 11/4/2025
Xây dựng mô hình hồi qui
Mối quan hệ giữa X và Y được mô tả bằng một hàm tuyến tính.
Sự thay đổi của Y được giả định là do sự thay đổi của X gây ra.
Mô hình hồi qui tuyến tính tổng thể chung: Y β β x i ε 0 1 i i Trong đó:
0và 1là các hệ số của mô hình tổng thể chung
là sai số ngẫu nhiên (random error).
Xây dựng mô hình hồi qui Hệ số hồi Sai số Hệ số tự do Biến độc lập qui tổng ngẫu tổng thể thể nhiên Biến phụ thuộc Y β β X i ε 0 1 i i Thành phần tuyến tính Thành phần sai số ngẫu nhiên 11 11/4/2025
Xây dựng mô hình hồi qui Y Y β β X i ε 0 1 i i Giá trị quan sát của Y cho Xi Hệ số hồi qui = β1 εi Giá trị dự đoán Sai số ngẫu nhiên cho của Y cho Xi giá trị Xi Hệ số tự do = β0 Xi X
Ước lượng mô hình hồi qui
Một mẫu gồm có n quan sát
xilà giá trị của biến độc lập thứ i.
yilà giá trị của biến phụ thuộc thứ i.
𝑥 là giá trị trung bình của biến độc lập.
𝑦 là giá trị trung bình của biến phụ thuộc. 12 11/4/2025
Ước lượng mô hình hồi qui
• Phương trình hồi qui tuyến tính mẫu đưa ra một ước lượng cho đường hồi qui tổng thể. Giá trị ước Ước lượng của Ước lượng của lượng (hay lý hệ số tự do hệ số hồi qui thuyết) của y cho quan sát i Giá trị của x cho quan sát i y b bˆ i x 0 1 i
Sai số ngẫu nhiên cá nhân eicó trung bình bằng 0 e y - y y - (b bi x i i i 0 1 (i ˆ ) )
Ước lượng mô hình hồi qui
•Phương pháp bình phương nhỏ nhất (OLS): Xác định giá trị nhỏ nhất
của bình phương chênh lệch giữa giá trị thực tế và giá trị từ phương trình
hồi qui lý thuyết (phần dư ei). 2 min SSE min e i 2 min (y yˆ ) i i 2 min [y (b b x )] i 0 1 i 13 11/4/2025
Ước lượng mô hình hồi qui
Các giả thiết của phương pháp bình phương nhỏ nhất (OLS):
• Giả thiết 1: Mô hình được ước lượng trên cơ sở mẫu ngẫu nhiên
• Giả thiết 2: Kỳ vọng toán của sai số bằng không
• Giả thiết 3: Sai số tuân theo quy luật phân bố chuẩn
• Giả thiết 4: Phương sai của sai số bằng nhau (không đổi)
• Giả thiết 5: Không có tương quan giữa các phần dư (không có tự tương quan)
• Giả thiết 6: Giữa các biến độc lập không có tương quan tuyến tính hoàn
hảo (đa cộng tuyến) - Đối với hồi quy bội.
Ước lượng phương trình hồi quy
• Từ OLS suy ra hệ phương trình chuẩn xác định các hệ số a và b: 𝜕SSE 𝜕𝑏𝑜 𝜕b1 = Σ2(y
Σ2(y− bo − b1x)(−1)
)(−x) = 0 Σy= nb0+ b1Σx 𝜕SSE
Σxy= b0Σx+ b1Σx
• Hoặc tính theo công thức: b1 = ∑(x ∑ − (x b0 x − =)(y x) y − − y) b1. x 14 11/4/2025
Ước lượng mô hình hồi qui
Giải thích ý nghĩa của các hệ số
b0là hệ số tự do (hệ số chặn) cho biết giá trị của y khi x bằng 0 (nếu
trong tổng thể x có nhận giá trị 0). Hoặc coi đó là ảnh hưởng trung bình
của tất cả biến nguyên nhân khác ngoài biến x tới biến kết quả y.
b1là hệ số hồi qui (hệ số góc) cho biết ảnh hưởng trực tiếp của biến
nguyên nhân x tới biến kết quả y. Cụ thể, khi x thay đổi 1 đơn vị thì y thay
đổi trung bình b1đơn vị. Ngoài ra, nó còn cho biết chiều hướng của mối liên hệ giữa x và y.
Đánh giá cường độ của mối liên hệ, sự phù hợp của mô hình • Hệ số xác định • Hệ số tương quan
• Sai số chuẩn của mô hình (ước lượng) 15 11/4/2025 Hệ số xác định
Tổng biến thiên (variation) được chia thành hai phần: SST S S R S SE
Biến thiên của biến phụ thuộc Biến thiên của hồi qui Biến thiên của phần dư (Total Sum of Squares) (Regression Sum of Squares) (Error Sum of Squares) SST 2 (y i ) y SSR ˆ 2 (y i) y SSE ˆ ( 2 y i y ) i
Đo lường sự biến thiên của Sự hệ btiế u n yế th n itê í n nh do gi m ữa ối x q v u à an y
Sự biến thiên do các nhân
các giá trị yiquanh giá trị
tố khác ngoài mối quan hệ trung bình 𝑦 của nó tuyến tính giữa x và y Hệ số xác định Y yi 𝑦 = 𝑏+ 𝑏𝑥
𝑺𝑺𝑻 = (𝒚𝒊− 𝒚)𝟐
𝑺𝑺𝑬 = (𝒚𝒊− 𝒚)𝟐 𝑦
𝑺𝑺𝑹 = (𝒚𝒊− 𝒚)𝟐 𝑦 XiX 16 11/4/2025 Hệ số xác định
Hệ số xác định là tỷ lệ (lần, %) thay đổi của biến phụ thuộc
được giải thích bởi sự thay đổi của biến độc lập, ký hiệu là R2. • Công thức: 𝑅=𝑆𝑆𝑅 𝑆𝑆𝑇
• Tính chất: 0 ≤ R2≤ 1 (100%) Hệ số xác định Y Y Y X X Y Y X r2= 0
Không có mối liên hệ tuyến tính X
giữa X và Y. Giá trị của Y không 0 < r2< 1 X r2= 1 phụ thuộc vào X.
Liên hệ tuyến tính hoàn hảo giữa X
Liên hệ tuyến tính yếu giữa X và Y:
và Y: 100% sự thay đổi của Y được
Một phần sự thay đổi của Y được
giải thích bởi sự thay đổi của X.
giải thích bởi sự thay đổi của X. 17 11/4/2025 Hệ số tương quan
Hệ số tương quan là số tương đối dùng để đánh giá chiều hướng và cường
độ của mối liên hệ tương quan tuyến tính.
Công thức: 𝑅 = 𝑅
= = 1 − = 1 − ∑ ∑ Tính chất: • -1 ≤ R ≤ 1
• R = ±1: giữa x và y có mối liên hệ hàm số
• R=0: giữa x và y không có mối liên hệ tương quan tuyến tính
• R>0: liên hệ thuận; R<0: liên hệ nghịch
• R→±1: mối liên hệ giữa x và y càng chặt chẽ Lưu ý
Mối quan hệ giữa hệ số xác định, hệ số tương quan và hệ số hồi quy R = R= b S S
• Dấu của hệ số tương quan là dấu của hệ số hồi quy. 18 11/4/2025 Sai số mô hình
• Trung bình bình phương sai số (MSE) cho biết ước lượng của phương sai sai số
mô hình tổng thể (б2), còn được ký hiệu là se2 s= MSE = SSE n − 2
• Sai số chuẩn của ước lượng (Se) đo lường biến thiên của các giá trị thực tế y
xung quanh đường hồi qui. s=MSE
Sai số càng lớn, biến thiên càng nhiều, đường hồi qui càng xa các điểm thực
tế. Đây là cơ sở để xác định đường hồi qui phù hợp nhất. Y Y XX small s large s e e
Kiểm định các hệ số của mô hình hồi qui
• Kiểm định ý nghĩa của hệ số hồi qui
• Kiểm định ý nghĩa của hệ số tương quan
• Kiểm định ý nghĩa của mô hình 19 11/4/2025
Kiểm định ý nghĩa của hệ số hồi qui
Liệu có tồn tại mối liên hệ giữa X và Y trong tổng thể không?
• Bước 1: Cặp giả thuyết cần kiểm định.
H0: β1=0 (X không có mối liên hệ với Y)
H1: β1≠0 (X có mối liên hệ với Y)
• Bước 2: Xác định mức ý nghĩa α (với 1-α là hệ số tin cậy).
• Bước 3: Tiêu chuẩn kiểm định t có phân phối Student, bậc tự do n-2 𝑡 =
(sai số chuẩn của hệ số hồi qui)
= Với 𝑆𝑒= ∑()
• Bước 4: Xác định miền bác bỏ và kết luận.
|t| > tα/2;n-2 : bác bỏ H0và ngược lại.
Khoảng tin cậy của hệ số hồi qui
• Khoảng tin cậy hai phía: 𝑏− 𝑡 ⁄
. 𝑆𝑒< 𝛽< 𝑏+ 𝑡 ⁄ . 𝑆𝑒
• Khoảng tin cậy phía phải:
𝑏− 𝑡. 𝑆𝑒< 𝛽< +∞
• Khoảng tin cậy phía trái:
−∞ < 𝛽< 𝑏+ 𝑡 . 𝑆𝑒 20