
Preview text:
Cách 1: Một trong những phương pháp để giải quyết hiện tượng phương sai thay đổi
(Heteroscedasticity) là sử dụng phương pháp Weighted Least Squares (WLS). Phương
pháp này tương tự như OLS, tuy nhiên trước khi mô hình được ước lượng, các giá trị
quan sát được điều chỉnh hoặc biến đổi bởi phương sai. Tuy nhiên, phương pháp này
đòi hỏi phải thử và sai nhiều lần để xác định cách biến đổi phù hợp.
Cách 2: Một cách khác để giải quyết hiện tượng phương sai thay đổi là biến đổi biến
về dạng log. Khi đó, thang đo của biến sẽ nhỏ hơn, từ đó giảm được hiện tượng
phương sai thay đổi. Tuy nhiên, cần lưu ý rằng dạng log chỉ có giá trị với các quan sát
lớn hơn 0 và hệ số beta sẽ được giải thích theo dạng phần trăm thay đổi.
Cách 3: để loại bỏ các giá trị bất thường (outliers) trong dữ liệu là sử dụng phương
pháp winsorize. Để xác định có outliers hay không, ta có thể sử dụng lệnh summarize
để truy xuất thông tin về giá trị trung bình, độ lệch chuẩn, giá trị lớn nhất và giá trị nhỏ
nhất của biến. Nếu giá trị độ lệch chuẩn quá lớn, có thể xảy ra outliers.
Để loại bỏ các outliers này, ta sử dụng lệnh winsor, tuy nhiên, lệnh này không có sẵn
trong STATA nên cần cài đặt trước khi sử dụng. Lệnh winsor không làm thay đổi số
lượng quan sát, mà sẽ thay thế các giá trị outliers bằng các giá trị khác. Ví dụ, ta có thể
loại bỏ 1% giá trị nhỏ nhất và 1% giá trị lớn nhất trong dữ liệu, lệnh winsor sẽ thay thế
các giá trị này bằng giá trị nhỏ thứ 2% và lớn thứ 99%.
Để sử dụng lệnh winsor, ta dùng công thức sau: "winsor bienA, gen(bienA_w) p(#)
hoặc h(#)" để winsor biến A và tạo ra biến mới là bienA_w, dựa trên việc kê khai giá
trị p hoặc h. Nếu ta dùng p, ta kê khai % dữ liệu muốn winsor, tuy nhiên số này phải
nhỏ hơn 0.5. Theo kinh nghiệm, nên thử với % nhỏ nhất như là 0.01 (nghĩa là 1%) và
kiểm tra lại các giá trị thống kê mô tả. Khi dùng h, ta kê khai số lượng quan sát mà
muốn thay đổi ở mỗi đầu dữ liệu. H này nhận giá trị ít nhất là 1 quan sát và nhiều nhất
là 1/2 quan sát trong bộ dữ liệu. Nếu ta chỉ muốn điều chỉnh dữ liệu ở một trong hai
đầu dữ liệu, ta có thể thêm lựa chọn highonly (cho giá trị lớn) hoặc lowonly (cho giá trị nhỏ).
Cách 4: Sử dụng ước lượng phương sai sai số chuẩn (standard errors or robust standard errors)
Phương pháp này vẫn sử dụng hệ số hồi quy như bình thường, tuy nhiên, sai số của các
hệ số hồi quy được điều chỉnh để phù hợp với sự tồn tại của hiện tượng phương sai sai
số và đảm bảo giả định của mô hình hồi quy. Để thực hiện, ta chỉ cần thêm lựa chọn
"robust" vào câu lệnh hồi quy.
Nguồn : 16/05/2023 https://luatminhkhue.vn/phuong-sai-thay-doi-la-gi.aspx