Tài liệu thuyết trình về đề tài " Phân tích các yếu tố ảnh hưởng đến giá nhà ở Hà Nội" | Đại học Thăng Long
Tài liệu thuyết trình về đề tài " Phân tích các yếu tố ảnh hưởng đến giá nhà ở Hà Nội" | Đại học Thăng Long được chia sẻ dưới dạng file PDF sẽ giúp bạn đọc tham khảo , củng cố kiến thức ,ôn tập và đạt điểm cao. Mời bạn đọc đón xem!
Môn: Phương pháp định lượng trong kinh tế
Trường: Đại học Thăng Long
Thông tin:
Tác giả:
Preview text:
lOMoARcPSD| 40615597
BỘ GIÁO DỤC ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THĂNG LONG ---o0o--- BÀI TẬP NHÓM
MÔN: PHƯƠNG PHÁP PHÂN TÍCH
ĐỊNH LƯỢNG TRONG KINH TẾ ĐỀ TÀI:
PHÂN TÍCH CÁC YẾU TỐ ẢNH HƯỞNG
ĐẾN GIÁ NHÀ Ở HÀ NỘI
Giáo viên hướng dẫn: Đỗ Trường Sơn
Lớp: PPPTDINHLUONGKTE.1
Nhóm: Biến ngẫu nhiên HÀ NỘI – 2023 lOMoARcPSD| 40615597 MỤC LỤC
PHẦN 1. GIỚI THIỆU CHUNG................................................................................1
1.1. Lý do nghiên cứu.............................................................................................1 1.2.
Giới thiệu đề tài nghiên cứu...........................................................................1
1.2.1. Đối tượng nghiên cứu................................................................................1
1.2.2. Ý nghĩa đề tài.............................................................................................2
1.3. Qui trình thực hiện, công cụ hỗ trợ...............................................................2
1.3.1.Qui trình thực hiện....................................................................................2
1.3.2. Công cụ hỗ trợ...........................................................................................2
PHẦN 2. XÂY DỰNG MÔ HÌNH KINH TẾ LƯỢNG............................................3
2.1. Lập bảng thống kê mô tả................................................................................3
2.1.1. Lập bảng thống kê mô tả cho các biến GiaNha, DienTich, SoPhongNgu,
SoPhongTam, SoTang, TuoiNha và nêu ý nghĩa các giá trị trong bảng......3
2.2. Sử dụng phương pháp OLS để ước lượng phương trình hồi quy tuyến tính
của các biến độc lập đến biến phụ thuộc giá nhà..................................4
2.2.1. Viết mô hình hồi quy tổng thể.....................................................................4
2.2.2. Viết phương trình hồi quy mẫu...................................................................5
2.2.3. Giải thích ý nghĩa các hệ số hồi quy trong phương trình mẫu...................5
2.2.4. Các biến độc lập trong mô hình giải thích được bao nhiêu % sự thay đổi
của biến phụ thuộc giá nhà........................................................................6
2.2.5. Kiểm định mức độ phù hợp của mô hình hồi quy.......................................6
2.2.6. Kiểm định ý nghĩa thống kê cho từng biến độc lập trong mô hình.............6
2.2.7. Khoảng tin cậy cho các hệ số hồi quy trong mô hình và nêu ý nghĩa.........9
2.3. Các bài toán kiểm định.................................................................................10
2.3.1. Các bài toán kiểm định từng hệ số hồi quy..............................................10
2.3.2. Các bài toán kiểm định nhiều hệ số hồi quy cùng một lúc........................11
2.4. Các bài toán dự báo......................................................................................12
2.4.1. Bài toán điểm dự báo...............................................................................12
2.4.2. Tìm khoảng thay đổi của biến phụ thuộc khi các biến độc lập thay đổi...12
2.5. Các bài toán về khuyết tật của mô hình hồi quy.........................................13
2.5.1. Kiểm định hiện tượng thiếu biến trong mô hình.......................................13 lOMoARcPSD| 40615597
2.5.2. Xét hiện tượng đa cộng tuyến trong mô hình............................................14
2.5.3. Xét hiện tượng phương sai sai số thay đổi trong mô hình........................15
2.6. Xây dựng mô hình hồi quy log-lin...............................................................16
2.6.1. Viết phương trình hồi quy mẫu cho mô hình (2) và nêu ý nghĩa các hệ số
hồi quy trong mô hình mới.......................................................................17
2.7. Lựa chọn mô hình phù hợp nhất để hồi quy các biến độc lập tác động đến
biến phụ thuộc GiaNha.................................................................................21
2.7.1. Sử dụng chỉ tiêu Adj R-squared để xem mô hình nào phù hợp nhất trong 2 mô
hình (1), (2)........................................................................................21
2.7.2. Sử dụng chỉ tiêu AIC để xem mô hình nào phù hợp nhất trong hai mô hình
(1), (2)......................................................................................................22
PHẦN 3. KẾT LUẬN................................................................................................23
3.1. Tóm tắt lại nội dung bài nghiên cứu............................................................23
3.2. Kiến nghị.......................................................................................................23 lOMoARcPSD| 40615597
PHẦN 1. GIỚI THIỆU CHUNG
1.1. Lý do nghiên cứu
Ở Việt Nam hiện nay thị trường bất động sản là một trong các thị trường có diễn
biến phức tạp, ảnh hưởng lớn đến sự phát triển của cả nền kinh tế. Việc xác định giá nhà
đất đối với các nghiên cứu kinh tế lượng luôn là một trong những đề tài nghiên cứu được
quan tâm nhất của các nhà kinh tế, nhà đầu tư. Nắm rõ tình hình giá cả của nhà đất là
một lợi thế đối với các nhà kinh doanh bất động sản cũng như những người có nhu cầu
mua nhà ở hay buôn bán có lời. Chính vì thế việc nghiên cứu những yếu tố ảnh hưởng
tới giá nhà là vô cùng quan trọng trong thực tế. Để nghiên cứu giá nhà ta thường thu
thập số liệu về những yếu tố ảnh hưởng đến ngôi nhà đó. Xuất phát từ thực tế khách
quan,và nhu cầu cấp thiết đó, nhóm chúng em tiến hành xây dựng các mô hình hồi quy
để tìm ra sự phụ thuộc của giá nhà bởi các yếu tố liên quan.
Do đó “Phân tích các yếu tố ảnh hưởng đến giá nhà ở Hà Nội” là đề tài mà
nhóm chúng em muốn tìm hiểu trong quá trình học tập môn phương pháp phân tích định
lượng trong kinh tế. Do khả năng có hạn nên nhóm không có đủ thời gian đi thu thập
được hết số liệu về giá nhà và các yếu tố liên quan, vì vậy nhóm chỉ thu thập được 9
biến là giá nhà, diện tích, số lượng phòng tắm, phòng ngủ, số tầng, tuổi nhà, giấy tờ liên
quan đến nhà ở, vị trí giao thông và trật tự an ninh để thực hiện các ước lượng và kiểm
định đến giá nhà. Trong quá trình làm bài chúng em đã tiến hành hồi quy các biến diện
tích nhà, số lượng phòng ngủ, số lượng phòng tắm, số tầng, tuổi nhà để phân tích, đánh
giá sự ảnh hưởng của một số yếu tố đến giá nhà.
1.2. Giới thiệu đề tài nghiên cứu
1.2.1. Đối tượng nghiên cứu
Đối tượng là một số căn nhà ở địa bàn Hà Nội và được tổng hợp lại trong file
“GiaNhaOHaNoi.xlsx”.
1.2.2. Ý nghĩa đề tài
Với việc giả định các bài toán dựa trên số liệu trong file “GiaNhaOHaNoi.xlsx” từ
đó tìm ra các kết quả trong các bài toán thống kê, ước lượng và kiểm định mà nhóm
chúng em đã có thể nhận biết được sự ảnh hưởng của các yếu tố đến giá trị của một
ngôi nhà. Từ đó giúp nhóm chúng em đã tìm hiểu được một số yếu tố tác động đến giá
nhà và có thể đưa ra lời khuyên cho các nhà đầu tư dựa theo những đánh giá của bài tập nhóm.
1.3. Qui trình thực hiện, công cụ hỗ trợ 1.3.1.
Qui trình thực hiện Bước 1: Chọn đề tài
Bước 2: Xác định tham số 1 lOMoARcPSD| 40615597
Bước 3: Xây dựng mô hình hồi quy
Bước 4: Phân tích, thống kê, ước lượng, kiểm định mô hình và khắc phục các lỗi
trong mô hình Bước 5: Nhận xét, kết luận
1.3.2. Công cụ hỗ trợ
Để tiến hành xây dựng mô hình hồi quy các yếu tố ảnh hưởng đến giá nhà ở Hà
Nội thì nhóm đã phân tích các biến trong file “GiaNhaOHaNoi.xlsx” bằng phần mềm stata 14. 2 lOMoARcPSD| 40615597
PHẦN 2. XÂY DỰNG MÔ HÌNH KINH TẾ LƯỢNG
Sử dụng dữ liệu trong file “GiaNhaOHaNoi.xlsx” để đánh giá sự ảnh hưởng của
các biến độc lập đến biến phục thuộc là giá nhà và có 880 quan sát về giá và nhiều đặc
điểm khác của các ngôi nhà dựa trên các biến cụ thể như sau:
Giá nhà (GiaNha: đơn vị tính là triệu đồng/m2)
Diện tích nhà (DienTich: đơn vị tính là m2)
Số lượng phòng ngủ (SoPhongNgu: đơn vị tính là phòng)
Số lượng phòng tắm (SoPhongTam: đơn vị tính là phòng)
Số tầng của căn nhà (SoTang: đơn vị tính là tầng)
Tuổi nhà (TuoiNha: đơn vị tính là năm)
Giấy tờ của nhà ở (GiayTo), với GiayTo = 1 là nhà có đầy đủ giấy tờ hợp pháp và hợp
lệ về quyền sử dụng đất, GiayTo = 0 là nhà chưa có đầy đủ giấy tờ hợp pháp và hợp lệ
về quyền sử dụng đất
Vị trí của nhà ở (ViTri), với ViTri = 1 là vị trí giao thông đi lại không thuận tiện (hay
tắc đường), ViTri = 0 là vị trí giao thông đi lại thuận tiện (ít tắc đường)
An ninh quanh nơi ở (AnNinh), với AnNinh = 1 là trật tự, an toàn, không xảy ra mất
trộm, và AnNinh = 0 là trật tự không an toàn, có thể xảy ra mất trộm.
2.1. Lập bảng thống kê mô tả
2.1.1. Lập bảng thống kê mô tả và nêu ý nghĩa các giá trị trong bảng:
Dùng hàm: summarize Kết quả: Ý nghĩa:
Trong file “GiaNhaOHaNoi.xlsx” có 880 quan sát (tương ứng với 880 căn nhà). 3 lOMoARcPSD| 40615597
Giá nhà trung bình là 149.5483 triệu đồng/m2, độ lệch chuẩn của giá nhà là 68.74778
triệu đồng/ m2, giá nhà nhỏ nhất là 34 triệu đồng/m2 và giá nhà lớn nhất là 446.5 triệu đồng/m2.
Diện tích nhà trung bình là 228.7993 m2, độ lệch chuẩn của diện tích nhà là 87.26848
m2, diện tích nhà nhỏ nhất là 68.2 m2 và diện tích nhà lớn nhất là 781 m2.
Số phòng ngủ trung bình trong các căn nhà là 3.754545 phòng, độ lệch chuẩn của số
phòng ngủ là 1.899938 phòng, căn nhà có số phòng ngủ ít nhất là 1 phòng và căn nhà
có số lượng phòng ngủ nhiều nhất là 8 phòng.
Số phòng tắm trung bình trong các căn nhà là 2.870455 phòng, độ lệch chuẩn của số
phòng tắm là 1.181596 phòng, căn nhà có số phòng tắm ít nhất là 1 phòng và căn nhà
có số lượng phòng tắm nhiều nhất là 6 phòng.
số tầng trung bình của các căn nhà là 2.882955 tầng, độ lệch chuẩn của số tầng trong
các căn nhà là 1.033536 tầng, căn nhà có số tầng ít nhất là 2 tầng và căn nhà có số tầng cao nhất là 5 tầng.
Tuổi nhà (số năm đã ở tính từ lúc xây dựng và hoàn thiện xong) trung bình của các căn
nhà là 12.91136 năm, độ lệch chuẩn của tuổi nhà là 8.455403 năm, căn nhà có tuổi nhà
thấp nhất là 2 năm và căn nhà có tuổi nhà lớn nhất là 40 năm.
2.2. Ước lượng phương trình hồi quy tuyến tính của các biến độc lập đến biến
phụ thuộc giá nhà
2.2.1. Viết mô hình hồi quy mẫu:
= B1 + B2 * DienTich + B3 * SoPhongNgu + B4 * SoPhongTam + B5 * SoTang
+ B6 * TuoiNha + B7 * GiayTo + B8 * ViTri + B9 * AnNinh + U
2.2.2. Viết phương trình hồi quy mẫu:
Sử dụng hàm: regress GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha
GiayTo ViTri AnNinh Kết quả: 4 lOMoARcPSD| 40615597 Hàm hồi quy mẫu là:
= 14.19915 + 0.1136012 DienTich + 5.037552 SoPhongNgu + 28.32838
SoPhongTam + 17.00438 SoTang 0.6303424 TuoiNha + 8.888709 GiayTo
25.09583 ViTri + 5.769944 AnNinh
2.2.3. Giải thích ý nghĩa các hệ số hồi quy trong phương trình:
= 14.19915, với điều kiện các yếu tố khác không đổi, khi tất cả các biến độc lập trong
mô hình đều = 0 thì giá nhà trung bình giảm 14.19915 triệu đồng/m2.
= 0.1136012, với điều kiện các yếu tố khác không đổi, khi diện tích nhà tăng 1 m 2 thì
giá nhà trung bình tăng 0.113601 triệu đồng/m2.
= 5.03755, với điều kiện các yếu tố khác không đổi, khi số phòng ngủ trong một ngôinhà
tăng lên 1 phòng thì giá nhà trung bình tăng 5.03755 triệu đồng/m2
= 28.32838, với điều kiện các yếu tố khác không đổi, khi số phòng tắm trong mộtngôi
nhà tăng lên 1 phòng thì giá nhà trung bình tăng 28.32838 triệu đồng/m2.
= 17.00438, với điều kiện các yếu tố khác không đổi, khi số tầng trong một ngôi nhàtăng
lên 1 tầng thì giá nhà trung bình tăng 17.00438 triệu đồng/m2.
= 0.6303424, với điều kiện các yếu tố khác không đổi, khi tuổi nhà tăng lên 1 năm thì
giá nhà trung bình giảm 0.6303424 triệu đồng/m2.
= 8.888709, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn
nhà có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất sẽ nhiều hơn giá nhà
trung bình của các căn nhà chưa có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng
đất là 8.888709 triệu đồng/m2. 5 lOMoARcPSD| 40615597
= 25.09583, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của các
căn nhà có vị trí giao thông đi lại không thuận tiện (hay tắc đường) thấp hơn giá nhà
trung bình của các căn nhà có vị trí giao thông đi lại thuận tiện (ít tắc đường) là 25.09583 triệu đồng/m2.
= 5.769944, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn
nhà có trật tự an toàn, không xảy ra mất trộm nhiều hơn giá nhà trung bình của các căn
nhà có trật tự không an toàn, có thể xảy ra mất trộm là 5.769944 triệu đồng/m2.
2.2.4. Các biến độc lập trong mô hình giải thích được bao nhiêu % sự thay đổi của
biến phụ thuộc giá nhà Ta có: Adj R-squared = 0.9176
Ý nghĩa: R bình phương hiệu thể hiện các biến độc lập trong mô hình đang giải thích
được khoảng 91.76% sự biến thiên của biến phụ thuộc GiaNha trong mô hình.
2.2.5. Kiểm định sự phù hợp của mô hình
Mô hình hồi quy trên có phù hợp tại mức ý nghĩa α = 5%? Giả Thuyết: H0: B2=B3=B4=B5=B6=B7=B8=B9=0
H1: Ít nhất 1 hệ số beta khác 0
. reg GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh Source SS df MS Number of obs = 880 F(8, 871) = 1224.58 3815179.55 Model
8 476897.444 Prob > F = 0.0000 Residual
339200.593 871 389.438109 R-squared = 0.9184
Adj R-squared = 0.9176 Total
4154380.14 879 4726.25727 Root MSE = 19.734 GiaNha
Coef. Std. Err. t P>|t| [95% Conf. Interval] DienTich
.1136012 .0117409 9.68 0.000 .0905574 .1366449 SoPhongNgu
5.037552 1.200676 4.20 0.000 2.680996 7.394107 SoPhongTam
28.32838 2.002089 14.15 0.000 24.39889 32.25786 SoTang
17.00438 2.048959 8.30 0.000 12.98291 21.02585 TuoiNha
-.6303424 .2379706 -2.65 0.008 -1.097405 -.1632796 GiayTo
8.888709 3.294485 2.70 0.007 2.422651 15.35477 ViTri
-25.09583 3.14663 -7.98 0.000 -31.27169 -18.91996 AnNinh
5.769944 3.133353 1.84 0.066 -.37986 11.91975 _cons
-14.19915 7.867605 -1.80 0.071 -29.64082 1.242533
Ta thấy: Các biến DienTich, SoPhongNgu, SoPhongTam, SoTang, TuoiNha, GiayTo, 6 lOMoARcPSD| 40615597
ViTri đều có p-value < α = 5% trừ biến AnNinh > α => Các biến không đồng thời =0
Kết luận: Chấp nhận H1, bác bỏ H0 và mô hình phù hợp tại mức ý nghĩa 5%
2.2.6. Khoảng tin cậy cho các hệ số hồi quy trong mô hình và nêu ý nghĩa
Ước lượng khoảng tin cậy 95% cho các hệ số hồi quy trong mô hình và nêu ý nghĩa? Ý nghĩa:
Khoảng tin cậy 95% cho 1 là [-29.64082, 1.242533], với điều kiện các yếu tố khác
không đổi, khi tất cả các biến độc lập trong mô hình đều = 0 thì giá nhà trung bình thuộc
khoảng [-29.64082, 1.242533] triệu đồng/m2.
Khoảng tin cậy 95% cho 2 là [0.0905574, 0.1366449] , với điều kiện các yếu tố khác
không đổi, khi diện tích nhà tăng 1 m2 thì giá nhà trung bình tăng ít nhất là 0.0905574
triệu đồng/m2 và tăng nhiều nhất là 0.1366449 triệu đồng/m2
Khoảng tin cậy 95% cho 3 là [2.680996, 7.394107], với điều kiện các yếu tố khác
không đổi, khi số phòng ngủ trong một ngôi nhà tăng lên 1 phòng thì giá nhà trung bình
tăng ít nhất là 2.680996 triệu đồng/m2 và tăng nhiều nhất là 7.394107 triệu đồng/m2
Khoảng tin cậy 95% cho 4 là [24.39889, 32.25786], với điều kiện các yếu tố khác
không đổi, khi số phòng tắm trong một ngôi nhà tăng lên 1 phòng thì giá nhà trung bình
tăng ít nhất là 24.39889 triệu đồng/m2 và tăng nhiều nhất là 32.25786 triệu đồng/m2
Khoảng tin cậy 95% cho 5 là [12.98291, 21.02585], với điều kiện các yếu tố khác
không đổi, khi số tầng trong một ngôi nhà tăng lên 1 tầng thì giá nhà trung bình tăng ít
nhất 12.98291 triệu đồng/m2 và tăng nhiều nhất là 21.02585 triệu đồng/m2
Khoảng tin cậy 95% cho 6 là [-1.097405, -0.1632796], với điều kiện các yếu tố khác
không đổi, khi tuổi nhà tăng lên 1 năm thì giá nhà trung bình giảm nhiều nhất là
1.097405 triệu đồng/m2 và giảm ít nhất là 0.1632796 triệu đồng/m2 7 lOMoARcPSD| 40615597
Khoảng tin cậy 95% cho 7 là [2.422651, 15.35477] với điều kiện các yếu tố khác không
đổi thì giá nhà trung bình của các căn nhà có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền
sử dụng đất sẽ nhiều hơn giá nhà trung bình của các căn nhà chưa có đầy đủ giấy tờ hợp
pháp và hợp lệ về quyền sử dụng đất ít nhất là 2.422651 triệu đồng/m2 và nhiều nhất là 15.35477 triệu đồng/m2
Khoảng tin cậy 95% cho 8 là [-31.27169, -18.91996], với điều kiện các yếu tố khác
không đổi thì giá nhà trung bình của các căn nhà có vị trí giao thông đi lại không thuận
tiện (hay tắc đường) thấp hơn giá nhà trung bình của các căn nhà có vị trí giao thông đi
lại thuận tiện (ít tắc đường) ít nhất là 18.91996 triệu đồng/m2 và nhiều nhất là 31.27169 triệu đồng/m2
Khoảng tin cậy 95% cho 9 là [-0.37986, 11.91975], với điều kiện các yếu tố khác không
đổi thì giá nhà trung bình của các căn nhà có trật tự an toàn, không xảy ra mất trộm sẽ
có một khoảng chênh lệch so với giá nhà trung bình của các căn nhà có trật tự không an
toàn, có thể xảy ra mất trộm là [-0.37986, 11.91975] triệu đồng/m2.
2.3. Các bài toán kiểm định
2.3.1. Các bài toán kiểm định hệ số hồi quy
Bài toán 1: Kiểm định ý kiến với điều kiện các yếu tố khác không đổi, khi tuổi nhà tăng
1 năm thì các căn nhà giảm 0.7 triệu đồng/m2. Tại α = 5%? Giả thuyết: H0: 6 = -0.7 H1: 6 ≠ -0.7 Các bước thực hiện:
. scalar tstat=(_b[ TuoiNha ]+0.7)/_se[ TuoiNha ]
. di “t-statistic for H0: beta6=-0.7 is ”tstat
. di “t tới hạn = ” invttail(e(df_r),0.025)
. di “-t tới hạn = ”invttail(e(df_r),0.975) Kết quả: 8 lOMoARcPSD| 40615597
Ta có: -t tới hạn = -1.9626913 < |t| = |tstat| = 0.29271512 < t tới hạn = 1.9626913 =>
chấp nhận H0, bác bỏ H1.
Kết luận: Tại α = 5%, đủ bằng chứng thống kê để cho rằng khi tuổi nhà tăng 1 năm thì
các căn nhà giảm 0.7 triệu đồng/m2
Bài toán 2 : Kiểm định tại α = 5%, khi diện tích nhà tăng lên 100 m2 và đồng thời tăng
số tầng trong ngôi nhà đó lên 1 tầng thì giá trị ngôi nhà tăng lên nhiều hơn 20 triệu đồng/m2. Giả thuyết: H0: 100* 2 + 5 ≤ 20 H1: 100* 2 + 5 > 20 Các bước thực hiện:
. lincom 100*DienTich+SoTang-20
. scalar t_2=r(estimate)/r(se)
. scalar ttoihan_2=invttail(e(df_r),0.05)
. scalar pgiatri_2=ttail(e(df_r),t_2)
. scalar list t_2 ttoihan_2 pgiatri_2 Kết quả:
Ta có: p giá trị = pgiatri_2 = 0.00010689 < α = 0.05 => bác bỏ H0, chấp nhận H1.
Kết luận: Tại α = 5%, đủ bằng chứng thống kê để cho rằng khi diện tích nhà tăng lên
100 m2 và đồng thời tăng số tầng trong ngôi nhà đó lên 1 tầng thì giá trị ngôi nhà tăng
lên nhiều hơn 20 triệu đồng/m2
2.4. Bài toán dự báo
Dự báo giá trị của một căn nhà khi nó có diện tích là 80m2, có 6 phòng ngủ, 3 phòng tắm,
4 tầng, đã được đưa vào sử dụng 10 năm kể từ khi xây dựng xong (tuổi nhà = 10 năm), có
đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất, vị trí giao thông đi lại không
thuận tiện (hay tắc đường) và trật tự, an toàn, không xảy ra mất trộm Các bước thực hiện:
scalar dubaoGiaNha=_b[_cons] + _b[DienTich] * 80 +_b[SoPhongNgu] * 6
+_b[SoPhongTam] * 3 + _b[SoTang] * 4 +_b[Tuoi Nha] * 10 +_b[GiayTo] * 1
+_b[ViTri] * 1 +_b[AnNinh] * 1 scalar list dubaoGiaNha Kết quả: 9 lOMoARcPSD| 40615597
Kết luận: khi một căn nhà có diện tích là 80m2, có 6 phòng ngủ, 3 phòng tắm, 4 tầng, đã
được đưa vào sử dụng 10 năm kể từ khi xây dựng xong (tuổi nhà = 10 năm), có đầy đủ
giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất, vị trí giao thông đi lại không thuận
tiện (hay tắc đường) và trật tự, an toàn, không xảy ra mất trộm thì giá trị của căn nhà đó
là 161.37631 triệu đồng/m2
2.5. Các bài toán về khuyết tật của mô hình hồi quy
2.5.1. Kiểm định hiện tượng thiếu biến trong mô hình
Kiểm định mô hình trên có hiện tượng thiếu biến không tại tại α = 5%?
H0: mô hình trên có hiện tượng thiếu biến
H1: mô hình trên không có hiện tượng thiếu biến
P-value= (Prob > F) = 0.0000 < α = 0.05 => Chấp nhận H0, bác bỏ H1.
Kết luận: tại α = 5% thì mô hình có hiện tượng thiếu biến. Do thời gian còn hạn
chế nên trong quá trình thu thập số liệu nhóm đã bỏ sót nhiều yếu tố quan trọng khác tác
động đến giá nhà ví dụ như hướng nhà, địa hình, vật liệu xây dựng…). Để khắc phục
hiện tượng thiếu biến ở mô hình trên thì cần thu thập them các số liệu liên quan đến nhà ở.
2.5.2. Kiểm định hiện tượng thừa biến
Kiểm định mô hình trên có hiện tượng thiếu biến không tại tại α = 5%? Các bước thực hiện:
. Hồi quy: regress GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh 10 lOMoARcPSD| 40615597
. Nhận thấy các biến TuoiNha GiayTo AnNinh có p-value > α . Giả thuyết: H0: B9 = 0 H1: B9≠ 0 . test AnNinh = 0 Kết quả:
Ta có: p-value > α -> Chấp nhận H0, bác bỏ H1 -> B9 =0
Kết luận: tại α = 5% thì mô hình có hiện tượng thừa biến. Cách khắc phục là loại bỏ biến
AnNinh, hồi quy lại như sau: 11 lOMoARcPSD| 40615597
Ta thấy độ lệch chuẩn của các biến giảm đi sau khi bỏ biến AnNinh so với độ lệch chuẩn ban đầu
2.5.3. Xét hiện tượng đa cộng tuyến trong mô hình Sau
khi hồi quy, sử sụng lệnh: vif . vif Variable VIF 1/VIF SoPhongTam 12.63 0.079167 SoPhongNgu 11.75 0.085137 SoTang 10.12 0.098794 TuoiNha 9.14 0.109429 ViTri 5.46 0.183026 AnNinh 5.06 0.197545 GiayTo 3.49 0.286841 DienTich 2.37 0.422020 Mean VIF 7.50
Kết luận: Do hệ số vif của 3 biến độc lập SoPhongTam, SoPhongNgu và SoTang đều
> 10 => mô hình trên có xảy ra hiện tượng đa cộng tuyến.
Để khắc phục hiện tượng đa cộng tuyến bằng cách bỏ đi biến độc lập có hệ số vif
cao nhất trong mô hình thì cần bỏ đến 2 biến là SoPhongNgu và SoPhongTam thì mới
làm cho các hệ số vif còn lại trong hình < 10
. reg GiaNha DienTich SoTang TuoiNha GiayTo ViTri AnNinh . vif Variable VIF 1/VIF 12 lOMoARcPSD| 40615597 6.41
TuoiNha 0.156013 5.07 ViTri 0.197406 4.84
AnNinh 0.206805 3.64
SoTang 0.274763 3.35
GiayTo 0.298288 2.27
DienTich 0.439805 Mean VIF 4.26
. reg GiaNha DienTich SoTang TuoiNha GiayTo ViTri AnNinh Source SS df MS Number of obs = 880 F(6, 873) = 1183.66 3699609.04 Model
6 616601.507 Prob > F Residual = 0.0000 454771.102 873 520.929098 R -squared = Total 0.8905
Adj R-squared = 0.8898
4154380.14 879 4726.25727 Root MSE = 22.824 GiaNha
Coef. Std. Err. t P>|t| [95% Conf. Interval] DienTich
.153705 .0133017 11.56 0.000 .127598 .1798121 SoTang
43.04322 1.420988 30.29 0.000 40.25427 45.83217
TuoiNha -2.756738 .2305051 -11.96 0.000 -3.209147 - 2.304329 GiayTo
-2.216692 3.73646 -0.59 0.553 -9.550186 5.116801 ViTri
-20.82066 3.504229 -5.94 0.000 -27.69836 - 13.94296
AnNinh -1.41309 3.541862 -0.40 0.690 -8.36465 5.53847 _cons
40.62941 8.319994 4.88 0.000 24.29988 56.95894
Tuy nhiên khi bỏ đi 2 biến SoPhongNgu và SoPhongTam để khắc phục hiện tượng
đa cộng tuyến trong mô hình sẽ làm cho 2 biến khác là GiayTo và Anh Ninh không có
ý nghĩa thống kê trong mô hình (hai biến GiayTo và Anh Ninh này sẽ bị thừa ra vì có p
giá trị = (P > |t|) > α = 0.05) tức là nếu khắc phục được đa cộng tuyến trong mô hình cũ
thì sẽ xảy ra hiện tượng thừa biến trong mô hình mới
2.5.4. Xét hiện tượng phương sai sai số thay đổi trong mô hình H0:
mô hình không có hiện tượng phương sai sai số thay đổi 13 lOMoARcPSD| 40615597
H1: mô hình có hiện tượng phương sai sai số thay đổi
Kiểm định theo Breusch – Pagan, sử dụng câu lệnh: estat hettest Kết quả: . hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance
Variables: fitted values of GiaNha chi2(1) = 1079.98
Prob > chi2 = 0.0000
Có p giá trị = (Prob > chi2) = 0.0000 < alpha = 0.05 =>
bác bỏ H0, chấp nhận H1.
Kết luận: Mô hình có hiện tượng phương sai sai số thay đổi
Nhận xét chung: Mô hình xảy ra các hiện tượng thiếu biến, đa cộng tuyến và cả phương
sai sai số thay đổi. Nguyên nhân xảy ra các hiện tượng có thể là do trong quá trình nhóm
thu thập số lượng biến độc lập chưa đủ hoặc số liệu mẫu còn ít chưa đại diện được hết
cho tổng thể. Cách khắc phục là sử dụng ước lượng vững của ma trận hiệp phương sai:
reg GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh,robust Kết quả:
2.6. Xây dựng mô hình hồi quy log-lin
2.6.1. Viết phương trình hồi quy mẫu và nêu ý nghĩa các hệ số hồi quy trong mô hình mới . gen logGiaNha=log(GiaNha) 14 lOMoARcPSD| 40615597
. reg logGiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh
. reg logGiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh SS df Source MS Number of obs = 880 Model F(8, 871) = 3828.96 163.705517 Residual
8 20.4631896 Prob > F = 0.0000 Total 4.65490173 871 .005344319 R-squared = 0.9724
Adj R-squared = 0.9721
168.360418 879 .191536312 Root MSE = .0731
Coef. Std. Err. t P>|t| [95% Conf. Interval] logGiaNha
DienTich .0003037 .0000435 6.98 0.000 .0002184 .0003891 SoPhongNgu
.0300808 .0044479 6.76 0.000 .021351 .0388106 SoPhongTam
.0767885 .0074167 10.35 0.000 .0622318 .0913452
SoTang .0772036 .0075903 10.17 0.000 .0623061 .092101 TuoiNha
-.0259907 .0008816 -29.48 0.000 -.0277209 - .0242605 GiayTo
.0446091 .0122043 3.66 0.000 .0206557 .0685624
ViTri -.0506965 .0116566 -4.35 0.000 -.0735749 - .0278182 AnNinh
.0067141 .0116074 0.58 0.563 -.0160677 .0294959 _cons
4.610593 .0291454 158.19 0.000 4.55339 4.667797
Phương trình hồi quy mẫu cho mô hình là: log() = 4.610593 + 0.0003037 *
DienTich + 0.0300808 * SoPhongNgu +
0.0767885 * SoPhongTam + 0.0772036 * SoTang 0.0259907 * TuoiNha + 0.0446091 *
GiayTo 0.0506965 * ViTri + 0.0067141 * AnNinh 15 lOMoARcPSD| 40615597
= 0.0003037, với điều kiện các yếu tố khác không đổi, khi diện tích nhà tăng 1 m2 thì
giá nhà trung bình tăng 0.0003037 * 100 (%) = 0.03037 %.
= 0.0300808, với điều kiện các yếu tố khác không đổi, khi số phòng ngủ trong mộtngôi
nhà tăng lên 1 phòng thì giá nhà trung bình tăng 0.0300808 * 100 (%) = 3.00808 %
= 0.0767885, với điều kiện các yếu tố khác không đổi, khi số phòng tắm trong mộtngôi
nhà tăng lên 1 phòng thì giá nhà trung bình tăng 0.0767885 * 100 (%) = 7.67885 %
= 0.0772036, với điều kiện các yếu tố khác không đổi, khi số tầng trong một ngôi
nhàtăng lên 1 tầng thì giá nhà trung bình tăng 0.0772036 * 100 (%) = 7.72036 (%)
= 0.0259907, với điều kiện các yếu tố khác không đổi, khi tuổi nhà tăng lên 1 năm thì
giá nhà trung bình giảm 0.0259907 * 100 (%) = 2.59907 (%).
= 0.0446091, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn
nhà có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng đất sẽ nhiều hơn giá nhà
trung bình của các căn nhà chưa có đầy đủ giấy tờ hợp pháp và hợp lệ về quyền sử dụng
đất là 0.0446091* 100 (%) = 4.46091 %.
= 0.0506965, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của các
căn nhà có vị trí giao thông đi lại không thuận tiện (hay tắc đường) thấp hơn giá nhà
trung bình của các căn nhà có vị trí giao thông đi lại thuận tiện (ít tắc đường) là
0.0506965 * 100 (%) = 5.06965 %.
= 0.0067141, với điều kiện các yếu tố khác không đổi thì giá nhà trung bình của cáccăn
nhà có trật tự an toàn, không xảy ra mất trộm nhiều hơn giá nhà trung bình của các căn
nhà có trật tự không an toàn, có thể xảy ra mất trộm là 0.0067141 * 100 (%) = 0.67141 %.
2.6.2. Các biến độc lập trong mô hình giải thích được bao nhiêu % sự thay đổi củabiến
phụ thuộc giá nhà Ta có: Adj R-squared = 0.9721
Ý nghĩa: R bình phương hiệu thể hiện các biến độc lập trong mô hình đang giải thích được
khoảng 97.21% sự biến thiên của biến phụ thuộc log(GiaNha) trong mô hình.
2.6.3. Kiểm định mức độ phù hợp của mô hình:
H0: Mô hình không phù hợp H1: Mô hình có phù hợp
Có p-giá trị = (Prob > F) = 0.0000 < α = 5% = 0.05 => Mô hình hồi quy log-lin đa biến (2) có phù hợp.
Có p-giá trị = (P>|t|) của tất cả các biên độc lập trong mô hình (2) ngoại trừ biến
độc lập AnNinh đều < α = 5% = 0.05 => các biến độc lập đều tác động (ảnh hưởng) đến
sự thay đổi của biến phụ thuộc log(GiaNha) ngoại trừ biến AnNinh.
2.6.4. Kiểm tra về hiện tượng thiếu biến trong mô hình ở trên:
H0: Mô hình không thiếu biến 16 lOMoARcPSD| 40615597
H1: Mô hình có thiếu biến . ovtest
Ramsey RESET test using powers of the fitted values of logGiaNha
Ho: model has no omitted variables F(3, 868) = 225.98 Prob > F = 0.0000
có p giá trị = (Prob > F) = 0.0000 < α = 5% => chấp nhận H0, bác bỏ H1 => mô
hình vẫn có hiện tượng thiếu biến
Kiểm tra về hiện tượng đa cộng tuyến trong mô hình ở trên: . vif Variable VIF 1/VIF SoPhongTam 12.63 0.079167 SoPhongNgu 11.75 0.085137 SoTang 10.12 0.098794 TuoiNha 9.14 0.109429 ViTri 5.46 0.183026 AnNinh 5.06 0.197545 GiayTo 3.49 0.286841 DienTich 2.37 0.422020 Mean VIF 7.50
Nhìn kết quả các hệ số vif của các biến độc lập SoPhongNgu, SoPhongTam và
SoTang trong mô hình > 10 => Mô hình log – lin đa biến vẫn có xảy ra hiện tượng đa cộng tuyến.
2.6.5. Kiểm tra về hiện tượng phương sai sai số thay đổi trong mô hình ở trên:
H0: Mô hình không có hiện tượng phương sai sai số thay đổi
H1: Mô hình có hiện tượng phương sai sai số thay đổi
Kiểm định hiện tượng phương sai sai số thay đổi theo White . imtest,white
White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity chi2(31) = 526.06
Prob > chi2 = 0.0000
Cameron & Trivedi's decomposition of IM-test 17 lOMoARcPSD| 40615597 Source chi2 df p Heteroskedasticity 526.06 31 0.0000 Skewness 109.03 8 0.0000 Kurtosis 19.22 1 0.0000 Total 654.31 40 0.0000
Có p giá trị = (Prob > chi2) = 0.0000 < alpha = 0.05 =>
bác bỏ H0, chấp nhận H1.
Kết luận: Mô hình có hiện tượng phương sai sai số thay đổi.
2.7. Lựa chọn mô hình phù hợp nhất để hồi quy các biến độc lập tác động đến biến phụ thuộc GiaNha
Hồi quy mô hình không log-lin: GiaNha = B1 + B2 * DienTich + B3 *
SoPhongNgu + B4 * SoPhongTam + B5 * SoTang + B6 * TuoiNha + B7 * GiayTo + B8 * ViTri + B9 * AnNinh + U (1)
. reg logGiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh Source SS df MS Number of obs = 880 F(8, 871) = 3828.96 Model
163.705517 8 20.4631896 Residual Prob > F = 0.0000
4.65490173 871 .005344319 R- squared = 0.9724 Adj R-squared = 0.9721 Total
168.360418 879 .191536312 Root MSE = .0731 18 lOMoARcPSD| 40615597
Coef. Std. Err. t P>|t| [95% Conf. Interval] logGiaNha
DienTich .0003037 .0000435 6.98 0.000 .0002184 .0003891 SoPhongNgu
.0300808 .0044479 6.76 0.000 .021351 .0388106 SoPhongTam
.0767885 .0074167 10.35 0.000 .0622318 .0913452
SoTang .0772036 .0075903 10.17 0.000 .0623061 .092101 TuoiNha
-.0259907 .0008816 -29.48 0.000 -.0277209 - .0242605 GiayTo
.0446091 .0122043 3.66 0.000 .0206557 .0685624
ViTri -.0506965 .0116566 -4.35 0.000 -.0735749 - .0278182 AnNinh
.0067141 .0116074 0.58 0.563 -.0160677 .0294959 _cons
4.610593 .0291454 158.19 0.000 4.55339 4.667797
Hồi quy mô hình log-lin: log(GiaNha) = B1 + B2 * DienTich + B3 *
SoPhongNgu + B4 * SoPhongTam + B5 * SoTang + B6 * TuoiNha + B7 * GiayTo +
B8 * ViTri + B9 * AnNinh + U (2)
Sử dụng chỉ tiêu AIC để xem mô hình nào phù hợp nhất trong hai mô hình (1), (2) Công thức: AIC = + 2 * Các bước thực hiện: Đối với mô hình (1):
. reg GiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh
. sca AIC1=ln(e(rss)/e(N))+2*e(rank)/e(N) Đối với mô hình (2):
. reg logGiaNha DienTich SoPhongNgu SoPhongTam SoTang TuoiNha GiayTo ViTri AnNinh
. sca AIC2=ln(e(rss)/e(N))+2*e(rank)/e(N) . sca list AIC1 AIC2 AIC1 = 5.9748796 AIC2 = -5.2215466
Do AIC của mô hình (2) là nhỏ hơn AIC của mô hình hồi quy (1) => mô hình (2)
phù hợp hơn (hay tốt hơn) so với mô hình (1) khi hồi quy đánh giá sự ảnh hưởng của
các biến độc lập đến sự thay đổi của biến phụ thuộc (giá nhà).
PHẦN 3. KẾT LUẬN 3.1. Tóm tắt lại nội dung bài nghiên cứu
Đầu tiên nhóm đã thực hiện lập bảng thống kê mô tả cho một số biến trong file
“GiaNhaOHaNoi.xlsx”. Sau đó nhóm đã xây dựng mô hình (1) là: GiaNha = B1 + B2 *
DienTich + B3 * SoPhongNgu + B4 * SoPhongTam + B5 * SoTang + B6 * TuoiNha +
B7 * GiayTo + B8 * ViTri + B9 * AnNinh + U . Trong mô hình này các thành viên ở
trong nhóm đã làm các bài toán về ước lượng nêu ý nghĩa các hệ số hồi quy, kiểm định 19 lOMoARcPSD| 40615597
sự có ý nghĩa của mô hình và từng biến độc lập, sau đó thì thực hiện thêm các bài toán
kiểm định từng hệ số hồi quy và đồng thời nhiều hệ số hồi cùng một lúc. Mô hình (1)
mà nhóm sử dụng ban đầu có mức độ phù hợp cao tuy nhiên lại có các hiện tượng đa
cộng tuyến, hiện tượng phương sai sai số thay đổi và có cả hiện tượng thiếu biến.
Sau đó nhóm có xây dựng thêm các ước lượng trong mô hình log-lin đa biến (2)
là logGiaNha = B1 + B2 * DienTich + B3 * SoPhongNgu + B4 * SoPhongTam + B5 *
SoTang + B6 * TuoiNha + B7 * GiayTo + B8 * ViTri + B9 * AnNinh + U rồi sử dụng
các chỉ tiêu Adj R-squared, AIC để so sánh với mô hình (1) thì thấy mô hình (2) là phù
hợp hơn để hồi quy sự ảnh hưởng của các biến độc lập đến biến phụ thuộc giá nhà. 3.2. Kiến nghị
Để tăng giá trị các căn nhà lên thì cần:
Thường xuyên vệ sinh, bảo trì nhà ở để giữ gìn nhà ở được mới, giảm thiểu sự hao mòn
của thời gian giúp giá trị ngôi nhà không bị mất giá trị quá nhiều do hao mòn về thời gian.
Xây dựng, thiết kế các căn nhà ban đầu phù hợp với thị hiếu của nơi mình ở.
Truyền thông, quảng cáo bất động sản trước khi rao bán để nhiều nhà đầu tư biết đến nhờ
vậy người bán có thể đẩy được giá nhà lên cao hơn.
Các nhà đầu tư thì nên chọn mua các căn nhà có đầy đủ giấy tờ hợp pháp, không thuộc
diện tranh chấp, thuộc diện có tiềm năng phát triển để giá trị các căn nhà vào thời gian sau
sẽ tăng lên và chuyển nhượng dễ dàng. 20