Họ tên: Đặng Linh Trang
Lớp: Hệ thống thông tin quản 67A
sinh viên:11258222
Phần dữ liệu sử dụng: 55-104
Phần A:
1. Hệ số biến thiên (CV) cho biết mức độ phân tán
tương đối của dữ liệu quanh giá trị trung bình. CV
càng cao, dữ liệu càng biến động mạnh (kém ổn định
hơn). Price (52.65%) > Size (47.38%) =>Biến Price
mức biến động cao hơn biến Size.
2. Nhận xét:
Bedroom:
- Nhóm 2–3 phòng ngủ chiếm tần số cao nhất
(15 13) => dữ liệu tập trung mạnh vào
nhóm nhà 2–3 phòng ngủ.
- Các nhóm còn lại (4, 5, 6, 7) tần số giảm
dần rệt,
=> phân bố lệch phải (nhiều nhà ít phòng, ít nhà nhiều phòng).
- Không nhà 1 phòng ngủ, cho thấy phân bố không đều, tập trung vào nhó
bình (2–3).
Township:
- Tần số dao động từ 7 13, khá gần nhau.
- Township 4 nhiều nhà nhất (13), Township 5 ít nhất (7).
=> Phân bố tương đối đều, không quá chênh lệch giữa các khu. thể nói các k
bố dân khá cân bằng, không khu nào chiếm ưu thế vượt trội.
3. - Lựa chọn biểu đồ Histogram cho biến Price biểu đồ này thể hiện phân
giá, giúp ta xem dữ liệu phân bố chuẩn, lệch phải, lệch trái hay ngo
- Lựa chọn Pie chart cho biến Mortgage type biểu đồ này giúp thấy tỷ trọ
từng loại Mortgage, dễ đọc hơn biểu đồ cột khi chỉ vài nhóm nhỏ.
Chỉ
tiêu Price Size
Mean 357261 3438
Median 311870 3090
Mode #N/A 2090
Min 169000 1630
Max 919480 7670
Range 750480 6040
Std Dev 188098.6
045 1628.675
799
CV (%) 52.65019
551 47.37552
501
Bedroom Tần số Township Tần số2
1 0 1 9
2 15 2 11
3 13 3 10
4 8 4 13
5 4 5 7
6 7
7 2
Tn số
Fixed Adjustable
Phần B:
4. CV(Price) = 52.65% > 0.3 (30%), nghĩa giá nhà biến động mạnh, không
Các căn nhà mức giá chênh lệch lớn so với giá trung bình, thể do
diện tích, vị trí, tiện ích hoặc điều kiện vay vốn.
Kết luận: Thị trường nhà trong mẫu dữ liệu này độ phân tán giá cao, ch
5. Quan sát từ dữ liệu trung bình: Mean (Price) = 357261, Mean (Size) = 3438.
này cùng tăng giảm theo chiều hướng tương tự (nhà lớn thường giá cao). Kh
tăng 10%, thì Price thường cũng tăng đáng kể (khoảng 8–12%), nhưng không
toàn tỷ lệ thuận giá còn phụ thuộc vị trí, Mortgage type, FICO,...
Kết luận: Price tăng cùng chiều với Size, nhưng không theo tỷ l cố định.
6. So sánh FICO trung bình giữa nhóm Default = 1 Default = 0
Nhóm Default = 1: FICO thấp hơn rệt
Nhóm Default = 0 : FICO cao hơn
Kết luận: mối quan hệ nghịch đảo giữa điểm n dụng rủi ro nợ xấu
FICO cao thì ít khả năng vỡ nợ, thể hiện mức uy n tài chính tốt hơn.
7. Nếu chọn 3 chỉ tiêu thống tả để báo cáo cho quản bất động sản
Mean (Giá trị trung bình): dễ hiểu, đại diện cho mức giá/diện tích điển hình.
Deviation (Độ lệch chuẩn): thể hiện mức biến động của giá nhà. Coefficient of
Variation (CV%): cho phép so sánh độ ổn định tương đối giữa các biến khác
(như Price Size). 3 chỉ tiêu này giúp vừa nắm được xu hướng trung tâm,
mức phân tán tương đối tuyệt đối, rất hữu ích cho ra quyết định định g
8. Yếu tố ảnh hưởng mạnh nhất đến Price (theo dữ liệu): Size Bedrooms
tăng cùng với Price. hay ảnh hưởng nhỏ hơn. Khi Size Mortgage type Township
Price tăng mạnh (thể hiện trong histogram bảng thống kê). CV(Size) thấ
CV(Price), nghĩa giá dao động không chỉ do Size còn do yếu tố khác
Size vẫn yếu tố chính.
Kết luận: Size yếu tố ảnh hưởng mạnh nhất đến Price trong bộ dữ li
Phần C:
9. Bộ dữ liệu cho thấy giá nhà trung bình khoảng 357 nghìn, với độ lệch chuẩ
(188 nghìn), phản ánh thị trường chưa ổn định. Diện tích trung bình các n
3438, phần lớn 2–3 phòng ngủ, cho thấy nhu cầu tập trung vào phân khú
trung bình. Hai loại thế chấp “Fixed” “Adjustable” tỷ lệ ơng đối cân
nhưng loại “Adjustable” nhỉnh hơn. Điểm tín dụng (FICO) của nhóm nợ xấ
thường thấp hơn, chứng tỏ rủi ro tín dụng tăng khi điểm FICO giảm. Mối q
Size Price thể hiện xu hướng cùng chiều rệt - nhà càng lớn giá càng
thể, dữ liệu gợi ý rằng diện tích tín dụng hai yếu tố then chốt trong
rủi ro tài chính của người mua.
10. Hạn chế của thống tả & hướng mở rộng
- Hạn chế:
Thống tả chỉ cho biết xu hướng mức phân tán tổng quát, khôn
kiểm định mối quan hệ nhân quả hay dự đoán giá trị mới.
- Hướng mở rộng:
thể sử dụng thống suy luận để xem các nhóm khác nhau khác
nghĩa không, hoặc dùng hình hồi quy tuyến tính để dự đoán Price dựa
Size, Bedrooms, Mortgage type, FICO, ...

Preview text:

Họ và tên: Đặng Linh Trang
Lớp: Hệ thống thông tin quản lý 67A Mã sinh viên:11258222
Phần dữ liệu sử dụng: 55-104 Phần A: tiêu Price Size Chỉ Mean 357261 3438
1. Hệ số biến thiên (CV) cho biết mức độ phân tán Median 311870 3090
tương đối của dữ liệu quanh giá trị trung bình. Mode CV #N/A 2090
càng cao, dữ liệu càng biến động mạnh (kém ổn Min định 169000 1630 045 1628.675
hơn). Price (52.65%) > Size (47.38%) =>Biến Price Max 919480 7670 Std Dev 188098.6
có mức biến động cao hơn biến Size. Range 750480551 6040 47.37552 CV (%) 52.65019 799 501 2. Nhận xét: Bedroom Tần số Township Tần số2 1 0 1 9 2 15 2 11 Bedroom: 3 13 3 10 -
Nhóm 2–3 phòng ngủ chiếm tần số cao nhất 4 8 4 13
(15 và 13) => dữ liệu tập trung mạnh vào 5 4 5 7
nhóm nhà có 2–3 phòng ngủ. 6 7 -
Các nhóm còn lại (4, 5, 6, 7) có tần số giảm 7 2 dần rõ rệt,
=> phân bố lệch phải (nhiều nhà ít phòng, ít nhà nhiều phòng). -
Không có nhà 1 phòng ngủ, cho thấy phân bố không đều, tập trung vào nhó bình (2–3). Township: -
Tần số dao động từ 7 → 13, khá gần nhau. -
Township 4 có nhiều nhà nhất (13), Township 5 ít nhất (7).
=> Phân bố tương đối đều, không quá chênh lệch giữa các khu. Có thể nói các k
bố dân cư khá cân bằng, không có khu nào chiếm ưu thế vượt trội.
3. - Lựa chọn biểu đồ Histogram cho biến Price vì biểu đồ này thể hiện phân
giá, giúp ta xem dữ liệu có phân bố chuẩn, lệch phải, lệch trái hay có ngo
- Lựa chọn Pie chart cho biến Mortgage type vì biểu đồ này giúp thấy tỷ trọ
từng loại Mortgage, dễ đọc hơn biểu đồ cột khi chỉ có vài nhóm nhỏ. Tần số Fixed Adjustable Phần B:
4. CV(Price) = 52.65% > 0.3 (30%), nghĩa là giá nhà biến động mạnh, không ổ
Các căn nhà có mức giá chênh lệch lớn so với giá trung bình, có thể do
diện tích, vị trí, tiện ích hoặc điều kiện vay vốn.
Kết luận: Thị trường nhà trong mẫu dữ liệu này có độ phân tán giá cao, ch
5. Quan sát từ dữ liệu trung bình: Mean (Price) = 357261, Mean (Size) = 3438.
này cùng tăng giảm theo chiều hướng tương tự (nhà lớn thường giá cao). Kh
tăng 10%, thì Price thường cũng tăng đáng kể (khoảng 8–12%), nhưng không
toàn tỷ lệ thuận vì giá còn phụ thuộc vị trí, Mortgage type, FICO,...
Kết luận: Price tăng cùng chiều với Size, nhưng không theo tỷ lệ cố định.
6. So sánh FICO trung bình giữa nhóm Default = 1 và Default = 0
Nhóm Default = 1: FICO thấp hơn rõ rệt
Nhóm Default = 0 : FICO cao hơn
Kết luận: Có mối quan hệ nghịch đảo giữa điểm tín dụng và rủi ro nợ xấu
FICO cao thì ít khả năng vỡ nợ, thể hiện mức uy tín tài chính tốt hơn.
7. Nếu chọn 3 chỉ tiêu thống kê mô tả để báo cáo cho quản lý bất động sản
Mean (Giá trị trung bình): dễ hiểu, đại diện cho mức giá/diện tích điển hình.
Deviation (Độ lệch chuẩn): thể hiện mức biến động của giá nhà. Coefficient of
Variation (CV%): cho phép so sánh độ ổn định tương đối giữa các biến khác
(như Price và Size). 3 chỉ tiêu này giúp vừa nắm được xu hướng trung tâm,
mức phân tán tương đối và tuyệt đối, rất hữu ích cho ra quyết định định g
8. Yếu tố ảnh hưởng mạnh nhất đến Price (theo dữ liệu): Size và Bedrooms có
tăng cùng với Price. Mortgage type hay Township ảnh hưởng nhỏ hơn. Khi Size
→ Price tăng mạnh (thể hiện trong histogram và bảng thống kê). CV(Size) thấ
CV(Price), nghĩa là giá dao động không chỉ do Size mà còn do yếu tố khác
Size vẫn là yếu tố chính.
Kết luận: Size là yếu tố có ảnh hưởng mạnh nhất đến Price trong bộ dữ liệ Phần C:
9. Bộ dữ liệu cho thấy giá nhà trung bình khoảng 357 nghìn, với độ lệch chuẩ
(188 nghìn), phản ánh thị trường chưa ổn định. Diện tích trung bình các căn
3438, phần lớn có 2–3 phòng ngủ, cho thấy nhu cầu tập trung vào phân khú
trung bình. Hai loại thế chấp “Fixed” và “Adjustable” có tỷ lệ tương đối cân
nhưng loại “Adjustable” nhỉnh hơn. Điểm tín dụng (FICO) của nhóm có nợ xấ
thường thấp hơn, chứng tỏ rủi ro tín dụng tăng khi điểm FICO giảm. Mối q
Size và Price thể hiện xu hướng cùng chiều rõ rệt - nhà càng lớn giá càng
thể, dữ liệu gợi ý rằng diện tích và tín dụng là hai yếu tố then chốt trong
và rủi ro tài chính của người mua.
10. Hạn chế của thống kê mô tả & hướng mở rộng - Hạn chế:
Thống kê mô tả chỉ cho biết xu hướng và mức phân tán tổng quát, khôn
kiểm định mối quan hệ nhân quả hay dự đoán giá trị mới. - Hướng mở rộng:
Có thể sử dụng thống kê suy luận để xem các nhóm khác nhau có khác
nghĩa không, hoặc dùng mô hình hồi quy tuyến tính để dự đoán Price dựa
Size, Bedrooms, Mortgage type, FICO, ...