Bài tập: Phân lớp dữ liệu
Bài tập: Phân lớp dữ liệu
Môn: Khoa học quản lý (KHQL001)
Trường: Đại học Nông Lâm Thái Nguyên
Thông tin:
Tác giả:
Preview text:
lOMoARcPSD|25518217
Bài tập về nhà buổi #4
Lab 2 – Phân lớp dữ liệu
1. Sử dụng 3 phương pháp: hồi qui logistic, svm, cây quyết định tiến hành phân lớp
theo “Vay Vốn”. Đánh giá các phương pháp. Lưu ý thế hiện quan sát dữ liệu theo
dạng bảng hoặc biều đồ.
a. Chụp màn hình xây dựng mô hình:
b. Chụp màn hình đánh giá các phương pháp và Ma trận nhầm lẫn
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Phương pháp hồi qui logistic
Phương pháp cây quyết định
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217 Phương pháp SVM
2. Sử dụng mô hình tốt nhất để dự báo “Vay Vốn” cho khách hàng trong file:
ThuNhap_HoGiaDinh_forecast.xlsx
a. Chụp màn hình xây dựng mô hình:
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Qua 3 mô hình phân lớp trên, số liệu các mô hình phân lớp không giống nhau,
trong đó nhầm lẫn loại 2 của mô hình Cây quyết định (Tree Decision) thấp nhất:
21,4%=> Lựa chọn mô hình này dự báo ' Vay vốn'' cho khách hàng trong file:
ThuNhap_HoGiaDinh_forecast.xlsx.
b. Chụp màn hình kết quả dự báo:
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Lab 1 – Chuẩn bị dữ liệu
1. Từ file dữ liệu cho sẳn ThuNhap_HoGiaDinh.xlsx tách làm 2 file excel riêng:
a. ThuNhap_HoGiaDinh_data.xlsx: chiếm 70% dữ liệu
b. ThuNhap_HoGiaDinh_forecast.xlsx: 30% dữ liệu dùng để dự báo. Và bỏ đi dữ
liệu cột biến phụ thuộc (Vay Vốn)
Downloaded by Van Le (mrl3v4n@gmail.com) lOMoARcPSD|25518217
Downloaded by Van Le (mrl3v4n@gmail.com)