lOMoARcPSD| 60797905
Đề tài: Ứng dụng khai phá dữ liệu bằng cây quyết định trong phân tích và dự
báo giá điện tại Việt Nam
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Trình bày bối cảnh biến động giá điện tại Việt Nam.
Nêu rõ ảnh hưởng của giá nhiên liệu (khí, than) và năng lượng tái tạo.
Giới thiệu vai trò của khai phá dữ liệu trong việc hỗ trợ ra quyết định.
2. Mục tiêu nghiên cứu
Ứng dụng phương pháp cây quyết định (Decision Tree) để xác định yếu tố ảnh hưởng mạnh nhất
đến giá điện.
Xây dựng mô hình dự báo xu hướng giá điện dựa trên dữ liệu giá nhiên liệu và năng lượng tái
tạo.
3. Câu hỏi nghiên cứu
Những yếu tố nào ảnh hưởng lớn nhất đến biến động giá điện Việt Nam?
Tác động của năng lượng tái tạo đến việc ổn định giá điện là gì?
Mô hình khai phá dữ liệu có thể dự báo giá điện chính xác đến mức nào?
4. Đối tượng và phạm vi nghiên cứu
Đối tượng: Dữ liệu giá điện, giá nhiên liệu (khí, than) và sản lượng điện tái tạo (mặt trời, gió).
Phạm vi: Việt Nam, giai đoạn 2015–2025, theo dữ liệu giả lập hoặc thu thập thực tế từ EVN, Bộ
Công Thương.
5. Phương pháp nghiên cứu
Phương pháp định lượng (mô hình cây quyết định).
Công cụ: Weka và Excel/Python.
Các chỉ số đánh giá: R², MAE, RMSE, mức độ giải thích mô hình (interpretability).
lOMoARcPSD| 60797905
6. Ý nghĩa thực tiễn
Giúp các nhà hoạch định chính sách dự báo xu hướng giá điện.
Hỗ trợ xác định vai trò của năng lượng tái tạo trong việc giảm chi phí điện.
PHẦN NỘI DUNG
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT TỔNG QUAN NGHIÊN CỨU
1.1. Khái quát về khai phá dữ liệu
1.1.1. Khái niệm và vai trò
1.1.2. Quy trình khai phá dữ liệu (Data Mining Process)
1.1.3. Ứng dụng khai phá dữ liệu trong lĩnh vực năng lượng
1.2. Cây quyết định trong khai phá dữ liệu
1.2.1. Nguyên lý hoạt động của cây quyết định
1.2.2. Thuật toán J48/C4.5 và quy trình huấn luyện
1.2.3. Ưu, nhược điểm của cây quyết định so với mô hình khác
1.3. Tổng quan nghiên cứu liên quan
1.3.1. Nghiên cứu trong nước về giá điện và năng lượng tái tạo
1.3.2. Nghiên cứu quốc tế ứng dụng khai phá dữ liệu trong năng lượng
1.3.3. Khoảng trống nghiên cứu và hướng đi của đề tài
CHƯƠNG 2. DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Thu thập và xử lý dữ liệu
2.1.1. Nguồn dữ liệu (EVN, IEA, giả lập 2015–2025)
2.1.2. Chuẩn hóa đơn vị tiền tệ (VNĐ)
2.1.3. Làm sạch dữ liệu và xử lý nhiễu (Data Cleaning)
2.2. Mô tả bộ dữ liệu
2.2.1. Các thuộc tính đầu vào
lOMoARcPSD| 60797905
2.2.2. Biến mục tiêu (Giá điện – VND/kWh)
2.2.3. Thống kê mô tả và trực quan dữ liệu (biểu đồ xu hướng, tương quan)
2.3. Xây dựng mô hình cây quyết định
2.3.1. Thiết lập tham số và lựa chọn thuật toán J48 trong Weka
2.3.2. Huấn luyện mô hình trên tập dữ liệu 2015–2024
2.3.3. Kiểm thử mô hình trên dữ liệu 2025
2.4. Đánh giá mô hình
2.4.1. Hệ số xác định (R²)
2.4.2. Sai số trung bình tuyệt đối (MAE)
2.4.3. Sai số bình phương trung bình (RMSE)
2.4.4. Mức độ giải thích và diễn giải cây quyết định
CHƯƠNG 3. KẾT QUẢ THẢO LUẬN
3.1. Kết quả mô hình cây quyết định
3.1.1. Cấu trúc cây và các nhánh quyết định chính
3.1.2. Yếu tố có ảnh hưởng mạnh nhất đến giá điện
3.1.3. Quy tắc dự báo (IF–THEN rules)
3.2. Phân tích kết quả
3.2.1. So sánh với các nghiên cứu hoặc dữ liệu thực tế
3.2.2. Diễn giải ý nghĩa kinh tế – năng lượng của kết quả
3.2.3. Ảnh hưởng của năng lượng tái tạo đến ổn định giá điện
3.3. Dự báo và kiến nghị
3.3.1. Dự báo xu hướng giá điện đến năm 2026
3.3.2. Kiến nghị phát triển năng lượng tái tạo và quản lý giá điện
lOMoARcPSD| 60797905
3.3.3. Hạn chế của mô hình và hướng phát triển tương lai
KẾT LUẬN VÀ KIẾN NGHỊ
Tóm tắt kết quả chính.
Nêu lại đóng góp khoa học và thực tiễn.
Đề xuất hướng nghiên cứu mở rộng (kết hợp mô hình Random Forest, Neural Network, hoặc dữ
liệu thực từ EVN).
TÀI LIỆU THAM KHẢO
Nêu các nguồn dữ liệu (EVN, IEA, GSO, Bộ Công Thương, v.v.).
Trích dẫn các nghiên cứu về khai phá dữ liệu trong năng lượng.

Preview text:

lOMoAR cPSD| 60797905
Đề tài: Ứng dụng khai phá dữ liệu bằng cây quyết định trong phân tích và dự
báo giá điện tại Việt Nam
PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Trình bày bối cảnh biến động giá điện tại Việt Nam.
Nêu rõ ảnh hưởng của giá nhiên liệu (khí, than) và năng lượng tái tạo.
Giới thiệu vai trò của khai phá dữ liệu trong việc hỗ trợ ra quyết định.
2. Mục tiêu nghiên cứu
Ứng dụng phương pháp cây quyết định (Decision Tree) để xác định yếu tố ảnh hưởng mạnh nhất đến giá điện.
Xây dựng mô hình dự báo xu hướng giá điện dựa trên dữ liệu giá nhiên liệu và năng lượng tái tạo.
3. Câu hỏi nghiên cứu
Những yếu tố nào ảnh hưởng lớn nhất đến biến động giá điện Việt Nam?
Tác động của năng lượng tái tạo đến việc ổn định giá điện là gì?
Mô hình khai phá dữ liệu có thể dự báo giá điện chính xác đến mức nào?
4. Đối tượng và phạm vi nghiên cứu
Đối tượng: Dữ liệu giá điện, giá nhiên liệu (khí, than) và sản lượng điện tái tạo (mặt trời, gió).
Phạm vi: Việt Nam, giai đoạn 2015–2025, theo dữ liệu giả lập hoặc thu thập thực tế từ EVN, Bộ Công Thương.
5. Phương pháp nghiên cứu
Phương pháp định lượng (mô hình cây quyết định).
Công cụ: Weka và Excel/Python.
Các chỉ số đánh giá: R², MAE, RMSE, mức độ giải thích mô hình (interpretability). lOMoAR cPSD| 60797905
6. Ý nghĩa thực tiễn
Giúp các nhà hoạch định chính sách dự báo xu hướng giá điện.
Hỗ trợ xác định vai trò của năng lượng tái tạo trong việc giảm chi phí điện. PHẦN NỘI DUNG
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT VÀ TỔNG QUAN NGHIÊN CỨU
1.1. Khái quát về khai phá dữ liệu
1.1.1. Khái niệm và vai trò
1.1.2. Quy trình khai phá dữ liệu (Data Mining Process)
1.1.3. Ứng dụng khai phá dữ liệu trong lĩnh vực năng lượng
1.2. Cây quyết định trong khai phá dữ liệu
1.2.1. Nguyên lý hoạt động của cây quyết định
1.2.2. Thuật toán J48/C4.5 và quy trình huấn luyện
1.2.3. Ưu, nhược điểm của cây quyết định so với mô hình khác
1.3. Tổng quan nghiên cứu liên quan
1.3.1. Nghiên cứu trong nước về giá điện và năng lượng tái tạo
1.3.2. Nghiên cứu quốc tế ứng dụng khai phá dữ liệu trong năng lượng
1.3.3. Khoảng trống nghiên cứu và hướng đi của đề tài
CHƯƠNG 2. DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Thu thập và xử lý dữ liệu
2.1.1. Nguồn dữ liệu (EVN, IEA, giả lập 2015–2025)
2.1.2. Chuẩn hóa đơn vị tiền tệ (VNĐ)
2.1.3. Làm sạch dữ liệu và xử lý nhiễu (Data Cleaning)
2.2. Mô tả bộ dữ liệu
2.2.1. Các thuộc tính đầu vào lOMoAR cPSD| 60797905
2.2.2. Biến mục tiêu (Giá điện – VND/kWh)
2.2.3. Thống kê mô tả và trực quan dữ liệu (biểu đồ xu hướng, tương quan)
2.3. Xây dựng mô hình cây quyết định
2.3.1. Thiết lập tham số và lựa chọn thuật toán J48 trong Weka
2.3.2. Huấn luyện mô hình trên tập dữ liệu 2015–2024
2.3.3. Kiểm thử mô hình trên dữ liệu 2025
2.4. Đánh giá mô hình
2.4.1. Hệ số xác định (R²)
2.4.2. Sai số trung bình tuyệt đối (MAE)
2.4.3. Sai số bình phương trung bình (RMSE)
2.4.4. Mức độ giải thích và diễn giải cây quyết định
CHƯƠNG 3. KẾT QUẢ VÀ THẢO LUẬN
3.1. Kết quả mô hình cây quyết định
3.1.1. Cấu trúc cây và các nhánh quyết định chính
3.1.2. Yếu tố có ảnh hưởng mạnh nhất đến giá điện
3.1.3. Quy tắc dự báo (IF–THEN rules)
3.2. Phân tích kết quả
3.2.1. So sánh với các nghiên cứu hoặc dữ liệu thực tế
3.2.2. Diễn giải ý nghĩa kinh tế – năng lượng của kết quả
3.2.3. Ảnh hưởng của năng lượng tái tạo đến ổn định giá điện
3.3. Dự báo và kiến nghị
3.3.1. Dự báo xu hướng giá điện đến năm 2026
3.3.2. Kiến nghị phát triển năng lượng tái tạo và quản lý giá điện lOMoAR cPSD| 60797905
3.3.3. Hạn chế của mô hình và hướng phát triển tương lai
KẾT LUẬN VÀ KIẾN NGHỊ
Tóm tắt kết quả chính.
Nêu lại đóng góp khoa học và thực tiễn.
Đề xuất hướng nghiên cứu mở rộng (kết hợp mô hình Random Forest, Neural Network, hoặc dữ liệu thực từ EVN).
TÀI LIỆU THAM KHẢO
Nêu các nguồn dữ liệu (EVN, IEA, GSO, Bộ Công Thương, v.v.).
Trích dẫn các nghiên cứu về khai phá dữ liệu trong năng lượng.