A. Nội dung tiểu luận:
Gồm 3 phần:
1. Thu thậ p d liệu:
- SV ph i T Ự thu thậ p d liệu (tự crawl).
- Số lượng: n ngu n d>1000 mẫu, dẫ ệu và mô tả cách thức thu thậli p.
- Xuất ra các thố ả trực quan về dữ ệu. ng kê mô t li
2. Trích xuất đặc trưng:
- Trình bày việ ựa chọ ặc trưng, làm sạch và c l n đ chuẩn hóa dữ liệu, giảm chiều, …
- Trực quan hoá kết quả của các quá trình trên.
3. Mô hình hóa dữ liệu:
- ọn các mô hình phù hợp (ít nhất 2 mô hình/thuật toán). Ch
- Chia dữ ệu thành Train/Validation/Test set theo tỉ lệ ợp. li phù h
- Trình bày các đồ thị thể ả của các mô hình trong quá trình huấhiện hiệu qu n
luyệ Hiện/ u chỉnh/Kiểm thử.
- So sánh ả của các mô hình bằ ồ thị. hiệu qu ng bảng d liệu hoặc đ
B. Phân nhóm và chấm thi:
- Các SV đăng ký nhóm và đề tài theo lớ (trườ ệt thì 2 p học phần: 3 SV/nhóm ng h p đ ặc bi
SV/nhóm).
- Mỗi SV trình bày RI ệc mình làm thông qua nộ ết trong tiể ận và ÊNG phần vi i dung vi u lu
ph nh nh ng phần trình bày tr ủa cả ên slide chung c óm õ để GV chấm điểm. Mỗi SV ghi r ( ) ần
việc m c ình làm trong bả phân công công việng ở đầu tiể uận và trình bày u l slide/demo code
phần n mình làm để GV vấ đáp và chấ ểm. m đi
- gian tr bày à demo code cho mỗ út. Thời ình slide v i nhóm: 15 ph

Preview text:

A. Nội dung tiểu luận: Gồm 3 phần: 1. Thu thập dữ liệu:
- SV phải TỰ thu thập dữ liệu (tự crawl).
- Số lượng: >1000 mẫu, n
dẫ nguồn dữ liệu và mô tả cách thức thu thập.
- Xuất ra các thống kê mô tả trực quan về dữ liệu.
2. Trích xuất đặc trưng:
- Trình bày việc lựa chọn đặc trưng, làm sạch và chuẩn hóa dữ liệu, giảm chiều, …
- Trực quan hoá kết quả của các quá trình trên.
3. Mô hình hóa dữ liệu:
- Chọn các mô hình phù hợp (ít nhất 2 mô hình/thuật toán).
- Chia dữ liệu thành Train/Validation/Test set theo tỉ lệ phù hợp.
- Trình bày các đồ thị thể hiện hiệu quả của các mô hình trong quá trình huấn
luyện/Hiệu chỉnh/Kiểm thử.
- So sánh hiệu quả của các mô hình bằng bảng dữ liệu hoặc đồ thị.
B. Phân nhóm và chấm thi:
- Các SV đăng ký nhóm và đề tài theo lớp học phần: 3 SV/nhóm (trường hợp đặc biệt thì 2 SV/nhóm).
- Mỗi SV trình bày RIÊNG phần việc mình làm thông qua nội dung v ết trong tiể i u luận và
phần trình bày trên slide chung của cả nhóm để GV chấm điểm. Mỗi SV ghi õ r (những p ) hần
việc mình làm trong bảng c
phân công công việ ở đầu tiểu luận và trình bày slide/demo code
phần mình làm để GV vấn đáp và chấm đ ểm. i
- Thời gian trình bày slide và demo code cho mỗi nhóm: 15 phút.