



Preview text:
lOMoAR cPSD| 58457166
Bài tập thực hành Phần: MÁY HỌC
1. Hãy xây dựng cây định danh và tìm luật theo
phương pháp vector đặc trưng của Quinlan để xác định
một người như thế nào khi đi tắm biển thì bị cháy nắng. Tên Tóc Ch.Cao Cân Dùng Kết nặng kem? quả Sarah Vàng T.Bình Nhẹ Không Cháy Dana Vàng Cao T.Bình Có Không Alex Nâu Thấp T.Bình Có Không Annie Vàng Thấp T.Bình Không Cháy Emilie Đỏ T.Bình Nặng Không Cháy Peter Nâu Cao Nặng Không Không John Nâu T.Bình Nặng Không Không Kartie Vàng Thấp Nhẹ Có Không ● Tóc
V Tóc (Vàng) = (T (Vàng, Cháy nắng), T (Vàng, Không bị cháy))
Số người tóc vàng là: 4
Số người tóc vàng và cháy nắng là: 2
Số người tóc vàng và không cháy nắng là: 2
● VTóc(vàng) = (T (Vàng, Cháy nắng), T (Vàng, Không cháy)) = (2/4, 2/4) lOMoAR cPSD| 58457166
● VTóc(nâu) = (T (Nâu, Cháy nắng), T (Nâu, Không cháy)) = (0/3,3/3)
= (0, 1) → Vector đơn vị
● VTóc(đỏ) = (T (Đỏ, Cháy nắng), T (Đỏ, Không cháy)) = (1/1,0/1) = (1, 0) → Vector đơn vị
Tổng số vector đơn vị thuộc tính tóc là 2 ● Chiều cao
• V Chiều cao(thấp) = (T (Thấp, Cháy nắng), T (Thấp, Không cháy)) = (1/3,2/3)
V Chiều cao (trung bình) = (T (Trung bình, Cháy nắng), T (Trung bình, Không cháy)) = (2/3,1/3)
V Chiều cao (cao) = (T (Cao, Cháy nắng), T (Cao,
Không cháy)) = (0/2,2/2) = (0,1) → Vector đơn vị
Tổng số vector đơn vị thuộc tính chiều cao là 1 ● Can nang
● V Cân nặng (nhẹ) = (T (Nhẹ, Cháy nắng), T (Nhẹ, Không cháy)) = (1/2,1/2)
● VCân nặng (Trung bình) = (T (Trung bình, Cháy nắng), T (Trung bình, Không cháy)) = (1/3,2/3)
● Vcân nặng (nặng) = (T (Nặng, Cháy nắng), T (Nặng, Không cháy)) = (1/3,2/3) lOMoAR cPSD| 58457166
Tổng số vector đơn vị thuộc tính cân nặng là 0 ● Dùng kem
● VKem (có) = (T (Có dùng kem, Cháy nắng), T
(Có dùng kem, Không cháy)) = (3/3,0/3) = (1,0) → Vector đơn vị
VKem (không) = (T (Không dùng kem, Cháy nắng), T (Không dùng kem, Không cháy)) = (3/5,2/5)
Tổng số vector đơn vị thuộc tính dùng kem là 1 Như
vậy thuộc tính màu tóc có số vector đơn vị nhiều nhất
nên sẽ được chọn để phân hoạch. Quy ước:
Emmile: Bị cháy nắng
Alex:Không bị cháy nắng
Sarah: Chưa có kết quả
2. Hãy xây dựng cây định danh và tìm luật theo
phương pháp vector đặc trưng của Quinlan để xác định
người Châu Á hay người Châu Âu.
Đặc điểm Dáng Ch. Cao Giới Thuộc Người tính châu lOMoAR cPSD| 58457166 1 To Trung bình Nam Châu Á 2 Nhỏ Thấp Nam Châu Á 3 Nhỏ Trung bình Nam Châu Á 4 To Cao Nam Châu Âu 5 Nhỏ Trung bình Nữ Châu Âu 6 Nhỏ Cao Nam Châu Âu 7 Nhỏ Cao Nữ Châu Âu 8 To Trung bình Nữ Châu Âu Ta có: bt=8
Bj=Dáng-To-1(to/Châu Á) -To-2(to/Châu Âu)
-Nhỏ-2(nhỏ/Châu Á) -3(nhỏ/Châu Âu)
C.cao-Cao-0(cao/Châu Á) -3(cao/Châu Âu) -TB-2(TB/Châu Á) -2(TB/Châu Âu)
Giới tính-Nam-3(Nam/Châu Á) -2(Nam/Châu Âu)
-Nữ-0(Nữ/Châu Á) -3(Nữ/Châu Âu)
Độ hỗn loạn TB dáng: =