



Preview text:
  lOMoAR cPSD| 58457166
Bài tập thực hành  Phần: MÁY HỌC 
1. Hãy xây dựng cây định danh và tìm luật theo 
phương pháp vector đặc trưng của Quinlan để xác định 
một người như thế nào khi đi tắm biển thì bị cháy nắng.  Tên  Tóc  Ch.Cao Cân  Dùng Kết  nặng  kem? quả  Sarah  Vàng  T.Bình Nhẹ  Không Cháy  Dana  Vàng  Cao  T.Bình Có  Không  Alex  Nâu  Thấp  T.Bình Có  Không  Annie Vàng  Thấp  T.Bình Không Cháy  Emilie Đỏ  T.Bình Nặng  Không Cháy  Peter  Nâu  Cao  Nặng  Không Không  John  Nâu  T.Bình Nặng  Không Không  Kartie Vàng  Thấp  Nhẹ  Có  Không  ● Tóc 
 V Tóc (Vàng) = (T (Vàng, Cháy nắng), T (Vàng,  Không bị cháy)) 
 Số người tóc vàng là: 4 
 Số người tóc vàng và cháy nắng là: 2 
 Số người tóc vàng và không cháy nắng là: 2 
● VTóc(vàng) = (T (Vàng, Cháy nắng), T (Vàng,  Không cháy)) = (2/4, 2/4)      lOMoAR cPSD| 58457166
● VTóc(nâu) = (T (Nâu, Cháy nắng), T (Nâu,  Không cháy)) = (0/3,3/3) 
= (0, 1) → Vector đơn vị 
● VTóc(đỏ) = (T (Đỏ, Cháy nắng), T (Đỏ, Không  cháy)) = (1/1,0/1) = (1, 0)   → Vector đơn vị 
 Tổng số vector đơn vị thuộc tính tóc là 2  ● Chiều cao 
• V Chiều cao(thấp) = (T (Thấp, Cháy nắng), T  (Thấp, Không cháy)) =   (1/3,2/3) 
 V Chiều cao (trung bình) = (T (Trung bình, Cháy  nắng), T (Trung bình,  Không cháy)) = (2/3,1/3) 
 V Chiều cao (cao) = (T (Cao, Cháy nắng), T (Cao, 
Không cháy)) = (0/2,2/2) = (0,1) → Vector đơn vị 
 Tổng số vector đơn vị thuộc tính chiều cao là 1  ● Can nang 
● V Cân nặng (nhẹ) = (T (Nhẹ, Cháy nắng), T (Nhẹ,  Không cháy)) = (1/2,1/2) 
● VCân nặng (Trung bình) = (T (Trung bình, Cháy  nắng), T (Trung bình,  Không cháy)) = (1/3,2/3) 
● Vcân nặng (nặng) = (T (Nặng, Cháy nắng), T  (Nặng, Không cháy)) =  (1/3,2/3)      lOMoAR cPSD| 58457166
Tổng số vector đơn vị thuộc tính cân nặng là 0  ● Dùng kem 
● VKem (có) = (T (Có dùng kem, Cháy nắng), T 
(Có dùng kem, Không cháy)) = (3/3,0/3) = (1,0)  → Vector đơn vị 
 VKem (không) = (T (Không dùng kem, Cháy nắng),  T (Không dùng kem,  Không cháy)) = (3/5,2/5) 
Tổng số vector đơn vị thuộc tính dùng kem là 1 Như 
vậy thuộc tính màu tóc có số vector đơn vị nhiều nhất 
nên sẽ được chọn để phân hoạch.    Quy ước: 
Emmile: Bị cháy nắng 
Alex:Không bị cháy nắng 
Sarah: Chưa có kết quả 
2. Hãy xây dựng cây định danh và tìm luật theo 
phương pháp vector đặc trưng của Quinlan để xác định 
người Châu Á hay người Châu Âu. 
 Đặc điểm Dáng  Ch. Cao  Giới  Thuộc  Người  tính  châu      lOMoAR cPSD| 58457166 1  To  Trung bình Nam  Châu Á  2  Nhỏ  Thấp  Nam  Châu Á  3  Nhỏ  Trung bình Nam  Châu Á  4  To  Cao  Nam Châu Âu  5  Nhỏ  Trung bình  Nữ  Châu Âu  6  Nhỏ  Cao  Nam Châu Âu  7  Nhỏ  Cao  Nữ  Châu Âu  8  To  Trung bình  Nữ  Châu Âu  Ta có: bt=8 
 Bj=Dáng-To-1(to/Châu Á)   -To-2(to/Châu Âu) 
 -Nhỏ-2(nhỏ/Châu Á)   -3(nhỏ/Châu Âu) 
 C.cao-Cao-0(cao/Châu Á)   -3(cao/Châu Âu)   -TB-2(TB/Châu Á)   -2(TB/Châu Âu) 
 Giới tính-Nam-3(Nam/Châu Á)   -2(Nam/Châu Âu) 
 -Nữ-0(Nữ/Châu Á)  -3(Nữ/Châu Âu) 
Độ hỗn loạn TB dáng:  =