Giải bài tập thống kê ứng dụng | Trường Đại học Kinh tế – Luật, Đại học Quốc gia Thành phố Hồ Chí Minh

Khách hàng không mua khoản vay trong chiến dịch. Khách hàng không mua khoản vay trong chiến dịch. Khách hàng mua khoản
vay trong chiến dịch. Các trường hợp nhánh sau được tính tương tự. Tài liệu giúp bạn tham khảo, ôn tập và đạt kết quả cao. Mời đọc đón xem!

lOMoARcPSD| 46348410
1. Age and Personal Loan Step
1: Gini Impurity
Average age
Age
Personal Loan
Gini Impurity
29.5
34.5
35
35
36
38
42
47.5
51.5
25
0
0.178
0.1
0.13
0.15
0.16
0.167
0.171
0.175
0.178
34
1
35
0
35
0
35
0
37
0
39
0
45
0
50
0
53
0
Step 2: Growing the Classification tree
Age < 34.5 có hệ số Gini nhỏ nhất vì vậy Age < 34.5 sẽ là gốc của cây.
lOMoARcPSD| 46348410
Các trường hợp nhánh sau được tính tương tự.
Step 1: Gini Impurity
Average income
Income
Personal Loan
16.5
25.5
11
0
22
0
Age < 29.5
Personal Loan
Yes
No
0 1
Personal Loan
Yes
No
1 8
Gini Impurity = 0
Gini Impurity = 1 - (1/9)^2 - (8/9)^2 = 0.198
Total Gini Impurity = (1/10)x0 + (9/10)x0.198 = 0.178
Step 3: Stopping the Classification tree
. Income and Personal Loan
2
Age < 34.5
Khách hàng không mua
kho
ản vay trong chiến
dịch
Age < 29.5
Khách hàng không mua
khoản vay trong chiến dịch
Khách hàng mua khoản
vay trong chiến dịch
True
False
True
False
lOMoARcPSD| 46348410
31.5
39.5
47
90.5
76.5
90.5
140
29
0
34
0
45
0
49
0
72
0
81
0
100
0
180
1
Step 2: Growing the Classification tree
Income < 140 có hệ số Gini nhỏ nhất vì vậy Income < 140 là gốc của cây.
Các trường hợp nhánh sau được tính tương tự.
Step 3: Stopping the Classification tree
Income < 16.5
Personal Loan
Yes
No
0 1
Personal Loan
Yes
No
1 8
Gini Impurity = 0
Gini Impurity = 1 - (1/9)^2 - (8/9)^2 = 0.198
=>
Total Gini Impurity = 0.198x
(9/10) = 0.178
lOMoARcPSD| 46348410
3. Family and Personal Loan
Step 1: Gini Impurity
Average family
Family
Personal Loan
Gini Impurity
1.5
2.5
3.5
1 (age 34)
0
0.15
0.16
0.171
1
1
1
0
1
0
2
0
3
0
3
0
4
0
4
0
4
0
Income < 140
Khách hàng không mua khoản
vay trong chiến dịch
Khách hàng mua khoản
vay trong chiến dịch
True
False
lOMoARcPSD| 46348410
Step 2: Growing the Classification tree
Family < 1.5 có hệ số Gini nhỏ nhất vì vậy Family < 1.5 sẽ là gốc của cây.
Step 1: Gini Impurity
Average education
Education
Personal Loan
Gini Impurity
Các nhánh sau
ược t
ính t
ương tự
Family < 1.5
Personal Loan
Yes
No
1 3
Personal Loan
Yes
No
0 6
Gini Impurity = 0
Gini Impurity = 1 - (1/4)^2 - (3/4)^2 = 0.375
Total Gini Impurity = (4/10)x0.375 + (6/10)x0 = 0.15
Step 3: Stopping the Classification tree
. Education and Personal Loan
4
Family < 1.5
Khách hàng không mua
kho
ản v
ay trong chi
ến
d
ịch
Khách hàng không mua kho
ản
vay trong chi
ến
d
ịch
True
False
Personal Loan
Yes
No
1 3
lOMoARcPSD| 46348410
1.5
2.5
1
0
0.171
0.1
1
0
1
0
2
0
2
0
2
0
2
0
2
0
3
0
3
1
Step 2: Growing the Classification tree
Education < 2.5 có hệ số Gini nhỏ hơn Education < 1.5, vậy Education < 2.5 sẽ tr
thành gốc của cây.
=>
Total Gini Impurity = 0.5x(2/10) = 0.1
Trường hợp (Education < 1.5) tương tự.
Step 3: Stopping the Classification tree
Education < 2.5
Personal Loan
Yes
No
0 8
Personal Loan
Yes
No
1 1
Gini Impurity = 0
Gini Impurity = 1 - (1/2)^2 - (1/2)^2 = 0.5
lOMoARcPSD| 46348410
5. Mortgage and Personal Loan
Step 1: Gini Impurity
Average mortgage
Mortgage
Personal Loan
Gini Impurity
52
129.5
0
0
0.175
0.178
0 (age 34)
1
0
0
0
0
0
0
0
0
0
0
0
0
104
0
Education < 2.5
Khách hàng không mua
kho
ản v
ay trong chi
ến
d
ịch
50
% khách hàng không mua kho
ản v
ay
trong chi
ến
d
ịch
và 50% khách hàng mua
kho
ản v
ay trong chi
ến
d
ịch
True
False
lOMoARcPSD| 46348410
155
0
Step 2: Growing the Classification tree
Mortgage < 52 có hệ số Gini nhỏ hơn Mortgage < 129.5, vậy Mortgage < 52 sẽ tr
thành gốc của cây.
Step 3: Stopping the Classification tree
Các tr
ường hợp sau ược t
ính t
ương tự
.
Mortgage < 52
Personal Loan
Yes
No
1 7
Personal Loan
Yes
No
0 2
Gini Impurity = 0
Gini Impurity = 1 - (1/8)^2 - (7/8)^2 = 0.2188
Total Gini Impurity = (8/10)x0.22 + (6/10)x0 = 0.175
Morgage < 52
Khách hàng không mua
kho
ản v
ay trong chi
ến
d
ịch
.
Custom Khách hàng không
mua kho
ản v
ay trong chi
ến
d
ịch
True
False
Personal Loan
No
Yes
1 7
| 1/8

Preview text:

lOMoAR cPSD| 46348410
1. Age and Personal Loan Step 1: Gini Impurity Average age Age Personal Loan Gini Impurity 25 0 29.5 0.178 34.5 0.1 34 1 35 0.13 35 0 35 0.15 36 35 0 0.16 38 0.167 35 0 42 0.171 37 47.5 0 0.175 51.5 39 0 0.178 45 0 50 0 53 0
Step 2: Growing the Classification tree
Age < 34.5 có hệ số Gini nhỏ nhất vì vậy Age < 34.5 sẽ là gốc của cây. lOMoAR cPSD| 46348410 Age < 29.5 Personal Loan Personal Loan Yes No Yes No 0 1 1 8 Gini Impurity = 0
Gini Impurity = 1 - (1/9)^2 - (8/9)^2 = 0.198
Total Gini Impurity = (1/10)x0 + (9/10)x0.198 = 0.178
− Các trường hợp nhánh sau được tính tương tự.
Step 3: Stopping the Classification tree Age < 34.5 True False Age < 29.5 Khách hàng không mua kho ản vay trong chiến dịch True False Khách hàng không mua Khách hàng mua khoản
khoản vay trong chiến dịch vay trong chiến dịch . Income a 2 nd Personal Loan Step 1: Gini Impurity Average income Income Personal Loan Gini Impurity 11 16.5 0 0.178 25.5 0.175 22 0 lOMoAR cPSD| 46348410 31.5 29 0.171 0 39.5 … 34 47 0 … 90.5 45 … 0 76.5 … 49 0 90.5 0.1 140 72 0 0 81 0 100 0 180 1
Step 2: Growing the Classification tree
Income < 140 có hệ số Gini nhỏ nhất vì vậy Income < 140 là gốc của cây. Income < 16.5 Personal Loan Personal Loan Yes No Yes No 0 1 1 8 Gini Impurity = 0
Gini Impurity = 1 - (1/9)^2 - (8/9)^2 = 0.198
=> Total Gini Impurity = 0.198x (9/10) = 0.178
Các trường hợp nhánh sau được tính tương tự.
Step 3: Stopping the Classification tree lOMoAR cPSD| 46348410 Income < 140 True False
Khách hàng không mua khoản Khách hàng mua khoản vay trong chiến dịch vay trong chiến dịch
3. Family and Personal Loan Step 1: Gini Impurity Average family Family Personal Loan Gini Impurity 1 (age 34) 0 1 1 1.5 1 2.5 0 0.15 0.16 1 0 3.5 2 0 0.171 3 0 3 0 4 0 4 0 4 0 lOMoAR cPSD| 46348410
Step 2: Growing the Classification tree
Family < 1.5 có hệ số Gini nhỏ nhất vì vậy Family < 1.5 sẽ là gốc của cây. Family < 1.5 Personal Loan Personal Loan Yes No Yes No 1 3 0 6
Gini Impurity = 1 - (1/4)^2 - (3/4)^2 = 0.375 Gini Impurity = 0
Total Gini Impurity = (4/10)x0.375 + (6/10)x0 = 0.15
− Các nhánh sau ược t ính t ương tự
Step 3: Stopping the Classification tree Family < 1.5 True False Personal Loan Khách hàng không mua Yes No kho ản v ay trong chi ến 1 3 d ịch
Khách hàng không mua kho ản vay trong chi ến d ịch . Ed 4
ucation and Personal Loan Step 1: Gini Impurity Average education Education Personal Loan Gini Impurity lOMoAR cPSD| 46348410 1 0 1 0 1 0 2 0 1.5 2 0 0.171 2 0 2 0 2 0 2.5 0.1 3 0 3 1
Step 2: Growing the Classification tree
Education < 2.5 có hệ số Gini nhỏ hơn Education < 1.5, vậy Education < 2.5 sẽ trở thành gốc của cây. Education < 2.5 Personal Loan Personal Loan Yes No Yes No 0 8 1 1 Gini Impurity = 0
Gini Impurity = 1 - (1/2)^2 - (1/2)^2 = 0.5 =>
Total Gini Impurity = 0.5x(2/10) = 0.1
− Trường hợp (Education < 1.5) tương tự.
Step 3: Stopping the Classification tree lOMoAR cPSD| 46348410 Education < 2.5 True False Khách hàng không mua
50 % khách hàng không mua kho ản v ay kho ản v ay trong chi ến
trong chi ến d ịch và 50% khách hàng mua d ịch
kho ản v ay trong chi ến d ịch
5. Mortgage and Personal Loan Step 1: Gini Impurity Average mortgage Mortgage Personal Loan Gini Impurity 0 0 0 (age 34) 1 0 0 0 0 52 0 0 129.5 0.175 0 0 0.178 0 0 0 0 104 0 lOMoAR cPSD| 46348410 155 0
Step 2: Growing the Classification tree
Mortgage < 52 có hệ số Gini nhỏ hơn Mortgage < 129.5, vậy Mortgage < 52 sẽ trở thành gốc của cây. Mortgage < 52 Personal Loan Personal Loan Yes No Yes No 1 7 0 2
Gini Impurity = 1 - (1/8)^2 - (7/8)^2 = 0.2188 Gini Impurity = 0
Total Gini Impurity = (8/10)x0.22 + (6/10)x0 = 0.175
− Các tr ường hợp sau ược t ính t ương tự .
Step 3: Stopping the Classification tree Morgage < 52 True False Personal Loan Khách hàng không mua Yes No kho ản v ay trong chi ến 1 7 d ịch . Custom Khách hàng không
mua kho ản v ay trong chi ến d ịch