Prepared by Tr nh Ng c Nh ân
I) KEY CONCEPT
Cho b ảng data như sau:
7
9
10
10
10
10
11
11
11
12
13
13
13
14
14
15
16
16
16
16
17
17
18
18
19
19
20
20
21
21
22
23
24
26
26
27
28
31
37
37
38
42
50
59
Stem-and-leaf plot visualize data method:
Cách làm:
V STEMi : l đ y h ng ch c ra. Sau đ m s lưng s c h ng chc.
V LEAFi : gh p s h ng ch c vi ch s h ng đơn v
Vd: Thông qua phương pháp Stem y đư-and leaf plot, ta có th d dàng th c c 2 s c hng
ch c b ng 0, 24 s c hng ch c b ng 1, 11 s c h ng ch c b ng 2, 4 s c h ng ch c b ng
3. 1 s h ng ch c b ng 4, 2 s h ng ch c b ng 5
Dot plots
=> Mi n d u n m t 7- 59. M i ch m nh s i m t con s trong t p d li tương đương v
liu nhé ^^
Frequency Distribution: is a table formed by classifying n data values into k classes called
bins
+ bin limits: define the values to be included in each bin. ( . Vd: 20-25 tu i, 26-30 kho ng
tui, 31-35 tu i, ….)
=> PROBLEMS: chia d u th nh c c khoPhương pháp ny sẽ li á ảng đều nhau. Nhưng trên
th th li c t n n t nh ch t c không quan tâm đ a d u
Vd: l p 1,2,3,4,12,13 => 1 v 2 l m t nh m, 3 v 4 l m t nh m, l p 12 v i h đ c năm nht
1 nh m => Sai l ch v h c (Sai l ch t nh ch t c a d trnh độ liu)
Các c làm: bư
Prepared by Tr nh Ng c Nh ân
B1: Tìm giá tr l n nh t và giá tr nh nh t ca data (trong trường hp này là 7 và 59)
B2: Ch n s Bins theo công th c: k= 1+3.3*log(n) (n là s ng ph n t trong t p d u) lư li
Vd: k= 1+3.3*log(44)= 6.42 (bins). Các b n có th tùy ch n s bins là 6 ho u oke nha. ặc 7 đề
B3: Thi t l p Bins limit theo công th c
𝐵𝑖𝑛 𝑤𝑖𝑑𝑡ℎ =
𝑋𝑚𝑎𝑥 𝑋𝑚𝑖𝑛
𝑘
Trong trường hp này, Bin width = (59-7)/6 = 8.67
Vì con s l l u nên mình s làm tròn nó lên thành 10 nha. ny nhn hơi kh ch
B4: Đm s lưng d liu cho tng bins
B5: Thi t l p b ng
Histogram
Prepared by Tr nh Ng c Nh ân
Scatter plot
Các chart khác như l Pie chart, Line chart, … các b coi kĩ hơn trong slides nhn có th !
II) EXERCISE
An executive’s telephone log showed the following data for the length of 65 calls initiated
during the last week of July.
(a) Prepare a dot plot.
(b) Prepare a frequency distribution and histogram (you may either specify the bins yourself
or use automatic bins).
(c) Describe the distribution, based on these displays
1
2
10
3
2
6
3
13
2
26
1
2
1
1
3
1
4
2
29
1
1
4
2
1
1
3
3
6
3
1
2
13
13
6
(Các b n check solution trong textbook, bài 3.29 nhé)

Preview text:

Prepared by Trịnh Ngọc Nhâ n I) KEY CONCEPT Cho bảng data như sau: 7 9 10 10 10 10 11 11 11 12 13 13 13 14 14 15 16 16 16 16 17 17 18 18 19 19 20 20 21 21 22 23 24 26 26 27 28 31 37 37 38 42 50 59
Stem-and-leaf plot visualize data method: Cách làm: Vi STEM: l  y h ng ch đ c ra. Sau đ m s lưng s c  h ng chc.
Vi LEAF: ghp s 
h ng chc vi ch s hng đơn v
Vd: Thông qua phương pháp Stem-and leaf plot, ta có thể dễ dàng thy đưc c 2 s c hng
chc bng 0, 24 s c hng chc bng 1, 11 s c 
h ng chc bng 2, 4 s c  h ng chc bng 3. 1 s h  ng ch c
 bng 4, 2 s hng ch c  bng 5 Dot plots => Miền d
 liệu nm từ 7- 59. Mỗi chm nh s
ỏ ẽ tương đương vi m t ộ con s t  rong tập d  liệu nhé ^^
Frequency Distribution: is a table formed by classifying n data values into k classes called bins
+ bin limits: define the values to be included in each bin. (“ ả kho ” ng . Vd: 20-25 tu i  , 26-30 tui, 31-35 tui, ….) => PROBLEMS: c
Phương pháp ny sẽ hia d
 liệu thnh các khoảng đều nhau. Nhưng trên thc t th n
 không quan tâm đn tnh cht ca d l iệu
Vd: lp 1,2,3,4,12,13 => 1 v 2 l m t ộ nh m  , 3 v 4 l m t ộ nh m
 , lp 12 v đi hc năm nht
1 nhm => Sai lệch về trnh độ h c
 (Sai lệch tnh cht c a  d  liệu) Các bưc làm:
Prepared by Trịnh Ngọc Nhâ n
B1: Tìm giá tr ln nht và giá tr nh nh ỏ
t ca data (trong trường hp này là 7 và 59) B2: Chn s B
 ins theo công thức: k= 1+3.3*log(n) (n là s  lưng phần t t ử rong tập d liệu)
Vd: k= 1+3.3*log(44)= 6.42 (bins). Các bn có thể tùy ch n s  bi
 ns là 6 hoặc 7 đều oke nha.
B3: Thit lập Bins limit theo công th c ứ
𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
𝐵𝑖𝑛 𝑤𝑖𝑑𝑡ℎ = 𝑘
Trong trường hp này, Bin width = (59-7)/6 = 8.67
Vì con s lẻ lẻ ny nhn hơi kh chu nên mình sẽ làm tròn nó lên thành 10 nha.
B4: Đm s lưng d liệu cho từng bins B5: Thit lập bảng Histogram
Prepared by Trịnh Ngọc Nhâ n Scatter plot
Các chart khác như l Pie chart, Line chart, … các bn có thể coi kĩ hơn trong slides nh ! II) EXERCISE
An executive’s telephone log showed the following data for the length of 65 calls initiated during the last week of July. (a) Prepare a dot plot.
(b) Prepare a frequency distribution and histogram (you may either specify the bins yourself or use automatic bins).
(c) Describe the distribution, based on these displays 1 2 10 5 3 3 2 20 1 1 6 3 13 2 2 1 26 3 1 3 1 2 1 7 1 2 3 1 2 12 1 4 2 2 29 1 1 1 8 5 1 4 2 1 1 1 1 6 1 2 3 3 6 1 3 1 1 5 1 18 2 13 13 1 6
(Các bn check solution trong textbook, bài 3.29 nhé)