Lecture 3- Describing data visually - Statistics for Business | Trường Đại học Quốc tế, Đại học Quốc gia Thành phố HCM

Lecture 3- Describing data visually - Statistics for Business | Trường Đại học Quốc tế, Đại học Quốc gia Thành phố HCM được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

Prepared by Tr nh Ng c Nh ân
I) KEY CONCEPT
Cho b ảng data như sau:
7
9
10
10
10
10
11
11
11
12
13
13
13
14
14
15
16
16
16
16
17
17
18
18
19
19
20
20
21
21
22
23
24
26
26
27
28
31
37
37
38
42
50
59
Stem-and-leaf plot visualize data method:
Cách làm:
V STEMi : l đ y h ng ch c ra. Sau đ m s lưng s c h ng chc.
V LEAFi : gh p s h ng ch c vi ch s h ng đơn v
Vd: Thông qua phương pháp Stem y đư-and leaf plot, ta có th d dàng th c c 2 s c hng
ch c b ng 0, 24 s c hng ch c b ng 1, 11 s c h ng ch c b ng 2, 4 s c h ng ch c b ng
3. 1 s h ng ch c b ng 4, 2 s h ng ch c b ng 5
Dot plots
=> Mi n d u n m t 7- 59. M i ch m nh s i m t con s trong t p d li tương đương v
liu nhé ^^
Frequency Distribution: is a table formed by classifying n data values into k classes called
bins
+ bin limits: define the values to be included in each bin. ( . Vd: 20-25 tu i, 26-30 kho ng
tui, 31-35 tu i, ….)
=> PROBLEMS: chia d u th nh c c khoPhương pháp ny sẽ li á ảng đều nhau. Nhưng trên
th th li c t n n t nh ch t c không quan tâm đ a d u
Vd: l p 1,2,3,4,12,13 => 1 v 2 l m t nh m, 3 v 4 l m t nh m, l p 12 v i h đ c năm nht
1 nh m => Sai l ch v h c (Sai l ch t nh ch t c a d trnh độ liu)
Các c làm: bư
Prepared by Tr nh Ng c Nh ân
B1: Tìm giá tr l n nh t và giá tr nh nh t ca data (trong trường hp này là 7 và 59)
B2: Ch n s Bins theo công th c: k= 1+3.3*log(n) (n là s ng ph n t trong t p d u) lư li
Vd: k= 1+3.3*log(44)= 6.42 (bins). Các b n có th tùy ch n s bins là 6 ho u oke nha. ặc 7 đề
B3: Thi t l p Bins limit theo công th c
𝐵𝑖𝑛 𝑤𝑖𝑑𝑡ℎ =
𝑋𝑚𝑎𝑥 𝑋𝑚𝑖𝑛
𝑘
Trong trường hp này, Bin width = (59-7)/6 = 8.67
Vì con s l l u nên mình s làm tròn nó lên thành 10 nha. ny nhn hơi kh ch
B4: Đm s lưng d liu cho tng bins
B5: Thi t l p b ng
Histogram
Prepared by Tr nh Ng c Nh ân
Scatter plot
Các chart khác như l Pie chart, Line chart, … các b coi kĩ hơn trong slides nhn có th !
II) EXERCISE
An executive’s telephone log showed the following data for the length of 65 calls initiated
during the last week of July.
(a) Prepare a dot plot.
(b) Prepare a frequency distribution and histogram (you may either specify the bins yourself
or use automatic bins).
(c) Describe the distribution, based on these displays
1
2
10
3
2
6
3
13
2
26
1
2
1
1
3
1
4
2
29
1
1
4
2
1
1
3
3
6
3
1
2
13
13
6
(Các b n check solution trong textbook, bài 3.29 nhé)
| 1/3

Preview text:

Prepared by Trịnh Ngọc Nhâ n I) KEY CONCEPT Cho bảng data như sau: 7 9 10 10 10 10 11 11 11 12 13 13 13 14 14 15 16 16 16 16 17 17 18 18 19 19 20 20 21 21 22 23 24 26 26 27 28 31 37 37 38 42 50 59
Stem-and-leaf plot visualize data method: Cách làm: Vi STEM: l  y h ng ch đ c ra. Sau đ m s lưng s c  h ng chc.
Vi LEAF: ghp s 
h ng chc vi ch s hng đơn v
Vd: Thông qua phương pháp Stem-and leaf plot, ta có thể dễ dàng thy đưc c 2 s c hng
chc bng 0, 24 s c hng chc bng 1, 11 s c 
h ng chc bng 2, 4 s c  h ng chc bng 3. 1 s h  ng ch c
 bng 4, 2 s hng ch c  bng 5 Dot plots => Miền d
 liệu nm từ 7- 59. Mỗi chm nh s
ỏ ẽ tương đương vi m t ộ con s t  rong tập d  liệu nhé ^^
Frequency Distribution: is a table formed by classifying n data values into k classes called bins
+ bin limits: define the values to be included in each bin. (“ ả kho ” ng . Vd: 20-25 tu i  , 26-30 tui, 31-35 tui, ….) => PROBLEMS: c
Phương pháp ny sẽ hia d
 liệu thnh các khoảng đều nhau. Nhưng trên thc t th n
 không quan tâm đn tnh cht ca d l iệu
Vd: lp 1,2,3,4,12,13 => 1 v 2 l m t ộ nh m  , 3 v 4 l m t ộ nh m
 , lp 12 v đi hc năm nht
1 nhm => Sai lệch về trnh độ h c
 (Sai lệch tnh cht c a  d  liệu) Các bưc làm:
Prepared by Trịnh Ngọc Nhâ n
B1: Tìm giá tr ln nht và giá tr nh nh ỏ
t ca data (trong trường hp này là 7 và 59) B2: Chn s B
 ins theo công thức: k= 1+3.3*log(n) (n là s  lưng phần t t ử rong tập d liệu)
Vd: k= 1+3.3*log(44)= 6.42 (bins). Các bn có thể tùy ch n s  bi
 ns là 6 hoặc 7 đều oke nha.
B3: Thit lập Bins limit theo công th c ứ
𝑋𝑚𝑎𝑥 − 𝑋𝑚𝑖𝑛
𝐵𝑖𝑛 𝑤𝑖𝑑𝑡ℎ = 𝑘
Trong trường hp này, Bin width = (59-7)/6 = 8.67
Vì con s lẻ lẻ ny nhn hơi kh chu nên mình sẽ làm tròn nó lên thành 10 nha.
B4: Đm s lưng d liệu cho từng bins B5: Thit lập bảng Histogram
Prepared by Trịnh Ngọc Nhâ n Scatter plot
Các chart khác như l Pie chart, Line chart, … các bn có thể coi kĩ hơn trong slides nh ! II) EXERCISE
An executive’s telephone log showed the following data for the length of 65 calls initiated during the last week of July. (a) Prepare a dot plot.
(b) Prepare a frequency distribution and histogram (you may either specify the bins yourself or use automatic bins).
(c) Describe the distribution, based on these displays 1 2 10 5 3 3 2 20 1 1 6 3 13 2 2 1 26 3 1 3 1 2 1 7 1 2 3 1 2 12 1 4 2 2 29 1 1 1 8 5 1 4 2 1 1 1 1 6 1 2 3 3 6 1 3 1 1 5 1 18 2 13 13 1 6
(Các bn check solution trong textbook, bài 3.29 nhé)