1
Bài 2
TRÌNH BÀY DỮ LIỆU
BẰNG BẢNG VÀ ĐỒ THỊ
Nội dung chính
I
TRÌNH BÀY
DỮ LIỆU
ĐƠN BIẾN
II
TRÌNH BÀY
DỮ LIỆU
ĐA BIẾN
III
ỨNG DỤNG
SPSS TRONG
TRÌNH BÀY
DỮ LIỆU
1
2
2/27/2025
2
Dữ liệu thu được qua điều tra
Tóm tắt trình bày dữ liệu
Tại sao cần phải tóm tắt trình bày dữ liệu?
Dữ liệu thu được qua điều tra được gọi dữ liệu 'thô’.
Dữ liệu thô thể bao gồm hàng nghìn, hàng triệu quan sát thường cung
cấp rất nhiều thông tin
không dễ sử dụng để ra các quyết định.
Cần phải tóm tắt trình bày dữ liệu.
3
4
2/27/2025
3
Tóm tắt trình bày dữ liệu
Mục đích
Cho biết đặc điểm chung của một tổng thể hoặc một mẫu nghiên cứu.
Yêu cầu
Tóm tắt dữ liệu loại bỏ các chi tiết nhưng phải cung cấp đặc điểm chung của
tổng thể hoặc mẫu nghiên cứu.
Thông tin được tóm tắt cần ngắn gọn nhưng phải phản ánh chính xác bản
chất của dữ liệu gốc
Tóm tắt trình bày dữ liệu
Nhiệm vụ
Tổ chức, sắp xếp dữ liệu theo một trật tự nhất định
Tính toán một số giá trị
Phương pháp
Bảng
Đồ thị
Các mức độ thống tả (bài 3)
Loại bảng hoặc đồ thị được sử dụng phụ thuộc vào biến được tóm tắt
5
6
2/27/2025
4
Trình bày dữ liệu đơn biến
Một số khái niệm bản
Trình bày dữ liệu định tính
Trình bày dữ liệu định lượng
Một số khái niệm bản
Bảng tần số phân phối, còn gọi y số phân phối (Frequency table)
ghi lại số lần xuất hiện của mỗi giá trị được trình y dưới dạng bảng.
Tần số (Frequency) số lần xuất hiện của mỗi giá trị nhất định hay số
quan sát được sắp xếp vào mỗi tổ tương ứng với một giá trị.
Khi lấy tần số của mỗi tổ chia cho tổng số quan sát, ta được tần suất của
tổ đó tính theo đơn vị lần (Relative frequency).
Khi lấy tần suất tính theo đơn v lần của mỗi tổ nhân với 100, ta được tần
suất tính theo đơn vị % hay còn gọi tỷ trọng của mỗi tổ trong tổng thể
hoặc mẫu nghiên cứu (Percent frequency).
7
8
2/27/2025
5
Trình bày dữ liệu định tính
FantaCocaCocaCocaCoca
CocaSpriteCoca ăn kiêngFantaCoca ăn kiêng
Coca ăn kiêngFantaCocaSpritePepsi
PepsiPepsiSpriteCocaCoca ăn kiêng
PepsiCoca ăn kiêngSpriteCoca ăn kiêngCoca
PepsiPepsiPepsiCocaCoca
PepsiCocaCocaCocaFanta
CocaCocaCocaSpriteCoca ăn kiêng
FantaCocaCocaCocaPepsi
PepsiPepsiPepsiCoca ăn kiêngPepsi
Ví dụ: Phỏng vấn 50 sinh viên về loại đồ uống ưa thích nhất.
Trình bày dữ liệu định tính
Tần sốLoại đồ uống
19Coca
8Coca ăn kiêng
5Fanta
13Pepsi
5Sprite
50Tổng số
Bảng tần số phân phối với dữ liệu định tính, còn gọi dãy số thuộc tính
Tần suất (%)Tần suất (lần)
380,38
160,16
100,10
260,26
100,10
1001
9
10
2/27/2025
6
Lưu ý
Khi mỗi biểu hiện (thuộc tính) của biến định tính hình thành một tổ: bảng
tần số phân phối giản đơn
Trong một số trường hợp, thể ghép một số biểu hiện đặc điểm
tương tự nhau vào trong ng một tổ.
Trình bày dữ liệu định tính
Đồ thị hình cột (Bar chart)
Một trục dùng để biểu diễn các thuộc tính cho từng tổ. Trục còn lại biểu diễn
tần số hoặc tần suất.
Mỗi thuộc tính được biểu diễn bằng một cột chiều rộng cố định, chiều cao
tương ứng với tần số hoặc tần suất của thuộc tính đó.
Các cột thường được tách ra để nhấn mạnh: mỗi tổ một nhóm riêng biệt.
Đồ thị hình tròn (Pie chart)
Vẽ một vòng tròn thường sử dụng tần suất (%) của các thuộc tính để chia
vòng tròn thành các phần tương ứng.
11
12
2/27/2025
7
Trình bày dữ liệu định tính
38
16
10
26
10
0
5
10
15
20
25
30
35
40
Coca Coca ăn
kiêng
Fanta Pepsi Sprite
Tần suất (%)
Loại đồ uống
38%
16%
10%
26%
10%
Coca
Coca ăn kiêng
Fanta
Pepsi
Sprite
Đồ thị hình cột Đồ thị hình tròn
Đồ thị phân phối
Trình bày dữ liệu định tính
Nên sử dụng đồ thị hình cột hay đồ thị hình tròn?
Chọn đồ thị trình bày thông tin hiệu quả nhất (‘Learning by doing’)
13
14
2/27/2025
8
Trình bày dữ liệu định lượng
Bảng tần số phân phối với dữ liệu định lượng, còn gọi dãy số
lượng biến: được sắp xếp theo trình tự biến động của lượng biến
Khi mỗi lượng biến hình thành 1 tổ: bảng tần số phân phối giản đơn.
Khi nhiều lượng biến cùng nằm trong 1 tổ: bảng tần số phân phối
khoảng cách tổ
Khoảng cách tổ bằng nhau
Khoảng cách tổ không bằng nhau
Bảng tần số phân phối giản đơn
Áp dụng với dữ liệu định lượng ít các lượng biến rời rạc.
dụ: số lượng đơn hàng đã thực hiện của 20 nhân viên giao hàng
Tiki trong 1 giờ đồng h như sau
7, 7, 10, 8, 5, 4, 5, 6, 4, 9, 8, 7, 6, 4, 8, 5, 7, 10, 10, 9
Xây dựng bảng tần số phân phối.
15
16
2/27/2025
9
Bảng tần số phân phối giản đơn
Sắp xếp d liệu theo thứ tự từ thấp đến cao
Xác định các t đếm số lượng nhân viên trong từng tổ đó.
Số nhân viênSố lượng đơn hàng
34
35
26
47
38
29
310
20Tổng số
Tn s
Bảng tần số phân phối khoảng cách tổ
Áp dụng với dữ liệu định lượng nhiều lượng biến rời rạc hoặc lượng biến
liên tục.
Kỹ thuật
Ghép một phạm vi lượng biến vào một t
Tại sao phải phân tổ khoảng cách tổ?
17
18
2/27/2025
10
Bảng tần số phân phối khoảng cách tổ
Các thuật ngữ:
Giới hạn dưới (lower class limit): giá trị thấp nhất trong một tổ
Giới hạn trên (upper class limit): giá trị cao nhất trong một tổ
Giới hạn dưới giới hạn trên của một tổ thường được làm tròn
Khoảng ch tổ (class width): phạm vi lượng biến của một tổ từ giới hạn
dưới đến giới hạn trên
Bảng tần số phân phối khoảng cách tổ
Các bước xây dựng
Sắp xếp d liệu theo thứ tự từ thấp đến cao
Xác định lượng biến lớn nhất, lượng biến nhỏ nhất khoảng biến thiên
của lượng biến (R)
R = Lượng biến lớn nhất lượng biến nh nhất
Xác định số t
Xác định khoảng ch tổ
Xác định giới hạn dưới của tổ đầu tiên
Xây dựng bảng tần số phân phối
19
20
2/27/2025
11
Bảng tần số phân phối khoảng cách tổ
bằng nhau
Xác định khoảng ch tổ bằng nhau
𝐡 𝐱𝐦𝐚𝐱 𝐱𝐦𝐢𝐧
𝐤
Trong đó:
h: khoảng cách t
x: giá trị của lượng biến lớn nhất
x: giá trị của lượng biến nhỏ nhất
k: số tổ định chia
Bảng tần số phân phối khoảng cách tổ
bằng nhau
dụ: số liệu về doanh số bình quân một tháng (triệu đồng) trong năm
2024 của 50 nhân viên trong một doanh nghiệp
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
21
22
2/27/2025
12
Bảng tần số phân phối khoảng cách tổ
bằng nhau
Giả sử, chia thành 6 tổ
Khoảng cách tổ: h = (109 - 52)/6 = 9,5 10
50-<60
60-<70
70-<80
80-<90
90-<100
100-110
Tng s
2
13
16
7
7
5
50
Doanh s nhân viênbq (Trđ) S
Gii h n
trên
Gii h n
dưới
Khoảng cách tổ
=60-50=1 0
Bảng tần số phân phối khoảng cách tổ
không bằng nhau
dụ: Lương bình quân tháng (triệu đồng) năm 2024 của 25 nhân viên
độ tuổi từ 25-30 trong một doanh nghiệp
Số nhân viênLương bq tháng (trđ)
45 - < 6
66 - < 8
68 - < 9
69 - < 12
312 - 15
25Tổng số
Mỗi tổ phản ánh sự khác biệt trong bản chất của d liệu
23
24
2/27/2025
13
Bảng tần số phân phối khoảng cách tổ mở
Tổ mở (open-ended class): tổ đầu tiên không giới hạn dưới và/hoặc tổ
cuối cùng không giới hạn trên
Thường sử dụng khi các dữ liệu đột xuất (outlier) (giá trị q thấp hoặc
quá cao) hoặc trong một số trường hợp không quá quan tâm đến các giá
trị nhỏ nhất hoặc lớn nhất của biến nghiên cứu.
Bảng tần số phân phối khoảng cách tổ mở
dụ: số liệu về mức thu nhập bình quân năm (triệu đồng) của 30
nhân viên trong một chi nhánh ngân hàng A năm 2024
361145654277202
1442406477457
429437362391310
216374221325176
282398274120480
209338303470153
25
26
2/27/2025
14
Bảng tần số phân phối khoảng cách tổ mở
Số nhân viênThu nhập (trđ)
2
<100
5
100 - <200
8
200 - <300
9
300 - <400
5
400 - <500
1
≥500
30
Tổng số
Tm, không
gii h n
dưới
Tm, không
gii hn trên
Câu hỏi
Tại sao giới hạn trên của tổ đứng trước thường trùng với giới hạn dưới của t
đứng sau?
Tính khoảng cách tổ của những tổ m như thế nào?
27
28
2/27/2025
15
Dãy số lượng biến tổng quát
𝒎𝒊=𝒇𝒊
𝒉𝒊
𝑺𝒊
𝒅𝒊=𝒇𝒊
∑𝒇𝒊 (𝟏𝟎𝟎)
𝒇𝒊𝒙𝒊
Mật độ phân phốiTần số tích lũyTần suấtTần sốLượng biến
Dùng để so sánh
các tần số khi
khoảng cách tổ
không bằng nhau
Là tần số cộng dồnLà tần số được biểu
hiện bằng số tương
đối (lần, %)
Là số lần xuất hiện
của lượng biến hoặc
số quan sát phân
phối vào mỗi tổ
Là biểu hiện bằng
số của biến định
lượng dùng để
phân tổ
m1S1= f1d1f1x1
mnSn = f + f + … + f1 2 ndnfnxn
𝒅
𝒊
𝒇
𝒊
Tổng
Dãy số lượng biến tổng quát: các tính
toán khác
Trị số giữa (Class midpoint) của một tổ: trung bình của giới hạn trên
giới hạn dưới của tổ đó.
Tần số tích lũy (Cummulative frequency) của một tổ: tổng tần số của tổ
đó các tổ trước đó, cho biết số lượng quan sát giá trị nhỏ hơn hoặc
bằng giới hạn trên của một tổ.
Tần suất tích lũy (Cummulative percent frequency) của một tổ (%): tổng
tần suất của tổ đó các tổ trước đó, cho biết phần trăm số quan sát
giá trị nhỏ n hoặc bằng giới hạn trên của một tổ.
29
30
Tr s gia = (Gii hn trên + Gii hn dưới) / 2
2/27/2025
16
Ví dụ
Tần suất tích
lũy (%)
Tần số tích
lũy
Tần suất (%)Tần sốTrị số giữaDoanh số bq
(Tr.đ)
42425550-<60
301526136560-<70
623132167570-<80
76381478580-<90
90451479590-<100
10050105100100-110
10050Tổng
38+7 76+147/50x100
(90+100)/2
Trình bày dữ liệu định lượng
Đồ thị phân phối với dữ liệu định lượng
Đồ thị điểm (Dot plot)
Biểu đồ tần số phân phối (Histogram)
Đa giác tần số (Polygon)
Đa giác tần số/tần suất tích lũy (Ogive)
Biểu đồ hộp (Box-plot) (Bài 3)
31
32
2/27/2025
17
Đồ thị điểm
Trục hoành biểu diễn biến động của các lượng biến.
Mỗi giá trị được thể hiện bằng một điểm trên trục.
50 60 70 80 90 100 11050 60 70 80 90 100 110
Doanh s (Tr.đ)Doanh s (Tr.đ)
. . . ..... .......... .. . .. . . ... . .. .. . . ..... .......... .. . .. . . ... . .. .
. .
. .. . . . . .. . . .
. .. .. .. .. . . . .. .. .. .. . .
Doanh s bình quân
Biểu đồ tần số phân phối
tả thông tin trong các bảng tần
số phân phối khoảng cách tổ
dưới dạng đồ thị
Chiều cao của cột biểu thị tần số
của mỗi tổ
Độ rộng của cột khoảng cách tổ
Các cột không tách rời dính
liền nhau.
22
44
66
88
1010
1212
1414
1616
1818
Doanh sbq
(trđ)
Doanh sbq
(trđ)
Tn sTn s
50 60 70 80 90 100-11050 60 70 80 90 100-110        
Doanh s bình quân
33
34
2/27/2025
18
Biểu đồ tần số phân phối
Tầm quan trọng của Histogram
Cho biết hình dáng phân phối của dữ liệu
Cho biết vị trí trung tâm của dữ liệu
Cho biết sự biến thiên của dữ liệu
Dùng để xác định dữ liệu đột xuất (outliers)
Hình dáng của Histogram
Đối xứng
Ví dụ: chiều cao cân nặng
Symmet ric
Frequency
2.41.60.80.0-0. 8-1.6-2.4
50
40
30
20
10
0
Histogr am of Sy mmetr ic
35
36
2/27/2025
19
Hình dáng của Histogram
Lệch trái
Ví dụ: điểm thi
Negative skew
Frequency
9.07.56.04.53.0
35
30
25
20
15
10
5
0
Histogram of Negative skew
Hình dáng của Histogram
Lệch phải
Ví dụ: giá nhà, thu nhập
Positive s ke w
Frequency
7 .56 .04 .53 .01 .50 .0
35
30
25
20
15
10
5
0
His to gr a m o f P o s itiv e s ke w
37
38
2/27/2025
20
Hình dáng của Histogram
Hai mốt
Ví dụ: điểm thi tiếng Anh
B im o d a l
Frequency
6 .04 .53 .01 .50 .0- 1 . 5
2 5
2 0
1 5
1 0
5
0
H is to g r a m o f B im oda l
Hình dáng của Histogram
Histogram với đường cong phân phối chuẩn
39
40

Preview text:

Bài 2 TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 1 Nội dung chính I II III TRÌNH BÀY TRÌNH BÀY ỨNG DỤNG DỮ LIỆU DỮ LIỆU SPSS TRONG ĐƠN BIẾN ĐA BIẾN TRÌNH BÀY DỮ LIỆU 2 1 2/27/2025
Dữ liệu thu được qua điều tra 3
Tóm tắt và trình bày dữ liệu
Tại sao cần phải tóm tắt và trình bày dữ liệu?
Dữ liệu thu được qua điều tra được gọi là dữ liệu 'thô’.
Dữ liệu thô có thể bao gồm hàng nghìn, hàng triệu quan sát và thường cung cấp rất nhiều thông tin
không dễ sử dụng để ra các quyết định.
Cần phải tóm tắt và trình bày dữ liệu. 4 2 2/27/2025
Tóm tắt và trình bày dữ liệu Mục đích
Cho biết đặc điểm chung của một tổng thể hoặc một mẫu nghiên cứu. Yêu cầu
Tóm tắt dữ liệu loại bỏ các chi tiết nhưng phải cung cấp đặc điểm chung của
tổng thể hoặc mẫu nghiên cứu.
Thông tin được tóm tắt cần ngắn gọn nhưng phải phản ánh chính xác bản chất của dữ liệu gốc 5
Tóm tắt và trình bày dữ liệu Nhiệm vụ
Tổ chức, sắp xếp dữ liệu theo một trật tự nhất định
Tính toán một số giá trị Phương pháp Bảng Đồ thị
Các mức độ thống kê mô tả (bài 3)
Loại bảng hoặc đồ thị được sử dụng phụ thuộc vào biến được tóm tắt 6 3 2/27/2025
Trình bày dữ liệu đơn biến
Một số khái niệm cơ bản
Trình bày dữ liệu định tính
Trình bày dữ liệu định lượng 7
Một số khái niệm cơ bản
Bảng tần số phân phối, còn gọi là Dãy số phân phối (Frequency table)
ghi lại số lần xuất hiện của mỗi giá trị và được trình bày dưới dạng bảng.
Tần số (Frequency) là số lần xuất hiện của mỗi giá trị nhất định hay là số
quan sát được sắp xếp vào mỗi tổ tương ứng với một giá trị.
Khi lấy tần số của mỗi tổ chia cho tổng số quan sát, ta được tần suất của
tổ đó tính theo đơn vị lần (Relative frequency).
• Khi lấy tần suất tính theo đơn vị lần của mỗi tổ nhân với 100, ta được tần
suất tính theo đơn vị % hay còn gọi là tỷ trọng của mỗi tổ trong tổng thể
hoặc mẫu nghiên cứu (Percent frequency). 8 4 2/27/2025
Trình bày dữ liệu định tính
Ví dụ: Phỏng vấn 50 sinh viên về loại đồ uống ưa thích nhất. Coca Coca Coca Coca Fanta Coca ăn kiêng Fanta Coca ăn kiêng Sprite Coca Pepsi Sprite Coca Fanta Coca ăn kiêng Coca ăn kiêng Coca Sprite Pepsi Pepsi Coca Coca ăn kiêng Sprite Coca ăn kiêng Pepsi Coca Coca Pepsi Pepsi Pepsi Fanta Coca Coca Coca Pepsi Coca ăn kiêng Sprite Coca Coca Coca Pepsi Coca Coca Coca Fanta Pepsi Coca ăn kiêng Pepsi Pepsi Pepsi 9
Trình bày dữ liệu định tính
Bảng tần số phân phối với dữ liệu định tính, còn gọi là dãy số thuộc tính Loại đồ uống Tần số Tần suất (lần) Tần suất (%) Coca 19 0,38 38 Coca ăn kiêng 8 0,16 16 Fanta 5 0,10 10 Pepsi 13 0,26 26 Sprite 5 0,10 10 Tổng số 50 1 100 10 5 2/27/2025 Lưu ý
Khi mỗi biểu hiện (thuộc tính) của biến định tính hình thành một tổ: bảng
tần số phân phối giản đơn
Trong một số trường hợp, có thể ghép một số biểu hiện có đặc điểm
tương tự nhau vào trong cùng một tổ. 11
Trình bày dữ liệu định tính
Đồ thị hình cột (Bar chart)
Một trục dùng để biểu diễn các thuộc tính cho từng tổ. Trục còn lại biểu diễn
tần số hoặc tần suất.
Mỗi thuộc tính được biểu diễn bằng một cột có chiều rộng cố định, chiều cao
tương ứng với tần số hoặc tần suất của thuộc tính đó.
Các cột thường được tách ra để nhấn mạnh: mỗi tổ là một nhóm riêng biệt.
Đồ thị hình tròn (Pie chart)
Vẽ một vòng tròn và thường sử dụng tần suất (%) của các thuộc tính để chia
vòng tròn thành các phần tương ứng. 12 6 2/27/2025
Trình bày dữ liệu định tính Đồ thị phân phối 40 38 35 30 26 25 10% Coca 20 16 38% Coca ăn kiêng T1 ầ 5 n suất (%) 26% 10 10 Fanta 10 Pepsi 5 Sprite 10% 16% 0 Coca Coca ăn Fanta Pepsi Sprite kiêng Loại đồ uống Đồ thị hình cột Đồ thị hình tròn 13
Trình bày dữ liệu định tính
Nên sử dụng đồ thị hình cột hay đồ thị hình tròn?
Chọn đồ thị trình bày thông tin hiệu quả nhất (‘Learning by doing’) 14 7 2/27/2025
Trình bày dữ liệu định lượng
Bảng tần số phân phối với dữ liệu định lượng, còn gọi là dãy số
lượng biến: được sắp xếp theo trình tự biến động của lượng biến
Khi mỗi lượng biến hình thành 1 tổ: bảng tần số phân phối giản đơn.
Khi nhiều lượng biến cùng nằm trong 1 tổ: bảng tần số phân phối có khoảng cách tổ
• Khoảng cách tổ bằng nhau
• Khoảng cách tổ không bằng nhau 15
Bảng tần số phân phối giản đơn
Áp dụng với dữ liệu định lượng có ít các lượng biến rời rạc.
Ví dụ: Có số lượng đơn hàng đã thực hiện của 20 nhân viên giao hàng
Tiki trong 1 giờ đồng hồ như sau
7, 7, 10, 8, 5, 4, 5, 6, 4, 9, 8, 7, 6, 4, 8, 5, 7, 10, 10, 9
• Xây dựng bảng tần số phân phối. 16 8 2/27/2025
Bảng tần số phân phối giản đơn
Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
Xác định các tổ và đếm số lượng nhân viên trong từng tổ đó. Số lượng đơn hàng Số nhân viên 4 3 Tần số 5 3 6 2 7 4 8 3 9 2 10 3 Tổng số 20 17
Bảng tần số phân phối có khoảng cách tổ
Áp dụng với dữ liệu định lượng có nhiều lượng biến rời rạc hoặc lượng biến liên tục. Kỹ thuật
• Ghép một phạm vi lượng biến vào một tổ
Tại sao phải phân tổ có khoảng cách tổ? 18 9 2/27/2025
Bảng tần số phân phối có khoảng cách tổ Các thuật ngữ:
• Giới hạn dưới (lower class limit): giá trị thấp nhất trong một tổ
• Giới hạn trên (upper class limit): giá trị cao nhất trong một tổ
→ Giới hạn dưới và giới hạn trên của một tổ thường được làm tròn
• Khoảng cách tổ (class width): phạm vi lượng biến của một tổ từ giới hạn
dưới đến giới hạn trên 19
Bảng tần số phân phối có khoảng cách tổ Các bước xây dựng
• Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
• Xác định lượng biến lớn nhất, lượng biến nhỏ nhất và khoảng biến thiên của lượng biến (R)
R = Lượng biến lớn nhất – lượng biến nhỏ nhất • Xác định số tổ
• Xác định khoảng cách tổ
• Xác định giới hạn dưới của tổ đầu tiên
• Xây dựng bảng tần số phân phối 20 10 2/27/2025
Bảng tần số phân phối có khoảng cách tổ bằng nhau
Xác định khoảng cách tổ bằng nhau
𝐡 ≈ 𝐱𝐦𝐚𝐱 − 𝐱𝐦𝐢𝐧 𝐤 Trong đó: h: khoảng cách tổ
x: giá trị của lượng biến lớn nhất
x: giá trị của lượng biến nhỏ nhất k: số tổ định chia 21
Bảng tần số phân phối có khoảng cách tổ bằng nhau
Ví dụ: Có số liệu về doanh số bình quân một tháng (triệu đồng) trong năm
2024 của 50 nhân viên trong một doanh nghiệp 91 78 93 57 75 52 99 80 97 62 71 69 72 89 66 75 79 75 72 76 104 74 62 68 97 105 77 65 80 109 85 97 88 68 83 68 71 69 67 74 62 82 98 101 79 105 79 69 62 73 22 11 2/27/2025
Bảng tần số phân phối có khoảng cách tổ bằng nhau
Giả sử, chia thành 6 tổ
Khoảng cách tổ: h = (109 - 52)/6 = 9,5 ≈ 10 Doanh sốbq (Trđ) Sốnhân viên Khoảng cách tổ 50-<60 2 =60-50=10 60-<70 13 Giới hạn 70-<80 16 trên 80-<90 7 90-<100 7 Giới hạn 100-110 5 dưới Tổng số 50 23
Bảng tần số phân phối có khoảng cách tổ không bằng nhau
Ví dụ: Lương bình quân tháng (triệu đồng) năm 2024 của 25 nhân viên có
độ tuổi từ 25-30 trong một doanh nghiệp Lương bq tháng (trđ) Số nhân viên 5 - < 6 4 6 - < 8 6 8 - < 9 6 9 - < 12 6 12 - 15 3 Tổng số 25
Mỗi tổ phản ánh sự khác biệt trong bản chất của dữ liệu 24 12 2/27/2025
Bảng tần số phân phối có khoảng cách tổ mở
Tổ mở (open-ended class): tổ đầu tiên không có giới hạn dưới và/hoặc tổ
cuối cùng không có giới hạn trên
Thường sử dụng khi có các dữ liệu đột xuất (outlier) (giá trị quá thấp hoặc
quá cao) hoặc trong một số trường hợp không quá quan tâm đến các giá
trị nhỏ nhất hoặc lớn nhất của biến nghiên cứu. 25
Bảng tần số phân phối có khoảng cách tổ mở
Ví dụ: Có số liệu về mức thu nhập bình quân năm (triệu đồng) của 30
nhân viên trong một chi nhánh ngân hàng A năm 2024 202 277 654 145 361 457 77 64 240 144 310 391 362 437 429 176 325 221 374 216 480 120 274 398 282 153 470 303 338 209 26 13 2/27/2025
Bảng tần số phân phối có khoảng cách tổ mở Thu nhập (trđ) Số nhân viên <100 2 100 - <200 5 Tổmở, không ạ 200 - <300 có giới h n 8 dưới 300 - <400 9 400 - <500 5 ≥500 1 Tổng số 30 Tổmở, không có giới hạn trên 27 Câu hỏi
Tại sao giới hạn trên của tổ đứng trước thường trùng với giới hạn dưới của tổ đứng sau?
Tính khoảng cách tổ của những tổ mở như thế nào? 28 14 2/27/2025
Dãy số lượng biến tổng quát 𝒙𝒊 𝒇𝒊 𝒅𝒊=𝒇𝒊 𝑺𝒊 𝒎𝒊=𝒇𝒊 ∑𝒇𝒊 (𝟏𝟎𝟎) 𝒉𝒊 Lượng biến Tần số Tần suất Tần số tích lũy Mật độ phân phối Là biểu hiện bằng Là số lần xuất hiện
Là tần số được biểu Là tần số cộng dồn Dùng để so sánh số của biến định của lượng biến hoặc hiện bằng số tương các tần số khi lượng dùng để số quan sát phân đối (lần, %) khoảng cách tổ phân tổ phối vào mỗi tổ không bằng nhau x1 f1 d1 S1= f1 m1 … … … … … xn fn dn Sn = f1+ f2+ … + fn mn Tổng 𝒅𝒊  𝒇𝒊 29
Trị số giữa = (Giới hạn trên + Giới hạn dưới) / 2
Dãy số lượng biến tổng quát: các tính toán khác
Trị số giữa (Class midpoint) của một tổ: là trung bình của giới hạn trên và
giới hạn dưới của tổ đó.
Tần số tích lũy (Cummulative frequency) của một tổ: là tổng tần số của tổ
đó và các tổ trước đó, cho biết số lượng quan sát có giá trị nhỏ hơn hoặc
bằng giới hạn trên của một tổ.
Tần suất tích lũy (Cummulative percent frequency) của một tổ (%): là tổng
tần suất của tổ đó và các tổ trước đó, cho biết phần trăm số quan sát có
giá trị nhỏ hơn hoặc bằng giới hạn trên của một tổ. 30 15 2/27/2025 Ví dụ Doanh số bq Trị số giữa Tần số Tần suất (%) Tần số tích Tần suất tích (Tr.đ) lũy lũy (%) 50-<60 55 2 4 2 4 60-<70 65 13 26 15 30 70-<80 75 16 32 31 62 80-<90 85 7 14 38 76 90-<100 95 7 14 45 90 100-110 100 5 10 50 100 Tổng 50 100 (90+100)/2 7/50x100 38+7 76+14 31
Trình bày dữ liệu định lượng
Đồ thị phân phối với dữ liệu định lượng
• Đồ thị điểm (Dot plot)
• Biểu đồ tần số phân phối (Histogram)
• Đa giác tần số (Polygon)
• Đa giác tần số/tần suất tích lũy (Ogive)
• Biểu đồ hộp (Box-plot) (Bài 3) 32 16 2/27/2025 Đồ thị điểm
• Trục hoành biểu diễn biến động của các lượng biến.
• Mỗi giá trị được thể hiện bằng một điểm trên trục. Doanh sốbình quân . . .. . . . . .. .. .. .. . .
. . . ..... .......... .. . .. . . ... . .. . 50 60 70 80 90 50 100 60 70 8 1 0 1 9 0 0 100 110 Doanh Doanh s s ố ố (Tr.đ) (Tr.đ) 33
Biểu đồ tần số phân phối Doanh sốbình quân 18 1
• Mô tả thông tin trong các bảng tần
số phân phối có khoảng cách tổ 16 1 dưới dạng đồ thị 14 1
• Chiều cao của cột biểu thị tần số 12 1 của mỗi tổ 10 1 Tần số Tần s
• Độ rộng của cột là khoảng cách tổ 8 6
• Các cột không tách rời mà dính liền nhau. 4 2 Do D a o n a h n số s bq b (t ( r t đ r ) đ 505 0    6  0  6 0    7  0  7 0    8  0  8 0    9  0  9 0    1  0  0- 1 1 0 1 0 0 -110 34 17 2/27/2025
Biểu đồ tần số phân phối
Tầm quan trọng của Histogram
• Cho biết hình dáng phân phối của dữ liệu
• Cho biết vị trí trung tâm của dữ liệu
• Cho biết sự biến thiên của dữ liệu
• Dùng để xác định dữ liệu đột xuất (outliers) 35 Hình dáng của Histogram Đối xứng
Ví dụ: chiều cao và cân nặng Histogr am of Symmetr ic 50 40 30 Freq 20 uency 10 0 -2.4 -1.6 -0.8 0.0 0.8 1.6 2.4 Sy mme t ric 36 18 2/27/2025 Hình dáng của Histogram Lệch trái Ví dụ: điểm thi Histogram of Negative skew 35 30 25 20 15 Frequency 10 5 0 3.0 4.5 6.0 7.5 9.0 Negat ive skew 37 Hình dáng của Histogram Lệch phải
Ví dụ: giá nhà, thu nhập
Hi s to gr a m o f P o s iti v e s ke w 35 30 25 20 15 Frequency 10 5 0 0 .0 1 .5 3 .0 4 .5 6 .0 7 .5 P o s it iv e s ke w 38 19 2/27/2025 Hình dáng của Histogram Hai mốt
Ví dụ: điểm thi tiếng Anh H is to gr a m o f B im oda l 2 5 2 0 1 5 Freq 1 u 0ency 5 0 - 1 .5 0 .0 1 .5 3 .0 4 .5 6 .0 B im o d a l 39 Hình dáng của Histogram
Histogram với đường cong phân phối chuẩn 40 20