lOMoARcPSD| 40342981
Chương 2. Một số phương pháp tóm
tt/trình bày dữ liệu
Một số phương pháp trình bày
dữ liệu cho một biến
lOMoARcPSD| 40342981
2
Trình bày dữ liệu cho một biến
2a. Tóm tắt dữ liệu cho biến ịnh nh
2b. Tóm tắt dữ liệu cho biến ịnh lượng
lOMoARcPSD| 40342981
2a. Tóm tt dữ liệu cho biến
ịnh nh
Phân phối tần số
Phân phối tần số tương ối
Phân phối tấn số phần trăm
Biu ồ thanh
Biu ồ Pareto
Biu ồ hình tròn
Phân phối tần số
-1
lOMoARcPSD| 40342981
4
Phân phối tần số là một bảng dùng ể tóm tắt/trình bày tần
số xuất hiện các giá trị quan sát cho mỗi loại hoặc lớp không
trùng lắp.
lOMoARcPSD| 40342981
Mục ích của bảng phân phối tần số là giúp ta có cái nhìn
sâu sắc về sự phân bố / xu thế của dữ liệu. Điều này không
thể thực hiện nếu dựa trên tập dữ liệu gốc.
lOMoARcPSD| 40342981
6
Phân phối tần số -2
Phân phối tần số
-3
lOMoARcPSD| 40342981
Phân phối tần số của 50 khách hàng về việc mua
ớc giải khát tại một ệm bách hóa trong ngày.
ối
lOMoARcPSD| 40342981
8
Tần số tương ối của mỗi lớp là tỉ số của tần số mỗi lớp
trên tổng các tần số.
lOMoARcPSD| 40342981
Phân phối tần số tương ối là một bảng dùng để trình
y tần số tương đối của mỗi lớp.
Phân phối tần số phần trăm
Tần số phần trăm của một lớp bằng tần số tương
ối nhân với 100 .
lOMoARcPSD| 40342981
10
Phân phối tần số phần trăm là một bảng tóm tt dữ
liệu, dùng ể trình bày tần số phần trăm cho mỗi lớp.
Bảng phân phối tần số tương ối và
phân phối tần số phần trăm
lOMoARcPSD| 40342981
lOMoARcPSD| 40342981
12
Biểu ồ thanh -1
lOMoARcPSD| 40342981
lOMoARcPSD| 40342981
14
V
thị thanh -1
Đối với trục hoành, chúng ta biểu diễn/ trình y các
nhãn/loại ại diện cho mỗi lớp.
Đối với trục tung, ta biểu diễn về tần số, tần số tương
ối hoặc tần số phần trăm.
Mỗi một thanh chiều rộng cịnh ược biểu diễn cho mỗi
lớp chúng ta có thmở rộng chiều cao một cách thích
hợp.
Các thanh ược tách biệt nhấn mạnh thực tế rằng mỗi
lớp là một thể loại riêng biệt.
Biểu
ồ Pareto
lOMoARcPSD| 40342981
Khi các thanh (bars) biu thanh ược sắp
theo thứ tự giảm dần theo chiều cao ttrái
sang phải thì biểu ồ thanh ược gọi là biểu
Pareto.
Biểu
ồ hình tròn
-1
Biu ồ hình tròn là loại biểu dùng ể trình bày phân phối
tần số tương ối hoc phân phối tần số phần trăm ối với dữ
liệu ịnh nh.
lOMoARcPSD| 40342981
16
Trước hết, v một ường tròn, sau ó dựa vào các tn số tương
i ể chia ường tròn thành các phần mà mỗi phần tương tứng vi
tần số tương ối của mỗi lớp.
Biểu
ồ hình tròn -1
Ví dụ: Từ bảng phân phối tần số sau ây, hãy vẽ biu ồ tròn.
lOMoARcPSD| 40342981
Biểu
ồ hình tròn -2
2b. Tóm tt dữ liệu cho biến
ịnh lượng
lOMoARcPSD| 40342981
18
Phân phối tần số, phân phối tần số tương ối và phân
phối tần sphần trăm.
Phân phối tần số ch lũy; tần số phn tram ch lũy.
Histogram ( ồ thị tần số)
Đồ th thân-lá Đồ
thị hộp.
Các bước xây dựng phân phối tần số:
-1
ớc 1. Xác ịnh số lớp/tổ/nhóm cần chia.
lOMoARcPSD| 40342981
ớc 2. Xác ịnh chiều dài/ ộ rng của lớp/tổ.
ớc 3. Xác ịnh các cận trên (giới hạn trên) và (gii
hạn dưới) ca mỗi lớp/tổ.
ớc 4. y dựng các lớp/nhóm với rộng bằng nhau.
ớc 5. Xác ịnh tn số mỗi lớp.
Phân phối tần số
-2
ớc 1: Cách m số tổ/lớp cần chia:
Gọi k là số tổ cần chia. Khi ó, với k nhỏ nht sao cho
, trong ó n là số quan sát của tập dữ liệu (cỡ mẫu).
ớc 2: Tìm khoảng cách/ chiều rộng mỗi lớp:
lOMoARcPSD| 40342981
20
Chiều rộng của mi lớp hiệu d
và ược xác ịnh n sau:
Trong ólần lượt giá trlớn nhất và giá trị nh
nhất của tập dữ liệu.
Một vài lưu ý khi xây dựng bảng
phân phối tần số
Xác ịnh cận trên và cận dưới mỗi lớp/nhóm:
Các giới hạn của mỗi lớp phải được chọn sao cho mỗi giá trị
của quan sát thuộc về một và chỉ một lp.
d xmax xmin , k
xmax , xmin

Preview text:

lOMoAR cPSD| 40342981
Chương 2. Một số phương pháp tóm tắt/trình bày dữ liệu
Một số phương pháp trình bày dữ liệu cho một biến lOMoAR cPSD| 40342981
Trình bày dữ liệu cho một biến
2a. Tóm tắt dữ liệu cho biến ịnh tính
2b. Tóm tắt dữ liệu cho biến ịnh lượng 2 lOMoAR cPSD| 40342981
2a. Tóm tắt dữ liệu cho biến ịnh tính • Phân phối tần số
• Phân phối tần số tương ối
• Phân phối tấn số phần trăm • Biểu ồ thanh • Biểu ồ Pareto • Biểu ồ hình tròn Phân phối tần số -1 lOMoAR cPSD| 40342981
Phân phối tần số là một bảng dùng ể tóm tắt/trình bày tần
số xuất hiện các giá trị quan sát cho mỗi loại hoặc lớp không trùng lắp. 4 lOMoAR cPSD| 40342981
Mục ích của bảng phân phối tần số là giúp ta có cái nhìn
sâu sắc về sự phân bố / xu thế của dữ liệu. Điều này không
thể thực hiện nếu dựa trên tập dữ liệu gốc. lOMoAR cPSD| 40342981 Phân phối tần số -2 Phân phối tần số -3 6 lOMoAR cPSD| 40342981
• Phân phối tần số của 50 khách hàng về việc mua
nước giải khát tại một tiệm bách hóa trong ngày.
Phân phối tần số tương ối lOMoAR cPSD| 40342981
Tần số tương ối của mỗi lớp là tỉ số của tần số mỗi lớp trên tổng các tần số. 8 lOMoAR cPSD| 40342981
Phân phối tần số tương ối là một bảng dùng để trình
bày tần số tương đối của mỗi lớp.
Phân phối tần số phần trăm
Tần số phần trăm của một lớp bằng tần số tương ối nhân với 100 . lOMoAR cPSD| 40342981
Phân phối tần số phần trăm là một bảng tóm tắt dữ
liệu, dùng ể trình bày tần số phần trăm cho mỗi lớp.
Bảng phân phối tần số tương ối và
phân phối tần số phần trăm 10 lOMoAR cPSD| 40342981 lOMoAR cPSD| 40342981 Biểu ồ thanh -1 12 lOMoAR cPSD| 40342981 lOMoAR cPSD| 40342981 Vẽ ồ thị thanh -1
• Đối với trục hoành, chúng ta biểu diễn/ trình bày các
nhãn/loại ại diện cho mỗi lớp.
• Đối với trục tung, ta biểu diễn về tần số, tần số tương
ối hoặc tần số phần trăm.
• Mỗi một thanh có chiều rộng cố ịnh ược biểu diễn cho mỗi
lớp và chúng ta có thể mở rộng chiều cao một cách thích hợp.
• Các thanh ược tách biệt ể nhấn mạnh thực tế rằng mỗi
lớp là một thể loại riêng biệt. Biểu ồ Pareto 14 lOMoAR cPSD| 40342981
• Khi các thanh (bars) ở biểu ồ thanh ược sắp
theo thứ tự giảm dần theo chiều cao từ trái
sang phải thì biểu ồ thanh ược gọi là biểu ồ Pareto. Biểu ồ hình tròn -1
Biểu ồ hình tròn là loại biểu ồ dùng ể trình bày phân phối
tần số tương ối hoặc phân phối tần số phần trăm ối với dữ liệu ịnh tính. lOMoAR cPSD| 40342981 Trước hết, vẽ một
ường tròn, sau ó dựa vào các tần số tương
ối ể chia ường tròn thành các phần mà mỗi phần tương tứng với
tần số tương ối của mỗi lớp. Biểu ồ hình tròn -1
Ví dụ: Từ bảng phân phối tần số sau ây, hãy vẽ biểu ồ tròn. 16 lOMoAR cPSD| 40342981 Biểu ồ hình tròn -2
2b. Tóm tắt dữ liệu cho biến ịnh lượng lOMoAR cPSD| 40342981
Phân phối tần số, phân phối tần số tương ối và phân
phối tần số phần trăm.
Phân phối tần số tích lũy; tần số phần tram tích lũy.
Histogram ( ồ thị tần số) Đồ thị thân-lá Đồ thị hộp.
Các bước xây dựng phân phối tần số: -1
• Bước 1. Xác ịnh số lớp/tổ/nhóm cần chia. 18 lOMoAR cPSD| 40342981
Bước 2. Xác ịnh chiều dài/ ộ rộng của lớp/tổ.
Bước 3. Xác ịnh các cận trên (giới hạn trên) và (giới
hạn dưới) của mỗi lớp/tổ.
Bước 4. Xây dựng các lớp/nhóm với ộ rộng bằng nhau.
Bước 5. Xác ịnh tần số mỗi lớp. Phân phối tần số -2
Bước 1: Cách tìm số tổ/lớp cần chia:
Gọi k là số tổ cần chia. Khi ó, với k nhỏ nhất sao cho
, trong ó n là số quan sát của tập dữ liệu (cỡ mẫu).
Bước 2: Tìm khoảng cách/ chiều rộng mỗi lớp: lOMoAR cPSD| 40342981 Chiều rộng của mỗi lớp ký hiệu là d và ược xác ịnh như sau: d xmax xmin , k
Trong ólần xmax , xmin lượt là giá trị lớn nhất và giá trị nhỏ nhất của tập dữ liệu.
Một vài lưu ý khi xây dựng bảng phân phối tần số
• Xác ịnh cận trên và cận dưới mỗi lớp/nhóm:
Các giới hạn của mỗi lớp phải được chọn sao cho mỗi giá trị
của quan sát thuộc về một và chỉ một lớp. 20