



















Preview text:
lOMoAR cPSD| 40342981
Chương 2. Một số phương pháp tóm tắt/trình bày dữ liệu
Một số phương pháp trình bày dữ liệu cho một biến lOMoAR cPSD| 40342981
Trình bày dữ liệu cho một biến
2a. Tóm tắt dữ liệu cho biến ịnh tính
2b. Tóm tắt dữ liệu cho biến ịnh lượng 2 lOMoAR cPSD| 40342981
2a. Tóm tắt dữ liệu cho biến ịnh tính • Phân phối tần số
• Phân phối tần số tương ối
• Phân phối tấn số phần trăm • Biểu ồ thanh • Biểu ồ Pareto • Biểu ồ hình tròn Phân phối tần số -1 lOMoAR cPSD| 40342981
Phân phối tần số là một bảng dùng ể tóm tắt/trình bày tần
số xuất hiện các giá trị quan sát cho mỗi loại hoặc lớp không trùng lắp. 4 lOMoAR cPSD| 40342981
Mục ích của bảng phân phối tần số là giúp ta có cái nhìn
sâu sắc về sự phân bố / xu thế của dữ liệu. Điều này không
thể thực hiện nếu dựa trên tập dữ liệu gốc. lOMoAR cPSD| 40342981 Phân phối tần số -2 Phân phối tần số -3 6 lOMoAR cPSD| 40342981
• Phân phối tần số của 50 khách hàng về việc mua
nước giải khát tại một tiệm bách hóa trong ngày.
Phân phối tần số tương ối lOMoAR cPSD| 40342981
Tần số tương ối của mỗi lớp là tỉ số của tần số mỗi lớp trên tổng các tần số. 8 lOMoAR cPSD| 40342981
Phân phối tần số tương ối là một bảng dùng để trình
bày tần số tương đối của mỗi lớp.
Phân phối tần số phần trăm
Tần số phần trăm của một lớp bằng tần số tương ối nhân với 100 . lOMoAR cPSD| 40342981
Phân phối tần số phần trăm là một bảng tóm tắt dữ
liệu, dùng ể trình bày tần số phần trăm cho mỗi lớp.
Bảng phân phối tần số tương ối và
phân phối tần số phần trăm 10 lOMoAR cPSD| 40342981 lOMoAR cPSD| 40342981 Biểu ồ thanh -1 12 lOMoAR cPSD| 40342981 lOMoAR cPSD| 40342981 Vẽ ồ thị thanh -1
• Đối với trục hoành, chúng ta biểu diễn/ trình bày các
nhãn/loại ại diện cho mỗi lớp.
• Đối với trục tung, ta biểu diễn về tần số, tần số tương
ối hoặc tần số phần trăm.
• Mỗi một thanh có chiều rộng cố ịnh ược biểu diễn cho mỗi
lớp và chúng ta có thể mở rộng chiều cao một cách thích hợp.
• Các thanh ược tách biệt ể nhấn mạnh thực tế rằng mỗi
lớp là một thể loại riêng biệt. Biểu ồ Pareto 14 lOMoAR cPSD| 40342981
• Khi các thanh (bars) ở biểu ồ thanh ược sắp
theo thứ tự giảm dần theo chiều cao từ trái
sang phải thì biểu ồ thanh ược gọi là biểu ồ Pareto. Biểu ồ hình tròn -1
Biểu ồ hình tròn là loại biểu ồ dùng ể trình bày phân phối
tần số tương ối hoặc phân phối tần số phần trăm ối với dữ liệu ịnh tính. lOMoAR cPSD| 40342981 Trước hết, vẽ một
ường tròn, sau ó dựa vào các tần số tương
ối ể chia ường tròn thành các phần mà mỗi phần tương tứng với
tần số tương ối của mỗi lớp. Biểu ồ hình tròn -1
Ví dụ: Từ bảng phân phối tần số sau ây, hãy vẽ biểu ồ tròn. 16 lOMoAR cPSD| 40342981 Biểu ồ hình tròn -2
2b. Tóm tắt dữ liệu cho biến ịnh lượng lOMoAR cPSD| 40342981
Phân phối tần số, phân phối tần số tương ối và phân
phối tần số phần trăm.
Phân phối tần số tích lũy; tần số phần tram tích lũy.
Histogram ( ồ thị tần số) Đồ thị thân-lá Đồ thị hộp.
Các bước xây dựng phân phối tần số: -1
• Bước 1. Xác ịnh số lớp/tổ/nhóm cần chia. 18 lOMoAR cPSD| 40342981
Bước 2. Xác ịnh chiều dài/ ộ rộng của lớp/tổ.
Bước 3. Xác ịnh các cận trên (giới hạn trên) và (giới
hạn dưới) của mỗi lớp/tổ.
Bước 4. Xây dựng các lớp/nhóm với ộ rộng bằng nhau.
Bước 5. Xác ịnh tần số mỗi lớp. Phân phối tần số -2
Bước 1: Cách tìm số tổ/lớp cần chia:
Gọi k là số tổ cần chia. Khi ó, với k nhỏ nhất sao cho
, trong ó n là số quan sát của tập dữ liệu (cỡ mẫu).
Bước 2: Tìm khoảng cách/ chiều rộng mỗi lớp: lOMoAR cPSD| 40342981 Chiều rộng của mỗi lớp ký hiệu là d và ược xác ịnh như sau: d xmax xmin , k
Trong ólần xmax , xmin lượt là giá trị lớn nhất và giá trị nhỏ nhất của tập dữ liệu.
Một vài lưu ý khi xây dựng bảng phân phối tần số
• Xác ịnh cận trên và cận dưới mỗi lớp/nhóm:
Các giới hạn của mỗi lớp phải được chọn sao cho mỗi giá trị
của quan sát thuộc về một và chỉ một lớp. 20