








Preview text:
Bài 2
1. Trình bày dữ liệu đơn biến (mô tả cho 1 biến)
TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ
(Ch.2 + Ch.4 – Thống kê trong KT&KD) 1.1. Bảng 1 2 Trình bày dữ Trình bày dữ liệu đơn biến liệu đa biến 1.2. Đồ thị 1 2 1 2 1.1. Bảng
a) Bảng tần số phân phối giản đơn
Bảng tần số phân phối:
• Phạm vi áp dụng:
• Tần số (Frequency): là số lần xuất hiện một • Biến định tính
giá trị lượng biến cụ thể nào đó
• Biến rời rạc có ít giá trị
• Bảng tần số phân phối liệt kê số lần xuất
hiện của các giá trị lượng biến dưới dạng bảng • Kỹ thuật:
• Mỗi giá trị/biểu hiện khác
• Các loại bảng tần số phân phối:
nhau của biến được xem
a) Bảng tần số phân phối giản đơn. là một tổ (class/group).
b) Bảng tần số phân phối có khoảng cách
• Đếm số lượng quan sát rơi tổ.
vào từng tổ để có tần số. 3 4 3 4 Page 1
a) Bảng tần số phân phối giản đơn
b) Bảng tần số phân phối có khoảng cách tổ
• Bảng tần số phân phối về các
• Bảng tần số phân phối về Số
• Phạm vi áp dụng:
loại xe được bán ra tại
lượng xe mà KH đã mua trước
§ Biến rời rạc có nhiều giá trị Applewood Auto Group đó § Biến liên tục Số lượng xe mà KH
• Kỹ thuật: ghép một phạm vi Loại xe
Số lượng (Tần số) đã mua trước đó Số KH (Lượng biến) (Tần số)
lượng biến vào một tổ (phân Sedan 72
chia nhóm dữ liệu định lượng 0 61 SUV 54 thành các tổ khác nhau) 1 75 Compact 27 2 29
• Lý do tiến hành phân tổ với khoảng cách tổ? Truck 18 3 10 Hybrid 9 4 5 Tổng 180 Tổng 180 5 6 5 6
b) Bảng tần số phân phối có khoảng cách tổ
Bảng tần số phân phối có khoảng cách tổ bằng nhau
• VD: Bảng tần số phân phối về lợi nhuận ($) của Applewood Auto Group. Các loại: Lợi nhuận ($)
• Bảng tần số có khoảng cách tổ bằng nhau (Lượng biến)
Các bước xây dựng: Tần số 200 – dưới 600 8
- Xác định số tổ (k): tham khảo quy tắc 2k
• Bảng tần số có khoảng cách tổ không bằng nhau 600 - dưới 1000 11 (trang 27) 1000 - dưới 1400 23
- Xác định khoảng cách tổ 1400 - dưới 1800 38
- Lựa chọn giới hạn của các tổ 1800 - dưới 2200 45
- Sắp xếp các đơn vị vào từng tổ và xác 2200 - dưới 2600 32
định số đơn vị của các tổ. 2600 - dưới 3000 19 3000 - dưới 3400 4 Tổng 180 7 8 7 8 Page 2
Bảng tần số phân phối có khoảng cách tổ bằng nhau
Bảng tần số phân phối có khoảng cách tổ không bằng nhau
• VD: Bảng tần số phân phối về lợi nhuận ($) của Applewood Auto Group.
• VD: Bảng tần số phân phối tiền lương (USD). Lợi nhuận ($)
Một số thuật ngữ: (Lượng biến) Tần số Tiền lương (USD)
Tần số (Số người)
- Giới hạn dưới (ghd): giá trị thấp nhất của một tổ. 200 – dưới 600 8 Dưới 200 8
ü Tại sao cần phân tổ với khoảng
- Giới hạn trên (ght): giá trị cao nhất của một tổ. 600 - dưới 1000 11 200 – dưới 500 15
cách tổ không bằng nhau?
- Khoảng cách tổ (KCT): phạm vi lượng biến của 1000 - dưới 1400 23 một tổ từ ghd đến ght 500 – dưới 1000 32
ü Tính khoảng cách của những 1400 - dưới 1800 38 - Trị số giữa 1.000 – dưới 2000 40 tổ mở như thế nào? 1800 - dưới 2200 45 2200 - dưới 2600 32 2.000 – 5000 22
Phân tổ với KCT mở: 2600 - dưới 3000 19 5.000 trở lên 5 - Thế nào là tổ mở? 3000 - dưới 3400 4 Tổng cộng 122
- Trường hợp dùng tổ mở. Tổng 180 9 10 9 10
Bảng tần số phân phối: một số thuật ngữ
Tần suất, Tần số/Tần suất tích luỹ
• Dãy số phân phối còn có tên gọi là dãy số thuộc tính (phân tổ theo
biến định tính) và dãy số lượng biến (phân tổ theo biến định lượng).
Lượng biến (Xi) Trị số giữa Tần số (fi)
tần số tích Tần suất (pi) tần suất tích (xi) lũy lũy < $100 50 2 2 6.7 6.7 Loại xe Số lượng xe mà KH $100 – < $200 150 5 7 16.7 23.3 (Thuộc tính)
Số lượng (Tần số) đã mua trước đó Số KH $200 – <$300 250 8 15 26.7 50.0 (Lượng biến) (Tần số) Sedan 72 0 61 $300 – <$400 350 9 24 30.0 80.0 SUV 54 1 75 $400 – <$500 450 5 29 16.7 96.7 Compact 27 2 29 $500 – <$600 550 1 30 3.3 100.0 Truck 18 3 10 Total 30 Hybrid 9 4 5
ØLưu ý: có thể sử dụng mật độ phân phối (mi=fi/KCTi) khi KCT không bằng nhau. Tổng 180 Tổng 180 11 12 11 12 Page 3
Tần suất, Tần số/Tần suất tích luỹ 1.2. Đồ thị
Lợi nhuận khi bán xe tại Applewood
• Công cụ cho biến định tính và biến rời rạc ít giá trị: Lợi nhuận ($)
• Biểu đồ hình cột giản đơn / Simple bar charts (Lượng biến) Tần số Tần số tích luỹ Tần suất
Tần suất tích luỹ
• Biểu đồ hình tròn / Pie charts 200 – dưới 600 8 8 4.4 4.4 600 - dưới 1000 11 19 6.1 10.6
• Công cụ cho biến liên tục và biến rời rạc nhiều giá trị: 1000 - dưới 1400 23 42 12.8 23.3
• Biểu đồ tần số phân phối / Histograms 1400 - dưới 1800 38 80 21.1 44.4 • Đa giác tần số 1800 - dưới 2200 45 125 25 69.4 2200 - dưới 2600 32 157 17.8 87.2
• Biểu đồ hộp / Boxplots (Bài 3) 2600 - dưới 3000 19 176 10.6 97.8 3000 - dưới 3400 4 180 2.2 100 Tổng 180 100 13 14 13 14
Biểu đồ hình cột giản đơn
Biểu đồ hình tròn
ü Một trục (thường là trục hoành – trục X) biểu diễn các thuộc tính/biểu hiện của biến.
Phần trăm các loại xe được bán ra
ü Trục còn lại (thường là trục tung – trục Y) biểu diễn tần số, tần suất hoặc tỷ lệ 5
ü Sử dụng biểu đồ tròn khi muốn
xuất hiện của từng thuộc tính/biểu hiện. 10
mô tả, so sánh tỉ lệ % xuất hiện 40
của các thuộc tính/lượng biến.
Số lượng xe bán ra phân theo loại xe (Tần số)
Phần trăm các loại xe bán ra (Tần suất) 15 45 80 72 40 40
ü Biểu đồ tròn “thường” mô tả tần 70 35 60 54 30 suất. 30 50 25 40 20 30 27 15 30 15 18 10 20 10 9 5 Sedan SUV Compact Truck Hybrid 10 5 0 0 S eda n S UV Co mp ac t Tr uc k Hyb rid S eda n S UV Co mp ac t Tr uc k Hyb rid 15 16 15 16 Page 4
Biểu đồ cột & Biểu đồ hình tròn
Biểu đồ tần số phân phối/Histogram
üCùng một thông tin (tần số hoặc tần suất) có thể được biểu diễn bằng biểu đồ cột hoặc biểu đồ tròn.
• Sử dụng cho dữ liệu định lượng (biến
rời rạc có nhiều giá trị và biến liên tục).
üViệc lựa chọn loại biểu đồ phụ thuộc vào mục đích nhấn mạnh và ngữ cảnh trình bày.
• BIỂU ĐỒ TẦN SỐ PHÂN PHỐI: Một
biểu đồ trong đó giới hạn các tổ được
Phần trăm các loại xe được bán ra
Phần trăm các loại xe được bán ra
trình bày trên trục hoành và tần số tổ (Tần suất) (Tần suất)
trên trục tung. Tần số của tổ được biểu 45 5 40
thị bằng chiều cao của các cột và vẽ 10 40 liền nhau. 35 30 30 40 15 25 20
• Ví dụ: Biểu đồ tần số phân phối về lợi 15 15 10
nhuận của 180 chiếc xe ô tô ở 10 5 Applewood Auto Group 5 30 0 S eda n S UV Co mp ac t Tr uc k Hyb rid S eda n S UV Co mp ac t Tr uc k Hyb rid 17 18 17 18
Hình dạng của Histogram: đối xứng
Hình dạng của Histogram: lệch phải
-'.%/0&1#2/32!"##$%&'( )&
2$#%"P,45("6(!"#$%$&'(#F'* '# #& '% )# *& )% F&$*H$,(" !& H,'-.'/01 (# (% $& # & (!"# ($"% (&"' &"& &"' $"% !"# % %"% ("# '"% &"# $"% !"# !"##$%&'( !"#$%$&'(#F'* 19 20 19 20 Page 5
Hình dạng của Histogram – lệch trái
Hình dạng của Histogram – hai đỉnh (bimodal) 0"12$3F$54!"#$B&'
3&F%4#-$5(46(!"#$%&'"(F*"H )% (% (# )# )% '% )# (F*H,*-./ '# ,-"./"0N2 *% *# % % # ('"% #"# '"% &"# $"% !"# # !"#$B&' ("# '"% &"# $"% !"# !"#$%&'"(F*"H 21 22 21 22 Đa giác tần số Đa giác tần số Tần số
• Đa giác tần số bao gồm
các đoạn thẳng nối tất cả 50
giao điểm của tần số và trị 45 số giữa của tổ. 40
• Đa giác tần số cũng cho 35
thấy hình dạng của phân 30 phối. 25 20 15
• VD: Đa giác tần số về lợi 10
nhuận của 180 chiếc xe ô 5 tô bán ra trong tháng ở 0 Applewood Auto Group 0 400 800
1200 1600 2000 2400 2800 3200 3600 23 24 23 24 Page 6
Đường cong tần số/tần suất tích luỹ
2. Trình bày dữ liệu đa biến (Trình bày dữ liệu mô tả mối liên hệ)
Cách vẽ đường cong tần số/tần suất tích luỹ:
• Công cụ cho biến định tính và biến rời rạc ít giá trị: ü
Trục X biểu diễn giới hạn trên của • Bảng dữ liệu chéo mỗi tổ,
• Biểu đồ nhiều thanh (Biểu đồ cột ghép) ü
Trục Y biểu diễn tần số/tần suất tích lũy.
Ví dụ: Vẽ đường cong tần số tích luỹ thể
hiện phân phối về lợi nhuận thu được tại
• Công cụ cho biến rời rạc có nhiều giá trị và biến liên tục: Applewood • Biểu đồ phân tán 25 26 25 26
Bảng dữ liệu chéo (Cross-table)
Bảng dữ liệu chéo (Cross-table) (Bảng tiếp liên) (Bảng tiếp liên)
• Bảng dữ liệu chéo là công cụ thống kê dùng để trình bày mối quan hệ giữa hai biến
• VD: Bảng dữ liệu chéo phản ánh mối liên hệ giữa bằng cấp và sử dụng
định tính hoặc biến rời rạc với ít giá trị. internet
• Không dùng cho biến liên tục/biến rời rạc có nhiều giá trị (trừ khi đã phân tổ thành Có dùng internet? Có Không Tổng nhóm). Số lượng 208 31 239
• Bảng dữ liệu chéo thể hiện số quan sát (tần số) cho từng tổ hợp giá trị của hai biến. Phần trăm theo dòng 87.0% 13.0% 100.0% Bằng cấp Bằng cấp 2 Số lượng 409 298 707
• Giúp nhìn thấy sự phân phối chéo và mối liên hệ tiềm năng giữa hai biến. Bằng cấp 3 Phần trăm theo dòng 57.9% 42.1% 100.0% • Cấu trúc bảng Số lượng 113 321 434
• Hàng: Giá trị của biến thứ nhất. Cao đẳng trở lên Phần trăm theo dòng 26.0% 74.0% 100.0%
• Cột: Giá trị của biến thứ hai. Số lượng 730 650 1380
• Ô giao nhau: Số quan sát thuộc tổ hợp giá trị tương ứng (tần số).
Phần trăm theo dòng 52.9% 47.1% 100.0%
• Có thể thêm Tần suất (%) trong ô để dễ so sánh. Tổng 27 28 27 28 Page 7
Biểu đồ nhiều thanh Biểu đồ phân tán 45 0 409
• BIỂU ĐỒ PHÂN TÁN được dùng để biểu diễn mỗi liên hệ giữa 2 biến định 40 0 lượng. 35 0 321
• Để vẽ biểu đồ phân tán, cần có thông tin về 2 biến. Trong đó, một biến được 298 30 0
biểu diễn trên trục hoành (trục X) và biến còn lại ở trục tung (trục Y). 25 0 208 20 0 15 0 113 10 0 50 31 0 Bằng cấp 2 Bằng cấp 3 Cao đằng trở lên Có dùn g internet Không dùng internet 29 30 29 30 Biểu đồ phân tán
Ứng dụng SPSS trong lập bảng tần số phân phối giản đơn
• VÍ DỤ: Applewood Auto Group: Liệu có mối liên hệ nào giữa biến lợi nhuận thu
Analyze > Descriptive Statistics > Frequencies…
được từ việc bán một chiếc xe ô tô và tuổi của người mua không? Liệu có hợp lý
khi cho rằng người mua càng nhiều tuổi thì mức lợi nhuận thu được từ việc bán
Đưa biến cần lập bảng sang xe cho họ càng cao? Variable(s) Click vào OK 31 32 31 32 Page 8
Ứng dụng SPSS trong vẽ đồ thị
Ứng dụng SPSS trong lập bảng dữ liệu chéo
Analyze > Descriptive Statistics > Crosstabs…
Analyze > Descriptive Statistics > Frequencies…
Đưa biến cần vẽ đồ thị sang
Đưa biến độc lập vào Row(s) Variable(s)
Đưa biến phụ thuộc vào column(s) Click vào Charts
Click vào Cell để chọn tính % theo
Chọn loại đồ thị cần vẽ. dòng hoặc cột 33 34 33 34
Ứng dụng SPSS trong lập biểu đồ nhiều thanh
Graphs > Legacy Dialogs > Bar 35 35 Page 9