



















Preview text:
BÀI 4 THỐNG KÊ MÔ TẢ
(Descriptive statistics)
❑ Thống kê mô tả là phương pháp liên quan đến việc tổ chức, tổng hợp và trình
bày số liệu thu thập được từ mẫu nghiên cứu hoặc tổng thể.
Dữ liệu thô: Thích loại nước ngọt
3 3 3 3 3 3 3 2 3 3 3 1 3 3 3 3 3 1 3 2 3 3 1 3 3 3 3 3 3 1
❑ Một trong những lý do chính sử dụng phương pháp thống kê là để tổng hợp và
mô tả dữ liệu, làm cho thông tin được trình bày rõ ràng hơn.
❖ Nội dung bài 4 - Thống kê mô tả
- Mô tả dưới dạng bảng
- Mô tả dưới dạng biểu đồ
- Mô tả độ tập trung biến
- Mô tả độ phân tán biến
I. Thống kê mô tả dưới dạng bảng
❑ Bảng phân phối tần suất: trình bày số lần xuất hiện của một hay nhiều giá
trị được quan sát trong mẫu hoặc tổng thể.
❑ Các kiểu bảng phân phối tần suất ✓ Thô (raw)
✓ Liên hệ (relative): tỉ lệ (proportion) và phần trăm (percent) ✓ Lũy tiến (cumulative)
❖ Phân phối tần suất
❑ Một số ký hiệu sử dụng trong tính toán phân phối tần suất
n = tổng số mẫu quan sát X = biến
i = giá trị (thành phần) của biến X
fi = tần suất quan sát của giá trị i
❑ Các thành phần (giá trị) của biến phải: ✓ Loại trừ lẫn nhau
✓ Bao phủ hết các trả lời
❖ Phân phối tần suất (tt)
❑ Bảng phân phối tần suất nên bao gồm:
✓ Tiêu đề mô tả nội dung của bảng ✓ Tên biến
✓ Nhãn giá trị cho các thành phần biến
✓ Tổng các quan sát của mẫu
✓ Khai báo nguồn dữ liệu
1. Bảng phân phối tần suất thô
Bảng 1. Loại nước ngọt ưa thích của sinh viên lớp TKXH Loại nước ngọt thích Số đếm được Tần suất (Tally) (Frequency) 1. Coca – Cola 4 4 2. Pepsi 2 2 3. Khác 24 24 Tổng (n) 30 30
Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
2. Bảng phân phối tần suất liên hệ
Bảng 2. Loại nước ngọt ưa thích của sinh viên lớp TKXH Loại nước ngọt thích Tần suất - fi Tỉ lệ - pi Phần trăm - %i (frequency) (proportion) (percent) 1. Coca – Cola 4 0,133 13,3 2. Pepsi 2 0,067 6,7 3. Khác 24 0,80 80,0 Tổng 30 1,0 100,0
Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
2. Bảng phân phối tần suất liên hệ (tt) ❑ Công thức: - Tần suất tỉ lệ 𝑓 𝑝 𝑖 𝑖 = ∑ = 1 𝑛 𝑝𝑖
n = tổng số mẫu quan sát - Tần suất phần trăm
i = giá trị (thành phần của biến)
fi = tần suất quan sát của giá trị i Τ 0 𝑓𝑖 0 ⅈ = X 100 ∑% ⅈ = 100 𝑛
3. Bảng phân phối tần suất lũy tiến
Bảng 3. Loại nước ngọt ưa thích của sinh viên lớp TKXH Loại nước ngọt thích Tần suất Phần trăm % lũy tiến (frequency) (percent) (cumulative) 1. Coca – Cola 4 13,3 13,3 2. Pepsi 2 6,7 20,0 3. Khác 24 80,0 100,0 Tổng 30 100,0
Nguồn: Khảo sát lớp học TKXH, tháng 11, 2007
4. Bảng phân phối tần suất cho biến có thang đo thứ bậc hocluc4 Hoc luc Tan suat Phan tram % luy tien Valid 1 Trung binh 9 30.0 30.0 2 Trung binh kha 11 36.7 66.7 3 Kha 9 30.0 96.7 4 Gioi 1 3.3 100.0 Total 30 100.0
Bảng: Học lực của sv lớp TKXH Học lực Tần suất
Phần trăm (%) % Luỹ tuyến 1. Trung bình 9 30,0 30,0 2. Trung bình khá 11 36,7 66,7 3. Khá 9 30,0 96,7 4.Giỏi 1 3,3 100,0 Tổng 30 100,0
Nguồn: khảo sát sv lớp TKXH, 12/2021
5. Bảng phân phối tần suất cho biến có thang đo khoảng cách – tỉ lệ
Bảng 5.1: Danh sách sinh viên lớp TK04 với điểm trung bình chung năm học SV Điểm TB SV Điểm TB SV Điểm TB 1 68 11 68 21 64 2 71 12 68 22 69 3 80 13 75 23 60 4 69 14 65 24 72 5 77 15 63 25 72 6 55 16 62 26 70 7 57 17 66 27 70 8 64 18 68 28 69 9 63 19 62 29 70 10 65 20 66 30 73
Nguồn: Khảo sát lớp học TK04, tháng 11, 2007
Bảng 5.2: Phân bổ tần suất điểm trung bình chung năm học của SV lớp TK04 Điểm TB chung Tần suất Phần trăm (số sinh viên) 50 – 55 1 3,3 56 – 60 2 6,7 61 – 65 8 26,7 66 – 70 12 40,0 71 – 75 5 16,6 76 – 80 2 6,7 Tổng 30 100,0
Nguồn: Khảo sát lớp học TK04, tháng 11, 2007
II. Thống kê mô tả dưới dạng biểu đồ
❖ BIỂU ĐỒ PP TẦN SUẤT (Histogram)
Biểu đồ pp tần suất (còn được gọi là biểu đồ phân bố mật độ, biểu đồ cột): Dạng biểu đồ
cột cho thấy tần suất xuất hiện của mỗi giá trị khác nhau trong một tập dữ liệu. → Cho
thấy sự biến động của tập dữ liệu và dựa vào hình dạng biểu đồ có thể đưa ra kết luận về
tình trạng của dữ liệu
Biểu đồ: Quan niệm hạnh phúc gia đình của người dân Quy
Nhơn thuộc lĩnh vực đời sống cá nhân Có sức khỏe Có thời gian Có niềm tin
Đời sống tinh Làm được việc tốt
nghỉ ngơi, giải vào con người, thần, tâm linh có ý nghĩa trí xã hội yên ổn
Nguồn: Dữ liệu khảo sát chủ đề “Gia đình Việt Nam đương đại” của thực tập tốt nghiệp khóa
K23, khoa Xã hội học, trường KHXH&NV TPHCM tại thành phố Quy Nhơn tháng 10/2020
❖ BIỂU ĐỒ PP TẦN SUẤT (Histogram)
Biểu đồ: So sánh về mức độ quan trọng chia theo các chiều kích
Quan niệm hạnh phúc gia đình của người dân Quy Nhơn (%) 90 82 80,5 80 80 70 60 50 40 30 18 19,5 20 20 10 0
Đời sống kinh tế - vật chất
Các mối quan hệ gia đình – xã hội Đời sống các nhân Không quan trọng Quan trọng
Nguồn: Dữ liệu khảo sát chủ đề “Gia đình Việt Nam đương đại” của thực tập tốt nghiệp khóa
K23, khoa Xã hội học, trường KHXH&NV TPHCM tại thành phố Quy Nhơn tháng 10/2020 ❖ BIỂU ĐỒ TRÒN
❑ Biểu đồ tròn: Biểu đồ mà trong đó, tần số của mỗi nhóm tương ứng với
một phần diện tích hình tròn. Người ta dùng tần số phần trăm để biểu
diễn trên biểu đồ tròn
Biểu đồ: Tâm trạng khi học TKXH 7% 23% 23% 47% Mệt Buồn Thích thú Vui
Nguồn: Khảo sát lớp học TKXH, tháng 12, 2021
III. Mô tả độ tập trung biến (central tendency)
1. Yếu vị (Mode)
2. Trung vị (Median)
3. Trung bình cộng (Mean)
III. Mô tả độ tập trung biến (central tendency) 1. Yếu vị (Mode)
Yếu vị (Mode): giá trị xuất hiện nhiều lần nhất trong tập một dữ liệu
• Mode có thể được sử dụng cho tất cả các loại thang đo Ví dụ 1: 2 3 3 3 2 2 2 3 3 2 3 3 2 2 3 2 3 3 2 3 3 4 4 2 3 4 3 2 2 3 → Mode = 3