



















Preview text:
Bài 3
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ 1 Nội dung chính I II III THỐNG KÊ THỐNG KÊ ỨNG DỤNG MÔ TẢ CHO MÔ TẢ MỐI SPSS TRONG MỘT BIẾN LIÊN HỆ TÍNH TOÁN CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ 2 1 2/27/2025
Thống kê mô tả cho một biến
Số tuyệt đối và số tương đối trong thống kê Các mức độ trung tâm
Các mức độ đo độ biến thiên
Hình dáng phân phối của dãy số 3
Số tuyệt đối và số tương đối trong thống kê
• Số tuyệt đối trong thống kê
• Số tương đối trong thống kê
• Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê 4 2 2/27/2025
Số tuyệt đối trong thống kê
Số tuyệt đối trong thống kê biểu hiện quy mô, khối lượng của hiện tượng
nghiên cứu trong điều kiện thời gian, địa điểm cụ thể. Ví dụ
• Tổng số dân Việt Nam vào lúc 0h ngày 1/4/2019 là 96.208.984 người.
• Tổng kim ngạch xuất khẩu hàng hóa của Việt Nam năm 2024 đạt 405,53 tỷ USD.
Các loại số tuyệt đối trong thống kê
Số tuyệt đối thời điểm: được xác định tại một mốc thời điểm cụ thể.
Số tuyệt đối thời kỳ: được xác định trong một khoảng thời gian. 5
Số tuyệt đối trong thống kê Đặc điểm
Luôn bao hàm một nội dung KTXH cụ thể trong điều kiện thời gian và địa điểm nhất định.
Chỉ xác định được qua điều tra thực tế và tổng hợp tài liệu.
Có đơn vị tính cụ thể (hiện vật hoặc giá trị). Tác dụng
Cung cấp nhận thức cụ thể về quy mô, khối lượng hiện tượng.
Là cơ sở để phân tích thống kê và tiến hành tính toán các mức độ khác trong nghiên cứu thống kê 6 3 2/27/2025
Số tương đối trong thống kê
Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng. Ví dụ:
• Giá trị kim ngạch xuất khẩu hàng hóa của Việt Nam năm 2024 bằng 114,3% so với năm 2023. Đặc điểm
• Là kết quả so sánh 2 số đã có, không trực tiếp thu được qua điều tra.
• Mỗi số tương đối đều có gốc so sánh.
• Đơn vị tính: lần, %, đơn vị kép tùy thuộc loại số tương đối. 7
Số tương đối trong thống kê Tác dụng
Phân tích hiện tượng qua quan hệ so sánh
Nêu rõ tình hình thực tế khi cần bảo đảm tính chất bí mật của số tuyệt đối.
Thường dùng để lập kế hoạch và kiểm tra tình hình thực hiện kế hoạch 8 4 2/27/2025
Số tương đối trong thống kê
Các loại số tương đối trong thống kê
Số tương đối động thái (tốc độ phát triển): phản ánh xu hướng biến động
của hiện tượng qua thời gian. t=yy(100)
Số tương đối kế hoạch: dùng để lập và kiểm tra tình hình thực hiện kế hoạch.
• Số tương đối nhiệm vụ kế hoạch: K=(100)
• Số tương đối thực hiện (hoàn thành) kế hoạch: K=(100) t K n KT 9
Số tương đối trong thống kê
Các loại số tương đối trong thống kê
Số tương đối kết cấu: biểu hiện tỷ trọng của từng bộ phận trong toàn bộ hiện tượng. d=y∑y(100)
Số tương đối không gian: sử dụng trong hai trường hợp:
• So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian.
• So sánh giữa hai bộ phận trong một tổng thể.
Số tương đối cường độ: so sánh hai mức độ khác loại nhưng có quan hệ với nhau. • Có đơn vị kép. 10 5 2/27/2025 Điều kiện vận dụng
Phải căn cứ vào tính chất và đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho chính xác.
Phải vận dụng kết hợp các số tuyệt đối và số tương đối. 11 Các mức độ trung tâm • Số trung bình cộng • Số trung vị • Mốt
• Các mức độ đo vị trí khác • Số trung bình nhân • Phân vị 12 6 2/27/2025 Số trung bình cộng
Số trung bình cộng (Mean), gọi tắt là số trung bình hoặc số bình quân, là
mức độ đo vị trí trung tâm của dữ liệu cho một biến. Ví dụ
• Thu nhập bình quân một tháng của một lao động ở Việt Nam năm 2024 là 7,7 triệu đồng. 13 Số trung bình cộng Đặc điểm:
Áp dụng với dữ liệu sử dụng thang đo khoảng, tỷ lệ (biến định lượng).
Tất cả các giá trị của biến định lượng đều tham gia vào công thức tính số
trung bình và chỉ tính được một giá trị trung bình duy nhất trên cơ sở san
bằng, bù trừ chênh lệch giữa các giá trị.
Tổng chênh lệch giữa các giá trị và số trung bình là bằng 0.
Chịu ảnh hưởng của các giá trị đột xuất. 14 7 2/27/2025
Số trung bình cộng – tính từ dữ liệu thô
Được tính theo công thức trung bình cộng giản đơn.
• Với tổng thể có N đơn vị: N x i Các giá trị x x x i 1 1 2 μN của tổng thể N N Quy mô tổng thể
• Với mẫu có n đơn vị: n x i Các x giá trx ị quan x i 1 1 2 xn sát từ mẫu n n Quy mô mẫu 15
Số trung bình cộng – tính từ dữ liệu thô Ví dụ
Giá thuê/tháng ($) của 70 căn hộ một phòng ngủ ở khu đô thị Phú Mỹ Hưng được
ghi chép lại như sau. Dữ liệu đã được sắp xếp theo trật tự từ thấp đến cao.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 ∑x 34.356 x = n = 70 = 490,8$ 16 8 2/27/2025
Số trung bình cộng – tính từ bảng tần số phân phối
Được tính theo công thức trung bình cộng gia quyền. n i x f x f x f ... i i1 1 1 2 2 x nfn x n f f ... 1 2 fn fi i 1
filà tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số và mẫu số)
→ tầm quan trọng của từng lượng biến trong tính số bình quân.
•Lưu ý: với tổ có khoảng cách tổ, xilà trị số giữa của mỗi tổ. 17
Số trung bình cộng – tính từ bảng tần số phân phối
Ví dụ: Tính tiền lương trung bình/ tháng của một lao động trong doanh nghiệp A năm 2024, biết: Tiền lương/tháng Số lao động x d x (1000 đồng) x ifi i idi i15 (Người) fi 5000 75000 0,075 375.0 5500 30 165000 0,150 825.0 6000 45 270000 0,225 1350.0 6500 55 357500 0,275 1787.5 7000 40 280000 0,200 1400.0 7500 15 112500 0,075 562.5 Chung 200 1260000 1,000 6300.0 = 6300 (nghìn đồng) x = ∑xf x = ∑xf=1260000
∑f= xd= 6300 nghìn đồng ∑ f 200 Với d = ∑ 18 9 2/27/2025
Số trung bình cộng – khi mỗi quan sát
được gán một quyền số
Trường hợp mỗi quan sát được gán một quyền số để chỉ ra tầm quan trọng
của nó trong bộ dữ liệu, áp dụng công thức tính trung bình cộng gia quyền: x = ∑xw
xi– giá trị của quan sát thứ i ∑w
wi– quyền số được gán cho quan sát thứ i
Tùy từng trường hợp áp dụng mà lựa chọn quyền số cho phù hợp.
Chọn quyền số phản ánh tốt nhất tầm quan trọng của từng quan sát trong xác định số trung bình. 19
Số trung bình cộng – khi mỗi quan sát
được gán một quyền số
Ví dụ: Tính giá thành đơn vị một sản phẩm sản xuất ra trong tháng 12/2024
của doanh nghiệp A, biết: Phân Giá thành Sản lượng CPSX xưởng đơn vị (trđ) (SP) (trđ) xi wi xi . wi x = ∑x ∑. w w =18500 1 3,00 1200 3600 6250 = 2,96 (trđ) 2 3,40 500 1700 3 2,80 2750 7700 4 2,90 1000 2900 5 3,25 800 2600 Tổng 6250 18500 20 10 2/27/2025 Trung vị
Trung vị (Median) là lượng biến của đơn vị đứng ở vị trí chính giữa trong một dãy
số lượng biến, chia dãy số thành hai phần bằng nhau. Đặc điểm
Áp dụng với dữ liệu sử dụng thang đo thứ bậc, khoảng, tỷ lệ.
Không chịu ảnh hưởng của giá trị đột xuất. Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng, đặc biệt khi dãy số phân
phối quá lệch, hoặc khi dãy số có quá ít đơn vị.
Cho biết đặc trưng phân phối của dãy số. 21
Trung vị - tính từ dữ liệu thô
Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
Với tổng số quan sát n là lẻ (n=2m+1), trung vị là giá trị của quan sát đứng ở vị trí thứ m+1. 𝑴𝒆 = 𝒙𝒎𝟏 7 quan sát 26 18 27 12 14 27 19 Sắp xếp 12 14 18 19 26 27 27 Me = 19 22 11 2/27/2025
Trung vị - tính từ dữ liệu thô
Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
Với tổng số quan sát n là chẵn (n=2m), trung vị là trung bình cộng các giá trị
của hai quan sát đứng ở vị trí chính giữa là m và m+1.
𝑴𝒆 = (𝒙𝒎+ 𝒙(𝒎𝟏)/𝟐 8 Quan sát 26 18 27 12 14 27 30 19 Sắp xếp 12 1418 19 26 27 27 30 Me = (19 + 26)/2 = 22.5 23
Trung vị - tính từ dữ liệu thô
Ví dụ: Xác định trung vị về giá thuê nhà
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 24 12 2/27/2025
Trung vị - tính từ bảng tần số phân phối
Bước 1: xác định tổ có trung vị - là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa.
Bước 2: tính trị số gần đúng của trung vị theo công thức: fi SMe 1 2 M x h . e min e e f M M M ớ e Gi i hạn dưới của tổ chứa trung vị
Lưu ý: xác định vị trí chính giữa dựa vào tần số tích lũy. 25 Mốt
Mốt (Mode) là biểu hiện xuất hiện phổ biến nhất. Đặc điểm
Áp dụng với dữ liệu theo tất cả các loại thang đo
Không chịu ảnh hưởng của giá trị đột xuất.
Mốt kém nhạy bén với sự biến thiên của dữ liệu. Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng.
Cho biết đặc trưng phân phối của dãy số.
Sử dụng trong bài toán lý thuyết phục vụ đám đông. 26 13 2/27/2025 Mốt
Một bộ dữ liệu có thể không có mốt hoặc có thể có nhiều mốt:
• Nếu bộ dữ liệu chỉ có chính xác hai mốt, gọi là bimodal
• Nếu bộ dữ liệu có nhiều hơn hai mốt, gọi là multimodal 27 Mốt
Cách xác định Mốt: phải dựa vào bảng tần số phân phối
Với bảng tần số phân phối giản đơn: Mốt là biểu hiện hoặc lượng biến có tần số filớn nhất.
Với bảng tần số phân phối có khoảng cách tổ.
Bước 1: xác định tổ có Mốt
• là tổ có tần số filớn nhất nếu khoảng cách tổ bằng nhau.
• hoặc tổ có mật độ milớn nhất nếu khoảng cách tổ không bằng nhau.
Bước 2: tính trị số gần đúng của Mốt theo công thức hoặc min M δ= xf − fM h m M − m 1 . 0 00
δ = f − f hoặc m − m 1 2 28 14 2/27/2025 Mốt Ví dụ. Apartment Rents
Giá trị 450 được gặp nhiều nhất (7 lần) Mo = 450$
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 29 Ví dụ
Tính doanh số trung bình, trung vị về doanh số và mốt về doanh số. Doanh sốbq (Trđ) Sốnhân viên 55 50-<60 2 65 60-<70 13 75 70-<80 16 85 80-<90 7 95 90-<100 7 105 100-110 5 3940 Tổng số 50
n=25 -> vị trí chính giữa: 25 và 26 30 15 2/27/2025
So sánh số trung bình cộng, trung vị và mốt
Cho biết đặc trưng phân phối của dãy số 𝑋< Me < Mo Mo < Me < 𝑋 𝑋= Me = Mo Lệch trái Lệch phải Đối xứng 31 Số trung bình nhân
Số trung bình nhân (Geometric Mean): được tính bằng công thức trung
bình nhân, áp dụng khi các lượng biến có quan hệ tích với nhau.
Thường dùng để đo lường tốc độ phát triển bình quân qua thời gian.
Số trung bình nhân giản đơn n 1 2 x nn x x ... x n x i
Số trung bình nhân gia quyền i 1 n 1 2 x finf f f x x ... x fii f x 1 2 n i i 1 32 16 2/27/2025 Số trung bình nhân
Ví dụ: Tốc độ phát triển GDP của Viêt Nam trong các năm 2016, 2017, 2018
lần lượt là 106,21%, 106,81% và 107,08%. Tính tốc độ phát triển bình quân
một năm của GDP Việt Nam trong giai đoạn 2016-2018.
𝑋= 1,0621𝑥1,0681𝑥1,0708 / = 1,0670 hay 106,7%
Tốc độ tăng GDP bình quân một năm trong giai đoạn 2016-2018 là 6,7%. 33 Phân vị
Phân vị (Percentiles) cung cấp thông tin về phân phối của dữ liệu trên
khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất.
Phân vị mức p là giá trị mà có ít nhất p% số quan sát nhận giá trị nhỏ hơn
hoặc bằng giá trị phân vị mức p và có ít nhất (100-p)% số quan sát nhận giá
trị lớn hơn hoặc bằng giá trị phân vị mức p. 34 17 2/27/2025 Phân vị
Cách tính phân vị mức p:
Bước 1: sắp xếp dữ liệu theo thứ từ nhỏ đến lớn.
Bước 2: xác định vị trí của phân vị mức p: L=p 100(n+1)
Với p là phân vị cần tính, n là tổng số quan sát.
Bước 3: tính giá trị của phân vị mức p. 35 Phân vị
Ví dụ: Có mức lương/tháng (triệu đồng) của 12 nhân viên ngân hàng như sau: 34,50 35,50 36,50 34,80 33,55 33,10 34,90 37,30 35,40 39,25 35,20 34,80
Với số liệu trên, xác định phân vị mức 85. Giải thích ý nghĩa.
• Sắp xếp theo thứ tự tăng dần.
33,10 33,55 34,50 34,80 34,80 34,90 35,20 35,40 35,50 36,50 37,30 39,25
•L= (n + 1) = (12 + 1) = 11,05
• Vị trí của phân vị mức 85 là 11,05.
• Giá trị của phân vị mức 85: 37,30+(39,25-37,30)x0,05= 37,3975 36 18 2/27/2025 Phân vị
Tứ phân vị (Quartiles): chia tổng thể thành 4 phần có số đơn vị bằng
nhau, mỗi phần chứa 25% tổng số đơn vị trong tổng thể. 25% 25% 25% 25% Q1Q2Q3 Phân vị Phân vị Phân vị mức 25 mức 50 mức 75 37 Phân vị
Ví dụ: Xác định Q1, Q2và Q3
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
L25 = 25/100*(n+1)=(n+1)/4=17,75
L50 = 50/100*(n+1)=(n+1)/2=35,5
L75 = 75/100*(n+1)=3/4*(n+1)=53,25 38 19 2/27/2025
Các mức độ đo độ biến thiên Cho biết:
Đặc trưng về phân phối Curve A
Kết cấu và tính đồng đều của tổng thể.
Trình độ đại biểu của số trung bình
→Giá trị của các mức độ càng nhỏ, tổng thể Curve B
càng đồng đều, độ biến thiên ít, trình độ đại
biểu của số trung bình càng cao. Cùng giá trị trung bình, độ biến thiên khác nhau 39
Các mức độ đo độ biến thiên Gồm có: Khoảng biến thiên Khoảng tứ phân vị Phương sai Độ lệch chuẩn Hệ số biến thiên 40 20