1
Bài 3
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ
Nội dung chính
I
THỐNG KÊ
MÔ TẢ CHO
MỘT BIẾN
II
THỐNG KÊ
MÔ TẢ MỐI
LIÊN HỆ
III
ỨNG DỤNG
SPSS TRONG
TÍNH TOÁN
CÁC MỨC ĐỘ
THỐNG KÊ
MÔ TẢ
1
2
2
Thống tả cho một biến
Số tuyệt đối số tương đối trong thống
Các mức đ trung m
Các mức độ đo đ biến thiên
Hình dáng phân phối của dãy số
Số tuyệt đối s tương đối trong thống
Số tuyệt đối trong thống
Số tương đối trong thống
Điều kiện vận dụng số tuyệt đối số tương đối trong thống
3
4
3
Số tuyệt đối trong thống
Số tuyệt đối trong thống biểu hiện của hiện tượngquy mô, khối lượng
nghiên cứu trong điều kiện thời gian, địa điểm cụ thể.
dụ
Tổng số dân Việt Nam vào lúc 0h ngày 1/4/2019 96.208.984 người.
Tổng kim ngạch xuất khẩu hàng hóa của Việt Nam năm 2024 đạt 405,53
tỷ USD.
Các loại số tuyệt đối trong thống
Số tuyệt đối thời điểm: được xác định tại một mốc thời điểm cụ thể.
Số tuyệt đối thời kỳ: được xác định trong một khoảng thời gian.
Số tuyệt đối trong thống
Đặc điểm
Luôn bao hàm một nội dung KTXH cụ thể trong điều kiện thời gian địa điểm
nhất định.
Chỉ xác định được qua điều tra thực tế tổng hợp i liệu.
đơn vị tính cụ th (hiện vật hoặc giá trị).
Tác dụng
Cung cấp nhận thức cụ thể về quy , khối lượng hiện tượng.
sở để phân tích thống tiến hành tính toán các mức độ khác trong
nghiên cứu thống
5
6
4
Số tương đối trong thống
Số tương đối trong thống biểu hiện quan hệ so sánh giữa hai mức độ
của hiện tượng.
dụ:
Giá trị kim ngạch xuất khẩu hàng hóa của Việt Nam năm 2024 bằng
114,3% so với năm 2023.
Đặc điểm
kết quả so sánh 2 số đã có, không trực tiếp thu được qua điều tra.
Mỗi số tương đối đều gốc so nh.
Đơn vị tính: lần, %, đơn vị kép tùy thuộc loại số tương đối.
Số tương đối trong thống
Tác dụng
Phân tích hiện tượng qua quan hệ so sánh
Nêu tình hình thực tế khi cần bảo đảm tính chất mật của số tuyệt đối.
Thường dùng để lập kế hoạch kiểm tra tình hình thực hiện kế hoạch
7
8
5
Số tương đối trong thống
Các loại số tương đối trong thống
Số tương đối động thái (tốc độ phát triển): phản ánh xu hướng biến động
của hiện tượng qua thời gian.
t = y
y(100)
Số tương đối kế hoạch: dùng để lập kiểm tra tình hình thực hiện kế
hoạch.
Số tương đối nhiệm vụ kế hoạch: K=
(100)
Số tương đối thực hiện (hoàn thành) kế hoạch: K=
(100)
Tn
KKt
Số tương đối trong thống
Các loại số tương đối trong thống
Số tương đối kết cấu: biểu hiện tỷ trọng của từng bộ phận trong toàn bộ hiện
tượng.
d=y
∑y(100)
Số tương đối không gian: sử dụng trong hai trường hợp:
So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian.
So sánh giữa hai bộ phận trong một tổng thể.
Số tương đối cường độ: so sánh hai mức độ khác loại nhưng quan hệ với nhau.
đơn vị kép.
9
10
6
Điều kiện vận dụng
Phải căn cứ vào tính chất đặc điểm của hiện tượng nghiên cứu để rút ra
kết luận cho chính xác.
Phải vận dụng kết hợp các số tuyệt đối số ơng đối.
Các mức độ trung tâm
Số trung bình cộng
Số trung vị
Mốt
Các mức độ đo vị trí khác
Số trung bình nhân
Phân vị
11
12
7
Số trung bình cộng
Số trung bình cộng (Mean), gọi tắt số trung bình hoặc số bình quân,
mức độ đo vị trí trung tâm của dữ liệu cho một biến.
dụ
Thu nhập bình quân một tháng của một lao động Việt Nam năm 2024
7,7 triệu đồng.
Số trung bình cộng
Đặc điểm:
Áp dụng với dữ liệu sử dụng thang đo khoảng, tỷ lệ (biến định lượng).
Tất cả các giá trị của biến định lượng đều tham gia vào công thức tính số
trung bình chỉ tính được một giá trị trung bình duy nhất trên sở san
bằng, trừ chênh lệch giữa c giá trị.
Tổng chênh lệch giữa các giá trị số trung bình bằng 0.
Chịu nh hưởng của c giá trị đột xuất.
13
14
8
Quy mô mẫu
n
xxx
n
x
xn21
n
1i
i
Các giá trị quan
sát từ mẫu
N
xxx
N
x
μN21
N
1i
i
Quy mô tổng thể
Các giá trị
của tổng thể
Với tổng thể N đơn vị:
Với mẫu n đơn vị:
Số trung bình cộng tính từ dữ liệu thô
Được tính theo công thức trung bình cộng giản đơn.
dụ
Giá thuê/tháng ($) của 70 căn hộ một phòng ngủ khu đô thị Phú Mỹ Hưng được
ghi chép lại như sau. Dữ liệu đã được sắp xếp theo trật tự từ thấp đến cao.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
x =
x
n
=
34.356
70
=490,8$
Số trung bình cộng tính từ dữ liệu thô
15
16
9
Số trung bình cộng tính từ bảng tần số
phân phối
Được tính theo công thức trung bình cộng gia quyền.
fi tần số, đóng vai trò quyền số (đại lượng mặt ở cả tử số mẫu số)
→ tầm quan trọng của từng lượng biến trong tính số bình quân.
Lưu ý: với tổ khoảng cách tổ, xi trị số giữa của mỗi tổ.
n
1i
i
n
1i ii
n21
nn2211
f
fx
f...ff
fx...fxfx
x
Số trung bình cộng tính từ bảng tần số
phân phối
Số lao động
(Người) fi
Tiền lương/tháng
(1000 đồng) xi15
5000
305500
45
6000
556500
407000
157500
200Chung
xifi
75000
165000
270000
357500
280000
112500
1260000
di
0,075
0,150
0,225
0,275
0,200
0,075
1,000
xidi
375.0
825.0
1350.0
1787.5
1400.0
562.5
6300.0
x = ∑xf
f
=1260000
200
= 6300 (nghìn đồng) x = ∑xf
∑f= xd= 6300 nghìn đồng
Với
d
=
dụ: Tính tiền lương trung nh/ tháng của một lao động trong doanh nghiệp A
năm 2024, biết:
17
18
10
Số trung bình cộng khi mỗi quan sát
được gán một quyền số
Trường hợp mỗi quan sát được gán một quyền số để chỉ ra tầm quan trọng
của trong bộ d liệu, áp dụng công thức tính trung bình cộng gia quyền:
x = ∑xw
∑w
xi giá trị của quan sát thứ i
wi quyền số được gán cho quan
sát thứ i
Tùy từng trường hợp áp dụng lựa chọn quyền số cho phù hợp.
Chọn quyền số phản ánh tốt nhất tầm quan trọng của từng quan sát trong
xác định số trung bình.
dụ: Tính giá thành đơn vị một sản phẩm sản xuất ra trong tháng 12/2024
của doanh nghiệp A, biết:
Sản lượng
(SP)
Giá thành
đơn vị (trđ)
Phân
xưởng
wixi
12003,001
5003,402
27502,803
10002,904
8003,255
6250Tổng
CPSX
(trđ)
xi . wi
3600
1700
7700
2900
2600
18500
x = ∑x.w
∑w=18500
6250 = 2,96 (trđ)
Số trung bình cộng khi mỗi quan sát
được gán một quyền số
19
20
11
Trung v
Trung vị (Median) lượng biến của đơn v đứng vị trí chính giữa trong một dãy
số lượng biến, chia dãy số thành hai phần bằng nhau.
Đặc điểm
Áp dụng với dữ liệu sử dụng thang đo thứ bậc, khoảng, tỷ lệ.
Không chịu ảnh hưởng của giá trị đột xuất.
Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng, đặc biệt khi dãy số phân
phối quá lệch, hoặc khi dãy số quá ít đơn vị.
Cho biết đặc trưng phân phối của dãy số.
Trung v - tính từ dữ liệu thô
Sắp xếp d liệu theo thứ tự từ thấp đến cao
Với tổng số quan sát n lẻ (n=2m+1), trung vị g trị của quan sát đứng
vị trí thứ m+1.
𝑴𝒆 = 𝒙𝒎𝟏
Sắp xếp
7 quan sát
Me = 19
26 18 27 12 14 27 19
12 14 19 26 2718 27
21
22
12
Trung v - tính từ dữ liệu thô
Sắp xếp d liệu theo thứ tự từ thấp đến cao
Với tổng số quan sát n là chẵn (n=2m), trung vị trung bình cộng các giá trị
của hai quan sát đứng vị trí chính giữa m m+1.
𝑴𝒆 = (𝒙𝒎+ 𝒙 )/𝟐𝒎𝟏
Sắp xếp
8 Quan sát 26 18 27 12 14 27 30 19
Me = (19 + 26)/2 = 22.5
12 14 19 26 2718 27 30
dụ: Xác định trung vị về giá thuê nhà
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Trung v - tính từ dữ liệu thô
23
24
13
Trung v - tính từ bảng tần số phân phối
Bước 1: xác định tổ trung vị - tổ chứa lượng biến của đơn vị đứng v
trí giữa.
Bước 2: tính trị số gần đúng của trung vị theo công thức:
e
e
ee
M
M
i
MMe f
S
f
hxM
1 2
.
min
Lưu ý: xác định vị trí chính giữa dựa o tần số tích lũy.
Mốt
Mốt (Mode) biểu hiện xuất hiện phổ biến nhất.
Đặc điểm
Áp dụng với d liệu theo tất cả các loại thang đo
Không chịu nh hưởng của giá trị đột xuất.
Mốt kém nhạy n với sự biến thiên của dữ liệu.
Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng.
Cho biết đặc trưng phân phối của dãy số.
Sử dụng trong bài toán thuyết phục vụ đám đông.
25
26
14
Mốt
Một bộ dữ liệu thể không mốt hoặc th nhiều mốt:
Nếu bộ dữ liệu chỉ chính xác hai mốt, gọi bimodal
Nếu bộ dữ liệu nhiều hơn hai mốt, gọi multimodal
Mốt
Cách xác định Mốt: phải dựa vào bảng tần số phân phối
Với bảng tần số phân phối giản đơn: Mốt biểu hiện hoặc lượng biến tần số filớn
nhất.
Với bảng tần số phân phối khoảng cách tổ.
Bước 1: xác định tổ Mốt
tổ tần số filớn nhất nếu khoảng cách tổ bằng nhau.
hoặc tổ mật độ m lớn nhất nếu khoảng cách tổ không bằng nhau.i
Bước 2: tính trị số gần đúng của Mốt theo công thức
21
1
000
.
min MM hxM δ= f f hoặc m m
δ
= f

f

hoặc m

m

27
28
15
Mốt
Ví dụ. Apartment Rents
Giá trị 450 được gặp nhiều nhất (7 lần)
Mo = 450$
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Ví dụ
Tính doanh số trung bình, trung vị về doanh số mốt về doanh số.
50-<60
60-<70
70-<80
80-<90
90-<100
100-110
Tng s
2
13
16
7
7
5
50
Doanh s nhân viênbq (Trđ) S
29
30
16
So sánh s trung bình cộng, trung vị mốt
𝑋
= Me = Mo
Đối xứng
Mo < Me < 𝑋
Lệch phải
𝑋
< Me < Mo
Lệch trái
Cho biết đặc trưng phân phối của dãy số
Số trung bình nhân
Số trung bình nhân (Geometric Mean): được tính bằng công thức trung
bình nhân, áp dụng khi các lượng biến quan h tích với nhau.
Số trung bình nhân giản đơn
Số trung bình nhân gia quyền
x... x x
n
1
nn21
n
i
i
xx

iiin21 f
1
f
i
ff
n
f
21 x x... x
n
i
f
xx
31
32
17
Số trung bình nhân
Đặc điểm
Số trung bình nhân luôn nhỏ n hoặc bằng số trung bình cộng.
Khi tính số trung bình nhân, tất cả các giá trị đều phải dương.
Thường dùng để đo lường tốc độ phát triển bình quân qua thời gian.
Số trung bình nhân
dụ: Tốc độ phát triển GDP của Viêt Nam trong các năm 2016, 2017, 2018
lần lượt 106,21%, 106,81% 107,08%. Tính tốc độ phát triển bình quân
một năm của GDP Việt Nam trong giai đoạn 2016-2018.
𝑋= 1,0621𝑥1,0681𝑥1,0708 / = 1,0670 hay 106,7%
Tốc độ tăng GDP bình quân một năm trong giai đoạn 2016-2018 6,7%.
33
34
18
Phân vị
Phân vị (Percentiles) cung cấp thông tin về phân phối của dữ liệu trên
khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất.
Phân vị mức p giá trị ít nhất p% số quan sát nhận giá trị nhỏ hơn
hoặc bằng giá trị phân vị mức p ít nhất (100-p)% số quan sát nhận giá
trị lớn hơn hoặc bằng giá trị phân vị mức p.
Phân vị
Cách tính phân vị mức p:
Bước 1: sắp xếp dữ liệu theo thứ từ nhỏ đến lớn.
Bước 2: xác định vị trí của phân vị mức p:
L=p
100 (n + 1)
Với p phân vị cần tính, n tổng số quan sát.
Bước 3: tính giá trị của phân vị mức p.
35
36
19
Phân vị
Ví dụ: mức lương/tháng (triệu đồng) của 12 nhân viên ngân hàng như sau:
Với số liệu trên, xác định phân vị mức 85. Giải thích ý nghĩa.
Sắp xếp theo thứ tự tăng dần.
33,10 33,55 34,50 34,80 34,80 34,90 35,20 35,40 35,50 36,50 37,30 39,25
L=  (n + 1) = 
 (12+ 1) = 11,05
Vị trí của phân v mức 85 là 11,05.
Giá trị của phân vị mức 85: 37,30+(39,25-37,30)x0,05= 37,3975
33,1033,5534,8036,5035,5034,50
34,8035,2039,2535,4037,3034,90
Phân vị
Tứ phân vị (Quartiles): chia tổng thể thành 4 phần số đơn vị bằng
nhau, mỗi phần chứa 25% tổng số đơn vị trong tổng thể.
25%25%25%25%
Phân vị
mức 25
Phân vị
mức 50
Phân vị
mức 75
Q1Q Q2 3
37
38
20
dụ: Xác định Q1, Q2 Q3
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Phân vị
Các mức độ đo độ biến thiên
Cho biết:
Đặc trưng về phân phối
Kết cấu tính đồng đều của tổng thể.
Trình độ đại biểu của số trung bình
→Giá trị của các mức độ càng nhỏ, tổng thể
càng đồng đều, độ biến thiên ít, trình độ đại
biểu của số trung bình càng cao. Cùng g trị trung
bình, độ biến thiên
khác nhau
Curve A
Curve B
39
40

Preview text:

Bài 3
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ 1 Nội dung chính I II III THỐNG KÊ THỐNG KÊ ỨNG DỤNG MÔ TẢ CHO MÔ TẢ MỐI SPSS TRONG MỘT BIẾN LIÊN HỆ TÍNH TOÁN CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ 2 1
Thống kê mô tả cho một biến
Số tuyệt đối và số tương đối trong thống kê Các mức độ trung tâm
Các mức độ đo độ biến thiên
Hình dáng phân phối của dãy số 3
Số tuyệt đối và số tương đối trong thống kê
• Số tuyệt đối trong thống kê
• Số tương đối trong thống kê
• Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê 4 2
Số tuyệt đối trong thống kê
Số tuyệt đối trong thống kê biểu hiện quy mô, khối lượng của hiện tượng
nghiên cứu trong điều kiện thời gian, địa điểm cụ thể. Ví dụ
• Tổng số dân Việt Nam vào lúc 0h ngày 1/4/2019 là 96.208.984 người.
• Tổng kim ngạch xuất khẩu hàng hóa của Việt Nam năm 2024 đạt 405,53 tỷ USD.
Các loại số tuyệt đối trong thống kê
Số tuyệt đối thời điểm: được xác định tại một mốc thời điểm cụ thể.
Số tuyệt đối thời kỳ: được xác định trong một khoảng thời gian. 5
Số tuyệt đối trong thống kê Đặc điểm
Luôn bao hàm một nội dung KTXH cụ thể trong điều kiện thời gian và địa điểm nhất định.
Chỉ xác định được qua điều tra thực tế và tổng hợp tài liệu.
Có đơn vị tính cụ thể (hiện vật hoặc giá trị). Tác dụng
Cung cấp nhận thức cụ thể về quy mô, khối lượng hiện tượng.
Là cơ sở để phân tích thống kê và tiến hành tính toán các mức độ khác trong nghiên cứu thống kê 6 3
Số tương đối trong thống kê
Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa hai mức độ của hiện tượng. Ví dụ:
• Giá trị kim ngạch xuất khẩu hàng hóa của Việt Nam năm 2024 bằng 114,3% so với năm 2023. Đặc điểm
• Là kết quả so sánh 2 số đã có, không trực tiếp thu được qua điều tra.
• Mỗi số tương đối đều có gốc so sánh.
• Đơn vị tính: lần, %, đơn vị kép tùy thuộc loại số tương đối. 7
Số tương đối trong thống kê Tác dụng
Phân tích hiện tượng qua quan hệ so sánh
Nêu rõ tình hình thực tế khi cần bảo đảm tính chất bí mật của số tuyệt đối.
Thường dùng để lập kế hoạch và kiểm tra tình hình thực hiện kế hoạch 8 4
Số tương đối trong thống kê
Các loại số tương đối trong thống kê
Số tương đối động thái (tốc độ phát triển): phản ánh xu hướng biến động
của hiện tượng qua thời gian. t=yy(100)
Số tương đối kế hoạch: dùng để lập và kiểm tra tình hình thực hiện kế hoạch.
• Số tương đối nhiệm vụ kế hoạch: K=(100)
• Số tương đối thực hiện (hoàn thành) kế hoạch: K=(100) t K  n  KT 9
Số tương đối trong thống kê
Các loại số tương đối trong thống kê
Số tương đối kết cấu: biểu hiện tỷ trọng của từng bộ phận trong toàn bộ hiện tượng. d=y∑y(100)
Số tương đối không gian: sử dụng trong hai trường hợp:
• So sánh giữa hai mức độ cùng loại nhưng khác nhau về không gian.
• So sánh giữa hai bộ phận trong một tổng thể.
Số tương đối cường độ: so sánh hai mức độ khác loại nhưng có quan hệ với nhau. • Có đơn vị kép. 10 5 Điều kiện vận dụng
Phải căn cứ vào tính chất và đặc điểm của hiện tượng nghiên cứu để rút ra kết luận cho chính xác.
Phải vận dụng kết hợp các số tuyệt đối và số tương đối. 11 Các mức độ trung tâm • Số trung bình cộng • Số trung vị • Mốt
• Các mức độ đo vị trí khác • Số trung bình nhân • Phân vị 12 6 Số trung bình cộng
Số trung bình cộng (Mean), gọi tắt là số trung bình hoặc số bình quân, là
mức độ đo vị trí trung tâm của dữ liệu cho một biến. Ví dụ
• Thu nhập bình quân một tháng của một lao động ở Việt Nam năm 2024 là 7,7 triệu đồng. 13 Số trung bình cộng Đặc điểm:
Áp dụng với dữ liệu sử dụng thang đo khoảng, tỷ lệ (biến định lượng).
Tất cả các giá trị của biến định lượng đều tham gia vào công thức tính số
trung bình và chỉ tính được một giá trị trung bình duy nhất trên cơ sở san
bằng, bù trừ chênh lệch giữa các giá trị.
Tổng chênh lệch giữa các giá trị và số trung bình là bằng 0.
Chịu ảnh hưởng của các giá trị đột xuất. 14 7
Số trung bình cộng – tính từ dữ liệu thô
Được tính theo công thức trung bình cộng giản đơn.
• Với tổng thể có N đơn vị: N  x   i Các giá trị  x x x i 1 1 2 μN  của tổng thể N N Quy mô tổng thể
• Với mẫu có n đơn vị: n  x   i Các x giá trx ị quan x i 1 1 2 xn  sát từ mẫu n n Quy mô mẫu 15
Số trung bình cộng – tính từ dữ liệu thô Ví dụ
Giá thuê/tháng ($) của 70 căn hộ một phòng ngủ ở khu đô thị Phú Mỹ Hưng được
ghi chép lại như sau. Dữ liệu đã được sắp xếp theo trật tự từ thấp đến cao.
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 ∑x 34.356 x =  n = 70 = 490,8$ 16 8
Số trung bình cộng – tính từ bảng tần số phân phối
Được tính theo công thức trung bình cộng gia quyền. n i  x f x f  x f  ...  i i1 1 1 2 2 x nfn  x n  f  f  ...  1 2 fn  fi i 1
filà tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số và mẫu số)
→ tầm quan trọng của từng lượng biến trong tính số bình quân.
•Lưu ý: với tổ có khoảng cách tổ, xilà trị số giữa của mỗi tổ. 17
Số trung bình cộng – tính từ bảng tần số phân phối
Ví dụ: Tính tiền lương trung bình/ tháng của một lao động trong doanh nghiệp A năm 2024, biết: Tiền lương/tháng Số lao động x d x (1000 đồng) x ifi i idi i15 (Người) fi 5000 75000 0,075 375.0 5500 30 165000 0,150 825.0 6000 45 270000 0,225 1350.0 6500 55 357500 0,275 1787.5 7000 40 280000 0,200 1400.0 7500 15 112500 0,075 562.5 Chung 200 1260000 1,000 6300.0 = 6300 (nghìn đồng) x = ∑xf x = ∑xf=1260000
∑f=  xd= 6300 nghìn đồng ∑ f 200 Với d =  ∑  18 9
Số trung bình cộng – khi mỗi quan sát
được gán một quyền số
Trường hợp mỗi quan sát được gán một quyền số để chỉ ra tầm quan trọng
của nó trong bộ dữ liệu, áp dụng công thức tính trung bình cộng gia quyền: x = ∑xw
xi– giá trị của quan sát thứ i ∑w
wi– quyền số được gán cho quan sát thứ i
Tùy từng trường hợp áp dụng mà lựa chọn quyền số cho phù hợp.
Chọn quyền số phản ánh tốt nhất tầm quan trọng của từng quan sát trong xác định số trung bình. 19
Số trung bình cộng – khi mỗi quan sát
được gán một quyền số
Ví dụ: Tính giá thành đơn vị một sản phẩm sản xuất ra trong tháng 12/2024
của doanh nghiệp A, biết: Phân Giá thành Sản lượng CPSX xưởng đơn vị (trđ) (SP) (trđ) xi wi xi . wi x = ∑x ∑. w w =18500 1 3,00 1200 3600 6250 = 2,96 (trđ) 2 3,40 500 1700 3 2,80 2750 7700 4 2,90 1000 2900 5 3,25 800 2600 Tổng 6250 18500 20 10 Trung vị
Trung vị (Median) là lượng biến của đơn vị đứng ở vị trí chính giữa trong một dãy
số lượng biến, chia dãy số thành hai phần bằng nhau. Đặc điểm
Áp dụng với dữ liệu sử dụng thang đo thứ bậc, khoảng, tỷ lệ.
Không chịu ảnh hưởng của giá trị đột xuất. Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng, đặc biệt khi dãy số phân
phối quá lệch, hoặc khi dãy số có quá ít đơn vị.
Cho biết đặc trưng phân phối của dãy số. 21
Trung vị - tính từ dữ liệu thô
Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
Với tổng số quan sát n là lẻ (n=2m+1), trung vị là giá trị của quan sát đứng ở vị trí thứ m+1. 𝑴𝒆 = 𝒙𝒎𝟏 7 quan sát 26 18 27 12 14 27 19 Sắp xếp 12 14 18 19 26 27 27 Me = 19 22 11
Trung vị - tính từ dữ liệu thô
Sắp xếp dữ liệu theo thứ tự từ thấp đến cao
Với tổng số quan sát n là chẵn (n=2m), trung vị là trung bình cộng các giá trị
của hai quan sát đứng ở vị trí chính giữa là m và m+1.
𝑴𝒆 = (𝒙𝒎+ 𝒙𝒎𝟏)/𝟐 8 Quan sát 26 18 27 12 14 27 30 19 Sắp xếp 12 1418 19 26 27 27 30 Me = (19 + 26)/2 = 22.5 23
Trung vị - tính từ dữ liệu thô
Ví dụ: Xác định trung vị về giá thuê nhà
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 24 12
Trung vị - tính từ bảng tần số phân phối
Bước 1: xác định tổ có trung vị - là tổ chứa lượng biến của đơn vị đứng ở vị trí giữa.
Bước 2: tính trị số gần đúng của trung vị theo công thức: fi    SMe  1  2 M x h . e min e e f M M Me
Lưu ý: xác định vị trí chính giữa dựa vào tần số tích lũy. 25 Mốt
Mốt (Mode) là biểu hiện xuất hiện phổ biến nhất. Đặc điểm
Áp dụng với dữ liệu theo tất cả các loại thang đo
Không chịu ảnh hưởng của giá trị đột xuất.
Mốt kém nhạy bén với sự biến thiên của dữ liệu. Tác dụng
Dùng để bổ sung hay thay thế cho số trung bình cộng.
Cho biết đặc trưng phân phối của dãy số.
Sử dụng trong bài toán lý thuyết phục vụ đám đông. 26 13 Mốt
Một bộ dữ liệu có thể không có mốt hoặc có thể có nhiều mốt:
• Nếu bộ dữ liệu chỉ có chính xác hai mốt, gọi là bimodal
• Nếu bộ dữ liệu có nhiều hơn hai mốt, gọi là multimodal 27 Mốt
Cách xác định Mốt: phải dựa vào bảng tần số phân phối
Với bảng tần số phân phối giản đơn: Mốt là biểu hiện hoặc lượng biến có tần số filớn nhất.
Với bảng tần số phân phối có khoảng cách tổ.
Bước 1: xác định tổ có Mốt
• là tổ có tần số filớn nhất nếu khoảng cách tổ bằng nhau.
• hoặc tổ có mật độ milớn nhất nếu khoảng cách tổ không bằng nhau.
Bước 2: tính trị số gần đúng của Mốt theo công thức min M δ= xf − fM  h  hoặc M m − m 1  .  0 00   
δ = f − f hoặc m − m 1 2 28 14 Mốt Ví dụ. Apartment Rents
Giá trị 450 được gặp nhiều nhất (7 lần) Mo = 450$
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 29 Ví dụ
Tính doanh số trung bình, trung vị về doanh số và mốt về doanh số. Doanh sốbq (Trđ) S nhân ố viên 50-<60 2 60-<70 13 70-<80 16 80-<90 7 90-<100 7 100-110 5 Tổng số 50 30 15
So sánh số trung bình cộng, trung vị và mốt
Cho biết đặc trưng phân phối của dãy số 𝑋< Me < Mo Mo < Me < 𝑋 𝑋= Me = Mo Lệch trái Lệch phải Đối xứng 31 Số trung bình nhân
Số trung bình nhân (Geometric Mean): được tính bằng công thức trung
bình nhân, áp dụng khi các lượng biến có quan hệ tích với nhau.
Số trung bình nhân giản đơn n 1 2 x nn  x  x  ...  x  n  x i
Số trung bình nhân gia quyền i 1  n  x  ff 1 f ... 2 x x  in f f  1 x x 2  ii f n i i 1 32 16 Số trung bình nhân Đặc điểm
• Số trung bình nhân luôn nhỏ hơn hoặc bằng số trung bình cộng.
• Khi tính số trung bình nhân, tất cả các giá trị đều phải dương.
• Thường dùng để đo lường tốc độ phát triển bình quân qua thời gian. 33 Số trung bình nhân
Ví dụ: Tốc độ phát triển GDP của Viêt Nam trong các năm 2016, 2017, 2018
lần lượt là 106,21%, 106,81% và 107,08%. Tính tốc độ phát triển bình quân
một năm của GDP Việt Nam trong giai đoạn 2016-2018.
𝑋= 1,0621𝑥1,0681𝑥1,0708 / = 1,0670 hay 106,7%
Tốc độ tăng GDP bình quân một năm trong giai đoạn 2016-2018 là 6,7%. 34 17 Phân vị
Phân vị (Percentiles) cung cấp thông tin về phân phối của dữ liệu trên
khoảng từ giá trị nhỏ nhất đến giá trị lớn nhất.
Phân vị mức p là giá trị mà có ít nhất p% số quan sát nhận giá trị nhỏ hơn
hoặc bằng giá trị phân vị mức p và có ít nhất (100-p)% số quan sát nhận giá
trị lớn hơn hoặc bằng giá trị phân vị mức p. 35 Phân vị
Cách tính phân vị mức p:
Bước 1: sắp xếp dữ liệu theo thứ từ nhỏ đến lớn.
Bước 2: xác định vị trí của phân vị mức p: L=p 100 (n+1)
Với p là phân vị cần tính, n là tổng số quan sát.
Bước 3: tính giá trị của phân vị mức p. 36 18 Phân vị
Ví dụ: Có mức lương/tháng (triệu đồng) của 12 nhân viên ngân hàng như sau: 34,50 35,50 36,50 34,80 33,55 33,10 34,90 37,30 35,40 39,25 35,20 34,80
Với số liệu trên, xác định phân vị mức 85. Giải thích ý nghĩa.
• Sắp xếp theo thứ tự tăng dần.
33,10 33,55 34,50 34,80 34,80 34,90 35,20 35,40 35,50 36,50 37,30 39,25
•L=  (n + 1) =  (12 + 1) = 11,05
• Vị trí của phân vị mức 85 là 11,05.
• Giá trị của phân vị mức 85: 37,30+(39,25-37,30)x0,05= 37,3975 37 Phân vị
Tứ phân vị (Quartiles): chia tổng thể thành 4 phần có số đơn vị bằng
nhau, mỗi phần chứa 25% tổng số đơn vị trong tổng thể. 25% 25% 25% 25% Q1Q2Q3 Phân vị Phân vị Phân vị mức 25 mức 50 mức 75 38 19 Phân vị
Ví dụ: Xác định Q1, Q2và Q3
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615 39
Các mức độ đo độ biến thiên Cho biết:
Đặc trưng về phân phối Curve A
Kết cấu và tính đồng đều của tổng thể.
Trình độ đại biểu của số trung bình
→Giá trị của các mức độ càng nhỏ, tổng thể Curve B
càng đồng đều, độ biến thiên ít, trình độ đại
biểu của số trung bình càng cao. Cùng giá trị trung bình, độ biến thiên khác nhau 40 20