Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 45
BÀI 4
CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ
Hướng dẫn học
Bài này giới thiệu một số mức độ nhằm phản ánh bản chất của các hiện tượng kinh tế -
xã hội, gồm số tuyệt đối và số tương đối; các mức độ trung tâm (số trung bình, trung vị:
và mốt) và các tham số đo độ biến thiên của tiêu thức (khoảng biến thiên, độ lệch tuyệt
đối trung bình, phương sai, độ lệch chuẩn và hệ số biến thiên).
Để học tốt bài này,
sinh viên : cần tham khảo các phương pháp học sau
•Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia
thảo luận trên diễn đàn.
•Đọc giáo trình: Lind, Marchal, Wathen. Thống kê trong kinh tế và Kinh doanh (sách
dịch), NXB Đại học KTQD.
•Đọc tài liệu: thuyết Thống kê, PGS. TS. Trần Thị Kim Thu chủ biên, NXB Đại
học KTQD.
•Sinh viên làm vic theo nhóm và trao đổi vi giảng vn trực tiếp tại lớp hc hoặc qua email.
Tham khảo các thông tin từ trang Web môn học.
Nội dung
Bài này s trình bày các m ph n ánh b n ch t c a các hi ng kinh t -h i, ức độ ện tượ ế
trong đó giớ ức tính toán và ý nghĩa c c đội thiệu khái niệm, công th a các m trong các
phân tích th ng kê.
Mục tiêu
Sau khi học xong bài y, sinh viên cần thc hin được các việc sau:
Trình bày được khái niệm và đặc điểm số tuyệt đối, số tương đối trong thống kê.
Phân biệt được các loại số tuyệt đối và số tương đối khác nhau.
•Nêu được khái niệm, công thức tính và so sánh các đặc điểm của số trung bình, trung
vị và mốt.
Nhận biết được các đặc trưng phân phối của dãy số.
•Trình bày được khái niệm, công thức tính đặc điểm các tham số đo độ biến thiên
của tiêu thức.
•Tính toán đượ các mức độ của hiện tượng kinh tế xã hội dựa theo số liệu đã có.
Bài 4: Các mức độ thống kê mô tả
46 STA302_Bai4_v1.0013109218
Tình huống dẫn nhập
Ðánh giá năng suất lao động và tiền lương
Bạn với cương vị nhân viên làm thống của một doanh nghiệp đang thực hiện nghiên cứu
nhằm đánh giá về năng suất lao động và tiền lương của doanh nghiệp mình. Sau khi đã tiến hành
điều tra thống kê và tổng hợp số liệu theo một số nội dung quan tâm, bạn thu được các dãy số phân
phối các bảng biểu tổng hợp khác. Bây giờ, nhiệm vụ của bạn thông qua các dãy số phân
phối đó thấy được các đặc trưng và so sánh độ biến thiên của hai tiêu thức năng suất lao động và
tiền lương.
1. Sử dụng mức độ nào để thấy được các đặc trưng về năng suất lao động tiền
lương của doanh nghiệp?
2. Sử dụng mức độ nào để so sánh độ biến thiên về năng suất lao động trung bình và
tiền lương trung bình của doanh nghiệp?
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 47
4.1. Số tuyệt đối và số tương đối trong thống kê
4.1.1. Số tuyệt đối trong thống kê
4.1.1.1. Khái niệm chung
Khái niệm: Số tuyệt đối trong thống mức độ biểu hiện quy mô, khối lượng của
hiện tượng nghiên cứu trong điều kiện thời gian và địa điểm cụ thể.
Như vậy, số tuyệt đối trong thống kê cho biết:
• Số đơn vị của tổng thể hay của bộ phận nghiên cứu
Ví dụ: Tổng số lao động của doanh nghiệp A ngày 1/7/N là 100 người.
• Trị số của chỉ tiêu số lượng
Ví dụ: Tổng quỹ tiền lương của doanh nghiệp A năm N là 500 triệu đồng.
Tác dụng:
• Số tuyệt đối cho ta nhận thức cụ thể về quy mô, khối lượng thực tế của hiện tượng
nghiên cứu.
• Số tuyệt đối cơ sở đầu tiên để tiến hành phân tích thống kê, đồng thời còn
sở để tính các mức độ khác.
• Số tuyệt đối là căn cứ không thể thiếu được trong việc xây dựng các kế hoạch kinh
tế quốc dân và chỉ đạo thực hiện kế hoạch.
4.1.1.2. Đặc điểm
Mỗi số tuyệt đối trong thống kê đều bao hàm một nội dung kinh tế - xã hội cụ thể trong
điều kiện thời gian và địa điểm nhất định.
Phải qua điều tra thực tế và tổng hợp một cách khoa học để có được số tuyệt đối trong
thống kê.
Các số tuyệt đối trong thống kê đều có đơn vị tính cụ thể.
4.1.1.3. Các loại số tuyệt đối
Căn cứ đặc điểm về qui mô của hiện tượng qua thời gian, số tuyệt đối hai loại :
• Số tuyệt đối thời kỳ phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong
một khoảng thời gian nhất định.
Ví dụ về tổng quỹ tiền lương doanh nghiệp A là số tuyệt đối thời kỳ.
Các số tuyệt đối thời kỳ đuợc hình thành thông qua sự tích luỹ về luợng trong suốt
thời gian nghiên cứu. Có thể cộng các số tuyệt đối thời kỳ của cùng một chỉ tiêu với
nhau; thời kỳ càng dài thì trị số của nó càng lớn.
• Số tuyệt đối thời điểm phản ánh quy mô, khối lượng của hiện tượng nghiên cứu
vào một thời điểm nhất định.
Ví dụ về tổng số lao động của doanh nghiệp A là số tuyệt đối thời điểm.
Số tuyệt đối thời điểm chỉ phản ánh tình hình của hiện tượng vào một thời điểm nào
đó; trước hoặc sau thời điểm đó, trạng thái của hiện tượng có thể khác. Số tuyệt đối
thời điểm không sự tích luỹ về lượng qua thời gian nên không cộng được với
nhau.
Bài 4: Các mức độ thống kê mô tả
48 STA302_Bai4_v1.0013109218
4.1.2. Số tương đối trong thống kê
4.1.2.1. Khái niệm chung
Khái niệm: Số tương đối trong thống biểu hiện quan hệ so sánh giữa hai mức độ nào
đó của hiện tượng nghiên cứu.
Quan hệ so sánh sự khác biệt bản giữa số tuyệt đối số tương đối trong thống
kê. Hai mức độ thiết lập quan hệ có thể là so sánh :
• Hai mức độ cùng loại nhưng khác nhau về thời gian hoặc về không gian, thực tế với
kế hoạch, bộ phận với tổng thể.
• Hai mức độ khác loại nhưng có mối liên hệ với nhau. Ðể có thể tính được số tương
đối này, hai mức độ so sánh phải có cùng thời gian và không gian.
Tác dụng:
• Các số tương đối tính được bằng các phương pháp so sánh có thể giúp ta đi sâu vào
đặc điểm của hiện tượng.
• Thuờng dùng trong lập kế hoạch và kiểm tra tình hình thực hiện kế hoạch.
• Dùng các số tương đối để biểu hiện tình hình thực tế trong khi cần bảo đảm được
tính chất bí mật của các số tuyệt đối.
4.1.2.2. Đặc điểm
Số tương đối kết quả so sánh giữa hai chỉ tiêu thống đã hay giữa hai mức độ
nào đó của hiện tượng nghiên cứu, không trực tiếp thu thập được qua điều tra.
Mỗi số tương đối đều phải gốc dùng để so sánh. Khi gốc so sánh khác nhau thì ý
nghĩa của số tương đối cũng khác nhau.
Đơn vị tính của số tương đối là số lần, phần trăm (%), phần nghìn (‰) hay đơn vị kép
tùy thuộc loại số tương đối.
4.1.2.3. Các loại số tương đối
Căn cứ theo nội dung mà số tương đối phản ánh, có thể chia thành 5 loại số tương đối
sau đây:
• Sơng đối động thái: biểu hiện biến động của hiện ợng nghiên cu qua thời gian.
Công thức tính:
1
0
y
ty
=
(lần, %)
Trong đó: t số tương đối động thái-
y0, y - 1 mức độ của hiện tượng tại kỳ gốc, kỳ nghiên cứu. Chú ý phải đảm
bảo tính chất có thể so sánh duợc giữa tử số và mẫu số, nghĩa là y0 và y 1
phải cùng phạm vi, phương pháp tính và đơn vị tính.
dụ: Tổng giá trị sản xuất của doanh nghiệp A năm 20 2 23 tỷ đồng năm 2
2021 là 20 tỷ đồng. Vậy, số tương đối động thái phản ánh sự phát triển về giá trị sản
xuất của doanh nghiệp A là: 𝑡 = 𝑦2022𝑦2021 =23
20 = 1,15 lần hay 115%.
• Số tương đối kế hoạch: dùng để biểu hiện nhiệm vụ kế hoạch kiểm tra tình hình
thực hiện kế hoạch. Có hai loại sau:
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 49
Số tương đối nhiệm vụ kế hoạch: biểu hiện quan hệ so sánh giữa mức độ cần đạt
tới của một chỉ tiêu nào đó với mức độ thực tế của chỉ tiêu này ở một kỳ được chọn
làm gốc so sánh.
Công thức tính:
k
n0
y
Ky
=
(lần, %)
Trong đó: Số tương đối nhiệm vụ kế hoạchKn -
yk - Mức độ kỳ kế hoạch
y0 - Mức độ thực tế ở kỳ gốc
Ví dụ: Tổng giá trị sản xuất của doanh nghiệp A năm 20 1 là 20 tỷ đồng, giá trị sản 2
xuất kế hoạch đề ra cho năm 20 2 22 tỷ đồng. Vậy, số tương đối nhiệm vụ kế 2
hoạch là:
𝐾𝑛=𝑦𝐾𝐻2022𝑦2021 =22
20 = 1,1lần hay 110%.
Số tương đối thực hiện kế hoạch: biểu hiện quan hệ so sánh giữa mức độ thực tế
đạt được trong kỳ nghiên cứu với mức độ kế hoạch đã đề ra cùng kỳ về một chỉ tiêu
kinh tế nào đó.
Công thức tính:
1
tk
y
Ky
=
(lần, %)
Trong đó: Số tương đối thực hiện kế hoạchKt -
yk - Mức độ kỳ kế hoạch
y1 - Mức độ thực tế ở kỳ nghiên cứu
Ví dụ: Tổng giá trị sản xuất của doanh nghiệp A năm 20 2 là 23 tỷ đồng, giá trị sản 2
xuất kế hoạch đề ra cho năm 20 2 22 tỷ đồng. Vậy, số tương đối thực hiện kế 2
hoạch hay tỷ lệ hoàn thành kế hoạch là: 𝐾𝑡=𝑦𝑇𝑇2022𝑦𝐾𝐻2022 =23
22 = 1,045lần
hay 104,5%.
Giữa số tương đối động thái, số tương đối nhiệm vụ kế hoạch và số tương đối hoàn
thành kế hoạch (của cùng một chỉ tiêu) có mối quan hệ với nhau. Cụ thể:
1 k 1
0 0 k
y y y
y y y
=
hay t = K Kn T
• Số tương đối kết cấu: biểu hiện tỷ trọng của mỗi bộ phận cấu thành trong một tổng
thể. Nghiên cứu số tương đối kết cấu để thấy được đặc điểm cơ bản của hiện tượng
trong những điều kiện khác nhau.
Công thức tính:
bp
tt
y
dy
= (lần, %,‰)
Trong đó Số tương đối kết cấu: d -
ybp - Mức độ của bộ phận
ytt - Mức độ của tổng thể
Bài 4: Các mức độ thống kê mô tả
50 STA302_Bai4_v1.0013109218
Ví dụ: Tổng số lao động của doanh nghiệp A là 100 người, trong đó, có 80 lao động
nữ và 20 lao động nam.
Như vậy, kết cấu lao động nam trong tổng số lao động là:
nam
nam
y 20
d 0,2
y 100
= = =
lần hay 20%
Và kết cấu lao động nữ trong tổng số lao động là:
nu
nu
y 80
d 0,8
y 100
= = =
lần hay 80%
• Số tương đối không gian: : sử dụng trong hai trường hợp
Biểu hiện quan hệ so sánh giữa hai hiện tượng cùng loại nhưng khác nhau về không
gian.
Ví dụ: Giá vàng ở Hà Nội so với giá vàng ở thành phố Hồ Chí Minh.
Biểu hiện quan hệ so sánh giữa hai bộ phận trong một tổng thể.
Ví dụ: Tỷ lệ lao động nam so với lao động nữ của doanh nghiệp A.
• Số tương đối cường độ: biểu hiện quan hệ so sánh giữa hai mức độ của hai hiện
tượng khác loại nhưng có mối liên hệ với nhau.
Ví dụ:
Mật độ dân số =
Dân số
(người/km2)
Diện tích
Đơn vị tính của số tương đối cường độ là đơn vị kép.
4.1.3. Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê
• Khi sử dụng số tương đối và tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên
cứu để rút ra kết luận cho đúng.
Ví dụ: Cùng là tỷ lệ phế phẩm 5%, nhưng với các sản phẩm bình thuờng thì đây
tỷ lệ chấp nhận được. Còn với những sản phẩm y tế, tỷ lệ này lại là quá cao vì hậu
quả sẽ rất nghiêm trọng.
• Phải vận dụng một cách kết hợp các số tương đối với số tuyệt đối vì:
o Số tương đối trong thống kê là kết quả so sánh giữa hai số tuyệt đối đã có, là sự
kết hợp khác nhau giữa các số tuyệt đối.
o Ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối mà nó phản ánh.
dụ: Năm 20 , tốc độ tăng GDP của quốc gia A 1,7% trong khi tốc độ tăng 22
GDP của quốc gia B Nếu chỉ căn cứ vào hai số tương đối này, chúng ta có là 5,9%.
thể đưa ra nhận định lạc quan rằng trong thời gian tới, nền kinh tế quốc gia A sẽ
đuổi kịp kinh tế quốc gia B. Nhưng khi xem xét các số tuyệt đối, ta thấy qui
GDP của quốc gia A năm 20 0 là 106,426 tỷ USD, trong khi đó, GDP của quốc gia 2
B là 14419,4 tỷ USD. Như vậy, 1% tăng trưởng của quốc gia B gần gấp rưỡi cả nền
kinh tế của Việt Nam. Vì vậy, nhận định trên là hoàn toàn sai lầm.
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 51
4.2. Các mức độ trung tâm
4.2.1. Số trung bình
4.2.1.1. Khái niệm chung
Khái niệm: Số trung bình (hay số bình quân) trong thống mức độ đại biểu theo
một tiêu thức nào đó của một tổng thể gồm nhiều đơn vị cùng loại.
dụ Năng suất lao động trung bình của công nhân doanh nghiệpA tháng 1/N 30 :
triệu đồng.
Trong dụ này, con số 30 triệu đồng biểu hiện mức độ đại diện theo tiêu thức năng
suất lao động của công nhân toàn doanh nghiệp.
Đặc điểm:
• Số trung bình san bằng mọi chênh lệch về lượng biến của tiêu thức nghiên cứu để
có một con số duy nhất đại diện cho tất cả lượng biến.
• Số trung bình chịu ảnh huởng của lượng biến đột xuất (lượng biến quá lớn hoặc quá
bé) trong dãy số. Ðây cũng là nhược điểm của số trung bình.
Tác dụng:
• Nêu lên đặc điểm chung của hiện tượng kinh tế hội số lớn trong điều kiện thời -
gian và địa điểm cụ thể.
• Tạo điều kiện để so sánh giữa các hiện tượng không có cùng quy mô.
Ví dụ Để so sánh giữa các doanh nghiệp không có cùng qui mô, không thể so sánh :
lợi nhuận hay doanh thu của các doanh nghiệp phải so sánh năng suất lao động
trung bình, mức doanh lợi trung bình…
• Tng qua biến động của s bình quân đthy đưc xu hướng pt triển của hiện tượng.
Ví dụ: Thông qua năng suất lao động trung bình của doanh nghiệp qua các năm, có
thể thấy xu hướng phát triển của năng suất lao động toàn doanh nghiệp.
• Dùng để lập kế hoạch, tích thống kê.phân
4.2.1.2. Các loại số bình quân
Thống kê học tờng ng hai loại số trung bình: số trung bình cộng và strung nh nn.
• Số trung bình cộng
Số trung bình cộng thực chất số trung bình được tính theo phương pháp trung bình
cộng trong toán học.
Công thức chung: Chú ý
x
=
Tổng lượng biến của tiêu thức
Tổng số đơn vị của tổng thể
o Số trung bình cộng giản đơn: vận dụng khi tài liệu chưa phân tổ
Công thức tính:
i
x
x n
=
Bài 4: Các mức độ thống kê mô tả
52 STA302_Bai4_v1.0013109218
o S nố trung bình c ng gia quy : vậ n d ng khi tài li c phân t . ệu đã đượ
Ứng với m ng biỗi lượ ế n xi s m t t n s fi hay nói cách khác, trong m i t
(bộ phận), m ng bi n x lỗi lượ ế i ặp lại là f l y, t ng bii ần. Như vậ ổng lượ ến của tiêu
th fức sẽ tổng các xi i và tổng số đơn vị của tổng thsẽ tổng các fi. Khi đó,
công th c tính s trung bình c ng gia quy n là:
i i
i
x f
xf
=
Trong đó, fi được gọi tần số, đóng vai trò là quyền sốại lượng có mặt cả tsố
mẫu số), nóin tầm quan trọng của từng lượng biến trong tính số bình quân.
Có hai trường hợp trong tính trung bình cộng gia quyền:
▪ Trường hợp 1 tính số trung bình với dãy số không có khoảng cách tổ,
Ví dụ: Có tài liệu về tiền lương của lao động trong doanh nghiệp A:
Lương
(triệu đồng)
xi
Số lao động
(người)
fi
xifi di xidi
2,5 2 5,0 0,02 0,050
3,0 8 24,0 0,08 0,240
3,5 12 42,0 0,12 0,420
4,0 15 60,0 0,15 0,600
4,5 25 112,5 0,25 1,125
5,0 20 100,0 0,20 1,000
5,5 13 71,5 0,13 0,715
6,0 5 30,0 0,05 0,300
Tổng 100 445,0 1,00 4,450
u cầu: nh tiền lương trung bình của lao động trong doanh nghiệp A nói tn.
Phân tích đề bài:
Đây tài liệu sau khi phân tổ không khoảng cách tổ, cần phải tính theo
công thức bình quân cộng gia quyền.
Xác định xi, f i.
xi: tiêu lượng biến, là biểu hiện cụ thể bằng số của thức số lượng. Tiêu thức
đang nghiên cứu là tiền lương lượng biến x là tiền lương i .
fi: tần số, số đơn vị của tổng thể được sắp xếp vào từng tổ. mỗi mức
lương khác nhau có số lao động tương ứng → tần số f là số lao động. i
Áp dụng công thức, ta có tiền lương trung bình của lao động trong doanh
nghiệp là:
i i
i
x f 445
x100
f
==
= 4,45 (triệu đồng)
Việc tính số trung bình theo cách nào phụ thuộc vào điều kiện tài liệu cho
phép. Nếu tài liệu chỉ tần suất d , hoàn toàn có thể sử dụng để thay thếi cho
fi. Ta có công thức:
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 53
i i i i
i
x f
x x d
f
==

(nếu di tính bằng đơn vị lần)
Hoặc:
i i i i
i
x f x d
x100
f
==

(nếu di tính bằng đơn vị %)
Trong đó, d đóng vai trò là quyền số.i
Trở lại ví dụ trên, giả sử đề bài chỉ cho tỷ trọng lao động tổng số công trong
nhân nhận các mức lương tương ứng, tức chỉ cho tần suất d (bảng trên). Khi i
đó, mức lương trung bình của công nhân trong doanh nghiệp sẽ được nh
như sau:
i i
x x d=
= 4,45 (triệu đồng)
Kết quả này hoàn toàn trùng khớp với kết quả tính được ở trên. Như vậy, dù
tính theo công thức nào, kết quả số trung bình tính ra đều như nhau.
▪ Trường hợp 2 tính số trung bình với dãy số có khoảng cách tổ,
dụ, có tài liệu về năng suất lao động của lao động doanh nghiệp B như sau:
NSLĐ
(kg)
Số lao động
(người)
fi
xi xifi di xidi
400 – 500 10 450 4500 0,050 22,50
500 – 600 30 550 16500 0,150 82,50
600 – 700 45 650 29250 0,225 146,25
700 - 800 80 750 60000 0,400 300,00
800 – 900 30 850 25500 0,150 127,50
900 – 1000 5 950 4750 0,025 23,75
Tổng 200 140500 1,000 702,50
Yêu cầu: tính năng suất lao động trung bình của lao động doanh nghiệp B
nói trên.
Phân tích đề bài:
Đây tài liệu sau khi phân tổ khoảng cách tổ, cần phải nh theo công
thức bình quân cộng gia quyền.
Xác định xi, f i.
xi là trị số giữa làm lượng biến đại diện cho từng tổ. Tiêu thức nghiên cứu là
năng suất lao động là trị số giữa về năng suất lao động của từng tổ → x i
fi tần số. Ở mỗi mức năng suất lao động khác nhau số lao động tương
ứng → tần số f là số lao động. i
Áp dụng công thức, ta có năng suất lao động trung bình của lao động là:
i i
i
x f 140500
x200
x
==
= 702,5 kg
Bài 4: Các mức độ thống kê mô tả
54 STA302_Bai4_v1.0013109218
Tương tự ví dụ trên, trong trường hợp chỉ số liệu tỷ trọng số lao động ứng
với các mức năng suất lao động, có thể áp dụng công thức:
i i
x x d=
= 702,5 kg
Hai công thức đều cho kết quả như nhau về năng suất lao động trung bình
của lao động doanh nghiệp B.
• Số trung bình nhân
Số trung bình nhân thực chất số trung bình được tính theo phương pháp trung bình
nhân trong toán học.
Thông thường, vận dụng số trung bình nhân khi các lượng biến có quan hệ tích. Có
hai trường hợp:
o Số trung bình giản đơnnhân : áp dụng khi tài liệu chưa phân tổ.
nn
1 2 n i
x x x ... x x = =
o Số trung bình nhân gia quyền: khác nhau áp dụng khi các tần số fi
ii
1 2 k i
ff
f f f f
1 2 k i
x x x ... x x= =

Ví dụ: Có tài liệu về tốc độ phát triển của chỉ tiêu doanh thu tại doanh nghiệp A
trong 10 năm như sau:
5 năm có tốc độ phát triển hàng năm là 110%
2 năm có tốc độ phát triển hàng năm là 108%
3 năm có tốc độ phát triển hàng năm là 115%
Yêu cầu: Tính tốc độ phát triển doanh thu trung bình hàng năm giai đoạn 10 năm
nói trên của doanh nghiệp A.
Phân tích:
xi tốc độ phát triển. Nếu nhân các tốc độ phát triển với nhau sẽ được tốc độ
phát triển doanh thu của doanh nghiệp năm thứ 10 so với năm đầu tiên. Vì vậy,
các x i có quan htích số và phải sử dụng công thức trung bình nhân trong trường
hợp này.
fi là thời gian có các tốc độ phát triển tương ứng.
Như vậy, tốc độ phát triển trung bình về doanh thu được tính theo công thức
trung bình nhân gia quyền như sau:
ii
ff5 2 3
10
i
x x 1,1 1,08 1,15 1,1107= = =
lần (111,07%)
4.2.1.3. Điều kiện vận dụng số trung bình
Có hai điều kiện khi vận dụng số trung bình:
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 55
Số trung bình được tính từ tổng thể đồng chất.nên Các đơn vị trong tổng thể đồng
chất có cùng tính chất bản nên mới có thể có ng một lượng tương ứng đại diện cho
các đơn vị. Trái lại, không tính số trung bình từ tổng thể bao gồm các đơn vị khác nên
nhau về tính chất vì mức độ này không những không có ý nghĩa thực tế mà còn có khi
làm cho ta hiểu sai lệch bản chất của hiện tượng.
Số trung bình chung chỉ phản ánh đặc trưng chung của toàn btổng thể nghiên
cứu, bỏ qua những chênh lệch thực tế giữa các đơn vị tổng thể. vậy, cần vận dụng
kết hợp với số trung bình tổ và dãy số phân phối để có thể giải thích sâu sắc từng khía
cạnh, từng bộ phận của hiện tượng.
4.2.2. T rung vị (Me)
4.2.2.1. Khái niệm chung
Khái niệm: Trung vị là lượng biến tiêu thức của đơn vị đứng ở vị trí chính giữa trong
một dãy số lượng biến, phân chia dãy số lượng biến thành hai phần, mỗi phần số đơn
vị tổng thể bằng nhau.
Tác dụng:
• Trung vị nêu lên mức độ đại biểu của hiện tượng, mà không san bằng bù trừ chênh
lệch giữa các lượng biến (khác số trung bình). thể bổ sung hay thay thế cho
số trung bình trong trường hợp tính số trung bình gặp khó khăn.
• Là một trong các chỉ tiêu dùng để nêu lên đặc trưng của một dãy số phân phối
• Không chịu ảnh hưởng của những lượng biến đột xuất.
• Dựa vào tính chất toán học đáng chú ý của rung vị Tổng các độ lệch tuyệt đối t :
giữa các lượng biến với trung vị là trị số nhỏ nhất so với số trung bình và mốt, nên
trung vị được sử dụng ứng dụng trong nhiều công tác kỹ thuật phục vụ công cộng,
bố trí ở vị trí thuận lợi để có thể phục vụ được nhiều người mà tiết kiệm nhất.
4.2.2.2. Cách xác định
• Xác định trung vị đối với dãy số không khoảng cách tổ: ượng biến của Me l
đơn vị đứng ở vị trí chính giữa.
o Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, trung vị sẽ là lượng biến của đơn vị đứng
ở vị trí thứ m + 1, tức là Me = x m+1
o Nếu số đơn vị tổng thể ∑f = 2m, trung vị sẽ là giá trị trung bình cộng hai chẵn:
lượng biến của đơn vị đứng ở vị trí thứ m và m + 1, tức là
m m 1
ex x
M2+
+
=
Xét ví dụ về tiền lương của lao động trong doanh nghiệp A:
Tiền lương (triệu đồng) xi Số lao động (người) fi Tần số tích lũy Si
2,5 2 2
3,0 8 10
3,5 12 22
4,0 15 37
4,5 25 62
Bài 4: Các mức độ thống kê mô tả
56 STA302_Bai4_v1.0013109218
5,0 20 82
5,5 13 95
6,0 5 100
Tổng 100
Trong ví dụ này, số đơn vị tổng thể (tổng số lao động) là chẵn ∑f = 2m = 100. Vậy :
trung vị là trung bình cộng của hai lượng biến đứng ở vị trí thứ 50 và 51.
Ðể xác định giá trị của hai đơn vthứ 50 và 51 ta phải dựa vào tần sốch luỹ. Tbảng
nh tần sch luỹ trên, nhận thấy hai đơn vị thứ 50 51 nằm ở tổ thứ m mức
tiền ơng 4,5 triệu đồng. Nghĩa là, xm = xm+1 = 4,5 triệu đồng. Từ đó:
m m 1
ex x 4,5 4,5
M2 2
+
++
== = 4,5 (triệu đồng)
Trung vị về tiền lương của lao động doanh nghiệp A tính ra là 4,5 triệu đồng. Ðiều
này nghĩa 50% số lao động nhận mức lương từ 4,5 triệu đồng trở xuống
50% số lao động nhận mức lương từ 4,5 triệu đồng trở lên.
• Xác định trung vị đối với dãy số có khoảng cách tổ: thực hiện theo hai bước
o ớc 1,c định tổ có trung vị: tổ chứa lượng biến của đơn vị đứngvị trí giữa.
o Bước 2 ính trị số gần đúng của trung vị theo công thức, t :
e
e e
e
iM 1
e M min M M
fS
2
M x h f
=+
Trong đó: x - là g Me(min) iới hạn dưới của tổ có trung vị
hMe - là k hoảng cách tổ có trung vị
fi - là t ổng số đơn vị tổng thể
S(Me-1) - là tổng các tần số của các tổ đứng trước tổ có trung vị
fMe - là tần số của tổ có trung vị
Xét ví dụ về năng suất lao động của lao động doanh nghiệp B:
NSLĐ (kg) Số lao động (người) fi Si
400 500 10 10
500 600 30 40
600 700 45 85
700 800 80 165
800 900 30 195
900 1000 5 200
Tổng 200
Dựa vào tần số tích lũy S , xác định được tổ chứa trung vị là tổ 700 800 tổ i -
này chứa hai đơn vị đứng ở vị trí chính giữa thứ 100 và 101. Từ đó, tính trung vị
theo công thức:
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 57
e
e e
e
iM 1
e M min M M
f200
S 85
2 2
M x h 700 100
f 80
−−
= + = +
= 718,75 kg
Như vậy, 50% số lao động có mức năng suất lao động từ 718,75kg trở xuống
và 50% số lao động có mức năng suất lao động từ 718,75kg trở lên.
4.2.3. Mốt (Mo)
4.2.3.1. Khái niệm chung
Khái niệm: Mốt là biểu hiện được gặp nhiều nhất của tiêu thức nghiên cứu trong một
tổng thể hay trong một dãy số phân phối.
Ưu điểm:
• Mốt không chịu ảnh hưởng của những lượng biến đột xuất.
• Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số luợng.
Nhược điểm:
• Mốt kém nhạy bén với sự biến thiên của tiêu thức Chỉ quan tâm tới lượng biến:
tần số lớn nhất mà không quan tâm tới các lượng biến khác.
• Nếu dãy số lượng biến có đặc điểm phân phối không bình thường (có quá nhiều Mốt
hoặc không có Mốt) thì cũng không nên xác định mốt.
Tác dụng:
• Mốt nêu lên mức độ đại biểu của hiện tượng, mà không san bằng bù trừ chênh lệch
giữa các lượng biến (khác số thể bổ sung hay thay thế cho số trung bình).
trung bình trong trường hợp tính số trung bình gặp khó khăn.
• Là một trong các chỉ tiêu dùng để nêu lên đặc trưng của một dãy số phân phối
• Không chịu ảnh hưởng của những lượng biến đột xuất
• Mốt sử dụng trong bài toán thuyết phục vụ đám đông: trong kinh doanh, chọn
loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và vừa ý nhất với số đông để sản xuất,
đáp ứng nhu cầu khách hàng.
4.2.3.2. Cách xác định
• Đối với dãy số thuộc tính: mốt là biểu hiện có tần số lớn nhất.
dụ: tài liệu về lao động doanh nghiệp A phân tổ theo tiêu thức giới tính vào
thời điểm 1/7 như sau:
Giới tính
Số lao động
(người)
Nam 30
Nữ 70
Bảng trên cho thấy mốt về giới tính của lao động doanh nghiệp A là “nữ” vì có tần
số (số lao động) lớn nhất.
• Đối với dãy số lượng biến không có khoảng cách tổ: mốt là lượng biến có tần số
lớn nhất.
Bài 4: Các mức độ thống kê mô tả
58 STA302_Bai4_v1.0013109218
Xét dụ về tiền lương của lao động trong doanh nghiệp A (mục 4.2.2.2): Mốt về
tiền lương của lao động doanh nghiệp này là 4,5 triệu đồng vì có nhiều lao động có
mức lương này nhất (25 lao động).
• Đối với y số lượng biến có khoảng ch tổ bằng nhau: c định Mốt qua hai ớc
Bước 1, xác định tổ chứa Mốt, là tổ có tần số lớn nhất.
Bước 2, xác định trị số gần đúng của Mốt theo công thức:
( ) ( )
o o Mo Mo 1
o M min M Mo Mo 1 Mo Mo 1
f f
M x h f f f f
−+
=+ +
Trong đó: Giới hạn dưới của tổ có mốt x : Mo(min)
hMo: Khoảng cách tổ có mốt
fMo: Tần số của tổ có mốt
fMo-1: Tần số của tổ đứng liền trước tổ có mốt
fMo+1: Tần số của tổ đứng liền sau tổ có mốt.
Xét dụ về năng suất lao động của lao động doanh nghiệp B (mục 4.2.2.2). Xác
định tổ chứa Mốt tổ 700 800 kg số lao động lớn nhất (80 người). Từ đó,
xác định giá trị gần đúng của Mốt:
( ) ( )
o80 45
M 700 100 741,2 kg
80 45 80 30
= + =
+
• Đối với dãy số lượng biến khoảng cách tổ không bằng nhau: việc xác định
Mốt phải căn cứ vào mật độ phân phối
i
ii
f
mh
=
. các khoảng cách tổ khác nhau
nên tổ chứa Mốt sẽ là tổ có mật độ phân phối lớn nhất. Cần phải thêm cột vào bảng
tính để xác định tổ chứa Mốt tính giá trị Mốt tương tự công thức trên, trong đó
tần số được thay bằng mật độ phân phối.
4.2.4. Đặc trưng phân phối của dãy số
Dựa vào mối quan hệ giữa ba mức độ trung tâm: số trung bình, trung vị và mốt, ba
đồ thị biểu diễn đặc trưng phân phối của dãy số như sau:
x
= Me = Mo
Phân phối chuẩn
x
< Me < Mo
Phân phối lệch trái
Mo < Me <
x
Phân phối lệch phải
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 59
Từ các đồ thị, xác định được Mốt trước tiên vì đây là lượng biến tương ứng với tần số
lớn nhất. Số trung bình trung vị nằm đâu sẽ quyết định hình dáng của phân phối.
Trong phân phối chuẩn, trung vị luôn nằm giữa số trung bình và Mốt.
x = Me = Mo: dãy số có phân phối chuẩn.
x
< Me < M0:y s pn phi lệch ti, số đơn vị có ợng biến nhn trung bình
chiếm đa số.
x > Me > M0: dãy số có phân phối lch phải, số đơn vị có ợng biến lớn n trung nh
chiếm đa số.
Với ví dụ về năng suất lao động ở doanh nghiệp B, đã tính được:
• Năng suất lao động trung bình x
= 702,5 kg
• Trung vị về năng suất lao động Me = 718,75 kg
• Mốt về năng suất lao động Mo =741,2 kg
So sánh giữa số trung bình, trung vị mốt, nhận thấy dãy số phân phối chuẩn, lệch
trái. Từ đó, số lao động có năng suất lao động lớn hơn 702,5 kg sẽ chiếm đa số.
4.3. Các tham số đo độ biến thiên của tiêu thức
Ý nghĩa của các tham số đo độ biến thiên hay độ phân tán của tiêu thức:
• Giúp đánh giá trình độ đại biểu của số bình quân nếu độ biến thiên thấp, trình độ :
đại biểu của số bình quân cao và ngược lại.
• Quan sát độ biến thiên của tiêu thức trong 1 dãy số lượng biến cho thấy đặc trưng
về phân phối và tính đồng đều của tổng thể .
• Độ biến thiên của tiêu thức thường được dùng trong nhiều trường hợp nghiên cứu
thống kê phân tích biến động, mối liên hệ trong điều tra, dự đoán...:
Ví dụ: Số liệu năng suất lao động của 5 công nhân trong 2 tổ sản xuất như sau:
NSLĐA NSLĐB
40 58
50 59
60 60
70 61
80 62
Khi so sánh năng suất lao động trung bình 2 tổ, kết quả cho thấy
A
x =
B
x = 60 kg.
Năng suất lao động trung bình của công nhân 2 tổ sản xuất như nhau nhưng tính đại
biểu của
B
x cao hơn vì độ biến thiên về năng suất lao động của 5 công nhân tổ sản xuất
B ít hơn.
Với tổng thể số lớn đơn vị, để đưa ra kết luận đúng đắn cho các hiện tượng, người ta
cần so sánh cả độ biến thiên của tiêu thức. Có 5 tham số sau:
Bài 4: Các mức độ thống kê mô tả
60 STA302_Bai4_v1.0013109218
4.3.1. Khoảng biến thiên
Khoảng biến thiên chênh lệch giữa lượng biến lớn nhất lượng biến nhỏ nhất của
tiêu thức nghiên cứu, biểu hiện bằng công thức:
Công thức tính: R = x - xmax min
Khoảng biến thiên chỉ tiêu đơn giản nhất, nêu lên một cách khái quát nhất độ biến
thiên của tiêu thức. Nhược điểm của chỉ tiêu này là chỉ phụ thuộc vào 2 lượng biến lớn
nhất và nhỏ nhất trong dãy số, mà không xét đến các lượng biến khác, do đó, việc nhận
định thể chưa thật hoàn toàn chính xác. Khoảng biến thiên rất nhạy cảm với các
lượng biến đột xuất.
4.3.2. Độ lệch tuyệt đối trung bình
Độ lệch tuyệt đối trung bình số trung bình cộng của c độ lệch tuyệt đối giữa các
lượng biến với số trung bình cộng của các lượng biến đó.
Công thức:
• Giản đơn:
i
x x
dn
=
• Gia quyền:
i i
i
x xf
df
=
Trong công thức này, nguời ta phải lấy giá trị tuyệt đối, tức bỏ qua sự khác nhau thực
tế về dấu của các độ lệch.
Độ lệch tuyệt đối trung bình có thể phản ánh độ biến thiên của tiêu thức một cách chặt
chẽ hơn khoảng biến thiên, vì nó có xét đến tất cả mọi lượng biến trong dãy số. Nhưng
khi tính toán chỉ tiêu này, ta chỉ t các trị số tuyệt đối của độ lệch, tức bỏ qua sự
khác nhau thực tế về dấu của các độ lệch, thế việc phân tích bằng các phương
pháp toán học gặp nhiều khó khăn.
4.3.3. Phương sai
Phương sai là số trung bình cộng của bình phương các độ lệch giữa các lượng biến với
số trung bình cộng của các lượng biến đó.
Công thức:
Giản đơn: 𝑆2=∑(𝑥𝑖𝑥)2
𝑛1 =𝑛 𝑛−1 [𝑥𝑖
2
𝑛 (𝑥𝑖
𝑛)2] = 𝑛
𝑛−1 [𝑥2 (𝑥) ]2
Gia quyền: 𝑆2=∑(𝑥𝑖𝑥)2𝑓𝑖
𝑓𝑖−1 =𝑥𝑖
2𝑓𝑖
𝑓𝑖−1 (∑𝑥𝑖𝑓𝑖)2
𝑓𝑖(∑𝑓𝑖−1) =𝑓𝑖
𝑓𝑖−1 [𝑥2 (𝑥) ]2
Phương sai là chỉ tiêu thường dùng để đánh giá độ biến thiên của tiêu thức. Vì được tính
trên cơ sở bình phương các độ lệch nên kết quả tính toán bị khuếch đại và không đơn
vị tính phù hợp.
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 61
4.3.4. tiêu Độ lệch chuẩn
Độ lệch tiêu chuẩn là căn bậc hai của phương sai, tức là số trung bình toàn phương của
bình phương các độ lệch giữa các lượng biến với số trung bình cộng của các lượng biến
đó.
Công th c: 𝑆 = 𝑆2
là căn bậc hai của phương sai, độ lệch tiêu chuẩn đã khắc phục được nhược điểm của
phương sai là có đơn vị tính và giảm khuếch đại.
Độ lệch tiêu chuẩn chỉ tiêu hoàn thiện nhất thường dùng nhất trong nghiên cứu
thống kê để đánh giá độ biến thiên của tiêu thức.
Cả bốn chỉ tiêu trên đều chỉ dùng để so sánh biến thiên của các hiện tượng cùng loại và
số trung bình bằng nhau trường hợp muốn so sánh độ biến thiên của các hiện . Trong
tượng khác loại hoặc các hiện tượng cùng loại và có số trung bình khác nhau, nguời ta
sẽ sử dụng tham số thứ năm, đó là hệ số biến thiên.
4.3.5. Hệ số biến thiên
Hệ số biến thiên là tham số đo độ biến thiên tương đối và được tính bằng cách so sánh
giữa độ lệch tiêu chuẩn với số trung bình cộng.
Công th c: 𝑉 = 𝑆
𝑥×100
Ví dụ: So sánh độ biến thiên của năng suất lao động và tiền lương trong doanh nghiệp
A, cho biết:
NS
x = 50 sản phẩm, 𝑆𝑁𝑆𝐿Đ= 5 sản phẩm,
TL
x = 3500 nghìn đồng, 𝑆𝑇𝐿=
490 nghìn đồng.
Từ đề bài, nhận thấy năng suất lao động tiền lương hai hiện tượng khác loại nên
cần dùng hệ số biến thiên để so sánh độ biến thiên của hai chỉ tiêu này.
𝑉𝑁𝑆𝐿Đ=𝑆𝑁𝑆𝐿Đ𝑥𝑁𝑆𝐿Đ×100 =5
50 ×100 =10%
𝑉𝑇𝐿 =𝑆𝑇𝐿𝑥𝑇𝐿 ×100 =490
3500 ×100 =14%
VNSLĐ < VTL nên năng suất lao động độ biến thiên nhỏ hơn so với tiền lương, năng
suất lao động trung bình có trình độ đại biểu cao hơn so với tiền lương trung bình.
Bài 4: Các mức độ thống kê mô tả
62 STA302_Bai4_v1.0013109218
Tóm lược cuối bài
• Các hiện tượng kinh tế xã hội thường rất đa dạng và phức tạp. Mỗi đặc điểm cơ bản của hiện -
tượng có thể được biểu hiện bằng các mức độ khác nhau. Các mức độ thường dùng trong thống
kê là: Số tuyệt đối, số tương đối, số trung bình, các chỉ tiêu đo độ biến thiên của tiêu thức.
• Khi vận dụng số tương đối và tuyệt đối cần chú ý điều kiện vận dụng chung: thứ nhất là phi căn
cứ vào đặc điểm của hiện tượng để t ra kết luận cho phù hợp; thứ hai phải vận dụng kết hợp
số tương đối tuyệt đối để nhận thức hiện tượng một cách đầy đủ, toàn diện u sắc.
• Các mức độ trung tâm: số trung bình, trung vị và mốt đều có ý nghĩa phản ánh, công thức tính
và điều kiện vận dụng khác nhau. Vì vậy, trong quá trình vận dụng phải kết hợp phân tích các
mức độ đó thì việc phân tích mới sâu sắc và toàn diện, mới nhận thức đúng sự tồn tại của hiện
tượng trong điều kiện không gian và thời gian cụ thể.
• Các mức độ đo độ biến thiên giúp chúng ta đánh giá độ đồng đều của tổng thể và là sở để
áp dụng nhiều phương pháp thống khác. Bao gồm 5 mức độ: khoảng biến thiên, độ lệch
tuyệt đối trung bình, phương sai, độ lệch chuẩn, hệ số biến thiên.tiêu
Bài 4: C ác mức độ thống kê mô tả
STA302_Bai4_v1.0013109218 63
Câu hỏi ôn tập
1. Trình bày khái niệm, ý nghĩa, đặc điểm và các loại số tuyệt đối trong thống kê.
2. Trình bày khái niệm, ý nghĩa, đặc điểm và các loại số tương đối trong thống kê.
3. Phân tích điều kiện vận dụng chung số tương đối và tuyệt đối trong thống kê.
4. Nêu k hái niệm, ý nghĩa số trung bình trong thống kê.
5. Trình bày các loại số trung bình trong thống kê.
6. Trình bày ý nghĩa nội dungc chỉ tiêu đo độ biến thn của tiêu thức.
Bài tập
Bài 1.
Có thông tin về độ tuổi của 36 triệu phú ở Mỹ như sau:
31 64 39 66 68 45 60 54 53
79 75 47 74 59 64 48 69 71
71 42 39 57 55 61 79 48 68
67 42 79 38 48 77 52 52 66
Yêu cầu:
a. Xây dựng bảng tần số phân bố với 6 tổ có khoảng cách tổ bằng nhau.
b. Tính tuổi bình quân của các triệu phú trên theo hai cách:
- Từ tài liệu ban đầu
- Từ tài liệu phân tổ
So sánh hai kết quả trên và cho biết kết quả nào chính xác hơn.
c. Tính trung vị về tuổi của các triệu phú trên.
Bài 2.
Một nhà nghiên cứu xã hội học đã nghiên cứu tình trạng tội phạm ở một địa phương. Sau khi thu
thập tài liệu, ông đã tính được tỷ lệ phần trăm tội phạm so với năm liền trước như sau (tốc độ phát
triển):
Năm 2017 2018 2019 2020 2021 2022
Tốc độ phát triển (%) 96 105 110 103 106 95
Yêu cầu:
a. Tính tốc độ phát triển trung bình về số lượng tội phạm trong các năm 2017-2022.
b. Tính tốc độ phát triển trung bình về số lượng tội phạm trong các năm 2017-2020.
c. Ông ta đã tìm thêm được một tài liệu cho biết rằng, trong những năm trước đây, từ 20 đến 15
2016, tốc độ phát triển tội phạm trung bình là 102% một năm. Hãy tính tốc độ phát triển trung
bình về số lượng tội phạm của địa phương trong giai đoạn 2015-2022.
Bài 3.
Bài 4: Các mức độ thống kê mô tả
64 STA302_Bai4_v1.0013109218
Có tài liệu phân tổ lao động theo tiêu thức năng suất lao động ở 1 công ty như sau :
Năng suất lao động (kg) Số lao động
<400
400-500
500-700
700-1000
1000-1200
1200
10
15
35
42
15
8
Hãy tính:
a. Năng suất lao động trung bình
b. Mốt về năng suất lao động
c. Trung vị về năng suất lao động
d. Phương sai về năng suất lao động
e. Nhận xét về phân phối của số lao động theo năng suất lao động
Bài 4.
số liệu về năng suất thu hoạch, diện tích sản lượng sản phẩm A của 6 huyện thuộc tỉnh M
trong 2 năm như sau:
Huyện
Năm 2021 Năm 2022
Năng suất thu
hoạch (t/ha)
Ttrọng diện tích
gieo trồng (%)
Năng suất
thu hoạch (tạ/ha)
Sản lưng
thu hoạch
(tấn)
Tlệ hoàn tnh
kế oạch vsản
lượng (%)
A 65 20 70 7000 95
B 80 15 82 6560 92
C 94 25 92 11040 90
D 71 10 78 4680 94
E 72 16 85 6800 86
G 84 14 90 6300 88
Yêu cầu:
a. Tính năng suất thu hoạch trung bình của tỉnh M trong từng năm.
b. Tính t l % hn thành kế hoạch trung bình về sn ợng thu hoạch của tn tỉnh trong năm 2022.
c. Tính tỷ trọng diện tích gieo trồng của từng huyện trong tỉnh M năm 2022.
Bài 5.
Có tài liệu về một cơ sở sản xuất trong quí I và II như sau :
Phân
xưởng
Quý I Quý II
Chi phí sản xuất
(nghìn đồng)
Giá thành sản phẩm
(nghìn đồng)
Sản lượng
(nghìn đồng)
Giá thành sản phẩm
(nghìn đồng)
A 3850 35 135 40
B 7200 50 180 45
C 6300 70 120 68
Yêu cầu:
a. Tính giá thành trung bình của cơ sở sản xuất trong quí I.
b. Tính giá thành trung bình của cơ sở sản xuất trong quí II.
c. Tính giá thành trung bình của cơ sở sản xuất trong 6 tháng đầu năm.
d. Xác định tỷ trọng về sản lượng của từng phân xưởng trong quý I.
Bài 6.

Preview text:

Bài 4: Các mức độ thống kê mô tả
BÀI 4 CÁC MỨC ĐỘ THỐNG KÊ MÔ TẢ Hướng dẫn học
Bài này giới thiệu một số mức độ nhằm phản ánh bản chất của các hiện tượng kinh tế -
xã hội, gồm: số tuyệt đối và số tương đối; các mức độ trung tâm (số trung bình, trung vị
và mốt) và các tham số đo độ biến thiên của tiêu thức (khoảng biến thiên, độ lệch tuyệt
đối trung bình, phương sai, độ lệch chuẩn và hệ số biến thiên).
Để học tốt bài này, sinh viên cần tham khảo các phương pháp học sau:
•Học đúng lịch trình của môn học theo tuần, làm các bài luyện tập đầy đủ và tham gia
thảo luận trên diễn đàn.
•Đọc giáo trình: Lind, Marchal, Wathen. Thống kê trong kinh tế và Kinh doanh (sách
dịch), NXB Đại học KTQD.
•Đọc tài liệu: Lý thuyết Thống kê, PGS. TS. Trần Thị Kim Thu chủ biên, NXB Đại học KTQD.
•Sinh viên làm việc theo nhóm và trao đổi với giảng viên trực tiếp tại lớp học hoặc qua email.
Tham khảo các thông tin từ trang Web môn học. • Nội dung
Bài này sẽ trình bày các mức ph độ ản ánh bản chất c a
ủ các hiện tượng kinh tế - xã h i, ộ
trong đó giới thiệu khái niệm, công thức tính toán và ý nghĩa của ứ các m c độ trong các phân tích th ng kê. ố Mục tiêu
Sau khi học xong bài này, sinh viên cần thực hiện được các việc sau:
Trình bày được khái niệm và đặc điểm số tuyệt đối, số tương đối trong thống kê.
• Phân biệt được các loại số tuyệt đối và số tương đối khác nhau.
••Nêu được khái niệm, công thức tính và so sánh các đặc điểm của số trung bình, trung vị và mốt.
Nhận biết được các đặc trưng phân phối của dãy số. •
•Trình bày được khái niệm, công thức tính và đặc điểm các tham số đo độ biến thiên của tiêu thức.
•Tính toán đượ các mức độ của hiện tượng kinh tế xã hội dựa theo số liệu đã có. STA302_Bai4_v1.0013109218 45
Bài 4: Các mức độ thống kê mô tả Tình huống dẫn nhập
Ðánh giá năng suất lao động và tiền lương
Bạn với cương vị là nhân viên làm thống kê của một doanh nghiệp đang thực hiện nghiên cứu
nhằm đánh giá về năng suất lao động và tiền lương của doanh nghiệp mình. Sau khi đã tiến hành
điều tra thống kê và tổng hợp số liệu theo một số nội dung quan tâm, bạn thu được các dãy số phân
phối và các bảng biểu tổng hợp khác. Bây giờ, nhiệm vụ
của bạn là thông qua các dãy số phân
phối đó thấy được các đặc trưng và so sánh độ biến thiên của hai tiêu thức năng suất lao động và tiền lương.
1. Sử dụng mức độ nào để thấy được các đặc trưng về năng suất lao động và tiền lương của doanh nghiệp?
2. Sử dụng mức độ nào để so sánh độ biến thiên về năng suất lao động trung bình và
tiền lương trung bình của doanh nghiệp? 46 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả 4.1.
Số tuyệt đối và số tương đối trong thống kê 4.1.1.
Số tuyệt đối trong thống kê 4.1.1.1. Khái niệm chung
Khái niệm: Số tuyệt đối trong thống kê là mức độ biểu hiện quy mô, khối lượng của
hiện tượng nghiên cứu trong điều kiện thời gian và địa điểm cụ thể.
Như vậy, số tuyệt đối trong thống kê cho biết:
• Số đơn vị của tổng thể hay của bộ phận nghiên cứu
Ví dụ: Tổng số lao động của doanh nghiệp A ngày 1/7/N là 100 người.
• Trị số của chỉ tiêu số lượng
Ví dụ: Tổng quỹ tiền lương của doanh nghiệp A năm N là 500 triệu đồng. Tác dụng:
• Số tuyệt đối cho ta nhận thức cụ thể về quy mô, khối lượng thực tế của hiện tượng nghiên cứu.
• Số tuyệt đối là cơ sở đầu tiên để tiến hành phân tích thống kê, đồng thời còn là cơ
sở để tính các mức độ khác.
• Số tuyệt đối là căn cứ không thể thiếu được trong việc xây dựng các kế hoạch kinh
tế quốc dân và chỉ đạo thực hiện kế hoạch. 4.1.1.2. Đặc điểm
Mỗi số tuyệt đối trong thống kê đều bao hàm một nội dung kinh tế - xã hội cụ thể trong
điều kiện thời gian và địa điểm nhất định.
Phải qua điều tra thực tế và tổng hợp một cách khoa học để có được số tuyệt đối trong thống kê.
Các số tuyệt đối trong thống kê đều có đơn vị tính cụ thể.
4.1.1.3. Các loại số tuyệt đối
Căn cứ đặc điểm về qui mô của hiện tượng qua thời gian, số tuyệt đối có hai loại:
• Số tuyệt đối thời kỳ phản ánh quy mô, khối lượng của hiện tượng nghiên cứu trong
một khoảng thời gian nhất định.
Ví dụ về tổng quỹ tiền lương doanh nghiệp A là số tuyệt đối thời kỳ.
Các số tuyệt đối thời kỳ đuợc hình thành thông qua sự tích luỹ về luợng trong suốt
thời gian nghiên cứu. Có thể cộng các số tuyệt đối thời kỳ c
ủa cùng một chỉ tiêu với
nhau; thời kỳ càng dài thì trị số của nó càng lớn.
• Số tuyệt đối thời điểm phản ánh quy mô, khối
lượng của hiện tượng nghiên cứu
vào một thời điểm nhất định.
Ví dụ về tổng số lao động của doanh nghiệp A là số tuyệt đối thời điểm.
Số tuyệt đối thời điểm
chỉ phản ánh tình hình của hiện tượng vào một thời điểm nào
đó; trước hoặc sau thời điểm đó, trạng thái của hiện tượng có thể khác. Số tuyệt đối
thời điểm không có sự tích luỹ về lượng qua thời gian nên không cộng được với nhau. STA302_Bai4_v1.0013109218 47
Bài 4: Các mức độ thống kê mô tả 4.1.2.
Số tương đối trong thống kê 4.1.2.1. Khái niệm chung
Khái niệm: Số tương đối trong thống kê biểu hiện quan hệ so sánh giữa hai mức độ nào
đó của hiện tượng nghiên cứu.
Quan hệ so sánh là sự khác biệt cơ bản giữa số tuyệt đối và số tương đối trong thống
kê. Hai mức độ thiết lập quan hệ so sánh có thể là:
• Hai mức độ cùng loại nhưng khác nhau về thời gian hoặc về không gian, thực tế với
kế hoạch, bộ phận với tổng thể.
• Hai mức độ khác loại
nhưng có mối liên hệ với nhau. Ðể có thể tính được số tương
đối này, hai mức độ so sánh phải có cùng thời gian và không gian. Tác dụng:
• Các số tương đối tính được bằng các phương pháp so sánh có thể giúp ta đi sâu vào
đặc điểm của hiện tượng.
• Thuờng dùng trong lập kế hoạch và kiểm tra tình hình thực hiện kế hoạch.
• Dùng các số tương đối để biểu hiện tình hình thực tế trong khi cần bảo đảm được
tính chất bí mật của các số tuyệt đối. 4.1.2.2. Đặc điểm
Số tương đối là kết quả so sánh giữa hai chỉ tiêu thống kê đã có hay giữa hai mức độ
nào đó của hiện tượng nghiên cứu, không trực tiếp thu thập được qua điều tra.
Mỗi số tương đối đều phải có gốc dùng để so sánh. Khi gốc so sánh khác nhau thì ý
nghĩa của số tương đối cũng khác nhau.
Đơn vị tính của số tương đối là số
lần, phần trăm (%), phần nghìn (‰) hay đơn vị kép
tùy thuộc loại số tương đối.
4.1.2.3. Các loại số tương đối
Căn cứ theo nội dung mà số tương đối phản ánh, có thể chia thành 5 loại số tương đối sau đây:
• Số tương đối động thái: biểu hiện biến động của hiện tượng nghiên cứu qua thời gian. y Công thức tính: 1 ty= (lần, %) 0
Trong đó: t - số tương đối động thái
y0, y1 - mức độ của hiện tượng tại kỳ gốc, kỳ nghiên cứu. Chú ý phải đảm
bảo tính chất có thể so sánh duợc giữa tử số và mẫu số, nghĩa là y0 và y1
phải cùng phạm vi, phương pháp tính và đơn vị tính.
Ví dụ: Tổng giá trị sản xuất của doanh nghiệp A năm 20 2
2 là 23 tỷ đồng và năm
2021 là 20 tỷ đồng. Vậy, số tương đối động thái phản ánh sự phát triển về giá trị sản
xuất của doanh nghiệp A là: 𝑡 = 𝑦20 𝑦 2 2 2
0 1 =23 20 = 1,15 lần hay 115%.
• Số tương đối kế hoạch: dùng để biểu hiện nhiệm vụ kế hoạch và kiểm tra tình hình
thực hiện kế hoạch. Có hai loại sau: 48 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả
Số tương đối nhiệm vụ kế hoạch: biểu hiện quan hệ so sánh giữa mức độ cần đạt
tới của một chỉ tiêu nào đó với mức độ thực tế của chỉ tiêu này ở một kỳ được chọn làm gốc so sánh. y Công thức tính: k Kn0 y = (lần, %)
Trong đó: Kn - Số tương đối nhiệm vụ kế hoạch
yk - Mức độ kỳ kế hoạch
y0 - Mức độ thực tế ở kỳ gốc
Ví dụ: Tổng giá trị sản xuất của doanh nghiệp A năm 20 1 là 20 2
tỷ đồng, giá trị sản
xuất kế hoạch đề ra cho năm 20 2
2 là 22 tỷ đồng. Vậy, số tương đối nhiệm vụ kế hoạch là:
𝐾𝑛=𝑦𝐾𝐻20𝑦22021 =22 20 = 1,1lần hay 110%.
Số tương đối thực hiện kế hoạch: biểu hiện quan hệ so sánh giữa mức độ thực tế
đạt được trong kỳ nghiên cứu với mức độ kế hoạch đã đề ra cùng kỳ về một chỉ tiêu kinh tế nào đó. y Công thức tính: 1 Ktky= (lần, %)
Trong đó: Kt - Số tương đối thực hiện kế hoạch
yk - Mức độ kỳ kế hoạch
y1 - Mức độ thực tế ở kỳ nghiên cứu
Ví dụ: Tổng giá trị sản xuất của doanh nghiệp A năm 20 2 là 2
23 tỷ đồng, giá trị sản
xuất kế hoạch đề ra cho năm 20 2
2 là 22 tỷ đồng. Vậy, số tương đối thực hiện kế
hoạch hay tỷ lệ hoàn thành kế hoạch là: 𝐾𝑡=𝑦𝑇𝑇2𝑦0𝐾22 𝐻 022 =23 22 = 1,045lần hay 104,5%.
Giữa số tương đối động thái, số tương đối nhiệm vụ kế hoạch và số tương đối hoàn
thành kế hoạch (của cùng một chỉ tiêu) có mối quan hệ với nhau. Cụ thể: 1 y y y k 1 = hay t = Kn KT 0 y 0 y ky
• Số tương đối kết cấu: biểu hiện tỷ trọng của mỗi bộ phận cấu thành trong một tổng
thể. Nghiên cứu số tương đối kết cấu để thấy được đặc điểm cơ bản của hiện tượng
trong những điều kiện khác nhau. y Công thức tính: bp dy= (lần, %,‰) tt
Trong đó: d - Số tương đối kết cấu
ybp - Mức độ của bộ phận
ytt - Mức độ của tổng thể STA302_Bai4_v1.0013109218 49
Bài 4: Các mức độ thống kê mô tả
Ví dụ: Tổng số lao động của doanh nghiệp A là 100 người, trong đó, có 80 lao động nữ và 20 lao động nam.
Như vậy, kết cấu lao động nam trong tổng số lao động là: yna2m0 dna0m, L 2 Đ = = = lần hay 20% y 100
Và kết cấu lao động nữ trong tổng số lao động là: ynu80 dnu0,LĐ 8= = = lần hay 80% y 100
• Số tương đối không gian: sử dụng trong hai trường hợp:
Biểu hiện quan hệ so sánh giữa hai hiện tượng cùng loại nhưng khác nhau về không gian.
Ví dụ: Giá vàng ở Hà Nội so với giá vàng ở thành phố Hồ Chí Minh.
Biểu hiện quan hệ so sánh giữa hai bộ phận trong một tổng thể.
Ví dụ: Tỷ lệ lao động nam so với lao động nữ của doanh nghiệp A.
• Số tương đối cường độ: biểu hiện quan hệ so sánh giữa hai mức độ của hai hiện
tượng khác loại nhưng có mối liên hệ với nhau. Ví dụ: Dân số Mật độ dân số = (người/km2) Diện tích
Đơn vị tính của số tương đối cường độ là đơn vị kép. 4.1.3.
Điều kiện vận dụng số tuyệt đối và số tương đối trong thống kê
• Khi sử dụng số tương đối và tuyệt đối phải xét đến đặc điểm của hiện tượng nghiên
cứu để rút ra kết luận cho đúng.
Ví dụ: Cùng là tỷ lệ phế phẩm 5%, nhưng với các sản phẩm bình thuờng thì đây là
tỷ lệ chấp nhận được. Còn với những sản phẩm y tế, tỷ lệ này lại là quá cao vì hậu
quả sẽ rất nghiêm trọng.
• Phải vận dụng một cách kết hợp các số tương đối với số tuyệt đối vì:
o Số tương đối trong thống kê là kết quả so sánh giữa hai số tuyệt đối đã có, là sự
kết hợp khác nhau giữa các số tuyệt đối.
o Ý nghĩa của số tương đối còn phụ thuộc vào trị số tuyệt đối mà nó phản ánh. Ví dụ: Năm 20 ,
22 tốc độ tăng GDP của quốc gia A là
1,7% trong khi tốc độ tăng GDP của quốc gia B Nếu chỉ c là 5,9%.
ăn cứ vào hai số tương đối này, chúng ta có
thể đưa ra nhận định lạc quan rằng trong thời gian tới, nền kinh tế quốc gia A sẽ
đuổi kịp kinh tế quốc gia B. Nhưng khi xem xét các số tuyệt đối, ta thấy qui mô GDP của quốc gia A năm 20 0
2 là 106,426 tỷ USD, trong khi đó, GDP của quốc gia
B là 14419,4 tỷ USD. Như vậy, 1% tăng trưởng của quốc gia B gần gấp rư ỡi cả nền
kinh tế của Việt Nam. Vì vậy, nhận định trên là hoàn toàn sai lầm. 50 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả 4.2. Các mức độ trung tâm 4.2.1. Số trung bình 4.2.1.1. Khái niệm chung
Khái niệm: Số trung bình (hay số bình quân) trong thống kê là mức độ đại biểu theo
một tiêu thức nào đó của một tổng thể gồm nhiều đơn vị cùng loại.
Ví dụ: Năng suất lao động trung bình của công nhân doanh nghiệpA tháng 1/N là 30 triệu đồng.
Trong ví dụ này, con số 30 triệu đồng biểu hiện mức độ đại diện theo tiêu thức năng
suất lao động của công nhân toàn doanh nghiệp. Đặc điểm:
• Số trung bình san bằng mọi chênh lệch về lượng biến của tiêu thức nghiên cứu để
có một con số duy nhất đại diện cho tất cả lượng biến.
• Số trung bình chịu ảnh huởng của lượng biến đột xuất (lượng biến quá lớn hoặc quá
bé) trong dãy số. Ðây cũng là nhược điểm của số trung bình. Tác dụng:
• Nêu lên đặc điểm chung của hiện tượng kinh tế - xã hội số lớn trong điều kiện thời
gian và địa điểm cụ thể.
• Tạo điều kiện để so sánh giữa các hiện tượng không có cùng quy mô.
Ví dụ: Để so sánh giữa các doanh nghiệp không có cùng qui mô, không thể so sánh
lợi nhuận hay doanh thu của các doanh nghiệp mà phải so sánh năng suất lao động
trung bình, mức doanh lợi trung bình…
• Thông qua biến động của số bình quân để thấy được xu hướng phát triển của hiện tượng.
Ví dụ: Thông qua năng suất lao động trung bình của doanh nghiệp qua các năm, có
thể thấy xu hướng phát triển của năng suất lao động toàn doanh nghiệp.
• Dùng để lập kế hoạch, phân tích thống kê.
4.2.1.2. Các loại số bình quân
Thống kê học thường dùng hai loại số trung bình: số trung bình cộng và số trung bình nhân. • Số trung bình cộng
Số trung bình cộng thực chất là số trung bình được tính theo phương pháp trung bình cộng trong toán học. Công thức chung: Chú ý
Tổng lượng biến của tiêu thức x =
Tổng số đơn vị của tổng thể
o Số trung bình cộng giản đơn: vận dụng khi tài liệu chưa phân tổ x Công thức tính: = i x n STA302_Bai4_v1.0013109218 51
Bài 4: Các mức độ thống kê mô tả
o Số trung bình c ng gia quy ộ ền: vậ ụ
n d ng khi tài liệu đã được phân t . ổ
Ứng với mỗi lượng biến xi sẽ có một tần số fi hay nói cách khác, trong m i ỗ t ổ
(bộ phận), mỗi lượng biến xi lặp lại là fi lần. Như vậy, tổng lượng biến của tiêu
thức sẽ là tổng các xifi và tổng số đơn vị của tổng thể sẽ là tổng các fi. Khi đó,
công thức tính s trung bình c ố ộng gia quyền là: xi if xf= i
Trong đó, fi được gọi là tần số, đóng vai trò là quyền số (đại lượng có mặt ở cả tử số
và mẫu số), nói lên tầm quan trọng của từng lượng biến trong tính số bình quân.
Có hai trường hợp trong tính trung bình cộng gia quyền:
▪ Trường hợp 1 tính số trung bình với dãy số không có khoảng cách tổ ,
Ví dụ: Có tài liệu về tiền lương của lao động trong doanh nghiệp A: Lương Số lao động (triệu đồng) (người) xifi di xidi xi fi 2,5 2 5,0 0,02 0,050 3,0 8 24,0 0,08 0,240 3,5 12 42,0 0,12 0,420 4,0 15 60,0 0,15 0,600 4,5 25 112,5 0,25 1,125 5,0 20 100,0 0,20 1,000 5,5 13 71,5 0,13 0,715 6,0 5 30,0 0,05 0,300 Tổng 100 445,0 1,00 4,450
Yêu cầu: tính tiền lương trung bình của lao động trong doanh nghiệp A nói trên. Phân tích đề bài:
Đây là tài liệu sau khi phân tổ không có khoảng cách tổ, cần phải tính theo
công thức bình quân cộng gia quyền. Xác định xi, fi.
xi: lượng biến, là biểu hiện cụ thể bằng số của tiêu thức số lượng. Tiêu thức
đang nghiên cứu là tiền lương → lượng biến x i là tiền lương .
fi: tần số, là số đơn vị của tổng thể được sắp xếp vào từng tổ. Ở mỗi mức
lương khác nhau có số lao động tương ứng → tần số f i là số lao động.
Áp dụng công thức, ta có tiền lương trung bình của lao động trong doanh nghiệp là: xi if 445 x10 =0 = = 4,45 (triệu đồng) fi
Việc tính số trung bình theo
cách nào phụ thuộc vào điều kiện tài liệu cho
phép. Nếu tài liệu chỉ có tần suất di, hoàn toàn có thể sử dụng để thay thế cho fi. Ta có công thức: 52 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả x i if i i x ==
x d (nếu di tính bằng đơn vị lần) fi xi if i x id Hoặc: x10 = 0 =
(nếu di tính bằng đơn vị %) i f
Trong đó, di đóng vai trò là quyền số.
Trở lại ví dụ trên, giả sử đề bài chỉ cho tỷ trọng lao động trong tổng số công
nhân nhận các mức lương tương ứng, tức chỉ cho tần suất di (bả ng trên). Khi
đó, mức lương trung bình của công nhân trong doanh nghiệp sẽ được tính như sau: x = i x id = 4,45 (triệu đồng)
Kết quả này hoàn toàn trùng khớp với kết quả tính được ở trên. Như vậy, dù
tính theo công thức nào, kết quả số trung bình tính ra đều như nhau.
▪ Trường hợp 2 tính số trung bình với dãy số có khoảng cách tổ ,
Ví dụ, có tài liệu về năng suất lao động của lao động doanh nghiệp B như sau: Số lao động NSLĐ (người) xi xifi di xidi (kg) fi 400 – 500 10 450 4500 0,050 22,50 500 – 600 30 550 16500 0,150 82,50 600 – 700 45 650 29250 0,225 146,25 700 - 800 80 750 60000 0,400 300,00 800 – 900 30 850 25500 0,150 127,50 900 – 1000 5 950 4750 0,025 23,75 Tổng 200 140500 1,000 702,50 Yêu cầu: tính
năng suất lao động trung bình của lao động doanh nghiệp B nói trên. Phân tích đề bài:
Đây là tài liệu sau khi phân tổ có khoảng cách tổ, cần phải tính theo công
thức bình quân cộng gia quyền. Xác định xi, fi.
xi là trị số giữa làm lượng biến đại diện cho từng tổ. Tiêu thức nghiên cứu là
năng suất lao động → xi là trị số giữa về năng suất lao động của từng tổ
fi là tần số. Ở mỗi mức năng suất lao động khác nhau có số lao động tương ứng → tần số f i là số lao động.
Áp dụng công thức, ta có năng suất lao động trung bình của lao động là: xi if 140500 x20 = 0 = = 702,5 kg xi STA302_Bai4_v1.0013109218 53
Bài 4: Các mức độ thống kê mô tả
Tương tự ví dụ trên, trong trường hợp chỉ có số liệu tỷ trọng số lao động ứng
với các mức năng suất lao động, có thể áp dụng công thức: x = i x id = 702,5 kg
Hai công thức đều cho kết quả như nhau về năng suất lao động trung bình
của lao động doanh nghiệp B. • Số trung bình nhân
Số trung bình nhân thực chất là số trung bình được tính theo phương pháp trung bình nhân trong toán học.
Thông thường, vận dụng số trung bình nhân khi các lượng biến có quan hệ tích. Có hai trường hợp:
o Số trung bình nhân giản đơn: áp dụng khi tài liệu chưa phân tổ. nn x = x 1 2 x ...n x = i x
o Số trung bình nhân gia quyền: áp dụng khi các tần số fi khác nhau fiif 1f 2f k f i f x = x x ... x = x 1 2 k i
Ví dụ: Có tài liệu về tốc độ phát triển của chỉ tiêu doanh thu tại doanh nghiệp A trong 10 năm như sau:
5 năm có tốc độ phát triển hàng năm là 110%
2 năm có tốc độ phát triển hàng năm là 108%
3 năm có tốc độ phát triển hàng năm là 115%
Yêu cầu: Tính tốc độ phát triển doanh thu trung bình hàng năm giai đoạn 10 năm
nói trên của doanh nghiệp A. Phân tích:
xi là tốc độ phát triển. Nếu nhân các tốc độ phát triển với nhau sẽ được tốc độ
phát triển doanh thu của doanh nghiệp năm thứ 10 so với năm đầu tiên. Vì vậy,
các xi có quan hệ tích số và phải sử dụng công thức trung bình nhân trong trường hợp này.
fi là thời gian có các tốc độ phát triển tương ứng.
Như vậy, tốc độ phát triển trung bình về doanh thu được tính theo công thức
trung bình nhân gia quyền như sau: fiif5 2 310 x = x= 1,1 1,08 1,15 = 1,1107 i lần (111,07%)
4.2.1.3. Điều kiện vận dụng số trung bình
Có hai điều kiện khi vận dụng số trung bình: 54 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả
Số trung bình nên được tính từ tổng thể đồng chất. Các đơn vị trong tổng thể đồng
chất có cùng tính chất cơ bản nên mới có thể có cùng một lượng tương ứng đại diện cho
các đơn vị. Trái lại, không nên tính số trung bình từ tổng thể bao gồm các đơn vị khác
nhau về tính chất vì mức độ này không những không có ý
nghĩa thực tế mà còn có khi
làm cho ta hiểu sai lệch bản chất của hiện tượng.
Số trung bình chung chỉ phản ánh đặc trưng chung của toàn bộ tổng thể nghiên
cứu, bỏ qua những chênh lệch thực tế giữa các đơn vị tổng thể. Vì vậy, cần vận dụng
kết hợp với số trung bình tổ và dãy số phân phối để có thể giải thích sâu sắc từng khía
cạnh, từng bộ phận của hiện tượng. 4.2.2. Trung vị (Me) 4.2.2.1. Khái niệm chung
Khái niệm: Trung vị là lượng biến tiêu thức của đơn vị đứng ở vị trí chính giữa trong
một dãy số lượng biến, phân chia dãy số lượng biến thành hai phần, mỗi phần có số đơn
vị tổng thể bằng nhau. Tác dụng:
• Trung vị nêu lên mức độ đại biểu của hiện tượng, mà không san bằng bù trừ chênh
lệch giữa các lượng biến (khác số trung bình). Nó có thể bổ sung hay thay thế cho
số trung bình trong trường hợp tính số trung bình gặp khó khăn.
• Là một trong các chỉ tiêu dùng để nêu lên đặc trưng của một dãy số phân phối
• Không chịu ảnh hưởng của những lượng biến đột xuất.
• Dựa vào tính chất toán học đáng chú ý của trung vị là: Tổng các độ lệch tuyệt đối
giữa các lượng biến với trung vị là trị
số nhỏ nhất so với số trung bình và mốt, nên
trung vị được sử dụng ứng dụng trong nhiều công tác kỹ thuật và phục vụ công cộng,
bố trí ở vị trí thuận lợi để có thể phục vụ được nhiều người mà tiết kiệm nhất. 4.2.2.2. Cách xác định
• Xác định trung vị đối với dãy số không có khoảng cách tổ: Me là lượng biến của
đơn vị đứng ở vị trí chính giữa.
o Nếu số đơn vị tổng thể lẻ: ∑f = 2m + 1, trung vị sẽ là lượng biến của đơn vị đứng
ở vị trí thứ m + 1, tức là Me = xm+1
o Nếu số đơn vị tổng thể chẵn: ∑f = 2m, trung vị sẽ
là giá trị trung bình cộng hai ex x +
lượng biến của đơn vị đứng ở vị trí thứ m và m + 1, tức là m m 1 M2+=
Xét ví dụ về tiền lương của lao động trong doanh nghiệp A:
Tiền lương (triệu đồng) xi
Số lao động (người) fi Tần số tích lũy Si 2,5 2 2 3,0 8 10 3,5 12 22 4,0 15 37 4,5 25 62 STA302_Bai4_v1.0013109218 55
Bài 4: Các mức độ thống kê mô tả 5,0 20 82 5,5 13 95 6,0 5 100 Tổng 100
Trong ví dụ này, số đơn vị tổng thể (tổng số lao động) là chẵn: ∑f = 2m = 100. Vậy
trung vị là trung bình cộng của hai lượng biến đứng ở vị trí thứ 50 và 51.
Ðể xác định giá trị của hai đơn vị thứ 50 và 51 ta phải dựa vào tần số tích luỹ. Từ bảng
tính tần số tích luỹ trên, nhận thấy hai đơn vị thứ 50 và 51 nằm ở tổ thứ năm và có mức
tiền lương là 4,5 triệu đồng. Nghĩa là, xm = xm+1 = 4,5 triệu đồng. Từ đó: ex mx++ m 1 4,5 4, 5 M2 2 + == = 4,5 (triệu đồng)
Trung vị về tiền lương của lao động doanh nghiệp A tính ra là 4,5 triệu đồng. Ðiều
này có nghĩa là 50% số lao động nhận mức lương từ 4,5 triệu đồng trở xuống và
50% số lao động nhận mức lương từ 4,5 triệu đồng trở lên.
• Xác định trung vị đối với dãy số có khoảng cách tổ:
thực hiện theo hai bước
o Bước 1, xác định tổ có trung vị: tổ chứa lượng biến của đơn vị đứng ở vị trí giữa.
o Bước 2, tính trị số gần đúng của trung vị theo công thức: fiM S 1 − e 2 − Mex=+ M h f e e min M M e
Trong đó: xMe(min) - là giới hạn dưới của tổ có trung vị
hMe - là khoảng cách tổ có trung vị fi - là t
ổng số đơn vị tổng thể
S(Me-1) - là tổng các tần số của các tổ đứng trước tổ có trung vị
fMe - là tần số của tổ có trung vị
Xét ví dụ về năng suất lao động của lao động doanh nghiệp B: NSLĐ (kg)
Số lao động (người) fi Si 400 500 – 10 10 500 600 – 30 40 600 700 – 45 85 700 800 – 80 165 800 900 – 30 195 900 1000 – 5 200 Tổng 200
Dựa vào tần số tích lũy Si, xác định được tổ chứa trung vị là tổ 700 - 800 vì tổ
này chứa hai đơn vị đứng ở vị trí chính giữa thứ 100 và 101. Từ đó, tính trung vị theo công thức: 56 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả fiM 2010S −− 85e 2 2 − Me = xM + h =70 + 0 100 = 718,75 kg e e min M M f 80e
Như vậy, có 50% số lao động có mức năng suất lao động từ 718,75kg trở xuống
và 50% số lao động có mức năng suất lao động từ 718,75kg trở lên. 4.2.3. Mốt (Mo) 4.2.3.1. Khái niệm chung
Khái niệm: Mốt là biểu hiện được gặp nhiều nhất của tiêu thức nghiên cứu trong một
tổng thể hay trong một dãy số phân phối. Ưu điểm:
• Mốt không chịu ảnh hưởng của những lượng biến đột xuất.
• Mốt có thể được tính ra từ cả tiêu thức thuộc tính và tiêu thức số luợng. Nhược điểm:
• Mốt kém nhạy bén với sự biến thiên của tiêu thức: Chỉ quan tâm tới lượng biến có
tần số lớn nhất mà không quan tâm tới các lượng biến khác.
• Nếu dãy số lượng biến có đặc điểm phân phối không bình thường (có quá nhiều Mốt
hoặc không có Mốt) thì cũng không nên xác định mốt. Tác dụng:
• Mốt nêu lên mức độ đại biểu của hiện tượng, mà không san bằng bù trừ chênh lệch
giữa các lượng biến (khác số trung bình). Nó có thể bổ sung hay thay thế cho số
trung bình trong trường hợp tính số trung bình gặp khó khăn.
• Là một trong các chỉ tiêu dùng để nêu lên đặc trưng của một dãy số phân phối
• Không chịu ảnh hưởng của những lượng biến đột xuất
• Mốt sử dụng trong bài toán lý thuyết phục vụ đám đông: trong kinh doanh, chọn
loại nào, màu sắc, kiểu cỡ nào phù hợp nhất và v
ừa ý nhất với số đông để sản xuất,
đáp ứng nhu cầu khách hàng. 4.2.3.2. Cách xác định
• Đối với dãy số thuộc tính: mốt là biểu hiện có tần số lớn nhất. Ví dụ: Có
tài liệu về lao động doanh nghiệp A phân tổ theo tiêu thức giới tính vào thời điểm 1/7 như sau: Số lao động Giới tính (người) Nam 30 Nữ 70
Bảng trên cho thấy mốt về giới tính của lao động doanh nghiệp A là “nữ” vì có tần
số (số lao động) lớn nhất.
• Đối với dãy số lượng biến không có khoảng cách tổ: mốt là lượng biến có tần số lớn nhất. STA302_Bai4_v1.0013109218 57
Bài 4: Các mức độ thống kê mô tả
Xét ví dụ về tiền lương của lao động trong doanh nghiệp A (mục 4.2.2.2): Mốt về
tiền lương của lao động doanh nghiệp này là 4,5 triệu đồng vì có nhiều lao động có
mức lương này nhất (25 lao động).
• Đối với dãy số lượng biến có khoảng cách tổ bằng nhau: xác định Mốt qua hai bước
Bước 1, xác định tổ chứa Mốt, là tổ có tần số lớn nhất.
Bước 2, xác định trị số gần đúng của Mốt theo công thức: f f − o o Mo Mo 1 Mox=+ M− minh M + f−f f f − (Mo Mo 1 M −+ ) o ( Mo 1 )
Trong đó: xMo(min): Giới hạn dưới của tổ có mốt
hMo: Khoảng cách tổ có mốt
fMo: Tần số của tổ có mốt
fMo-1: Tần số của tổ đứng liền trước tổ có mốt
fMo+1: Tần số của tổ đứng liền sau tổ có mốt.
Xét ví dụ về năng suất lao động của lao động doanh nghiệp B (mục 4.2.2.2). Xác
định tổ chứa Mốt là tổ 700 – 800
kg vì có số lao động lớn nhất (80 người). Từ đó,
xác định giá trị gần đúng của Mốt: o80 45 − M = 70 + 0 100 = 741,2 kg (80 4−5+ − )8 ( 0 30 )
• Đối với dãy số lượng biến có khoảng cách tổ không bằng nhau: việc xác định f
Mốt phải căn cứ vào mật độ phân phối i miih=
. Vì các khoảng cách tổ khác nhau
nên tổ chứa Mốt sẽ là tổ có mật độ phân phối lớn nhất. Cần phải thêm cột vào bảng
tính để xác định tổ chứa Mốt và tính giá trị Mốt tương tự công thức trên, trong đó
tần số được thay bằng mật độ phân phối. 4.2.4.
Đặc trưng phân phối của dãy số
Dựa vào mối quan hệ giữa ba mức độ trung tâm: số trung bình, trung vị và mốt, có ba
đồ thị biểu diễn đặc trưng phân phối của dãy số như sau: x = Me = Mo x < Me < Mo Mo < Me < x Phân phối chuẩn Phân phối lệch trái Phân phối lệch phải 58 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả
Từ các đồ thị, xác định được Mốt trước tiên vì đây là lượng biến tương ứng với tần số
lớn nhất. Số trung bình và trung vị nằm
ở đâu sẽ quyết định hình dáng của phân phối.
Trong phân phối chuẩn, trung vị luôn nằm giữa số trung bình và Mốt.
• x = Me = Mo: dãy số có phân phối chuẩn .
• x < Me < M0: dãy số có phân phối lệch trái, số đơn vị có lượng biến nhỏ hơn trung bình chiếm đa số.
• x > Me > M0: dãy số có phân phối lệch phải, số đơn vị có lượng biến lớn hơn trung bình chiếm đa số.
Với ví dụ về năng suất lao động ở doanh nghiệp B, đã tính được:
• Năng suất lao động trung bình x = 702,5 kg
• Trung vị về năng suất lao động Me = 718,75 kg
• Mốt về năng suất lao động Mo =741,2 kg
So sánh giữa số trung bình, trung vị và
mốt, nhận thấy dãy số phân phối chuẩn, lệch
trái. Từ đó, số lao động có năng suất lao động lớn hơn 702,5 kg sẽ chiếm đa số. 4.3.
Các tham số đo độ biến thiên của tiêu thức
Ý nghĩa của các tham số đo độ biến thiên hay độ phân tán của tiêu thức:
• Giúp đánh giá trình độ đại biểu của số bình quân: nếu độ biến thiên thấp, trình độ
đại biểu của số bình quân cao và ngược lại.
• Quan sát độ biến thiên của tiêu thức trong 1 dãy số lượng biến cho thấy đặc trưng
về phân phối và tính đồng đều của tổng thể .
• Độ biến thiên của tiêu thức thường được dùng
trong nhiều trường hợp nghiên cứu
thống kê: phân tích biến động, mối liên hệ trong điều tra, dự đoán...
Ví dụ: Số liệu năng suất lao động của 5 công nhân trong 2 tổ sản xuất như sau: NSLĐA NSLĐB 40 58 50 59 60 60 70 61 80 62
Khi so sánh năng suất lao động trung bình ở 2 tổ, kết quả cho thấy x A =x B = 60 kg.
Năng suất lao động trung bình của công nhân 2 tổ sản xuất như nhau nhưng tính đại
biểu của x B cao hơn vì độ biến thiên về năng suất lao động của 5 công nhân tổ sản xuất B ít hơn.
Với tổng thể số lớn đơn vị, để đưa ra kết luận đúng đắn cho các hiện tượng, người ta
cần so sánh cả độ biến thiên của tiêu thức. Có 5 tham số sau: STA302_Bai4_v1.0013109218 59
Bài 4: Các mức độ thống kê mô tả 4.3.1. Khoảng biến thiên
Khoảng biến thiên là chênh lệch giữa lượng biến lớn nhất và lượng biến nhỏ nhất của
tiêu thức nghiên cứu, biểu hiện bằng công thức:
Công thức tính: R = xmax - xmin
Khoảng biến thiên là chỉ tiêu đơn giản nhất, nêu lên một cách khái quát nhất độ biến
thiên của tiêu thức. Nhược điểm của chỉ tiêu này là chỉ phụ thuộc vào 2 lượng biến lớn
nhất và nhỏ nhất trong dãy số, mà không xét đến các lượng biến khác, do đó, việc nhận
định có thể chưa thật hoàn toàn chính xác. Khoảng biến thiên rất nhạy cảm với các
lượng biến đột xuất. 4.3.2.
Độ lệch tuyệt đối trung bình
Độ lệch tuyệt đối trung bình là số trung bình cộng của các độ lệch tuyệt đối giữa các
lượng biến với số trung bình cộng của các lượng biến đó. Công thức: x x− • Giản đơn: i dn= xi ixf− • Gia quyền: df= i
Trong công thức này, nguời ta phải lấy giá trị tuyệt đối, tức là bỏ qua sự khác nhau thực
tế về dấu của các độ lệch.
Độ lệch tuyệt đối trung bình có thể phản ánh độ biến thiên của tiêu thức một cách chặt
chẽ hơn khoảng biến thiên, vì nó có xét đến tất cả mọi lượng biến trong dãy số. Nhưng khi tính toán chỉ tiêu
này, ta chỉ xét các trị số tuyệt đối của độ lệch, tức là bỏ qua sự
khác nhau thực tế về dấu của các độ lệch, vì thế mà việc phân tích bằng các phương
pháp toán học gặp nhiều khó khăn. 4.3.3. Phương sai
Phương sai là số trung bình cộng của bình phương các độ lệch giữa các lượng biến với
số trung bình cộng của các lượng biến đó. Công thức: Giản đơn: 2
𝑆2=∑(𝑥𝑖−𝑥𝑛−)2 1 =𝑛 𝑛−1 [∑𝑥 𝑛)2] = 𝑛 𝑖 𝑛− (∑𝑥𝑖 𝑛−1 [𝑥2− (𝑥 )2] Gia quyền: 𝑆2=∑(𝑥 2𝑓𝑖 𝑖−𝑥 ∑ ) 𝑓𝑖2𝑓 − 𝑖
1 =∑𝑥𝑖 ∑𝑓𝑖−1 −(∑𝑥𝑖𝑓𝑖)2
∑𝑓𝑖(∑𝑓𝑖−1) =∑𝑓𝑖 ∑𝑓𝑖−1 [𝑥2− (𝑥 )2]
Phương sai là chỉ tiêu thường dùng để đánh giá độ biến thiên của tiêu thức. Vì được tính
trên cơ sở bình phương các độ lệch nên kết quả tính toán bị khuếch đại và không có đơn vị tính phù hợp. 60 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả 4.3.4. Độ lệch tiêu chuẩn
Độ lệch tiêu chuẩn là căn bậc hai của
phương sai, tức là số trung bình toàn phương của
bình phương các độ lệch giữa các lượng biến với số trung bình cộng của các lượng biến đó. Công thức: 𝑆 = √𝑆2
Vì là căn bậc hai của phương sai, độ lệch tiêu chuẩn đã khắc phục được nhược điểm của
phương sai là có đơn vị tính và giảm khuếch đại.
Độ lệch tiêu chuẩn là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong nghiên cứu
thống kê để đánh giá độ biến thiên của tiêu thức.
Cả bốn chỉ tiêu trên đều chỉ dùng để so sánh biến thiên của các hiện tượng cùng loại và
số trung bình bằng nhau. Trong trường hợp muốn so sánh độ biến thiên của các hiện
tượng khác loại hoặc các hiện tượng cùng loại và có số trung bình khác nhau, nguời ta
sẽ sử dụng tham số thứ năm, đó là hệ số biến thiên. 4.3.5. Hệ số biến thiên
Hệ số biến thiên là tham số đo độ biến thiên tương đối và được tính bằng cách so sánh
giữa độ lệch tiêu chuẩn với số trung bình cộng.
Công thức: 𝑉 = 𝑆 𝑥×100
Ví dụ: So sánh độ biến thiên của năng suất lao động và tiền lương trong doanh nghiệp
A, cho biết: x NSLĐ = 50 sản phẩm, 𝑆𝑁𝑆𝐿Đ= 5 sản phẩm, xTL = 3500 nghìn đồng, 𝑆𝑇𝐿= 490 nghìn đồng.
Từ đề bài, nhận thấy năng suất lao động và tiền lương là hai hiện tượng khác loại nên
cần dùng hệ số biến thiên để so sánh độ biến thiên của hai chỉ tiêu này.
𝑉𝑁𝑆𝐿Đ=𝑆𝑁𝑆
𝑥𝐿Đ𝑁𝑆𝐿Đ×100 =5 50 ×100 =10% 𝑉𝑇𝐿 =𝑆𝑇𝐿 𝑥 𝑇𝐿 ×100 =490 3500 ×100 =14%
VNSLĐ < VTL nên năng suất lao động có độ biến thiên nhỏ hơn so với tiền lương, năng
suất lao động trung bình có trình độ đại biểu cao hơn so với tiền lương trung bình. STA302_Bai4_v1.0013109218 61
Bài 4: Các mức độ thống kê mô tả Tóm lược cuối bài
• Các hiện tượng kinh tế - xã hội thường rất đa dạng và phức tạp. Mỗi đặc điểm cơ bản của hiện
tượng có thể được biểu hiện bằng các mức độ khác nhau. Các mức độ thường dùng trong thống
kê là: Số tuyệt đối, số tương đối, số trung bình, các chỉ tiêu đo độ biến thiên của tiêu thức.
• Khi vận dụng số tương đối và tuyệt đối cần chú ý điều kiện vận dụng chung: thứ nhất là phải căn
cứ vào đặc điểm của hiện tượng để rút ra kết luận cho phù hợp; thứ hai là phải vận dụng kết hợp
số tương đối và tuyệt đối để nhận thức hiện tượng một cách đầy đủ, toàn diện và sâu sắc.
• Các mức độ trung tâm: số trung bình, trung vị và mốt đều có ý nghĩa phả n ánh, công thức tính
và điều kiện vận dụng khác nhau. Vì vậy, trong quá trình vận dụng phải kết hợp phân tích các
mức độ đó thì việc phân tích mới sâu sắc và toàn diện, mới nhận thức đúng sự tồn tại của hiện
tượng trong điều kiện không gian và thời gian cụ thể.
• Các mức độ đo độ biến thiên giúp chúng ta đánh giá độ đồng đều của tổng thể và là cơ sở để
áp dụng nhiều phương pháp thống kê khác. Bao gồm 5 mức độ: khoảng biến thiên, độ lệch
tuyệt đối trung bình, phương sai, độ lệch tiêu chuẩn, hệ số biến thiên. 62 STA302_Bai4_v1.0013109218
Bài 4: Các mức độ thống kê mô tả Câu hỏi ôn tập
1. Trình bày khái niệm, ý nghĩa, đặc điểm và các loại số tuyệt đối trong thống kê.
2. Trình bày khái niệm, ý nghĩa, đặc điểm và các
loại số tương đối trong thống kê.
3. Phân tích điều kiện vận dụng chung số tương đối và tuyệt đối trong thống kê.
4. Nêu khái niệm, ý nghĩa số trung bình trong thống kê.
5. Trình bày các loại số trung bình trong thống kê.
6. Trình bày ý nghĩa và nội dung các chỉ tiêu đo độ biến thiên của tiêu thức. Bài tập Bài 1.
Có thông tin về độ tuổi của 36 triệu phú ở Mỹ như sau: 31 64 39 66 68 45 60 54 53 79 75 47 74 59 64 48 69 71 71 42 39 57 55 61 79 48 68 67 42 79 38 48 77 52 52 66 Yêu cầu:
a. Xây dựng bảng tần số phân bố với 6 tổ có khoảng cách tổ bằng nhau.
b. Tính tuổi bình quân của các triệu phú trên theo hai cách: - Từ tài liệu ban đầu - Từ tài liệu phân tổ
So sánh hai kết quả trên và cho biết kết quả nào chính xác hơn.
c. Tính trung vị về tuổi của các triệu phú trên. Bài 2.
Một nhà nghiên cứu xã hội học đã nghiên cứu tình trạng tội phạm ở một địa phương. Sau khi thu
thập tài liệu, ông đã tính được tỷ lệ phần trăm tội phạm so với năm liền trước như sau (tốc độ phát triển): Năm 2017 2018 2019 2020 2021 2022 Tốc độ phát triển (%) 96 105 110 103 106 95 Yêu cầu:
a. Tính tốc độ phát triển trung bình về số lượng tội phạm trong các năm 2017-2022.
b. Tính tốc độ phát triển trung bình về số lượng tội phạm trong các năm 2017-2020.
c. Ông ta đã tìm thêm được một tài liệu cho biết rằng, trong những năm trước đây, từ 2015 đến
2016, tốc độ phát triển tội phạm trung bình là 102% một năm. Hãy tính tốc độ phát triển trung
bình về số lượng tội phạm của địa phương trong giai đoạn 2015-2022. Bài 3. STA302_Bai4_v1.0013109218 63
Bài 4: Các mức độ thống kê mô tả
Có tài liệu phân tổ lao động theo tiêu thức năng suất lao động ở 1 công ty như sau : Năng suất lao động (kg) Số lao động <400 10 400-500 15 500-700 35 700-1000 42 1000-1200 15 1200 8 Hãy tính:
a. Năng suất lao động trung bình
b. Mốt về năng suất lao động
c. Trung vị về năng suất lao động
d. Phương sai về năng suất lao động
e. Nhận xét về phân phối của số lao động theo năng suất lao động Bài 4.
Có số liệu về năng suất thu hoạch, diện tích và sản lượng sản phẩm A của 6 huyện thuộc tỉnh M trong 2 năm như sau: Năm 2021 Năm 2022 Sản lượng Tỷ lệ hoàn thành Huyện Năng suất thu Tỷ trọng diện tích Năng suất thu hoạch kế oạch về sản hoạch (tạ/ha) gieo trồng (%) thu hoạch (tạ/ha) (tấn) lượng (%) A 65 20 70 7000 95 B 80 15 82 6560 92 C 94 25 92 11040 90 D 71 10 78 4680 94 E 72 16 85 6800 86 G 84 14 90 6300 88 Yêu cầu:
a. Tính năng suất thu hoạch trung bình của tỉnh M trong từng năm.
b. Tính tỷ lệ % hoàn thành kế hoạch trung bình về sản lượng thu hoạch của toàn tỉnh trong năm 2022.
c. Tính tỷ trọng diện tích gieo trồng của từng huyện trong tỉnh M năm 2022. Bài 5.
Có tài liệu về một cơ sở sản xuất trong quí I và II như sau : Quý I Quý II Phân Chi phí sản xuất Giá thành sản phẩm Sản lượng Giá thành sản phẩm xưởng (nghìn đồng) (nghìn đồng) (nghìn đồng) (nghìn đồng) A 3850 35 135 40 B 7200 50 180 45 C 6300 70 120 68 Yêu cầu:
a. Tính giá thành trung bình của cơ sở sản xuất trong quí I.
b. Tính giá thành trung bình của cơ sở sản xuất trong quí II.
c. Tính giá thành trung bình của cơ sở sản xuất trong 6 tháng đầu năm.
d. Xác định tỷ trọng về sản lượng của từng phân xưởng trong quý I. Bài 6. 64 STA302_Bai4_v1.0013109218