Trang 1
CHUYÊN ĐỀ: MỘT SỐ YẾU TỐ V THỐNG KÊ
A. KIN THC CN NH
I. CÁC S ĐẶC TRƯNG ĐO XU THẾ TRUNG TÂM CHO MU S LIU GHÉP NHÓM
1. S trung bình cng (s trung bình)
Cho mu s liu ghép nhóm như ở Bng 1 .
Trung điểm
i
x
ca na khong (tính bng trung bình cng của hai đầu mút) ng vi nhóm
i
giá tr đại din của nhóm đó.
S trung binh cng ca mu s liu ghép nhóm, kí hiu
x
, được tính theo công thc:
1 1 2 2 mm
n x n x n x
x
n
Bng 1
Ý nghĩa: S trung bình cng ca mu s liu ghép nhóm có th làm đại din cho v trí trung tâm
ca mu s liệu đó khi các số liu trong mu ít sai lch vi s trung bình cng.
2. Trung v
Cho mu s liệu ghép nhóm như ở Bng 2 . Gi s nhóm
k
là nhóm đầu tiên có tn s tích lu
lớn hơn hoặc bng
2
n
, tc là
1
2
k
n
cf
nhưng
2
k
n
cf
. Ta gi
lần lượt là đầu mút trái, độ
dài, tn s ca nhóm
1
;
k
k cf
là tn s tích lu ca nhóm
1k
.
Bng 2
Trung v ca mu s liu ghép nhóm, kí hiu
e
M
, được tính theo công thc sau:
Trang 2
1
2
k
e
k
n
cf
M r d
n





Quy uc:
0
0cf
.
Ý nghĩa: Trung v ca mu s liu có th dùng để đại din cho mu s liệu đó.
3. T phân v
Cho mu s liệu ghép nhóm như ở Bng 2.
Gi s nhóm
p
là nhóm đầu tiên có tn s tích lu lớn hơn hoặc bng
4
n
, tc là
1
4
p
n
cf
nhưng
4
p
n
cf
. Ta gi
,,
p
s h n
lần lượt là đầu mút trái, độ dài, tn s ca nhóm
p
;
1p
cf
là tn s tích lu
ca nhóm
1p
.
Tú phân v thú nht
1
Q
được tính theo công thc sau:
1
1
4
p
p
n
cf
Q s h
n





T phân v thúc hai
2
Q
bng trung v
e
M
.
Gi s nhóm
q
là nhóm đầu tiên có tn s tích lu lớn hơn hoặc bng
3
4
n
, tc là
1
3
4
q
n
cf
nhưng
3
4
q
n
cf
. Ta gi
,,
q
t l n
lần lượt là đầu mút trái, độ dài, tn s ca nhóm
1
;
q
q cf
là tn s
tích lu ca nhóm
1q
.
T phân v thú ba
3
Q
được tính theo công thc sau:
1
3
3
4
q
q
n
cf
Q t l
n





Ý nghĩa: Tứ phân v
1 2 3
,,Q Q Q
ca mu s liu chia mu s liệu đó thành bốn phn, mi phn
cha
25%
giá tr.
4. Mt
Cho mu s liệu ghép nhóm như ở Bng 2.
Gi s nhóm
i
là nhóm có tn s ln nht. Ta gi
i
,,u g n
lần lượt là đầu mút trái, độ dài, tn s
ca nhóm
11
;,
ii
i n n

lần lượt là tn s ca nhóm
1i
, nhóm
1i
. Mt ca mu s liu ghép nhóm,
kí hiu
o
M
, ưc cính theo công thc sau:
Quy ước:
01
0; 0
m
nn

.
1
11
2
ii
o
i i i
nn
M u g
n n n





Ý nghĩa: Mốt ca mu s liu ghép nhóm có th dùng để đo xu thế trung tâm ca mu s liệu đó.
II. CÁC SỐ ĐẶC TRƯNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU GHÉP NHÓM
1. Khoảng biến thn
Cho mẫu số liệu ghép nhóm nhưBảng 3,
Trang 3
trong đó
1
n
m
n
là các số nguyên dương.
Gọi
1
a
,
1m
a
lần lượt đầu mút trái của nhóm
1
, đầu mút phải của nhóm
m
.
Hiệu
11m
R a a

được gọi là khoảng biến thiên của mẫu số liệu ghép nhóm đó.
Ý nghĩa
Khoảng biến thiên của mẫu số liệu ghép nhóm đo mức độ phân tán cho mẫu số liệu đó. Khoảng
biến thiên càng lớn thì mẫu số liệu càng phân tán.
Trong các đại lượng đo mức độ phân tán của mẫu số liệu ghép nhóm, khoảng biến thiên là đại
lượng dễ hiểu, dễ tính toán. Tuy nhiên, do khoảng biến thiên chỉ sử dụng hai gtrị
1
a
1m
a
của
mẫu số liệu nên đại lượng đó dễ bị ảnh hưởng bởi các giá trị bất thường.
2. Khoảng tứ phân vị
Cho mẫu số liệu ghép nhóm nhưBảng 2.
Gọi
1 2 3
,,Q Q Q
là tứ phân vcủa mẫu số liệu đó. Ta gọi hiệu
31
Q Q Q
khoảng tứ phân vị của
mẫu số liệu đó.
Ý nghĩa: Khoảng tứ phân vị của mẫu số liệu ghép nhóm giúp xác định các giá trị bất thường của
mẫu đó. Khoảng tứ phân vthường được sử dụng thay cho khoảng biến thiên vì nó loại trừ hầu
hết giá trị bất thường vủa mu số liệu và nó không bị ảnh hưởng bởi các gtrị bất thường đó.
3. Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm
Cho mẫu số liệu ghép nhóm nhưBảng 1.
Gọi
x
là số trung bình cộng của mẫu số liệu đó.
Số
2 2 2
1 1 2 2
2
...
mm
n x x n x x n x x
s
n
được gọi là phương sai của mẫu số liệu đó.
Căn bậc hai (số học) của phương sai được gọi là độ lệch chuẩn của mẫu số liệu ghép nhóm, kí
hiệu là
s
, nghĩa là
2
ss
.
Ý nghĩa
Phương sai (độ lệch chuẩn) của mẫu số liệu ghép nhóm được dùng để đo mức độ phân tán của
mẫu số liệu ghép nhóm đó.
Độ lệch chuẩn có cùng đơn vị với đơn vcủa mẫu số liệu.
Khi hai mẫu số liệu ghép nhóm có cùng đơn vđo và có số trung trình cộng bằng nhau (hoặc
xấp xỉ nhau), mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình
cộng) của các số liệu trong mẫu đó sẽ thấp hơn.
B. MỘT SỐ VÍ DỤ
Dạng 1. Câu trắc nghiệm nhiều phương án lựa chọn
Mỗi câu hỏi thí sinh chỉ chọn một phương án.
Trang 4
Ví dụ 1. Người ta tiến hành phỏng vấn
40
người về một mẫu quần mới. Người phỏng vấn yêu
cầu cho điểm mẫu quần đó theo thang điểm
100
. Kết quả được trình bày theo mẫu số liệu ghép
nhóm được cho ở Bảng 4. Trung vị của mẫu số liệu ghép nhóm đó là:
A.
75.
B.
70,8.
C.
78,8.
D.
74,8.
Giải
Cách 1:
Gọi
1 40
;...;xx
là mẫu số liệu gốc về điểm mẫu quần được xếp theo thứ tự không giảm.
Ta có
13
;...;xx
[50; 60),
48
;...;xx
[60; 70),
9 33
;...;xx
[70; 80),
34 37
;...;xx
[80; 90),
38 40
;xx
[90;
100).
Số phần tử của mẫu là
40n
.
Ta có:
1 41
20,5
22
n

Suy ra, trung vị của mẫu số liệu gốc là
20 21
2
e
xx
M

[70; 80). Suy ra,
3p
Áp dụng công thức
11
1
...
4
p
r p p p
p
rn
mm
Q a a a
m
Ta có:
12
2 3 4 3
3
2
4
e
n
mm
M Q a a a
m

2.40
35
374
4
70 80 70 74,8
25 5

Chọn D.
Cách 2:
Số phần tử của mẫu là
40n
. Ta có:
40
20
22
n

8 20 33
. Suy ra nhóm
3
là nhóm đầu
tiên có tần số tích lũy lớn hơn hoặc bằng
20
. Xét nhóm
3
3
70; 10; 25r d n
và nhóm
2
2
8cf
.
Trang 5
Trung vị của mẫu số liệu đó là:
20 8
70 .10 74,8
25
e
M



. Chọn D.
Ví d 2: Xét mu s liệu ghép nhóm được cho Bảng 4. Phương sai của mu s liu ghép nhóm
đó là
A.
9,08
. B.
82,4375
. C.
74,75
. D.
50
.
Lời giải
Chn B
S trung bình cng ca mu s liệu đó
3.55 5.65 25.75 4.85 3.95
74,75.
40
x

Phương sai của mu s liệu đó là:
2
s
2 2 2 2 2
3 55 74,75 5 65 74,75 25 75 74
0
,75 4 85 74,75 3 95 74,75
4
82,4375
Dng 2: Trc nghim đúng -sai
Trong mi ý a) b) c) d) mi câu thí sinh chọn đúng hoặc sai.
Ví d 3: Bng 5 biu din mu s liu ghép nhóm v s tiền (đơn vị: nghìn đồng)
60
khách
hàng mua sách mt ca hàng trong mt ngày.
a) S trung bình cng ca mu s liu trên là
65
(nghìn đồng).
b) Trung v ca mu s liu trên là
66,8
(nghìn đồng).
c) T phân v nht
1
Q
ca mu s liu trên là
60,8
(nghìn đồng).
d) Mt ca mu s liu trên là
65
(nghìn đồng).
Lời giải
Ý
a)
b)
c)
d)
Kết quả
S
Đ
Đ
S
a) S trung bình cng ca mu s liu ghép nhóm trên là
5.45 8.55 25.65 20.75 2.85
66
60
x

(nghìn đồng)
b) S phn t ca mu
60n
. Ta có:
60
30
22
n

13 30 38
. Suy ra nhóm
3
là nhóm đầu
tiên có tn s tích lu lớn hơn hoặc bng
30
. Xét nhóm
3
60r
;
3
10; 25dn
và nhóm
2
Trang 6
2
13cf
.
Trung v ca mu s liệu đó là:
30 13
60 10 66,8
25
e
M



(nghìn đồng).
c) Ta có:
60
15
44
n

13 15 38
. Suy ra nhóm
3
là nhóm đầu tiên có tn s tích lu lớn hơn
hoc bng
15
. Xét nhóm
3
3
60; 10; 25r d n
và nhóm
2
2
13cf
.
T phân v th nht
1
Q
ca mu s liệu đó là:
1
15 13
60 10 60,8
25
Q



(nghìn đồng).
d) Ta thy nhóm
3
là nhóm có tn s ln nht vi
3
60; 10; 25u g n
. Nhóm
2
có tn s
2
8n
, nhóm
4
có tn s
4
20n
.
Mt ca mu s liệu đó là:
25 8
60 10 68
2 25 8 20
o
M



(nghìn đồng).
Ví d 4: Kết qu kim tra môn Tiếng Anh (cùng đề) ca hc sinh hai lp
12A
12B
được cho
lần lượt bi mu s liu ghép nhóm Bng 6, Bng 7.
a) S trung bình cng ca hai mu s liu trên bng nhau.
b) Độ lch chun ca mu s liu lp
12A
nh hơn 2.
c) Phương sai của mu s liu lp
12B
lớn hơn 3.
d) Điểm thi ca hc sinh lp
12B
đồng đều hơn lớp
12A
.
Lời giải
Ý
a)
b)
c)
d)
Kết quả
Đ
S
Đ
Đ
a) S trung bình cng ca mu s liu lp
12A
là:
3.1 5.3 5.5 25.7 2.9
5,9.
40
A
x

S trung bình cng ca mu s liu lp
12B
là:
1.1 4 3 15.5 16 7 4.9
5,9.
40
B
x

Suy ra s trung bình cng ca hai mu s liu trên bng nhau.
Phương sai của mu s liu lp
12A
là:
Trang 7
2
A
s
2 2 2 2 2
3 1 5,9 5 3 5,9 5 5 5,9 25 7 5,9 2 9 5,9
40
4,19
Độ lch chun ca mu s liu lp
12A
4,19
4,19 2
.
Phương sai của mu s liu lp
12B
là:
2
B
s
2 2 2 2 2
1 1 5,9 4 3 5,9 15 5 5,9 16 7 5,9 4 9 5,9
40
3,19
3,19 3
.
22
AB
ss
nên điểm thi ca hc sinh lp
12B
đồng đều hơn lớp
12A
.
Đáp án:
Ý
a)
b)
c)
d)
Kết quả
Đ
S
Đ
Đ
Dng 3. Câu trc nghim tr li ngn
Ví d 5. Mu s liệu dưới đây ghi lại tốc độ ca 40 ô tô khi đi qua mt trạm đo tốc độ (đơn vị:
/km h
).
Sau khi ghép nhóm mu s liu trên thành sáu nhóm ng vi sáu na khong:
40;45 , 45;50 , 50;55 , 55;60 , 60;65 , 65;70
Thì trung v ca mu s liu ghép nhóm nhận được bng
/
a
km h
b
(
a
b
là phân s ti giản). Khi đó
giá tr ca
a
bng bao nhiêu?
Gii
Lập mẫu số liệu ghép nhóm bao gồm cả tần số tích lũy như ở Bảng 8.
Số phần tử của mẫu là
40n
. Ta có
20
2
n
15 20 22
.
Suy ra nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 20.
Trang 8
Xét nhóm 3 có
3
50; 5; 7r d n
và nhóm 2 có
2
15cf
.
Trung vị của mẫu số liệu ghép nhóm đó là
20 15 375
50 .5 /
77
e
M km h
.
Suy ra
375a
.
Ví dụ 6. Bảng 9 biểu diễn mẫu số liệu ghép nhóm vnhiệt độ không khí trung bình các tháng
trong năm 2021 tại Hà Nội (đơn vị: độ C)
(Nguồn: Niên giám Thống kê 2021, NXB Thống kê, 2022)
Phương sai của mẫu số liệu đó bằng bao nhiêu? (làm tròn kết quả đến hàng phần mười)?
Giải
Số trung bình cộng của mẫu số liệu đó là:
2.18,3 3.21,3 2.24,3 1.27,3 4.30,3
12
x
24,8 C
.
Phương sai của mẫu số liệu đó là
2
s
2 2 2 2 2
2 18,3 24,8 3 21,3 24,8 2 24,3 24,8 27,3 24,8 4 30,3 24,8
12
20,8
C. BÀI TẬP TỰ LUYỆN
Dạng 1. Câu trắc nghiệm nhiều phương án lựa chọn
Mỗi câu hỏi thí sinh chỉ chọn một phương án.
Câu 1. Bảng 10 biểu diễn mẫu số liệu ghép nhóm vdoanh thu (tỉ USD) của 20 hãng xe ô tô có
doanh thu cao nhất thế giới năm 2023.
(Nguồn: Business Research Insights, wiki)
Trang 9
Tứ phân vị thứ ba
3
Q
của mẫu số liệu đó bằng
A.
300
B.
100
C.
275
D.
175
Lời giải
Chọn D
Câu 2. Bng 11 biu din mu s liu ghép nhóm v chi tiêu bình quân (đơn vị: USD) ca mt
t khách quc tế đến Vit Nam phân theo 27 quc tịch năm 2019.(Nguồn:
https://www.gso.gov.vn)
Độ lch chun ca mu s liệu đó nằm trong khoảng nào dưới đây?
A.
200;300
B.
300; 400
C.
400;500
D.
500;600
Lời giải
Chọn B
Dng 2. Câu trc nghiệm đúng sai
Trong mi ý a), b), c), d) mi câu, thi sinh chọn đúng hoặc sai.
Trang 10
Câu 3. Bng 12 cho ta bng tn s ghép nhóm v s liu thng kê t l che ph rừng (đơn v: %)
ca 60 tnh, thành ph Vit Nam (không bao gồm Hưng Yên, Vĩnh Long, Cn 𝑇ℎ𝑜󰈓) tính đến
ngày 31/12/2020. (Ngun: https://bandolamnghiep.com)
a) T l che ph rng trung bình trên mt tnh, thành ph được thng trên là lớn hơn
33%
.
b) Trung v ca mu s liu trên là
40%
.
c) Có 20 tnh, thành pht l che ph rng nh n
10%
.
d) Mt ca mu s liu trên là
5%
.
Lời giải
Tỉ lệ che phủ rừng trưng bình trên một tình, thành phố là:
x
17 5 6 15 3 25 4 35 9 45 15 55 5 65 1 75
60
101
(%) 33(%)
3

Trung v ca mu s liệu đó là:
30 26
30 10 40 %
4
e
M



Theo bng thng kê thì có 17 tnh, thành ph có t l che ph rng nh hơn
10%
. Mt ca mu s
liệu đó là:
17 0
0 10 6 %
2 17 0 6
o
M



Đáp án: a) Đ, b) Đ, c) S, d) S.
Câu 4. Bn An và bn Bình làm thí nghim trng cây. Mi bn trng 40 cây cn tây trong cc,
phn gc ca các cây khi bắt đu trồng đều dài 4cm. Bng 13 và Bng 14 lần lượt biu din mu
s liu ghép nhóm v s liu thng kê chiu cao của các cây (đơn vị: centimét) mà bn An và bn
Bình trng sau 5 tun.
Trang 11
a) Chiều cao trung bình của mỗi cây do hai bạn An và Bình trồng không bằng nhau.
b) Khoàng biến thiên của cả hai mẫu số liệu trên là 20.
c) Khoảng tứ phân vị của mẫu số liệu ở Bảng 13 là 5,5.
d) Chiều cao của các cây mà bạn Bình trồng đồng đều hơn các cây mà bạn An trồng.
Lời giải
Chiu cao trung bình ca cây do bn An trng là:
30,25 cm
A
x
.
Chiu cao trung bình ca cây do bn Bình trng là:
30,25 cm
B
x
.
Suy ra chiu cao trung bình ca mi cây do hai bn An và Bình trng là bng nhau.
Khong biến thiên ca c hai mu s liu là
40 20 20
.
Xét mu s liu Bng 13.
T phân v th nht
1
Q
ca mu s liệu đó là:
1
10 2
25 5 27,5 cm
16
Q



T phân v th ba
3
Q
ca mu s liệu đó là:
3
30 18
30 5 33 cm
20
Q



Suy ra khong t phân v ca mu s liu Bng 13 là
33 27,5 5,5
.
Phương sai của mu s liu Bng 13 là:
2
11,1875
A
s
.
Phương sai ca mu s liu Bng 14 là:
2
13,6875
B
s
.
Suy ra
22
AB
ss
. Vy chiu cao ca các cây mà bn An trồng đồng đều hơn các cây mà bạn Bình
trng.
Đáp án: a) S, b) Đ, c) Đ, d) S.
Dạng 3. Câu trắc nghiệm trả lòi ngắn
Câu 5. Bảng 15 cho ta bảng tần số ghép nhóm vsố liệu thống kê chiều dài đường bờ biển (đơn
vị: kilômét) của 28 tỉnh, thành phố có giáp biến ờ Việt Nam.
(Nguồn: https:///vi.wikipedia.org)
Trang 12
Trung vị của mẫu số liệu đó bằng bao nhiêu (làm tròn kết quȧ đến hàng đơn vị)?
Lời giải
Trung v ca mu s liệu đó bằng khong 109 km .
Câu 6. Bảng 16 cho ta bảng tần số ghép nhóm vsố liệu thống kê chiều cao (đơn vị: mét) của 40
núi cao nhất Đông Nam Á.
(Nguồn: https://vi.wikipedia.org)
Độ lệch chuẩn của mẫu số liệu đó bằng bao nhiêu (làm tròn kết quả đến hàng đơn vị)?
Lời giải
Độ lch chun ca mu s liệu đó bằng khong 590 km .

Preview text:

CHUYÊN ĐỀ: MỘT SỐ YẾU TỐ VỀ THỐNG KÊ
A. KIẾN THỨC CẦN NHỚ
I. CÁC SỐ ĐẶC TRƯNG ĐO XU THẾ TRUNG TÂM CHO MẪU SỐ LIỆU GHÉP NHÓM
1. Số trung bình cộng (số trung bình)
Cho mẫu số liệu ghép nhóm như ở Bảng 1 .
• Trung điểm x của nửa khoảng (tính bằng trung bình cộng của hai đầu mút) ứng với nhóm i i
giá trị đại diện của nhóm đó.
• Số trung binh cộng của mẫu số liệu ghép nhóm, kí hiệu x , được tính theo công thức:
n x n x  n x 1 1 2 2 m m x n Bảng 1
Ý nghĩa: Số trung bình cộng của mẫu số liệu ghép nhóm có thể làm đại diện cho vị trí trung tâm
của mẫu số liệu đó khi các số liệu trong mẫu ít sai lệch với số trung bình cộng. 2. Trung vị
Cho mẫu số liệu ghép nhóm như ở Bảng 2 . Giả sử nhóm k là nhóm đầu tiên có tần số tích luỹ n n n lớn hơn hoặc bằng , tức là cf   nhưng cf
. Ta gọi r, d, n lần lượt là đầu mút trái, độ 2 k 1 2 k 2 k
dài, tần số của nhóm k;cf k  . k 1
 là tần số tích luỹ của nhóm 1 Bảng 2
Trung vị của mẫu số liệu ghép nhóm, kí hiệu M , được tính theo công thức sau: e Trang 1n   cf  1   2 k M r   d e nk    Quy uớc: cf  0 . 0
Ý nghĩa: Trung vị của mẫu số liệu có thể dùng để đại diện cho mẫu số liệu đó. 3. Tứ phân vị
Cho mẫu số liệu ghép nhóm như ở Bảng 2. • n n
Giả sử nhóm p là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng , tức là cf   nhưng 4 p 1 4 n cf  . Ta gọi s, ,
h n lần lượt là đầu mút trái, độ dài, tần số của nhóm p ; cf p
 là tần số tích luỹ 4 p p 1 của nhóm p 1.
Tú phân vị thú nhất Q được tính theo công thức sau: 1  n   cf  1   4 p Q s   h 1 np   
• Tứ phân vị thúc hai Q bằng trung vị M . 2 e • 3n 3n
Giả sử nhóm q là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng , tức là cf   4 q 1 4 nhưng 3n cf
. Ta gọi t, l, n lần lượt là đầu mút trái, độ dài, tần số của nhóm ; q cf q  là tần số 4 q q 1
tích luỹ của nhóm q 1.
Tứ phân vị thú ba Q được tính theo công thức sau: 3  3n   cf  1   4 q Q t   l 3 nq   
Ý nghĩa: Tứ phân vị Q ,Q ,Q của mẫu số liệu chia mẫu số liệu đó thành bốn phần, mỗi phần 1 2 3 chứa 25% giá trị. 4. Mốt
Cho mẫu số liệu ghép nhóm như ở Bảng 2.
Giả sử nhóm i là nhóm có tần số lớn nhất. Ta gọi u, g, n lần lượt là đầu mút trái, độ dài, tần số i của nhóm ; i n , n
i  , nhóm i 1 . Mốt của mẫu số liệu ghép nhóm, i 1  i 1
 lần lượt là tần số của nhóm 1
kí hiệu M , ược cính theo công thức sau: o
Quy ước: n  0;n  0. 0 m 1   n ni i 1 M u     g o 2n nni i 1  i 1  
Ý nghĩa: Mốt của mẫu số liệu ghép nhóm có thể dùng để đo xu thế trung tâm của mẫu số liệu đó.
II. CÁC SỐ ĐẶC TRƯNG ĐO MỨC ĐỘ PHÂN TÁN CHO MẪU SỐ LIỆU GHÉP NHÓM 1. Khoảng biến thiên
Cho mẫu số liệu ghép nhóm như ở Bảng 3, Trang 2
trong đó n n là các số nguyên dương. 1 m Gọi a , a 1 m 1
 lần lượt là đầu mút trái của nhóm 1, đầu mút phải của nhóm m . Hiệu R a
a được gọi là khoảng biến thiên của mẫu số liệu ghép nhóm đó. m 1  1 Ý nghĩa
• Khoảng biến thiên của mẫu số liệu ghép nhóm đo mức độ phân tán cho mẫu số liệu đó. Khoảng
biến thiên càng lớn thì mẫu số liệu càng phân tán.
• Trong các đại lượng đo mức độ phân tán của mẫu số liệu ghép nhóm, khoảng biến thiên là đại
lượng dễ hiểu, dễ tính toán. Tuy nhiên, do khoảng biến thiên chỉ sử dụng hai giá trị a a 1 m 1  của
mẫu số liệu nên đại lượng đó dễ bị ảnh hưởng bởi các giá trị bất thường.
2. Khoảng tứ phân vị
Cho mẫu số liệu ghép nhóm như ở Bảng 2.
Gọi Q ,Q ,Q là tứ phân vị của mẫu số liệu đó. Ta gọi hiệu Q
  Q Q khoảng tứ phân vị của 1 2 3 3 1 mẫu số liệu đó.
Ý nghĩa: Khoảng tứ phân vị của mẫu số liệu ghép nhóm giúp xác định các giá trị bất thường của
mẫu đó. Khoảng tứ phân vị thường được sử dụng thay cho khoảng biến thiên vì nó loại trừ hầu
hết giá trị bất thường vủa mẫu số liệu và nó không bị ảnh hưởng bởi các giá trị bất thường đó.
3. Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm
Cho mẫu số liệu ghép nhóm như ở Bảng 1.
• Gọi x là số trung bình cộng của mẫu số liệu đó. n x x
n x x  ... n x x 1  1 2 2 2 2 2 m m 2 Số s
được gọi là phương sai của mẫu số liệu đó. n
• Căn bậc hai (số học) của phương sai được gọi là độ lệch chuẩn của mẫu số liệu ghép nhóm, kí
hiệu là s , nghĩa là 2 s s . Ý nghĩa
• Phương sai (độ lệch chuẩn) của mẫu số liệu ghép nhóm được dùng để đo mức độ phân tán của
mẫu số liệu ghép nhóm đó.
• Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.
• Khi hai mẫu số liệu ghép nhóm có cùng đơn vị đo và có số trung trình cộng bằng nhau (hoặc
xấp xỉ nhau), mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình
cộng) của các số liệu trong mẫu đó sẽ thấp hơn. B. MỘT SỐ VÍ DỤ
Dạng 1. Câu trắc nghiệm nhiều phương án lựa chọn
Mỗi câu hỏi thí sinh chỉ chọn một phương án. Trang 3
Ví dụ 1. Người ta tiến hành phỏng vấn 40 người về một mẫu quần mới. Người phỏng vấn yêu
cầu cho điểm mẫu quần đó theo thang điểm là 100. Kết quả được trình bày theo mẫu số liệu ghép
nhóm được cho ở Bảng 4. Trung vị của mẫu số liệu ghép nhóm đó là: A. 75. B. 70,8. C. 78,8. D. 74,8. Giải Cách 1:
Gọi x ;...; x là mẫu số liệu gốc về điểm mẫu quần được xếp theo thứ tự không giảm. 1 40 Ta có
x ;...; x [50; 60), x ;...; x  [60; 70), x ;...; x  [70; 80), x ;...; x  [80; 90), x ; x  [90; 1 3 4 8 9 33 34 37 38 40 100).
Số phần tử của mẫu là n  40 . n 1 41 Ta có:   20,5 2 2 x x
Suy ra, trung vị của mẫu số liệu gốc là 20 21 M
[70; 80). Suy ra, p  3 e 2
rn m ... m 1 1   Áp dụng công thức 4 p Q a aa r pp 1 pmp
2n m m 1 2  Ta có: 4
M Q a a a e 2 3  4 3 m3 2.40 35      374 4 70 80 70   74,8 25 5 Chọn D. Cách 2:
Số phần tử của mẫu là n 40 n  40 . Ta có: 
 20 mà 8  20  33. Suy ra nhóm 3 là nhóm đầu 2 2
tiên có tần số tích lũy lớn hơn hoặc bằng 20 . Xét nhóm 3 có r  70; d 10; n  25 và nhóm 2 có 3 cf  8 . 2 Trang 4  
Trung vị của mẫu số liệu đó là: 20 8  M  70 
.10  74,8 . Chọn D. e    25 
Ví dụ 2: Xét mẫu số liệu ghép nhóm được cho ở Bảng 4. Phương sai của mẫu số liệu ghép nhóm đó là A. 9, 08 . B. 82, 4375 . C. 74, 75 . D. 50 . Lời giải Chọn B
Số trung bình cộng của mẫu số liệu đó là
3.55  5.65  25.75  4.85  3.95 x   74,75. 40
Phương sai của mẫu số liệu đó là:   2   
2    ,752 48574,752 39574,752 3 55 74, 75 5 65 74, 75 25 75 74 2 s  0 4  82, 4375
Dạng 2: Trắc nghiệm đúng -sai
Trong mỗi ý a) b) c) d) ở mỗi câu thí sinh chọn đúng hoặc sai.
Ví dụ 3:
Bảng 5 biều diễn mẫu số liệu ghép nhóm về số tiền (đơn vị: nghìn đồng) mà 60 khách
hàng mua sách ở một cửa hàng trong một ngày.
a) Số trung bình cộng của mẫu số liệu trên là 65 (nghìn đồng).
b) Trung vị của mẫu số liệu trên là 66,8 (nghìn đồng).
c) Tứ phân vị nhất Q của mẫu số liệu trên là 60,8 (nghìn đồng). 1
d) Mốt của mẫu số liệu trên là 65 (nghìn đồng). Lời giải Ý a) b) c) d) Kết quả S Đ Đ S
a) Số trung bình cộng của mẫu số liệu ghép nhóm trên là
5.45  8.55  25.65  20.75  2.85 x   66 (nghìn đồng) 60 n 60
b) Số phần tứ của mẫu là n  60 . Ta có: 
 30 mà 13  30  38 . Suy ra nhóm 3 là nhóm đầu 2 2
tiên có tần số tích luỹ lớn hơn hoặc bằng 30 . Xét nhóm 3 có r  60 ; d  10; n  25 và nhóm 2 3 Trang 5cf  13 . 2   
Trung vị của mẫu số liệu đó là: 30 13 M  60 
10  66,8 (nghìn đồng). e    25  n 60 c) Ta có: 
 15 mà13 15  38 . Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn 4 4
hoặc bằng 15 . Xét nhóm 3 có r  60; d  10; n  25 và nhóm 2 có cf  13 . 3 2 15 13 
Tứ phân vị thứ nhất Q của mẫu số liệu đó là: Q  60 
10  60,8 (nghìn đồng). 1 1    25 
d) Ta thấy nhóm 3 là nhóm có tần số lớn nhất với u  60; g  10; n  25 . Nhóm 2 có tần số 3
n  8 , nhóm 4 có tần số n  20 . 2 4   
Mốt của mẫu số liệu đó là: 25 8 M  60 
10  68 (nghìn đồng). o    2 25 8  20 
Ví dụ 4: Kết quả kiểm tra môn Tiếng Anh (cùng đề) của học sinh hai lớp 12 A và 12B được cho
lần lượt bời mẫu số liệu ghép nhóm ở Bảng 6, Bảng 7.
a) Số trung bình cộng của hai mẫu số liệu trên bằng nhau.
b) Độ lệch chuẩn của mẫu số liệu lớp 12A nhỏ hơn 2.
c) Phương sai của mẫu số liệu lớp 12B lớn hơn 3.
d) Điểm thi của học sinh lớp 12B đồng đều hơn lớp 12A . Lời giải Ý a) b) c) d) Kết quả Đ S Đ Đ
a) Số trung bình cộng của mẫu số liệu lớp 12 A là:
3.1 5.3  5.5  25.7  2.9 x   5,9. A 40
Số trung bình cộng của mẫu số liệu lớp 12B là:
1.1 4  3 15.5 16  7  4.9 x   5,9. B 40
Suy ra số trung bình cộng của hai mẫu số liệu trên bằng nhau.
Phương sai của mẫu số liệu lớp 12A là: Trang 6
  2    2    2    2    2 3 1 5,9 5 3 5,9 5 5 5,9 25 7 5,9 2 9 5,9 2 s   4,19 A 40
Độ lệch chuẩn của mẫu số liệu lớp 12A là 4,19 và 4,19  2 .
Phương sai của mẫu số liệu lớp 12B là:
  2    2    2    2    2 1 1 5,9 4 3 5,9 15 5 5,9 16 7 5,9 4 9 5,9 2 s   3,19 B 40 Và 3,19  3. Vì 2 2
s s nên điểm thi của học sinh lớp 12B đồng đều hơn lớp 12 A . A B Đáp án: Ý a) b) c) d) Kết quả Đ S Đ Đ
Dạng 3. Câu trắc nghiệm trả lời ngắn
Ví dụ 5.
Mẫu số liệu dưới đây ghi lại tốc độ của 40 ô tô khi đi qua một trạm đo tốc độ (đơn vị:
km / h ).
Sau khi ghép nhóm mẫu số liệu trên thành sáu nhóm ứng với sáu nửa khoảng:
40;45,45;50,50;55,55;60,60;65,65;70 a a
Thì trung vị của mẫu số liệu ghép nhóm nhận được bằng km / h ( là phân số tối giản). Khi đó b b
giá trị của a bằng bao nhiêu? Giải
Lập mẫu số liệu ghép nhóm bao gồm cả tần số tích lũy như ở Bảng 8.
Số phần tử của mẫu là n n  40 . Ta có  20 mà 15  20  22 . 2
Suy ra nhóm 3 là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 20. Trang 7
Xét nhóm 3 có r  50; d  5;n  7 và nhóm 2 có cf  15 . 3 2 
Trung vị của mẫu số liệu ghép nhóm đó là 20 15 375 M  50  .5  km h . e  /  7 7 Suy ra a  375 .
Ví dụ 6. Bảng 9 biểu diễn mẫu số liệu ghép nhóm về nhiệt độ không khí trung bình các tháng
trong năm 2021 tại Hà Nội (đơn vị: độ C)
(Nguồn: Niên giám Thống kê 2021, NXB Thống kê, 2022)
Phương sai của mẫu số liệu đó bằng bao nhiêu? (làm tròn kết quả đến hàng phần mười)? Giải
Số trung bình cộng của mẫu số liệu đó là:
2.18, 3  3.21, 3  2.24, 3 1.27, 3  4.30, 3 x   24,8 C  . 12
Phương sai của mẫu số liệu đó là   2    2    2   2    2 2 18,3 24,8 3 21,3 24,8 2 24,3 24,8 27,3 24,8 4 30,3 24,8 2 s  20,8 12 C. BÀI TẬP TỰ LUYỆN
Dạng 1. Câu trắc nghiệm nhiều phương án lựa chọn
Mỗi câu hỏi thí sinh chỉ chọn một phương án.
Câu 1. Bảng 10 biểu diễn mẫu số liệu ghép nhóm về doanh thu (tỉ USD) của 20 hãng xe ô tô có
doanh thu cao nhất thế giới năm 2023.
(Nguồn: Business Research Insights, wiki) Trang 8
Tứ phân vị thứ ba Q của mẫu số liệu đó bằng 3 A. 300 B. 100 C. 275 D. 175 Lời giải Chọn D
Câu 2.
Bảng 11 biểu diễn mẫu số liệu ghép nhóm về chi tiêu bình quân (đơn vị: USD) của một
lượt khách quốc tế đến Việt Nam phân theo 27 quốc tịch năm 2019.(Nguồn: https://www.gso.gov.vn)
Độ lệch chuẩn của mẫu số liệu đó nằm trong khoảng nào dưới đây? A. 200 ; 300 B. 300 ; 400 C. 400 ; 500 D. 500 ; 600 Lời giải Chọn B
Dạng 2. Câu trắc nghiệm đúng sai
Trong mỗi ý a), b), c), d) ở mỗi câu, thi sinh chọn đúng hoặc sai. Trang 9
Câu 3. Bảng 12 cho ta bảng tần số ghép nhóm về số liệu thống kê tỉ lệ che phủ rừng (đơn vị: %)
của 60 tỉnh, thành phố ở Việt Nam (không bao gồm Hưng Yên, Vĩnh Long, Cần 𝑇ℎ𝑜̛) tính đến
ngày 31/12/2020. (Nguồn: https://bandolamnghiep.com)
a) Tỉ lệ che phủ rừng trung bình trên một tỉnh, thành phố được thống kê ở trên là lớn hơn 33%.
b) Trung vị của mẫu số liệu trên là 40% .
c) Có 20 tỉnh, thành phố có tỉ lệ che phủ rừng nhỏ hơn 10% .
d) Mốt của mẫu số liệu trên là 5%. Lời giải
Tỉ lệ che phủ rừng trưng bình trên một tình, thành phố là:                101 x  17 5
6 15 3 25 4 35 9 45 15 55 5 65 1 75  (%)  33(%) 60 3
Trung vị của mẫu số liệu đó là:  30  26  M  30  10  40 e   %  4 
Theo bảng thống kê thì có 17 tỉnh, thành phố có tỉ lệ che phủ rừng nhỏ hơn 10% . Mốt của mẫu số liệu đó là:  17  0  M  0  10  6 o   %  217  0  6 
Đáp án: a) Đ, b) Đ, c) S, d) S.
Câu 4.
Bạn An và bạn Bình làm thí nghiệm trồng cây. Mỗi bạn trồng 40 cây cần tây trong cốc,
phần gốc của các cây khi bắt đầu trồng đều dài 4cm. Bảng 13Bảng 14 lần lượt biểu diễn mẫu
số liệu ghép nhóm về số liệu thống kê chiều cao của các cây (đơn vị: centimét) mà bạn An và bạn Bình trồng sau 5 tuần. Trang 10
a) Chiều cao trung bình của mỗi cây do hai bạn An và Bình trồng không bằng nhau.
b)
Khoàng biến thiên của cả hai mẫu số liệu trên là 20.
c)
Khoảng tứ phân vị của mẫu số liệu ở Bảng 13 là 5,5.
d)
Chiều cao của các cây mà bạn Bình trồng đồng đều hơn các cây mà bạn An trồng. Lời giải
Chiều cao trung bình của cây do bạn An trồng là: x  30, 25 cm . A
Chiều cao trung bình của cây do bạn Bình trồng là: x  30, 25 cm . B
Suy ra chiều cao trung bình của mỗi cây do hai bạn An và Bình trồng là bằng nhau.
Khoảng biến thiên của cả hai mẫu số liệu là 40  20  20 .
Xét mẫu số liệu ở Bảng 13.
• Tứ phân vị thứ nhất Q của mẫu số liệu đó là: 1 10  2  Q  25  5  27,5 cm 1      16 
• Tứ phân vị thứ ba Q của mẫu số liệu đó là: 3  30 18  Q  30  5  33 cm 3      20 
Suy ra khoảng tứ phân vị của mẫu số liệu ở Bảng 13 là 33  27,5  5,5 .
Phương sai của mẫu số liệu ở Bảng 13 là: 2 s  11,1875 . A
Phương sai của mẫu số liệu ở Bảng 14 là: 2 s  13, 6875 . B Suy ra 2 2
s s . Vậy chiều cao của các cây mà bạn An trồng đồng đều hơn các cây mà bạn Bình A B trồng.
Đáp án: a) S, b) Đ, c) Đ, d) S.
Dạng 3. Câu trắc nghiệm trả lòi ngắn
Câu 5.
Bảng 15 cho ta bảng tần số ghép nhóm về số liệu thống kê chiều dài đường bờ biển (đơn
vị: kilômét) của 28 tỉnh, thành phố có giáp biến ờ Việt Nam.
(Nguồn: https:///vi.wikipedia.org) Trang 11
Trung vị của mẫu số liệu đó bằng bao nhiêu (làm tròn kết quȧ đến hàng đơn vị)? Lời giải
Trung vị của mẫu số liệu đó bằng khoảng 109 km .
Câu 6. Bảng 16 cho ta bảng tần số ghép nhóm về số liệu thống kê chiều cao (đơn vị: mét) của 40
núi cao nhất Đông Nam Á.
(Nguồn: https://vi.wikipedia.org)
Độ lệch chuẩn của mẫu số liệu đó bằng bao nhiêu (làm tròn kết quả đến hàng đơn vị)? Lời giải
Độ lệch chuẩn của mẫu số liệu đó bằng khoảng 590 km . Trang 12
Document Outline

  • Dạng 2: Trắc nghiệm đúng -sai