Chương 6. Lý thuyết mẫu và Thống kê mô tả - Xác suất thống kê | Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội

Chương 6. Lý thuyết mẫu và Thống kê mô tả - Xác suất thống kê | Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem!

1
CHƯƠNG 6. LÝ THUYẾT MU
“Trong một tương lai
không xa ki n th c th ng ế
kê và tư duy thống kê s
tr ế thành m t y u t không
th thi c trong hếu đượ c
vn c a m i công dân,
giống như là khả năng biế t
đọ c, biết viết v y”
H. G. WELLS (1920)
6.1. M u s u, th ng kê mô t li
6.2. Các phương pháp trình bày, biểu din mu
6.3. Các đặc trưng mẫu
6.4. Phân b xác su u t của các đặc trưng mẫ
Bài 6.1. M U S U, TH NG KÊ MÔ T LI
1. Mt s khái ni ệm cơ bản:
Trước khi đi đế ệm cơ bản các khái ni n, ta xét ví d
sau:
Để điề u tra chi u cao trung bình c ng ủa sinh viên Trườ
Đạ i h c Công ngh i ta lệ, ngườ p m t danh sách bao
gm t t c các sinh viên c ng. ủa Trườ
a) Tp h p toàn b các sinh viên c c g ủa Trường đượ i
(hay còn g i là hay tp h p chính tng th dân
s).
b) Mi sinh viên được gi là mt cá th c a t p chính.
2
c) Chiu cao c c g i m t biủa sinh viên đượ ến lượng.
Giá tr c a bi i t cá th này ến lượng này thay đổ
sang cá th c bi u di n b i 1 s khác và đượ thc.
d) Do s sinh viên c ng là l a, khi s ủa Trườ n, hơn nữ
lượ ng cá th đạt đến ngưỡng nào đó lượng thông tin
tăng không đáng kể, nên ta không điều tra hết, mà
ch ch n ra 1 tp hợp con để điều tra.
Tp h c l c g i là mợp con đượ ấy ra để điều tra đượ t
mu, s ph n t ca mt m c gẫu đượ i là c m u.
Định nghĩa 1.
a) Tp hp chính (hay dân s) S là tp tt c các đối
tượ ng có chung m t tính chất nào đó mà chúng ta
đang quan tâm.
b) Mi ph n t ca t p h c g ợp chính đượ i là mt cá
th.
c) Mt bi ng X là mến lượ t ánh x t S lên R.
d) Vi c ch n ra t t p h p chính m t tập con nào đó
gi là phép ly mu.
T p h c g i là m t m u. ợp con này đượ
S cá th c a m c g i là c m u. ẫu đượ
Ví d : l y m u c nh chi u cao TB n=10 để xác đị
ca L c 2012-2013: ớp MAT 1101_6 năm họ
SV
1
2
3
4
5
6
7
8
9
10
H
175
172
175
170
164
169
167
161
170
165
Th hin 2
SV
1
2
3
4
5
6
7
8
9
10
H
184
180
170
170
172
175
172
170
173
170
ly m u c nh chi u cao TB c a L p n=10 để xác đị
MAT 1101_3 năm học 2012-2013:
SV
1
2
3
4
5
6
7
8
9
10
H
162
175
170
169
172
170
167
172
165
167
3
Th hin 2
SV
1
2
3
4
5
6
7
8
9
10
H
172
169
170
173
172
174
170
166
163
167
Th hin 3
SV
1
2
3
4
5
6
7
8
9
10
H
172
174
165
165
175
172
170
171
170
171
Lớp MAT 1101_4 năm học 2013-2014
SV
1
2
3
4
5
6
7
8
9
10
H
168
170
177
171
165
156
168
175
173
165
2. Phương pháp chọn mu:
a. Nguyên t c ch n m u:
Tu theo t ng yêu c u c a bài toán mà ta ch n m t
phương pháp hoặ ều phương pháp chọc kết hp nhi n
mu thích h t sợp. Sau đây là mộ n phương pháp chọ
mẫu thường được s dng:
- Chn m u ng ẫu nhiên: Để chọn được mu ngu
nhiên, người ta yêu cu mi cá th trong tng th
đề u có kh năng được l a ch ọn như nhau.
- Chn m u theo t l : Khi t ng th bao g m s
lượ ng l n và phân thành nhiu b phn khác nhau,
thì m u ph i di n cho t t c các b ph n theo t ải đạ
l c a t ng b phn.
- Chn m u theo nhóm tr n i: Chúng ta quan tâm đế
nhng nhóm t p trung cao d u hi u mà ta quan tâm
để điề u tra. Ví d , mu u tra viốn điề c s d ng
Internet để hc tp, tra cu thông tin, ta tp trung
thành ph n trí th c và sinh viên.
trong giáo trình này, chúng ta tp trung vào mu
ngu nhiên.
4
b. 2: M u ng u nhiên Định nghĩa
Dãy các đại lượng ngu nhiên X
1
, X
2
, …, X
n
độc
lp, cùng phân ph i v ng ng u nhiên X ới đại lượ
đượ c gi là m u ng u nhiên c n t đại lượng ng u
nhiên X.
Kết qu ca mi l n l y m u c c các giá n, ta đượ
tr th c x
1
, x . B , x
2
, …, x
n
giá tr x
1 2
, …, x
n
được
gi là 1 th hi n c a m u ng u nhiên c n t X.
Ví d nh chi u cao và tr ng trung ụ1. Để xác đị ọng lượ
bình c a SV l p MAT 1101 1 (2011-2012), ta l y m u
c 20. K t qu cế th c a ph ếp l y m u là 1 th hi n
ca m u ng u nhiên (MNN) c 20:
1
5
6
165
170
168
52
52
66
11
15
16
170
165
157
60
54
50
Để xác định chi u cao và tr ng trung bình cọng lượ a
SV l p MAT 2078 (2011-2012), ta l y m u c 20.
Kết qu c th ca ph p lế y m u là 1 th n c hi a m u
ngu nhiên (MNN) c 20:
1
5
6
172
165
162
53
61
52
11
15
16
178
174
160
67
70
50
Lớp MAT 1101_4 năm học 2012-2013
1
5
6
170
168
168
60
54
48
5
11
15
16
160
155
157
65
49
44
Chúng ta đã biế ằng, để ọn đượt r ch c m u ng u nhiên,
ngườ đềi ta yêu cu m i cá th trong t ng th u có kh
năng đượ ọn như nhau.c la ch
3. Th ng kê mô t :
Th ng kê mô t tđược dùng để ng h p s liu, mô t
các đặc trưng quan trọ ến lượng ca các bi ng bng các
bng, và các sbiểu, đồ thị, sơ đồ tr.
Bài 6.2. Các phương pháp trình bày, biểu din mu
Gi s ta có dãy các s u quan sát c a m li x
1
, x
2
, …, x
n
t
ĐLNN X nào đấy. Gi s X hàm phân phi F(x). Ta
cn bi t các thông tin v F(x), ch ng h n, giá tr trung bình, ế
phương sai, các men, dáng điệ ật độu ca hàm m f(x),
hàm phân ph i F(x).
1
5
6
165
163
170
168
170
52
52
66
11
15
16
170
165
157
60
54
50
Ví d
Lớp MAT 1101_4 năm học 2012-2013
1
5
6
170
168
168
60
54
48
6
11
15
16
160
155
157
65
49
44
Bướ c 1. Ta li t ra các giá tr khác nhau đếm s l n
xut hi n các giá tr này. Ti p theo, s p x p các giá tr này ế ế
t bé t i l n. Gi s , sau khi s p x p l c ế ại ta đượ
x < x , gi s x
(1) (2)
<…<x
(m)
(k)
xu t hi n r l n (k=1, 2,
k
…, n), trong đó, r
1
+r
2
+...+r
m
=n.
Giá tr n c g đượ i là c mu. Các s r
1
, r
2
, …, r
m
được gi
là t n s xu t hi n c a các bi n c ế X=x
1
, X=x
2
, …,
X=x
m
tương ng.
T n su t c a các bi n c ế X=x
1
, X=x
2
, …,
X=x
m
được tính tương ứng:
f
1
=r
1
/n, f
2
=r
2
/n,…, f
m
=r
m
/n
(đượ c g i là tn sut xu t hin biến c X=x X=x
1
,
2
,
…, tương ứX=x
m
ng).
i
1
2
3
4
5
6
7
8
9
10
x
i
176
172
162
160
165
168
165
153
155
160
i
11
12
13
14
15
16
17
18
19
20
xi
155
164
170
158
160
155
160
164
168
165
Ví d : Th ng kê chi u cao c a SV L p K59CA
165
172
165
160
169
180
170
164
177
165
169
172
165
165
165
172
167
171
174
159
174
163
164
180
172
7
Bng t n s , t n su t
159
160
163
164
165
167
169
170
171
1
1
1
1
2
6
1
2
1
1
0.04
0.04
0.04
0.08
0.24
0.04
0.08
0.04
0.04
0
Trong thực hành, ta thường phân chia s liu quan sát
thành các kho u nhau ho u nhau), rảng (đề ặc không đề i
tính t n s và t n su t cho m i kho ng.
Nếu s u này là k t quli ế u cao c i Vi t, ta đo chiề ủa ngườ
cn bi t chiế ều cao trung bình, độ lch chun v chi u cao,
… Việc phân tích như thế rt c n thi t cho th c t . Ch ng ế ế
hn, ta c n bi ết bao nhiêu ph i Vi t ần trăm ngườ
chiu cao t 1,65m đến 1,75m.
Bướ c 2. V biểu đồ, t chức đồ
Đố i v i s liệu chưa phân khoảng
- Chm trên m t ph ẳng các điểm (x , r
k k
), k=1, 2, …, m.
- Nối các điể ới các điể ), ta đượm (x , 0) v
k
m (x , r
k k
c
biểu đồ tn s hình gy.
- Ni liên tiếp điểm (x , r ) v i (x
k k
k+1
, r
k+1
), ta được bi u
đồ đa giác tần s .
Tương tự,
- Chm trên m t ph ẳng các điểm (x , f
k k
), k=1, 2, …, m.
- Nối các điể ới các điể ), ta đượm (x , 0) v
k
m (x , f
k k
c
biểu đồ tn sut hình gy.
8
- Ni liên tiếp điểm (x , f ) v i (x
k k
k+1
, f
k+1
), ta được bi u
đồ đa giác tần sut.
X
31
34
35
36
38
40
42
44
Tn s
10
20
30
15
10
10
5
20
Tn su t
12
1
12
2
12
2
8
1
12
1
12
1
24
1
12
2
0
5
10
15
20
25
30
35
31 34 35 36 38 40 42 44
X
TAN SO
Series2
BIỂU ĐỒ TẦN SỐ
0
5
10
15
20
25
30
35
31 34 35 36 38 40 42 44
x
TẦN SỐ
Series1
9
0
1/20
1/10
3/20
1/5
1/4
3/10
31 34 35 36 38 40 42 44
X
TAN SUAT
Series2
0
1/20
1/10
3/20
1/5
1/4
3/10
31 34 35 36 38 40 42 44
x
Y
Series2
10
ĐA GC TẦN SỐ
0
5
10
15
20
25
30
35
31 34 35 36 38 40 42 44
X
TẦN SỐ
Series2
ĐA GC TẦN SUẤT
0
1/20
1/10
3/20
1/5
1/4
3/10
31 34 35 36 38 40 42 44
X
TẦN SUẤT
Series2
11
T t n schức đồ - t t n su chức đồ t:
Đố i v i s liệu đã phân chia thành c khoảng độ dài
bng nhau:
- Trên m i kho ng ta d ng hình ch nh t có chi u cao
bng t n s (hay t n su ng v ất) tương ứ i kho ảng đó.
- Tô đậ ằng các đườm hoc k chéo b ng song song các
hình ch nh c t t n s (hay ật này ta thu đượ chức đồ
t chức đồ tn sut).
Đối v i s liệu đã phân chia thành các khoảng độ dài
không b ng nhau.
- Trên m i hình ch nh t chi u cao b ng y
k
=λr
k
/l
k
(hay y
k
=λf
k
/l
k
).
trong đó l là chiều dài ca khong, l là s tu n, chch ng
hn l=1, sao cho hình v thu được d coi.
- Tô đậ ằng các đườm hoc k chéo b ng song song các
hình ch nh c t t n s (hay ật này ta thu đượ chức đồ
t chức đồ tn sut).
Ví d sau minh ho nh u v a trình bày trên: ững điề
Khong
Tn s
Tn su t
26,5-48,5
2
0,04
48,5-70,5
8
0,16
70,5-92,5
12
0,24
92,5-114,5
12
0,24
114,5-136,5
8
0,16
136,5-158,5
7
0,14
158,5-180,5
1
0,02
180,5-202,5
1
0,02
12
Tng
51
1
Bước 3. Tính các đặc trưng mẫu
Trung bình m u tính theo công th c:
n
i
r
xr
i
n
m
k
k
m
k
kk
xx
1
1
1
1
Phương sai mẫu tính theo công thc:
m
k
kkn
n
i
i
n
xxrxxs
1
2
1
1
1
2
1
1
2
)()(
Độ lch mu tính theo công th c:
m
k
kkn
n
i
i
n
xxrxxs
1
2
1
1
1
2
1
1
)()(
Bài 6.3. Các đặc trưng mẫu
13
Trong ph i thiần trên ta đã giớ ệu cách tính 3 đặc trưng
mu là: trung bình m lẫu, phương sai mẫu và độ ch
chun m i thi u mẫu. Sau đây, chúng ta giớ t s đặc trưng
quan tr ng khác:
1. Trung v (Median) Ký hi u là Med(X) :
Vi m t m u, trung v là là giá tr n m gi dãy a
giá tr quan tr c theo th t tăng hay giảm.
Nếu dãy quan tr c có 2n+1 s liu s p x p theo ế
th th t tăng dần thì giá tr n+1 là trung v, nếu
dãy quan tr c g m 2n s u thì trung v là giá tr li
trung bình c a giá tr n và n+1. th
Nếu các giá tr x
i i
có t n s r , gi
k là s bé nh ch ất để
r
1
+r
2
+…+r
k
≥n/2. Khi đó ta định
nghĩa Med(X)=x
k
.
Ví d : Cho b ng phân b t n s c ủa đại lượng X như sau:
X
0
1
2
3
4
5
6
7
8
9
10
11
r
i
6
15
43
53
85
72
55
33
18
10
7
3
Kích thước mu là 400
Hãy tính trung bình m u và trung v .
Gii
Trung bình m u
645.4x
Ta th y s giá tr c a m ng 3 là: ẫu bé hơn hay bằ
6+15+43+53=117<200
S giá tr c a mu bé ng 4 là: hơn hay bằ
6+15+43+53+85=202>200
Vy Med(X)=4.
Trong trườ ẫu được cho dướng hp m i dng phân b ghép
lp ta định nghĩa trung vị như sau:
Gi s ta có m kho ng v m chia là: ới các điể
| 1/26

Preview text:

CHƯƠNG 6. LÝ THUYẾT MU “Trong một tương lai
không xa kiến thc th ng
kê và tư duy thống kê s
tr
thành mt yếu t không
th
thiếu được trong hc
v
n ca mi công dân,
gi
ống như là khả năng biết
đọc, biết viết vậy” H. G. WELLS (1920)
6.1. Mẫu số liệu, thống kê mô tả
6.2. Các phương pháp trình bày, biểu diễn mẫu 6.3. Các đặc trưng mẫu
6.4. Phân bố xác suất của các đặc trưng mẫu
Bài 6.1. MU S LIU, THNG KÊ MÔ T
1. Mt s khái ni ố ệm cơ bản :
Trước khi đi đến các khái niệm cơ bản, ta xét ví dụ sau:
Để điều tra chiều cao trung bình của sinh viên Trường
Đại học Công nghệ, người ta lập một danh sách bao
gồm tất cả các sinh viên của Trường. a) Tập hợp toàn b c ộ ác sinh viên c c ủa Trường đượ gọi
tp hp chính (hay còn g i
ọ là tng thể hay dân số).
b) Mỗi sinh viên được gọi là một cá thể của tập chính. 1
c) Chiều cao của sinh viên được gọi một biến lượng. Giá trị c a
ủ biến lượng này thay đổi từ cá thể này sang cá thể c
khác và đượ biểu diễn bởi 1 số thực .
d) Do số sinh viên của Trường là lớn, hơn nữa, khi s ố
lượng cá thể đạt đến ngưỡng nào đó lượng thông tin
tăng không đáng kể, nên ta không điều tra hết, mà chỉ c
họn ra 1 tập hợp con để điều tra.
Tập hợp con được lấy ra để điều tra được g i ọ là một
mẫu, số phần tử của một mẫu được gọi là cỡ mẫu. Định nghĩa 1.
a) Tp hp chính (hay dân s) S là tp tt c các đối
tượng có chung mt tính chất nào đó mà chúng ta đang quan tâm.
b) Mỗi phần tử của tập hợp chính được gọi là một cá thể.
c) Một biến lượng X là một ánh xạ từ S lên R.
d) Vic chn ra t tậ ợ
p h p chính mt tập con nào đó
gi là phép ly mu.
Tập hợp con này được g i ọ là m t ộ mẫu. S c
ố á thể của mẫu được g i ọ là cỡ mẫu.
Ví dụ: lấy mẫu cỡ n=10 để xác định chiều cao TB
của Lớp MAT 1101_6 năm học 2012-2013: SV 1 2 3 4 5 6 7 8 9 10 H
175 172 175 170 164 169 167 161 170 165 Thể hiện 2 SV 1 2 3 4 5 6 7 8 9 10 H
184 180 170 170 172 175 172 170 173 170
lấy mẫu cỡ n=10 để xác định chiều cao TB c a ủ Lớp
MAT 1101_3 năm học 2012-2013: SV 1 2 3 4 5 6 7 8 9 10 H
162 175 170 169 172 170 167 172 165 167 2 Thể hiện 2 SV 1 2 3 4 5 6 7 8 9 10 H
172 169 170 173 172 174 170 166 163 167 Thể hiện 3 SV 1 2 3 4 5 6 7 8 9 10 H
172 174 165 165 175 172 170 171 170 171
Lớp MAT 1101_4 năm học 2013-2014 SV 1 2 3 4 5 6 7 8 9 10 H
168 170 177 171 165 156 168 175 173 165
2. Phương pháp chọn mu: a. Nguyên tắc ch n m ọ ẫu:
Tuỳ theo từng yêu cầu c a
ủ bài toán mà ta chọn một
phương pháp hoặc kết hợp nhiều phương pháp chọn
mẫu thích hợp. Sau đây là một số phương pháp chọn
mẫu thường được sử dụng:
- Chọn mẫu ngẫu nhiên: Để chọn được mẫu ngẫu
nhiên, người ta yêu cầu mỗi cá thể trong tổng thể
đều có khả năng được lựa chọn như nhau.
- Chọn mẫu theo tỷ lệ: Khi tổng thể bao gồm số
lượng lớn và phân thành nhiề ộ u b phận khác nhau,
thì mẫu phải đại diện cho tất cả các b ph ộ ận theo tỷ lệ c a ủ từng bộ phận.
- Chọn mẫu theo nhóm trội: Chúng ta quan tâm đến
những nhóm tập trung cao dấu hiệu mà ta quan tâm
để điều tra. Ví dụ, muốn điều tra việc sử dụng
Internet để học tập, tra cứu thông tin, ta tập trung
thành phần ở trí thức và sinh viên.
Ở trong giáo trình này, chúng ta tập trung vào mẫu ngẫu nhiên. 3
b. Định nghĩa 2: Mẫu ngẫu nhiên
Dãy các đại lượng ngu nhiên X1, X2, …, Xn độc
lp, cùng phân ph i v ng ng ới đại lượ ẫu nhiên X
được gi là mu ngu nhiên c n t đại lượng ngu nhiên X.
Kết quả của mỗi lần lấy mẫu cỡ n, ta được các giá
trị cụ thể x1, x2, …, xn. Bộ giá trị x1, x2, …, xn được
gọi là 1 thể hiện của mẫu ngẫu nhiên cỡ n từ X.
Ví dụ1. Để xác định chiều cao và trọng lượng trung bình c a
ủ SV lớp MAT 1101 1 (2011-2012), ta lấy mẫu
cỡ 20. Kết quả cụ thể c a
ủ phếp lấy mẫu là 1 thể hiện
của mẫu ngẫu nhiên (MNN) cỡ 20: SV 1 2 3 4 5 6 7 8 9 10 H
165 163 170 170 170 168 170 162 163 168 W 52 51 51 52 52 66 67 45 50 58 SV 11 12 13 14 15 16 17 18 19 20 H
170 157 171 170 165 157 160 159 178 176 W 60 44 61 53 54 50 52 46 55 59
Để xác định chiều cao và trọng lượng trung bình của
SV lớp MAT 2078 (2011-2012), ta lấy mẫu cỡ 20.
Kết quả cụ thể của phếp lấy mẫu là 1 thể hiện của mẫu ngẫu nhiên (MNN) cỡ 20: SV 1 2 3 4 5 6 7 8 9 10 H
172 166 165 170 165 162 168 172 174 170 W 53 54 50 52 61 52 56 63 55 56 SV 11 12 13 14 15 16 17 18 19 20 H
178 162 168 157 174 160 162 165 164 167 W 67 48 47 45 70 50 50 60 59 53
Lớp MAT 1101_4 năm học 2012-2013 SV 1 2 3 4 5 6 7 8 9 10 H
170 164 168 164 168 168 166 170 170 175 W 60 52 55 50 54 48 49 63 53 57 4 SV 11 12 13 14 15 16 17 18 19 20 H
160 171 170 163 155 157 162 170 169 165 W 65 51 64 48 49 44 51 52 50 50
Chúng ta đã biết rằng, để chọn được mẫu ngẫu nhiên,
người ta yêu cầu mỗi cá thể trong tổng thể đều có khả
năng được lựa chọn như nhau.
3. Thng kê mô t:
Thống kê mô tả được dùng để tổng hợp số liệu, mô tả
các đặc trưng quan trọng của các biến lượng bằng các
bảng, biểu, đồ thị, sơ đồ và các số trị.
Bài 6.2. Các phương pháp trình bày, biểu din mu Giả sử ta có dãy các s
ố liệu quan sát x1, x2, …, xn c a ủ một
ĐLNN X nào đấy. Giả sử X có hàm phân phối F(x). Ta
cần biết các thông tin về F(x), chẳng hạn, giá trị trung bình,
phương sai, các mô men, dáng điệu của hàm mật độ f(x), hàm phân ph i ố F(x). SV 1 2 3 4 5 6 7 8 9 10 H
165 163 170 170 170 168 170 162 163 168 W 52 51 51 52 52 66 67 45 50 58 SV 11 12 13 14 15 16 17 18 19 20 H
170 157 171 170 165 157 160 159 178 176 W 60 44 61 53 54 50 52 46 55 59 Ví d ụ
Lớp MAT 1101_4 năm học 2012-2013 SV 1 2 3 4 5 6 7 8 9 10 H
170 164 168 164 168 168 166 170 170 175 W 60 52 55 50 54 48 49 63 53 57 5 SV 11 12 13 14 15 16 17 18 19 20 H
160 171 170 163 155 157 162 170 169 165 W 65 51 64 48 49 44 51 52 50 50
Bước 1. Ta liệt kê ra các giá trị khác nhau và đếm số lần
xuất hiện các giá trị này. Tiếp theo, sắp xếp các giá trị này
từ bé tới lớn. Giả sử, sau khi sắp xếp lại ta được
x(1)< x(2)<……, n), trong đó, r1+r2+...+rm=n.
Giá trị n được gọi là cỡ mẫu. Các số r1, r2, …, rm được gọi là tần s ố xuất hiện c a
ủ các biến cố X=x1 , X=x2 , …, X=xm tương ứng.
Tần suất của các biến cố X=x1 , X=x2 , …,
X=xm được tính tương ứng: f1=r1/n, f2=r2/n,…, fm=rm/n
(được gọi là tần suất xuất hiện biến cố X=x1 , X=x2 , …, X=xm tương ứ ng). i 1 2 3 4 5 6 7 8 9 10 xi
176 172 162 160 165 168 165 153 155 160 i 11 12 13 14 15 16 17 18 19 20 xi
155 164 170 158 160 155 160 164 168 165 Ví d :
ụ Thống kê chiều cao c a ủ SV Lớp K59CA
165 172 165 160 169 180 170 164 177 165
169 172 165 165 165 172 167 171 174 159 174 163 164 180 172 6
Bảng tần số, tần suất 159 160 163 164 165 167 169 170 171 1 1 1 1 2 6 1 2 1 1
0.04 0.04 0.04 0.08 0.24 0.04 0.08 0.04 0.04 0
Trong thực hành, ta thường phân chia số liệu quan sát
thành các khoảng (đều nhau hoặc không đều nhau), rồi tính tần s và ố
tần suất cho mỗi khoảng.
Nếu số liệu này là kết quả đo chiều cao của người Việt, ta
cần biết chiều cao trung bình, độ lệch chuẩn về chiều cao,
… Việc phân tích như thế rất cần thiết cho thực tế. Chẳng
hạn, ta cần biết có bao nhiêu phần trăm người Việt có
chiều cao từ 1,65m đến 1,75m.
Bước 2. Vẽ biểu đồ, tổ chức đồ
Đối với số liệu chưa phân khoảng
- Chấm trên mặt phẳng các điểm (xk, rk), k=1, 2, …, m.
- Nối các điểm (xk, 0) với các điểm (xk, rk), ta được
biểu đồ tần số hình gậy.
- Nối liên tiếp điểm (xk, rk) với (xk+1, rk+1), ta được biểu đồ đa giác tần số. Tương tự,
- Chấm trên mặt phẳng các điểm (xk, fk), k=1, 2, …, m.
- Nối các điểm (xk, 0) với các điểm (xk, fk), ta được
biểu đồ tần suất hình gậy. 7
- Nối liên tiếp điểm (xk, fk) với (xk+1, fk+1), ta được biểu đồ đa giác tần suất. X 31 34 35 36 38 40 42 44 Tần số 10 20 30 15 10 10 5 20 Tần suất 1 2 2 1 1 1 1 2 12 12 12 8 12 12 24 12 35 30 25 O 20 S N Series2 A 15 T 10 5 0 31 34 35 36 38 40 42 44 X BIỂU ĐỒ TẦN SỐ 35 30 25 Ố 20 S N Series1 Ầ 15 T 10 5 0 31 34 35 36 38 40 42 44 x 8 3/10 1/4 1/5 T A U 3/20 S Series2 N A T 1/10 1/20 0 31 34 35 36 38 40 42 44 X 3/10 1/4 1/5 Y 3/20 Series2 1/10 1/20 0 31 34 35 36 38 40 42 44 x 9 ĐA GIÁC TẦN SỐ 35 30 25 Ố 20 S N Series2 Ầ 15 T 10 5 0 31 34 35 36 38 40 42 44 X ĐA GIÁC TẦN SUẤT 3/10 1/4 1/5 T Ấ U 3/20 S Series2 N Ầ T 1/10 1/20 0 31 34 35 36 38 40 42 44 X 10 Tổ ch t ức đồ ần số - tổ ch t ức đồ ần suất: Đối ớ
v i số liệu đã phân chia thành các khoảng có độ dài bằng nhau: - Trên m i
ỗ khoảng ta dựng hình chữ nhật có chiều cao
bằng tần số (hay tần su ng v ất) tương ứ ới khoảng đó. - Tô đậm hoặc kẻ ché ằng các o b đường song song các
hình chữ nhật này ta thu được t
ổ chức đồ tần số (hay
tổ chức đồ tần suất). Đối với s
ố liệu đã phân chia thành các khoảng có độ dài không bằng nhau. - Trên m i
ỗ hình chữ nhật có chiều cao bằng yk=λrk/lk (hay yk=λfk/lk).
trong đó l là chiều dài của khoảng, l là số tuỳ chọn, chẳng
hạn l=1, sao cho hình vẽ thu được dễ coi. - Tô đậm hoặc kẻ ché ằng các o b đường song song các
hình chữ nhật này ta thu được t
ổ chức đồ tần số (hay
tổ chức đồ tần suất). Ví d s ụ au minh hoạ nh u v ững điề ừa trình bày ở trên: Khoảng Tần s ố Tần suất 26,5-48,5 2 0,04 48,5-70,5 8 0,16 70,5-92,5 12 0,24 92,5-114,5 12 0,24 114,5-136,5 8 0,16 136,5-158,5 7 0,14 158,5-180,5 1 0,02 180,5-202,5 1 0,02 11 Tổng 51 1
Bước 3. Tính các đặc trưng mẫu
Trung bình mẫu tính theo công thức: m n r x k k 1 k x x 1 n i m i 1 rk k 1
Phương sai mẫu tính theo công thức: n m s2 1 (x x 2 1 ) r (x x 2 ) n 1 i n 1 k k i 1 k 1
Độ lệch mẫu tính theo công thức: n m 2 2 1 1 s ( x x) r ( x x) n 1 i n 1 k k i 1 k 1
Bài 6.3. Các đặc trưng mẫu 12
Trong phần trên ta đã giới thiệu cách tính 3 đặc trưng
mẫu là: trung bình mẫu, phương sai mẫu và độ lệch
chuẩn mẫu. Sau đây, chúng ta giới thiệu một số đặc trưng quan tr ng khá ọ c:
1. Trung v (Median): Ký hiu là Med(X) Vi m t m u, t
rung v là là giá tr nm gia dãy
giá tr quan tr c
theo th t tăng hay giảm .
Nếu dãy quan trắc có 2n+1 số liệu sắp xếp theo
thứ tự tăng dần thì giá trị t
hứ n+1 là trung vị, nếu dãy quan trắc g m
ồ 2n số liệu thì trung vị là giá trị trung bình c a
ủ giá trị thứ n và n+1.
Nếu các giá tr xi có tn s ri, gi
k là ch
s bé nhất để
r1+r2
+…+rk≥n/2. Khi đó ta định nghĩa Med(X)=xk. Ví d : ụ Cho bảng phân b t
ố ần số của đại lượng X như sau: X 0 1 2 3 4 5 6 7 8 9 10 11 ri 6 15 43 53 85 72 55 33 18 10 7 3 Kích thước mẫu là 400
Hãy tính trung bình mẫu và trung vị. Giải Trung bình mẫu x 6 . 4 45 Ta thấy số giá trị c a
ủ mẫu bé hơn hay bằng 3 là: 6+15+43+53=117<200
Số giá trị của mẫu bé hơn hay bằng 4 là: 6+15+43+53+85=202>200 Vậy Med(X)=4.
Trong trường hợp mẫu được cho dưới dạng phân bố ghép
lớp ta định nghĩa trung vị như sau:
Giả sử ta có m khoảng với các điểm chia là: 13