2.4. SË liªu các sË ∞c tr˜ng
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 34 / 43
Bin sË
Bin sË (variable) khái niªm dùng ∫ ch bø ßt k˝ ∞c tính nào cıa qun th ta
nghiên c˘u.
dˆ: ∫ nghiên c˘u sinh viên c u cácıa mÎt tr˜Ìng §i hÂc, ta th nghiên c˘
bin nh :˜
GiÓi tính
Tu iÍ
Chiu cao
Ngành h cÂ
S tiË n chi tiêu trong mÎt tháng,...
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 35 / 43
Phân lo§i bin sË
Bin ‡nh tính (qualitative) bin dùng n ánh tính ch∫ ph£ ßt, lo§i hình, không th hi nª
tr .¸c tip b¨ng các con sË
Giá tr a m cı Èi bin ‡nh tính th p th x ˘ t¸ ˜Òc (Thái Î: không hài lòng-hài
lòng-r t ).ßt hài lòng), hoc không xp th˘ ¸ ˜Òc (GiÓi tính: Nam-N˙
Bin ‡nh l˜Òng (quantitative) bin dùng n t p c∫ diπ £ các m˘c Î cao, thß ıa d˙ li u,ª
th hi . ªn tr¸c tip b¨ng các con sË
Giá tr a bi cı n ‡nh l˜Òng th §i l˜Òng liên t u cao, cân nˆc (chi ng) ho ic §
l i˜Òng rÌi r§c ( m sË, sË ca khi bªnh trong mÎt tháng).
? y xác ‡nh các lo§i bin trong dˆ v th Ëng sinh viên.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 36 / 43
Các sË ∞c tr˜ng
Xem im Toán cıa 10 hÂc sinh l c kÓp A, ta thu ˜Ò t qu£ nh˜ sau:
10 9 5 6 1 5 7 9 5 6
? th rút ra các thông tin t¯ m li®u sË ªu trên?
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 37 / 43
Các sË ∞c tr˜ng m u®
1. Các sË o giá tr trung tâm:
a) Trung bình m®u (Sample mean)
Gi£ s˚ {x x
1
, x
2
, . . . ,
n
} mÎt m®u d˙ li ó:ªu ta thu thp ˜Òc. Khi
x
=
x
1
+ . . . + x
n
n
.
N li :u m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË
Giá tr x x
1
x
2
. . .
k
Tn sË n n n
1 2
. . .
k
Khi
ó, x =
n
1
x
1
+ +n
2
x
2
...+n
k
x
k
n
=
1
n
P
k
i
=1
n
i
x
i
.
N liu m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË theo nhóm:
Kho£ng giá tr (a
1
; a
2
) (a a a
2
;
3
) . . . (
k
; a
k+1
)
Tn sË n n
1 2
. . . n
k
G
Âi x
i
=
a
i
+ a
i +1
2
giá tr §i diªn cho kho£ng ( )a
i
; a
i +1
.
Khi
ó, x
n
1
x
1
+ +n
2
x
2
...+n
k
x
k
n
=
1
n
P
k
i
=1
n
i
x
i
.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 38 / 43
Các sË ∞c tr˜ng m u®
nghæa cıa trung bình m®u:
S liË trung bình m®u ˜Òc dùng làm §i diªn cho các sË ªu cıa m®u. mÎt sË
∞ Â ı ®c tr˜ng quan tr ng c a m u sË liªu.
dˆ: nu bit im trung bình môn Toán cıa l p A 6,5, c a l p C 7,5 thì ta Ó ı Ó
th i cho r¨ng sinh viên lÓp C §t m cao hÏn sinh viên lÓp A.
Tuy nhiên, khi các sË liªu trong m®u s chênh l¸ ªch rßt lÓn Ëi vÓi nhau thì sË
trung bình m t cho các s u trong m®u ch˜a §i diªn tË Ë liª ®u. Khi ó, ta dùng mÎt sË
∞ Ò Ïc tr˜ng khác thích h p h n .trung v
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 39 / 43
Các sË ∞c tr˜ng m u®
b) Trung v m®u (Median): gi£ s li˚ m®u d˙ ªu {x
1
, . . . , x
n
} ˜Ò ¸c s p xp theo th˘ t
không gi m£
x
1
x
2
· · · x
n
.
- N
u n = 2k thì trung v m®u
1
2
(x
k
+ x
k
+1
).
- Nu n = 2k + 1 thì trung v m®u x
k
+1
.
Chú ˛: Khi các sË li uªu trong m®u không s¸ chênh lªch quá lÓn thì trung bình m®
trung v x nhau.ßp xø
c) Mode giá tr a m cı ®u xußt hiªn nhi u nh t. ß
Chú ˛: M liÎt m®u sË ªu th mÎt hay nhiu Mode.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 40 / 43
Các sË ∞c tr˜ng m u®
2. Các sË o Î phân tán:
a) Ph˜Ïng sai m®u (Sample variance)
Gi£ s˚ {x x
1
, x
2
, . . . ,
n
} mÎt m®u d˙ li ó:ªu ta thu thp ˜Òc. Khi
s
2
=
1
n 1
n
X
i =1
(
x
i
x)
2
=
1
n 1
n
X
i =1
x
2
i
1
n
(n 1)
n
X
i =1
x
i
!
2
.
N li :u m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË
Giá tr x x
1
x
2
. . .
k
Tn sË n n n
1 2
. . .
k
Khi
ó, s
2
=
1
n
1
P
k
i
=1
n
i
x
2
i
1
n n
( 1)
P
k
i
=1
n
i
x
i
2
N liu m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË theo nhóm:
Kho£ng giá tr (a
1
; a
2
) (a a a
2
;
3
) . . . (
k
; a
k+1
)
Tn sË n n
1 2
. . . n
k
G
Âi x
i
=
a
i
+ a
i +1
2
giá tr §i diªn cho kho£ng ( )a
i
; a
i +1
.
Khi
ó, s
2
1
n
1
P
k
i
=1
n
i
x
2
i
1
n n
( 1)
P
k
i
=1
n
i
x
i
2
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 41 / 43
Các sË ∞c tr˜ng m u®
2. Các sË o Î phân tán:
b) Î lªch tiêu chu© ®n m u (Standard deviation) hay .Î lªch m®u s
nghæa cıa ph˜Ïng sai Î l u:ªch m®
Ph li˜Ïng sai trung bình cÎng cıa bình ph˜Ïng kho£ng cách t¯ mÈi sË ªu tÓi sË
trung bình m®u.
Nh v˜ y, ph˜Ïng sai Î l li uªch m®u o m˘c Î phân tán cıa các sË ªu trong m®
quanh sË trung bình m®u.
Ph l n.˜Ïng sai Î ªch m®u càng lÓn thì Î phân tán càng lÓ
c) Ph§m vi m®u (Range) x
n
x
1
.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 42 / 43
dˆ
Theo dõi im Toán cıa 10 hÂc sinh lÓp A, ta thu ˜Òc kt qu£ nh sau:˜
10 9 5 6 1 5 7 9 5 6
Khi ó, các sË ∞c tr˜ng cıa m u ta thu®u d˙ liª ˜Òc là:
CÔ m®u: n = 10
Trung bình m®u:
x
=
1
10
(10 + + + +9 5 + 6 1 + 5 + 7 9 + 5 + 6) = 6 3,
Ph u:˜Ïng sai m®
s
2
=
1
9
(10 6 3, )
2
+ (9 6 3, )
2
+ (5 6 3, )
2
+ (6 6 3, )
2
+ (
1 6 3, )
2
+ (5 6 3 6 3, )
2
+ 7 , )
2
+ (9 6 3, )
2
+(
5 6 3, )
2
+ (6 6 3, )
2
=6 9,
Î lªch m®u: s = 2, 6268
Mode = 5; Median = 6; Range = 9
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 43 / 43

Preview text:

2.4. SË liªu và các sË ∞c tr˜ng CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 34 / 43 Bi∏n sË
Bi∏n sË (variable) là khái niªm dùng ∫ chø bßt k˝ ∞c tính nào cıa qu¶n th∫ mà ta nghiên c˘u.
Ví dˆ: ∫ nghiên c˘u sinh viên cıa mÎt tr˜Ìng §i hÂc, ta có th∫ nghiên c˘u các bi∏n nh˜: GiÓi tính Tu i Í Chi∑u cao Ngành hÂc
SË ti∑n chi tiêu trong mÎt tháng,... CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 35 / 43 Phân lo§i bi∏n sË
Bi∏n ‡nh tính (qualitative) là bi∏n dùng ∫ ph£n ánh tính chßt, lo§i hình, không th∫ hiªn
tr¸c ti∏p b¨ng các con sË.
Giá tr‡ cıa mÈi bi∏n ‡nh tính có th∫ x∏p th˘ t¸ ˜Òc (Thái Î: không hài lòng-hài
lòng-rßt hài lòng), ho∞c không x∏p th˘ t¸ ˜Òc (GiÓi tính: Nam-N˙).
Bi∏n ‡nh l˜Òng (quantitative) là bi∏n dùng ∫ diπn t£ các m˘c Î cao, thßp cıa d˙ liªu,
th∫ hiªn tr¸c ti∏p b¨ng các con sË.
Giá tr‡ cıa bi∏n ‡nh l˜Òng có th∫ là §i l˜Òng liên tˆc (chi∑u cao, cân n∞ng) ho∞c §i
l˜Òng rÌi r§c (i∫m sË, sË ca kh‰i bªnh trong mÎt tháng).
? Hãy xác ‡nh các lo§i bi∏n trong ví dˆ v∑ thËng kê sinh viên. CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 36 / 43 Các sË ∞c tr˜ng
Xem i∫m Toán cıa 10 hÂc sinh lÓp A, ta thu ˜Òc k∏t qu£ nh˜ sau: 10 9 5 6 1 5 7 9 5 6 ?
Có th∫ rút ra các thông tin gì t¯ m®u sË liªu trên? CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 37 / 43 Các sË ∞c tr˜ng m u ®
1. Các sË o giá tr‡ trung tâm:
a) Trung bình m®u (Sample mean) Gi£ s˚ {x1 x
ªu ta thu th™p ˜Òc. Khi  ,
2, . . . , xn} là mÎt m®u d˙ li ó: x1 + + x x = . . . n n .
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n s : Ë Giá tr‡ x x 1 x2 . . . k T¶n sË n n n 1 2 . . . k Khi ó, n2x2 +n Pk x = n1x1+ +... k xk = 1 n n i=1 ni xi .
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n sË theo nhóm: Kho£ng giá tr‡ (a1; a2) (a a a 2; 3) ( . . . k ; ak+1) T¶n sË n n 1 2 n . . . k a GÂi i + ai+1 xi =
là giá tr‡ §i diªn cho kho£ng (ai ; ai+1). 2 Khi ó, n1x1+n2x2+ +n Pk x ≈ ... k xk = 1 n n i=1 ni xi . CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 38 / 43 Các sË ∞c tr˜ng m u ®
fi nghæa cıa trung bình m®u:
SË trung bình m®u ˜Òc dùng làm §i diªn cho các sË liªu cıa m®u. Nó là mÎt sË
∞c tr˜ng quan trÂng cıa m®u sË liªu.
Ví dˆ: n∏u bi∏t i∫m trung bình môn Toán cıa lÓp A là 6,5, cıa lÓp C là 7,5 thì ta có
th∫ cho r¨ng sinh viên lÓp C §t i∫m cao hÏn sinh viên lÓp A.
Tuy nhiên, khi các sË liªu trong m®u có s¸ chênh lªch rßt lÓn Ëi vÓi nhau thì sË
trung bình m®u ch˜a §i diªn tËt cho các sË liªu trong m®u. Khi ó, ta dùng mÎt sË
∞c tr˜ng khác thích hÒp hÏn là trung v‡. CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 39 / 43 Các sË ∞c tr˜ng m u ®
b) Trung v‡ m®u (Median): gi£ s˚ m®u d˙ liªu {x1 x c s p x∏p theo th˘ t , . . . , n} ˜Ò ≠ ¸ không gi£m x ∗ 1 ≤ x ∗ 2 ≤ · · · ≤ x ∗ n .
- N∏u n = 2k thì trung v‡ m®u là 1 + x∗ 2 (x ∗ k k+1).
- N∏u n = 2k + 1 thì trung v‡ m®u là x∗ k+1.
Chú ˛: Khi các sË liªu trong m®u không có s¸ chênh lªch quá lÓn thì trung bình m®u và trung v‡ xßp xø nhau.
c) Mode là giá tr‡ cıa m®u xußt hiªn nhi∑u nhßt.
Chú ˛: MÎt m®u sË liªu có th∫ có mÎt hay nhi∑u Mode. CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 40 / 43 Các sË ∞c tr˜ng m u ®
2. Các sË o Î phân tán:
a) Ph˜Ïng sai m®u (Sample variance) Gi£ s˚ {x1 x
ªu ta thu th™p ˜Òc. Khi  ,
2, . . . , xn} là mÎt m®u d˙ li ó: 1 n 1 n 1 s2 = (x !2 i − x )2 = x 2 − . n i − 1 X n − 1 X nX i=1 i=1 i=1 xi n(n − 1)
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n s : Ë Giá tr‡ x x 1 x2 . . . k T¶n sË n n n 1 2 . . . k ⇣ ⌘2 Khi ó, 2 Pk 2 1 Pk s = 1 n−1 i=1 ni xi − n(n−1) i=1 ni xi
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n sË theo nhóm: Kho£ng giá tr‡ (a1; a2) (a a a 2; 3) ( . . . k ; ak+1) T¶n sË n n 1 2 n . . . k a GÂi i + ai+1 xi =
là giá tr‡ §i diªn cho kho£ng (ai ; ai+1). 2 2 1 ⇣ ⌘2 Khi ó, 2 1 Pk Pk s ≈ n−1 i=1 ni xi − n(n−1) i=1 ni xi CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 41 / 43 Các sË ∞c tr˜ng m u ®
2. Các sË o Î phân tán:
b) Î lªch tiêu chu©n m®u (Standard deviation) hay Î lªch m®u là s.
fi nghæa cıa ph˜Ïng sai và Î lªch m®u:
Ph˜Ïng sai là trung bình cÎng cıa bình ph˜Ïng kho£ng cách t¯ mÈi sË liªu tÓi sË trung bình m®u.
Nh˜ v™y, ph˜Ïng sai và Î lªch m®u o m˘c Î phân tán cıa các sË liªu trong m®u quanh sË trung bình m®u.
Ph˜Ïng sai và Î lªch m®u càng lÓn thì Î phân tán càng lÓn.
c) Ph§m vi m®u (Range) là x∗ − x∗ n 1 . CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 42 / 43 Ví dˆ
Theo dõi i∫m Toán cıa 10 hÂc sinh lÓp A, ta thu ˜Òc k∏t qu£ nh˜ sau: 10 9 5 6 1 5 7 9 5 6
Khi ó, các sË ∞c tr˜ng cıa m®u d˙ liªu mà ta thu ˜Òc là: CÔ m®u: n = 10 Trung bình m®u: 1 x =
(10 + 9 + 5 + 6 + 1 + 5 + 7 + 9 + 5 + 6) = 6, 3 10 Ph˜Ïng sai m®u: 1 s2 =
⇥(10 − 6 )2 + (9 − 6 )2 + (5 − 6 )2 + (6 − 6 )2 , 3 , 3 , 3 , 3
9+ (1 − 6 )2 + (5 − 6 )2 + 7 − )2 + (9 − 6 )2 , 3 , 3 6, 3 , 3 ⇤ = + 6, (5 9 − 6 )2 + (6 − 6 )2 , 3 , 3 Î lªch m®u: s = 2 6268 ,
Mode = 5; Median = 6; Range = 9 CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 43 / 43