Số liệu và các số đặc trưng | Đại học Sư Phạm Hà Nội

Số liệu và các số đặc trưng | Đại học Sư Phạm Hà Nội với những kiến thức và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả cao cũng như có thể vận dụng tốt những kiến thức mình đã học vào thực tiễn cuộc sống.

2.4. SË liªu các sË ∞c tr˜ng
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 34 / 43
Bin sË
Bin sË (variable) khái niªm dùng ∫ ch bø ßt k˝ ∞c tính nào cıa qun th ta
nghiên c˘u.
dˆ: ∫ nghiên c˘u sinh viên c u cácıa mÎt tr˜Ìng §i hÂc, ta th nghiên c˘
bin nh :˜
GiÓi tính
Tu iÍ
Chiu cao
Ngành h cÂ
S tiË n chi tiêu trong mÎt tháng,...
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 35 / 43
Phân lo§i bin sË
Bin ‡nh tính (qualitative) bin dùng n ánh tính ch∫ ph£ ßt, lo§i hình, không th hi nª
tr .¸c tip b¨ng các con sË
Giá tr a m cı Èi bin ‡nh tính th p th x ˘ t¸ ˜Òc (Thái Î: không hài lòng-hài
lòng-r t ).ßt hài lòng), hoc không xp th˘ ¸ ˜Òc (GiÓi tính: Nam-N˙
Bin ‡nh l˜Òng (quantitative) bin dùng n t p c∫ diπ £ các m˘c Î cao, thß ıa d˙ li u,ª
th hi . ªn tr¸c tip b¨ng các con sË
Giá tr a bi cı n ‡nh l˜Òng th §i l˜Òng liên t u cao, cân nˆc (chi ng) ho ic §
l i˜Òng rÌi r§c ( m sË, sË ca khi bªnh trong mÎt tháng).
? y xác ‡nh các lo§i bin trong dˆ v th Ëng sinh viên.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 36 / 43
Các sË ∞c tr˜ng
Xem im Toán cıa 10 hÂc sinh l c kÓp A, ta thu ˜Ò t qu£ nh˜ sau:
10 9 5 6 1 5 7 9 5 6
? th rút ra các thông tin t¯ m li®u sË ªu trên?
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 37 / 43
Các sË ∞c tr˜ng m u®
1. Các sË o giá tr trung tâm:
a) Trung bình m®u (Sample mean)
Gi£ s˚ {x x
1
, x
2
, . . . ,
n
} mÎt m®u d˙ li ó:ªu ta thu thp ˜Òc. Khi
x
=
x
1
+ . . . + x
n
n
.
N li :u m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË
Giá tr x x
1
x
2
. . .
k
Tn sË n n n
1 2
. . .
k
Khi
ó, x =
n
1
x
1
+ +n
2
x
2
...+n
k
x
k
n
=
1
n
P
k
i
=1
n
i
x
i
.
N liu m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË theo nhóm:
Kho£ng giá tr (a
1
; a
2
) (a a a
2
;
3
) . . . (
k
; a
k+1
)
Tn sË n n
1 2
. . . n
k
G
Âi x
i
=
a
i
+ a
i +1
2
giá tr §i diªn cho kho£ng ( )a
i
; a
i +1
.
Khi
ó, x
n
1
x
1
+ +n
2
x
2
...+n
k
x
k
n
=
1
n
P
k
i
=1
n
i
x
i
.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 38 / 43
Các sË ∞c tr˜ng m u®
nghæa cıa trung bình m®u:
S liË trung bình m®u ˜Òc dùng làm §i diªn cho các sË ªu cıa m®u. mÎt sË
∞ Â ı ®c tr˜ng quan tr ng c a m u sË liªu.
dˆ: nu bit im trung bình môn Toán cıa l p A 6,5, c a l p C 7,5 thì ta Ó ı Ó
th i cho r¨ng sinh viên lÓp C §t m cao hÏn sinh viên lÓp A.
Tuy nhiên, khi các sË liªu trong m®u s chênh l¸ ªch rßt lÓn Ëi vÓi nhau thì sË
trung bình m t cho các s u trong m®u ch˜a §i diªn tË Ë liª ®u. Khi ó, ta dùng mÎt sË
∞ Ò Ïc tr˜ng khác thích h p h n .trung v
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 39 / 43
Các sË ∞c tr˜ng m u®
b) Trung v m®u (Median): gi£ s li˚ m®u d˙ ªu {x
1
, . . . , x
n
} ˜Ò ¸c s p xp theo th˘ t
không gi m£
x
1
x
2
· · · x
n
.
- N
u n = 2k thì trung v m®u
1
2
(x
k
+ x
k
+1
).
- Nu n = 2k + 1 thì trung v m®u x
k
+1
.
Chú ˛: Khi các sË li uªu trong m®u không s¸ chênh lªch quá lÓn thì trung bình m®
trung v x nhau.ßp xø
c) Mode giá tr a m cı ®u xußt hiªn nhi u nh t. ß
Chú ˛: M liÎt m®u sË ªu th mÎt hay nhiu Mode.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 40 / 43
Các sË ∞c tr˜ng m u®
2. Các sË o Î phân tán:
a) Ph˜Ïng sai m®u (Sample variance)
Gi£ s˚ {x x
1
, x
2
, . . . ,
n
} mÎt m®u d˙ li ó:ªu ta thu thp ˜Òc. Khi
s
2
=
1
n 1
n
X
i =1
(
x
i
x)
2
=
1
n 1
n
X
i =1
x
2
i
1
n
(n 1)
n
X
i =1
x
i
!
2
.
N li :u m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË
Giá tr x x
1
x
2
. . .
k
Tn sË n n n
1 2
. . .
k
Khi
ó, s
2
=
1
n
1
P
k
i
=1
n
i
x
2
i
1
n n
( 1)
P
k
i
=1
n
i
x
i
2
N liu m®u d˙ ªu ˜Òc biu diπn d˜Ói d§ng mÎt b£ng tn sË theo nhóm:
Kho£ng giá tr (a
1
; a
2
) (a a a
2
;
3
) . . . (
k
; a
k+1
)
Tn sË n n
1 2
. . . n
k
G
Âi x
i
=
a
i
+ a
i +1
2
giá tr §i diªn cho kho£ng ( )a
i
; a
i +1
.
Khi
ó, s
2
1
n
1
P
k
i
=1
n
i
x
2
i
1
n n
( 1)
P
k
i
=1
n
i
x
i
2
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 41 / 43
Các sË ∞c tr˜ng m u®
2. Các sË o Î phân tán:
b) Î lªch tiêu chu© ®n m u (Standard deviation) hay .Î lªch m®u s
nghæa cıa ph˜Ïng sai Î l u:ªch m®
Ph li˜Ïng sai trung bình cÎng cıa bình ph˜Ïng kho£ng cách t¯ mÈi sË ªu tÓi sË
trung bình m®u.
Nh v˜ y, ph˜Ïng sai Î l li uªch m®u o m˘c Î phân tán cıa các sË ªu trong m®
quanh sË trung bình m®u.
Ph l n.˜Ïng sai Î ªch m®u càng lÓn thì Î phân tán càng lÓ
c) Ph§m vi m®u (Range) x
n
x
1
.
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 42 / 43
dˆ
Theo dõi im Toán cıa 10 hÂc sinh lÓp A, ta thu ˜Òc kt qu£ nh sau:˜
10 9 5 6 1 5 7 9 5 6
Khi ó, các sË ∞c tr˜ng cıa m u ta thu®u d˙ liª ˜Òc là:
CÔ m®u: n = 10
Trung bình m®u:
x
=
1
10
(10 + + + +9 5 + 6 1 + 5 + 7 9 + 5 + 6) = 6 3,
Ph u:˜Ïng sai m®
s
2
=
1
9
(10 6 3, )
2
+ (9 6 3, )
2
+ (5 6 3, )
2
+ (6 6 3, )
2
+ (
1 6 3, )
2
+ (5 6 3 6 3, )
2
+ 7 , )
2
+ (9 6 3, )
2
+(
5 6 3, )
2
+ (6 6 3, )
2
=6 9,
Î lªch m®u: s = 2, 6268
Mode = 5; Median = 6; Range = 9
CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 43 / 43
| 1/10

Preview text:

2.4. SË liªu và các sË ∞c tr˜ng CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 34 / 43 Bi∏n sË
Bi∏n sË (variable) là khái niªm dùng ∫ chø bßt k˝ ∞c tính nào cıa qu¶n th∫ mà ta nghiên c˘u.
Ví dˆ: ∫ nghiên c˘u sinh viên cıa mÎt tr˜Ìng §i hÂc, ta có th∫ nghiên c˘u các bi∏n nh˜: GiÓi tính Tu i Í Chi∑u cao Ngành hÂc
SË ti∑n chi tiêu trong mÎt tháng,... CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 35 / 43 Phân lo§i bi∏n sË
Bi∏n ‡nh tính (qualitative) là bi∏n dùng ∫ ph£n ánh tính chßt, lo§i hình, không th∫ hiªn
tr¸c ti∏p b¨ng các con sË.
Giá tr‡ cıa mÈi bi∏n ‡nh tính có th∫ x∏p th˘ t¸ ˜Òc (Thái Î: không hài lòng-hài
lòng-rßt hài lòng), ho∞c không x∏p th˘ t¸ ˜Òc (GiÓi tính: Nam-N˙).
Bi∏n ‡nh l˜Òng (quantitative) là bi∏n dùng ∫ diπn t£ các m˘c Î cao, thßp cıa d˙ liªu,
th∫ hiªn tr¸c ti∏p b¨ng các con sË.
Giá tr‡ cıa bi∏n ‡nh l˜Òng có th∫ là §i l˜Òng liên tˆc (chi∑u cao, cân n∞ng) ho∞c §i
l˜Òng rÌi r§c (i∫m sË, sË ca kh‰i bªnh trong mÎt tháng).
? Hãy xác ‡nh các lo§i bi∏n trong ví dˆ v∑ thËng kê sinh viên. CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 36 / 43 Các sË ∞c tr˜ng
Xem i∫m Toán cıa 10 hÂc sinh lÓp A, ta thu ˜Òc k∏t qu£ nh˜ sau: 10 9 5 6 1 5 7 9 5 6 ?
Có th∫ rút ra các thông tin gì t¯ m®u sË liªu trên? CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 37 / 43 Các sË ∞c tr˜ng m u ®
1. Các sË o giá tr‡ trung tâm:
a) Trung bình m®u (Sample mean) Gi£ s˚ {x1 x
ªu ta thu th™p ˜Òc. Khi  ,
2, . . . , xn} là mÎt m®u d˙ li ó: x1 + + x x = . . . n n .
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n s : Ë Giá tr‡ x x 1 x2 . . . k T¶n sË n n n 1 2 . . . k Khi ó, n2x2 +n Pk x = n1x1+ +... k xk = 1 n n i=1 ni xi .
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n sË theo nhóm: Kho£ng giá tr‡ (a1; a2) (a a a 2; 3) ( . . . k ; ak+1) T¶n sË n n 1 2 n . . . k a GÂi i + ai+1 xi =
là giá tr‡ §i diªn cho kho£ng (ai ; ai+1). 2 Khi ó, n1x1+n2x2+ +n Pk x ≈ ... k xk = 1 n n i=1 ni xi . CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 38 / 43 Các sË ∞c tr˜ng m u ®
fi nghæa cıa trung bình m®u:
SË trung bình m®u ˜Òc dùng làm §i diªn cho các sË liªu cıa m®u. Nó là mÎt sË
∞c tr˜ng quan trÂng cıa m®u sË liªu.
Ví dˆ: n∏u bi∏t i∫m trung bình môn Toán cıa lÓp A là 6,5, cıa lÓp C là 7,5 thì ta có
th∫ cho r¨ng sinh viên lÓp C §t i∫m cao hÏn sinh viên lÓp A.
Tuy nhiên, khi các sË liªu trong m®u có s¸ chênh lªch rßt lÓn Ëi vÓi nhau thì sË
trung bình m®u ch˜a §i diªn tËt cho các sË liªu trong m®u. Khi ó, ta dùng mÎt sË
∞c tr˜ng khác thích hÒp hÏn là trung v‡. CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 39 / 43 Các sË ∞c tr˜ng m u ®
b) Trung v‡ m®u (Median): gi£ s˚ m®u d˙ liªu {x1 x c s p x∏p theo th˘ t , . . . , n} ˜Ò ≠ ¸ không gi£m x ∗ 1 ≤ x ∗ 2 ≤ · · · ≤ x ∗ n .
- N∏u n = 2k thì trung v‡ m®u là 1 + x∗ 2 (x ∗ k k+1).
- N∏u n = 2k + 1 thì trung v‡ m®u là x∗ k+1.
Chú ˛: Khi các sË liªu trong m®u không có s¸ chênh lªch quá lÓn thì trung bình m®u và trung v‡ xßp xø nhau.
c) Mode là giá tr‡ cıa m®u xußt hiªn nhi∑u nhßt.
Chú ˛: MÎt m®u sË liªu có th∫ có mÎt hay nhi∑u Mode. CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 40 / 43 Các sË ∞c tr˜ng m u ®
2. Các sË o Î phân tán:
a) Ph˜Ïng sai m®u (Sample variance) Gi£ s˚ {x1 x
ªu ta thu th™p ˜Òc. Khi  ,
2, . . . , xn} là mÎt m®u d˙ li ó: 1 n 1 n 1 s2 = (x !2 i − x )2 = x 2 − . n i − 1 X n − 1 X nX i=1 i=1 i=1 xi n(n − 1)
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n s : Ë Giá tr‡ x x 1 x2 . . . k T¶n sË n n n 1 2 . . . k ⇣ ⌘2 Khi ó, 2 Pk 2 1 Pk s = 1 n−1 i=1 ni xi − n(n−1) i=1 ni xi
N∏u m®u d˙ liªu ˜Òc bi∫u diπn d˜Ói d§ng mÎt b£ng t¶n sË theo nhóm: Kho£ng giá tr‡ (a1; a2) (a a a 2; 3) ( . . . k ; ak+1) T¶n sË n n 1 2 n . . . k a GÂi i + ai+1 xi =
là giá tr‡ §i diªn cho kho£ng (ai ; ai+1). 2 2 1 ⇣ ⌘2 Khi ó, 2 1 Pk Pk s ≈ n−1 i=1 ni xi − n(n−1) i=1 ni xi CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 41 / 43 Các sË ∞c tr˜ng m u ®
2. Các sË o Î phân tán:
b) Î lªch tiêu chu©n m®u (Standard deviation) hay Î lªch m®u là s.
fi nghæa cıa ph˜Ïng sai và Î lªch m®u:
Ph˜Ïng sai là trung bình cÎng cıa bình ph˜Ïng kho£ng cách t¯ mÈi sË liªu tÓi sË trung bình m®u.
Nh˜ v™y, ph˜Ïng sai và Î lªch m®u o m˘c Î phân tán cıa các sË liªu trong m®u quanh sË trung bình m®u.
Ph˜Ïng sai và Î lªch m®u càng lÓn thì Î phân tán càng lÓn.
c) Ph§m vi m®u (Range) là x∗ − x∗ n 1 . CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 42 / 43 Ví dˆ
Theo dõi i∫m Toán cıa 10 hÂc sinh lÓp A, ta thu ˜Òc k∏t qu£ nh˜ sau: 10 9 5 6 1 5 7 9 5 6
Khi ó, các sË ∞c tr˜ng cıa m®u d˙ liªu mà ta thu ˜Òc là: CÔ m®u: n = 10 Trung bình m®u: 1 x =
(10 + 9 + 5 + 6 + 1 + 5 + 7 + 9 + 5 + 6) = 6, 3 10 Ph˜Ïng sai m®u: 1 s2 =
⇥(10 − 6 )2 + (9 − 6 )2 + (5 − 6 )2 + (6 − 6 )2 , 3 , 3 , 3 , 3
9+ (1 − 6 )2 + (5 − 6 )2 + 7 − )2 + (9 − 6 )2 , 3 , 3 6, 3 , 3 ⇤ = + 6, (5 9 − 6 )2 + (6 − 6 )2 , 3 , 3 Î lªch m®u: s = 2 6268 ,
Mode = 5; Median = 6; Range = 9 CH◊ÃNG 2 MàU NGàU NHIÊN Ngày 12 tháng 1 n´m 2022 43 / 43