1
Chương 3
TRÌNH BÀY D NG KÊ LIU TH
Ni dung chính
I
PHÂN T
THNG KÊ
II
BNG
THNG KÊ
III
ĐỒ TH
THNG KÊ
1
2
2/25/2024
2
Dliuthuth đ pđược sau i utra
Phân tthng
Khái nim chung
•Cáclo i phân tth ng
•Cácbước phân tthng
•Dãysphân phi
3
4
2/25/2024
3
Khái nim chung
Phân tthng căncvào m t hay m tstiêu thcnàođóđể tiến
hành phân chia các đơnvcahintượng nghiên cu thành các t(hoc
tiut ) tính ch t khác nhau.
Ý nghĩa: Phân tthng đóng vai trò quan trng trong c3giai ncđo a
quá trình nghiên cuthng kê.
Nhimv:
Phân chia các loihìnhkinhtế hicahintượng nghiên cu
•Biuhinkếtcucahintượng nghiên cu
•Biudinmi liên hgi a các tiêu th c
Các loi phân tthng
Căncvào nhimvc a phân t :
Phân tphân loi
Phân tkếtcu
Phân tliên h
Căncvào slượng tiêu thc dùng để phân t:
Phân ttheo mttiêuthc
Phân ttheo nhiutiêuthc
Căncvào loitiêuthc dùng để phân t:
Phân t theo tiêu th cthuc tính
Phân t theo tiêu th cslượng
5
6
2/25/2024
4
Các bước phân tthng
Phân phi các đơn v vào tng t
Xác định s t và khong cách t
La chn tiêu thc phân t
Xác định mc đích
phân t
Bước4
B c 3ướ
B c 2ướ
B c 1ướ
Lachntiêuth c phân t
•Datrêncơ s phân tích lu nđể ch nratiêuthcbnchtnht, phù
hpvim đc ích nghiên cu
•Căncvào đ i ukinl ch scthc ahintượng nghiên cu
7
8
2/25/2024
5
Xác định st phân phi các đơnv
vào tng t
Mibiuhincatiêuthc thhình thành mtt.
•Slượng đơnvịđưcspxếpvàomitổđưcgilàtns(frequency).
•Khilytnscamitchia cho tng sốđơnvtrong t ng th ,tađược
tnsutcatổđó (relative frequency).
•Khilytnsutcamitnhân v i 100, ta đượcttrng c atổđótrong
t (tng th nsut tính theo đơnv%) (percentage frequency)
Phân ttheo tiêu thcthuctính
FantaCocaCocaCocaCoca
CocaSpriteCoca ăn kiêngFantaCoca ăn kiêng
Coca ăn kiêngFantaCocaSpritePepsi
PepsiPepsiSpriteCocaCoca ăn kiêng
PepsiCoca ăn kiêngSpriteCoca ăn kiêngCoca
PepsiPepsiPepsiCocaCoca
PepsiCocaCocaCocaFanta
CocaCocaCocaSpriteCoca ăn kiêng
FantaCocaCocaCocaPepsi
PepsiPepsiPepsiCoca ăn kiêngPepsi
Ví d: Phng vn 50 sinh viên vloiđồ ung ưa thích nht.
9
10
2/25/2024
6
Phân ttheo tiêu thcthuctính
T nsut(%)T nsut(ln)T nsLoiđồ ung
380,3819Coca
160,168Cocaănkiêng
100,105Fanta
260,2613Pepsi
100,105Sprite
100150Tngs
Đồ thphân bvidliuđịnh tính
38
16
10
26
10
0
5
10
15
20
25
30
35
40
CocaCocaăn
kiêng
Fanta PepsiSprite
T nsu t(%)
Loiđồung
38%
16%
10%
26%
10%
Coca
Cocaănkiêng
Fanta
Pepsi
Sprite
Đồ thhìnhct(barchart)Đồ thhìnhtròn(piechart)
11
12
2/25/2024
7
Phân ttheo tiêu thcslượng
Khi milượng biế n hình thành 1 t : phân tkhông kho ng cách t .
Khi nhiulượng biế n cùng n m trong 1 t : phân t kho ng cách t
Khong cách tbng nhau
Khong cách tkhông bng nhau
Khong cách tm
Phân tkhông khong cách t
Áp dng vidli ếuđịnh lượ ượng ít các l ng bi nrirc.
•Víd:Cóslượng đơn hàng đãthchinca 20 nhân viên giao hàng
ca Tiki trong 1 giờđng hnhưsau
7, 7, 10, 8, 5, 4, 5, 7, 6, 4, 8, 5, 6, 4, 9, 8, 7, 10, 10, 9
•Phânt s lượ ượng nhân viên trên theo sl ng đơn hàng đã giao trong 1
gi.
13
14
2/25/2024
8
Phân tkhông khong cách t
Spxếpdli u theo th t t th pđếncao
Xác định các t đếmslượng nhân viên trong tng tổđó.
Snhân viênSlượng đơn hàng
34
35
26
47
38
29
310
20Tng s
Tns
Phân t khong cách t
Áp dng
•Dli uđịnh lượng nhi ulượng biếnrirc
•Dli ế uđịnh lượ ượng l ng bi n liên t c
Các bướcxâydng
•Spxếpd liu theo th t t thpđếncao
•Xácđịnh lượng biếnlnnh ết, lượng bi nnhnhtvàkho ế ng bi n thiên c a
lượng biến(R)
R = Lượng biếnlnnht–lượng biếnnhnht
•Xácđịnh st
•Xácđịnh khong cách t
•Xácđịnh giihndướicatổđutiên
•Xâydng dãy sphân phi
15
16
2/25/2024
9
Phân t khong cách t
Các thutng:
•Giihndưới: giá trthpnh t trong m tt
•Giih n trên: giá trcao nh t trong m tt
Giihndướivàgiihntrêncamttthường đượclàmtròn
•Kho ng cách t :kho ng cách tgi ihndướiđếngi i han trên c amtt
•Tm:tổđutiênkhôngcógiihndưới và/hoctcui cùng không
giihntrên
Tmthường đượpd ng khi các dli ukhôngbìnhthường (quá
thphoc quá cao)
Phân t khong cách tbng nhau
Xác định khong cách t
Khong cách tbng nhau
Khong cách txpxbng:
𝑳ượ𝒏𝒈 𝒃𝒊ế𝒏 𝒍ớ𝒏 𝒏𝒉ấ𝒕 𝑳ư𝒏𝒈 𝒃𝒊ế𝒏 𝒏𝒉ỏ 𝒏𝒉ấ𝒕
𝑺ố 𝒕ổ
17
18
2/25/2024
10
Phân t khong cách tbng nhau
•Víd:Cósliuv doanh s bình quân m t tháng (tri uđồng) trong năm
2023 ca 50 nhân viên trong mt doanh nghipnhưsau
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
Phân t khong cách tbng nhau
Gis, chia thành 6 t
Khong cách t= (109 - 52)/6 = 9.5 10
50-<60
60-<70
70-<80
80-<90
90-<100
100-110
Tng s
2
13
16
7
7
5
50
Doanh sbq (Trđ) Snhân viên
Giihn
trên
Giihn
d iướ
Khongcácht
=6050=10
19
20
2/25/2024
11
Phân t khong cách tkhông bng nhau
•Víd:Lương bình quân tháng (tri ă uđồng) n m 2023 c a25nhânviêncó
độ tuit25-30 trong m t doanh nghi pnhưsau
Snhân viênL )ương bq tháng (trđ
45-<6
66 - < 8
68 - < 9
69 - < 12
312 - 15
25Tng s
Mitphnhskhácbittrongbnchtcadliu
Phân t khong cách tm
Áp dng vidli ế uđịnh lượ ượng l ng bi n liên t c
•Víd:Cótàiliuvmc thu nhpbìnhquânnăm(tri uđồng) c a30
nhân viên trong mt ngân hàng nhưsau
361145654277202
1442404467457
429437362391310
216374221325176
282398274120480
209338303470153
21
22
2/25/2024
12
Phân t khong cách tm
S ingườThu nhp (trđ)
2
<100
5
100 - <200
8
200 - <300
9
300 - <400
5
400 - <500
1
500
30
Tng s
T m , không
giihn
d iướ
T m , không
giihntrên
Dãy sphân phi(B ng t nsphân b)
Dãy sphân phi kếtquca phân tth ng theo m ttiêuthcnàođó.
Các loi dãy sphân phi
Dãy sphân phithuc tính: kếtquca phân tthng theo tiêu thc
thuc tính
Dãy sphân philượng biến: kếtquca phân tthng theo tiêu
thcslượng
Đượcspxế ế p theo trình tbi nđộng c alượng biếntiêuthcphânt
23
24
2/25/2024
13
Các thành phncadãyslượng biến
tng quát
𝒎𝒊𝒇𝒊
𝒉𝒊
𝑺𝒊
𝒅𝒊𝒇𝒊
∑𝒇𝒊 󰇛𝟏𝟎𝟎󰇜
𝒇𝒊𝒙𝒊
Mtđộ phân phiTnstích lũyTnsutTnsLượng biến
Dùng để so sánh
các tnskhi
khong cách t
không bng nhau
Là t n s cng dnLà t n s được biu
hin b ng s tương
đối(ln, %)
Là s ln xut hin
ca lượng biến
ho c s đơn v phân
phi vào mi t
Là biu hi n b ng
s ca tiêu thc s
lượng dùng để phân
t
m1S1= f1d1f1x1
mnSn = f + f1 2+ … + fndnfnxn
𝒅𝒊 𝒇𝒊
Tng
Dãy slượng biếntng quát: các tính
toán khác
Tnstích lũ ếy cho bi tslượng đơnv giá tr nhhơnhocbng
giihntrêncamtt,làt ng t nscatổđóvàcácttrướcđó.
Tnsu ũ ết tích l y cho bi ttlsốđơnv(tính theo đơnvln) giá tr
nhhơnhocb ng gi ihntrêncamtt,làt ng t nsutcatổđóvà
các ttrướcđó
Tnsut(ttr ũ ếng) tích l y cho bi tphntrămsốđơnv giá tr nh
hơnhocbng giihntrêncamtt,làt ng ttr ng c atổđóvàcác
ttrướcđó.
25
26
2/25/2024
14
Ví d
Tnsut
(T tr ng)
tích lũy(%)
Tnsut
tích lũy
(ln)
Tnstích
lũy
Ttrng
(%)
TnsutTnsDoanh s
bq (Tr.đ)
40.04240.042
50-<60
300.3015260.2613
60-<70
620.6231320.3216
70-<80
760.7638140.147
80-<90
900.9045140.147
90-<100
1001.0050100.105
100-110
1001.0050
Tng
0.14x100 38+7 76+147/50 0.76+0.14
Đồ thphân bvidliuđịnh lượng
Đồ thịđim (Dot plot)
•Bi uđồ t nsphân b(Histogram)
Đagiáctns(Polygon)
Đagiáctnstích lũy(Ogive)
27
28
2/25/2024
15
Đồ thịđim (Dot plot)
Trchoànhbiudinbiế nđộngc acáclượngbiế n.
Migiátrịđưcthhinbngmtđimtrêntr c.
50 60 70 80 90 100 11050 60 70 80 90 100 110
Doanh s(Tr.đ)Doanh s(Tr.đ)
. . . ..... .......... .. . .. . . ... . .. .. . . ..... .......... .. . .. . . ... . .. .
. .
. .. . . . . .. . . .
. .. .. .. .. . . . .. .. .. .. . .
Doanh sbình quân
Biuđồ tnsphân b(Histogram)
Biuđồ hình ct (Histogram)
Không khong cách giacác
ctmàlàgiihngia hai t.
•Tcao thpbiuthtnsca
mit.
Độ rng ctlàkhong cách t
22
44
66
88
1010
1212
1414
1616
1818
Doanh sbq
(trđ)
Doanh sbq
(trđ)
TnsTns
50 60 70 80 90     100-11050 60 70 80 90     100-110
Doanh sbình quân
29
30
2/25/2024
16
Hình dáng ca Histogram
Đốixng
d : chiucaovàcânnng(phânphichun)
TnsutTnsut
.05.05
.10.10
.15.15
.20.20
.25.25
.30.30
.35.35
00
Hình dáng ca Histogram
Lchtrái
d :đimthi
TnsutTnsut
.05.05
.10.10
.15.15
.20.20
.25.25
.30.30
.35.35
00
31
32
2/25/2024
17
Hình dáng ca Histogram
Lchphi
d : giánhà
TnsutTnsut
.05.05
.10.10
.15.15
.20.20
.25.25
.30.30
.35.35
00
Hình dáng ca Histogram
Rtlchphi
d : thunhp
TnsutTnsut
.05.05
.10.10
.15.15
.20.20
.25.25
.30.30
.35.35
00
33
34
2/25/2024
18
Tm quan trng ca Histogram
Cho biết hình dáng phân phicadliu
Cho biếtvtrí trung tâm cadliu
Cho biếtsbiế n thiên c adliu
Dùng để xác định dliuđộtxut (outliers)
Đagiáctns(Polygon)
Trsgiacat= (Giihntrên+ Giihndưới) / 2
02
13
16
77
5
0
2
4
6
8
10
12
14
16
18
0 102030405060708090100110120
Tn s
Tr s gia c a t
Polygon
35
36
2/25/2024
19
Đagiáctnstích lũy (Ogive)
Doanh s
bq (Trđ)
Doanh s
bq (Trđ)
2020
4040
6060
8080
100100
50 60 70 80 90 100 11050 60 70 80 90 100 110
(90, 76)
Trc hoành: Giihntrêncat
Trc tung:
-Tnstích lũy
-Tnsu ũt tích l y
-Tnsu ũt (%) tích l y
Bng dliu chéo (cross tabulation -
contingency table)
Bng chéo: biudinm ếi liên hgia hai bi n.
Tng dòngCtcCt3Ct2Ct1
ΣO1jO1cO13O12O11Dòng 1
ΣO2jO2cO23O22O21Dòng 2
ΣodjOdcOd3Od2Od1Dòng d
n=ΣOijΣOicΣOi3ΣOi2ΣOi1T tng c
37
38
2/25/2024
20
Bng dliuchéo
d.B ếng chéo cho bi tmiliênhgiagiátincamtsu ăt nvà
đ ánh giá ch tlượng su ă đt n ó.
Tngs
Giátinmtsutăn(Nghìnđồng)
Đánhgiá 809070 8060 7050 60
84024042Tmđược
1506466434Ngon
662228142Rtngon
300287611878Tngs
Tkếtqutrên,cóthtínhđượckếtcutheocáctiêuthckhácnhau
Bng dliuchéo
d.Phntră m trong t ng chung.
Tngs
Giátinmtsutăn(Nghìnđồng)
Đánhgiá 809070 8060 7050 60
28.000.000.6713.3314.00
Tmđược
50.002.0015.3321.3311.33
Ngon
22.007.339.334.670.67
Rtngon
100.009.3325.3339.3326.00
Tngs
39
40

Preview text:

Chương 3
TRÌNH BÀY DỮ LIỆU THỐNG KÊ 1 Nội dung chính I II III PHÂN TỔ BẢNG ĐỒ THỊ THỐNG KÊ THỐNG KÊ THỐNG KÊ 2 1 2/25/2024
Dữliệuthuthậpđược sau điềutra 3 Phân tổthống kê • Khái niệm chung
•Cácloại phân tổthống kê
•Cácbước phân tổthống kê •Dãysốphân phối 4 2 2/25/2024 Khái niệm chung
Phân tổthống kê là căncứvào một hay mộtsốtiêu thứcnàođóđể tiến
hành phân chia các đơnvịcủahiệntượng nghiên cứu thành các tổ(hoặc
tiểutổ) có tính chất khác nhau.
Ý nghĩa: Phân tổthống kê đóng vai trò quan trọng trong cả3giađoạncủa
quá trình nghiên cứuthống kê. Nhiệmvụ:
• Phân chia các loạihìnhkinhtếxã hộicủahiệntượng nghiên cứu •Bi
ểuhiệnkếtcấucủahiệntượng nghiên cứu •Bi
ểudiễnmối liên hệgiữa các tiêu thức 5
Các loại phân tổthống kê
Căncứvào nhiệmvụcủa phân tổ: • Phân tổphân loại • Phân tổkếtcấu • Phân tổliên hệ
Căncứvào sốlượng tiêu thức dùng để phân tổ:
• Phân tổtheo mộttiêuthức
• Phân tổtheo nhiềutiêuthức
Căncứvào loạitiêuthức dùng để phân tổ:
• Phân tổtheo tiêu thứcthuộc tính
• Phân tổtheo tiêu thứcsốlượng 6 3 2/25/2024
Các bước phân tổthống kê
Phân phối các đơn vị vào từng tổ Bước4
Xác định số tổ và khoảng cách tổ Bước3
Lựa chọn tiêu thức phân tổ Bước2 Xác định mục đích phân tổ Bước1 7
Lựachọntiêuthức phân tổ •Dựatrêncơ ở
s phân tích lý luậnđể chọnratiêuthứcbảnchấtnhất, phù
hợpvớimụcđích nghiên cứu
•Căncứvào điềukiệnlịch sửcụthể ủ
c ahiệntượng nghiên cứu 8 4 2/25/2024
Xác định sốtổvà phân phối các đơnvị vào từng tổ
Mỗibiểuhiệncủatiêuthứccó thểhình thành mộttổ.
•Sốlượng đơnvịđượcsắpxếpvàomỗitổđượcgọilàtầnsố(frequency).
•Khilấytầnsốcủamỗitổchia cho tổng sốđơnvịtrong tổng thể,tađược
tầnsuấtcủatổđó (relative frequency).
•Khilấytầnsuấtcủamỗitổnhân với 100, ta đượctỷtrọng ủ c atổđótrong
tổng thể(tầnsuất tính theo đơnvị%) (percentage frequency) 9
Phân tổtheo tiêu thứcthuộctính
Ví dụ: Phỏng vấn 50 sinh viên vềloạiđồ uống ưa thích nhất. Coca Coca Coca Coca Fanta Coca ăn kiêng Fanta Coca ăn kiêng Sprite Coca Pepsi Sprite Coca Fanta Coca ăn kiêng Coca ăn kiêng Coca Sprite Pepsi Pepsi Coca Coca ăn kiêng Sprite Coca ăn kiêng Pepsi Coca Coca Pepsi Pepsi Pepsi Fanta Coca Coca Coca Pepsi Coca ăn kiêng Sprite Coca Coca Coca Pepsi Coca Coca Coca Fanta Pepsi Coca ăn kiêng Pepsi Pepsi Pepsi 10 5 2/25/2024
Phân tổtheo tiêu thứcthuộctính Loạiđồ uống Tầnsố Tầnsuất(lần) Tầnsuất(%) Coca 19 0,38 38 Cocaănkiêng 8 0,16 16 Fanta 5 0,10 10 Pepsi 13 0,26 26 Sprite 5 0,10 10 Tổngsố 50 1 100 11
Đồ thịphân bốvớidữliệuđịnh tính 40 38 35 30 26 25 10% Coca 20 16 38% Cocaănkiêng 15 26% Tầnsuất(%) Fanta 10 10 10 Pepsi 5 Sprite 10% 16% 0 CocaCocaăn Fanta PepsiSprite kiêng Loạiđồuống Đồ
thịhìnhcột(barchart)Đồ
thịhìnhtròn(piechart) 12 6 2/25/2024
Phân tổtheo tiêu thứcsốlượng
Khi mỗilượng biến hình thành 1 tổ: phân tổkhông có khoảng cách tổ.
Khi nhiềulượng biến cùng nằm trong 1 tổ: phân tổcó khoảng cách tổ
Khoảng cách tổbằng nhau
Khoảng cách tổkhông bằng nhau Khoảng cách tổmở 13
Phân tổkhông có khoảng cách tổ
Áp dụng vớidữliệuđịnh lượng có ít các lượng biếnrờirạc.
•Vídụ:Cósốlượng đơn hàng đãthựchi
ệncủa 20 nhân viên giao hàng
của Tiki trong 1 giờđồng hồnhưsau
7, 7, 10, 8, 5, 4, 5, 6, 4, 9, 8, 7, 6, 4, 8, 5, 7, 10, 10, 9 •Phântổ ố
s lượng nhân viên trên theo sốlượng đơn hàng đã giao trong 1 giờ. 14 7 2/25/2024
Phân tổkhông có khoảng cách tổ
Sắpxếpdữliệu theo thứtựtừthấpđếncao
Xác định các tổvà đếmsốlượng nhân viên trong từng tổđó.
Sốlượng đơn hàng Sốnhân viên 4 3 Tầnsố 5 3 6 2 7 4 8 3 9 2 10 3 Tổng số 20 15
Phân tổcó khoảng cách tổ Áp dụng
•Dữliệuđịnh lượng có nhiềulượng biếnrờirạc
•Dữliệuđịnh lượng có lượng biến liên tục Các bướcxâydựng
•Sắpxếpdữliệu theo thứtựtừthấpđếncao
•Xácđịnh lượng biếnlớnnhất, lượng biếnnhỏnhấtvàkhoảng biến thiên của lượng biến(R)
R = Lượng biếnlớnnhất–lượng biếnnhỏnhất •Xácđịnh sốtổ
•Xácđịnh khoảng cách tổ
•Xácđịnh giớihạndướicủatổđầutiên
•Xâydựng dãy sốphân phối 16 8 2/25/2024
Phân tổcó khoảng cách tổCác thuậtngữ: •Gi
ớihạndưới: giá trịthấpnhất trong mộttổ •Gi
ớihạn trên: giá trịcao nhất trong mộttổ
→Giớihạndướivàgiớihạntrêncủamộttổthường đượclàmtròn
•Khoảng cách tổ:khoảng cách từgiớihạndướiđếngiới han trên ủ c amộttổ
•Tổmở:tổđầutiênkhôngcógiớihạndưới và/hoặctổcuối cùng không có giớihạntrên
→Tổmởthường đượcápdụng khi có các dữliệukhôngbìnhthường (quá thấphoặc quá cao) 17
Phân tổcó khoảng cách tổbằng nhau
Xác định khoảng cách tổ
Khoảng cách tổbằng nhau
Khoảng cách tổxấpxỉbằng:
𝑳ượ𝒏𝒈 𝒃𝒊ế𝒏 𝒍ớ𝒏 𝒏𝒉ấ𝒕 𝑳ượ𝒏𝒈 𝒃𝒊ế𝒏 𝒏𝒉ỏ 𝒏𝒉ấ𝒕 𝑺ố 𝒕ổ 18 9 2/25/2024
Phân tổcó khoảng cách tổbằng nhau
•Vídụ:Cósốliệuvềdoanh ố
s bình quân một tháng (triệuđồng) trong năm
2023 của 50 nhân viên trong một doanh nghiệpnhưsau 91 9 78 7 93 9 57 5 75 7 52 5 99 9 80 8 97 9 62 6 71 7 69 6 72 7 89 8 66 6 75 7 79 7 75 7 72 7 76 7 10 1 4 0 74 7 62 6 68 6 97 9 10 1 5 0 77 7 65 6 80 8 10 1 9 0 85 8 97 9 88 8 68 6 83 8 68 6 71 7 69 6 67 6 74 7 62 6 82 8 98 9 10 1 1 0 79 7 10 1 5 0 79 7 69 6 62 6 73 7 19
Phân tổcó khoảng cách tổbằng nhau
Giảsử, chia thành 6 tổ
Khoảng cách tổ= (109 - 52)/6 = 9.5 ≈10
Doanh sốbq (Trđ) Sốnhân viên Khoảngcáchtổ 50-<60 2 =60‐50=10 60-<70 13 Giớihạn 70-<80 16 trên 80-<90 7 90-<100 7 Giớihạn 100-110 5 dưới Tổng số 50 20 10 2/25/2024
Phân tổcó khoảng cách tổkhông bằng nhau
•Vídụ:Lương bình quân tháng (triệuđồng) năm 2023 ủ c a25nhânviêncó
độ tuổitừ25-30 trong một doanh nghiệpnhưsau Lương bq tháng (trđ) Sốnhân viên 5-<6 4 6 - < 8 6 8 - < 9 6 9 - < 12 6 12 - 15 3 Tổng số 25
Mỗitổphảnánhsựkhácbiệttrongbảnchấtcủadữliệu 21
Phân tổcó khoảng cách tổmở
Áp dụng vớidữliệuđịnh lượng có lượng biến liên tục •Vídụ:Cótàili ệuvềmức thu nhậpbì nhquânnăm(t ri ệuđồng) ủ c a30
nhân viên trong một ngân hàng nhưsau 202 277 654 145 361 457 67 44 240 144 310 391 362 437 429 176 325 221 374 216 480 120 274 398 282 153 470 303 338 209 22 11 2/25/2024
Phân tổcó khoảng cách tổmở Thu nhập (trđ) Sốngười <100 2 100 - <200 5 Tổmở, không 200 - <300 có giớihạn 8 dưới 300 - <400 9 400 - <500 5 ≥500 1 Tổng số 30 Tổmở, không có giớihạntrên 23
Dãy sốphân phối(Bảng tầnsốphân bố)
Dãy sốphân phốilà kếtquảcủa phân tổthống kê theo mộttiêuthứcnàođó.
Các loại dãy sốphân phối
Dãy sốphân phốithuộc tính: là kếtquảcủa phân tổthống kê theo tiêu thức thuộc tính
Dãy sốphân phốilượng biến: là kếtquảcủa phân tổthống kê theo tiêu thứcsốlượng
•Đượcsắpxếp theo trình tựbiếnđộng ủ
c alượng biếntiêuthứcphântổ 24 12 2/25/2024
Các thành phầncủadãysốlượng biến tổng quát 𝒙𝒊 𝒇𝒊 𝒅𝒊𝒇𝒊 𝑺𝒊 𝒎𝒊𝒇𝒊
∑𝒇𝒊 󰇛𝟏𝟎𝟎󰇜 𝒉𝒊 Lượng biến Tầnsố Tầnsuất Tầnsốtích lũy Mậtđộ phân phối Là biểu hiện bằng
Là số lần xuất hiện Là tần số được biểu Là tần số cộng dồn Dùng để so sánh số của tiêu thức số của lượng biến hiện bằng số tương các tầnsốkhi
lượng dùng để phân hoặc số đơn vị phân đối(lần, %) khoảng cách tổ tổ phối vào mỗi tổ không bằng nhau x1 f1 d1 S1= f1 m1 … … … … … xn fn dn Sn = f1+ f2+ … + fn mn Tổng  𝒇𝒊 𝒅𝒊 25
Dãy sốlượng biếntổng quát: các tính toán khác
Tầnsốtích lũy – cho biếtsốlượng đơnvịcó giá trịnhỏhơnhoặcbằng
giớihạntrêncủamộttổ,làtổng tầnsốcủatổđóvàcáctổtrướcđó.
Tầnsuất tích lũy – cho biếttỷlệsốđơnvị(tính theo đơnvịlần) có giá trị
nhỏhơnhoặcbằng giớihạntrêncủamộttổ,làtổng tầnsuấtcủatổđóvà các tổtrướcđó
Tầnsuất(tỷtrọng) tích lũy – cho biếtphầntrămsốđơnvịcó giá trịnhỏ
hơnhoặcbằng giớihạntrêncủamộttổ,làtổng tỷtrọng củatổđóvàcác tổtrướcđó. 26 13 2/25/2024 Ví dụ Doanh số Tầnsố Tầnsuất Tỷtrọng Tầnsốtích Tầnsuất Tầns uất bq (Tr.đ) (%) lũy tích lũy (Tỷtrọng) (lần) tích lũy(%) 50-<60 2 0.04 4 2 0.04 4 60-<70 13 0.26 26 15 0.30 30 70-<80 16 0.32 32 31 0.62 62 80-<90 7 0.14 14 38 0.76 76 90-<100 7 0.14 14 45 0.90 90 100-110 5 0.10 10 50 1.00 100 Tổng 50 1.00 100 7/50 0.76+00 . . 11 44x100 38+7 76+14 27
Đồ thịphân bốvớidữliệuđịnh lượng
•Đồ thịđiểm (Dot plot) •Bi
ểuđồ tầnsốphân bố(Histogram) •Đagiáctầnsố(Polygon)
•Đagiáctầnsốtích lũy(Ogive) 28 14 2/25/2024
Đồ thịđiểm (Dot plot)
•Trụchoànhbiểudiễnbiếnđộngcủacáclượngbiến.
•Mỗigiátrịđượcthểhiệnbằngmộtđiểmtrêntrục. Doanh sốbình quân . . .. . . . . .. .. .. .. . .
. . . ..... .......... .. . .. . . ... . .. . 50 60 70 80 90 50 100 60 70 80 90 110 100 110 Doanh Doanh s s ố(Tr.đ (Tr.đ ) ) 29
Biểuđồ tầnsốphân bố(Histogram) Doanh sốbình quân  18 Biểuđồ hình cột (Histogram) 16 14
• Không có khoảng cách giữacá 12
cộtmàlàgiớihạngiữa hai tổ. 10 •T ổcao thấpbi ểuthịầnsốcủa TT ầ ầ n 8n ssố mỗitổ. 6
•Độ rộng cộtlàkhoảng cách tổ 4 2 Do D a o n a h n sbq b (t ( rđ tr ) 50 60 50 70 60 80 70 90 80 90 100-110  100-110 30 15 2/25/2024
Hình dáng của HistogramĐốixứng
Vídụ:chiềucaovàcânnặng(phânphốichuẩn) .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 31
Hình dáng của HistogramLệchtrái Vídụ:điểmthi .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 32 16 2/25/2024
Hình dáng của HistogramLệchphải Vídụ:giánhà .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 33
Hình dáng của HistogramRấtlệchphải Vídụ:thunhập .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 34 17 2/25/2024
Tầm quan trọng của Histogram
• Cho biết hình dáng phân phốicủadữliệu
• Cho biếtvịtrí trung tâm củadữliệu
• Cho biếtsựbiến thiên ủ c adữliệu
• Dùng để xác định dữliệuđộtxuất (outliers) 35
Đagiáctầnsố(Polygon) Polygon 18 16 16 14 13 12 10 8 Tần số 77 6 5 4 2 02 0 2 0 1 0 1 00 0 1 1 2 03 04 5 06 7 08 9 0 Trị số giữa của tổ
Trịsốgiữacủatổ= (Giớihạntrên+ Giớihạndưới) / 2 36 18 2/25/2024
Đagiáctầnsốtích lũy (Ogive) 100 Trục tung: 80 -T ầnsốtích lũy 60 (90, 76) -T ầnsuất tích lũy 40 -T ầnsuất (%) tích lũy 20 Doanh số bq (Trđ (Tr ) 50 60 70 80 90 100 110
Trục hoành: Giớihạntrêncủatổ 37
Bảng dữliệu chéo (cross tabulation - contingency table)
Bảng chéo: biểudiễnmối liên hệgiữa hai biến. Cột1 Cột2 Cột3 Cộtc Tổng dòng Dòng 1 O11 O12 O13 O1c ΣO1j Dòng 2 O21 O22 O23 O2c ΣO2j … Dòng d Od1 Od2 Od3 Odc Σodj Tổng cột ΣOi1 ΣOi2 ΣOi3 ΣOic n=ΣOij 38 19 2/25/2024 Bảng dữliệuchéo
Ví dụ.Bảng chéo cho biếtmốili ênhệgiữagi áti ềncủamộtsuấtănvà
đánh giá chấtlượng suấtănđó.
Giátiềnmộtsuấtăn(Nghìnđồng) Đánhgiá 50‐60 60‐70 70‐80 80‐90 Tổngsố Tạmđược 42 40 2 0 84 Ngon 34 64 46 6 150 Rấtngon 2 14 28 22 66 Tổngsố 78 118 76 28 300
→Từkếtquảtrên,cóthểtínhđượckếtcấutheocáctiêuthứckhácnhau 39 Bảng dữliệuchéo
Ví dụ.Phầntrăm trong tổng chung.
Giátiềnmộtsuấtăn(Nghìnđồng) Đánhgiá 50‐60 60‐70 70‐80 80‐90 Tổngsố Tạmđược 14.00 13.33 0.67 0.00 28.00 Ngon 11.33 21.33 15.33 2.00 50.00 Rấtngon 0.67 4.67 9.33 7.33 22.00 Tổngsố 26.00 39.33 25.33 9.33 100.00 40 20