



















Preview text:
Chương 3
TRÌNH BÀY DỮ LIỆU THỐNG KÊ 1 Nội dung chính I II III PHÂN TỔ BẢNG ĐỒ THỊ THỐNG KÊ THỐNG KÊ THỐNG KÊ 2 1 2/25/2024
Dữliệuthuthậpđược sau điềutra 3 Phân tổthống kê • Khái niệm chung
•Cácloại phân tổthống kê
•Cácbước phân tổthống kê •Dãysốphân phối 4 2 2/25/2024 Khái niệm chung
Phân tổthống kê là căncứvào một hay mộtsốtiêu thứcnàođóđể tiến
hành phân chia các đơnvịcủahiệntượng nghiên cứu thành các tổ(hoặc
tiểutổ) có tính chất khác nhau.
Ý nghĩa: Phân tổthống kê đóng vai trò quan trọng trong cả3giađoạncủa
quá trình nghiên cứuthống kê. Nhiệmvụ:
• Phân chia các loạihìnhkinhtếxã hộicủahiệntượng nghiên cứu •Bi
ểuhiệnkếtcấucủahiệntượng nghiên cứu •Bi
ểudiễnmối liên hệgiữa các tiêu thức 5
Các loại phân tổthống kê
Căncứvào nhiệmvụcủa phân tổ: • Phân tổphân loại • Phân tổkếtcấu • Phân tổliên hệ
Căncứvào sốlượng tiêu thức dùng để phân tổ:
• Phân tổtheo mộttiêuthức
• Phân tổtheo nhiềutiêuthức
Căncứvào loạitiêuthức dùng để phân tổ:
• Phân tổtheo tiêu thứcthuộc tính
• Phân tổtheo tiêu thứcsốlượng 6 3 2/25/2024
Các bước phân tổthống kê
Phân phối các đơn vị vào từng tổ Bước4
Xác định số tổ và khoảng cách tổ Bước3
Lựa chọn tiêu thức phân tổ Bước2 Xác định mục đích phân tổ Bước1 7
Lựachọntiêuthức phân tổ •Dựatrêncơ ở
s phân tích lý luậnđể chọnratiêuthứcbảnchấtnhất, phù
hợpvớimụcđích nghiên cứu
•Căncứvào điềukiệnlịch sửcụthể ủ
c ahiệntượng nghiên cứu 8 4 2/25/2024
Xác định sốtổvà phân phối các đơnvị vào từng tổ
Mỗibiểuhiệncủatiêuthứccó thểhình thành mộttổ.
•Sốlượng đơnvịđượcsắpxếpvàomỗitổđượcgọilàtầnsố(frequency).
•Khilấytầnsốcủamỗitổchia cho tổng sốđơnvịtrong tổng thể,tađược
tầnsuấtcủatổđó (relative frequency).
•Khilấytầnsuấtcủamỗitổnhân với 100, ta đượctỷtrọng ủ c atổđótrong
tổng thể(tầnsuất tính theo đơnvị%) (percentage frequency) 9
Phân tổtheo tiêu thứcthuộctính
Ví dụ: Phỏng vấn 50 sinh viên vềloạiđồ uống ưa thích nhất. Coca Coca Coca Coca Fanta Coca ăn kiêng Fanta Coca ăn kiêng Sprite Coca Pepsi Sprite Coca Fanta Coca ăn kiêng Coca ăn kiêng Coca Sprite Pepsi Pepsi Coca Coca ăn kiêng Sprite Coca ăn kiêng Pepsi Coca Coca Pepsi Pepsi Pepsi Fanta Coca Coca Coca Pepsi Coca ăn kiêng Sprite Coca Coca Coca Pepsi Coca Coca Coca Fanta Pepsi Coca ăn kiêng Pepsi Pepsi Pepsi 10 5 2/25/2024
Phân tổtheo tiêu thứcthuộctính Loạiđồ uống Tầnsố Tầnsuất(lần) Tầnsuất(%) Coca 19 0,38 38 Cocaănkiêng 8 0,16 16 Fanta 5 0,10 10 Pepsi 13 0,26 26 Sprite 5 0,10 10 Tổngsố 50 1 100 11
Đồ thịphân bốvớidữliệuđịnh tính 40 38 35 30 26 25 10% Coca 20 16 38% Cocaănkiêng 15 26% Tầnsuất(%) Fanta 10 10 10 Pepsi 5 Sprite 10% 16% 0 CocaCocaăn Fanta PepsiSprite kiêng Loạiđồuống Đồ
thịhìnhcột(barchart)Đồ
thịhìnhtròn(piechart) 12 6 2/25/2024
Phân tổtheo tiêu thứcsốlượng
Khi mỗilượng biến hình thành 1 tổ: phân tổkhông có khoảng cách tổ.
Khi nhiềulượng biến cùng nằm trong 1 tổ: phân tổcó khoảng cách tổ
Khoảng cách tổbằng nhau
Khoảng cách tổkhông bằng nhau Khoảng cách tổmở 13
Phân tổkhông có khoảng cách tổ
Áp dụng vớidữliệuđịnh lượng có ít các lượng biếnrờirạc.
•Vídụ:Cósốlượng đơn hàng đãthựchi
ệncủa 20 nhân viên giao hàng
của Tiki trong 1 giờđồng hồnhưsau
7, 7, 10, 8, 5, 4, 5, 6, 4, 9, 8, 7, 6, 4, 8, 5, 7, 10, 10, 9 •Phântổ ố
s lượng nhân viên trên theo sốlượng đơn hàng đã giao trong 1 giờ. 14 7 2/25/2024
Phân tổkhông có khoảng cách tổ
Sắpxếpdữliệu theo thứtựtừthấpđếncao
Xác định các tổvà đếmsốlượng nhân viên trong từng tổđó.
Sốlượng đơn hàng Sốnhân viên 4 3 Tầnsố 5 3 6 2 7 4 8 3 9 2 10 3 Tổng số 20 15
Phân tổcó khoảng cách tổ Áp dụng
•Dữliệuđịnh lượng có nhiềulượng biếnrờirạc
•Dữliệuđịnh lượng có lượng biến liên tục Các bướcxâydựng
•Sắpxếpdữliệu theo thứtựtừthấpđếncao
•Xácđịnh lượng biếnlớnnhất, lượng biếnnhỏnhấtvàkhoảng biến thiên của lượng biến(R)
R = Lượng biếnlớnnhất–lượng biếnnhỏnhất •Xácđịnh sốtổ
•Xácđịnh khoảng cách tổ
•Xácđịnh giớihạndướicủatổđầutiên
•Xâydựng dãy sốphân phối 16 8 2/25/2024
Phân tổcó khoảng cách tổ Các thuậtngữ: •Gi
ớihạndưới: giá trịthấpnhất trong mộttổ •Gi
ớihạn trên: giá trịcao nhất trong mộttổ
→Giớihạndướivàgiớihạntrêncủamộttổthường đượclàmtròn
•Khoảng cách tổ:khoảng cách từgiớihạndướiđếngiới han trên ủ c amộttổ
•Tổmở:tổđầutiênkhôngcógiớihạndưới và/hoặctổcuối cùng không có giớihạntrên
→Tổmởthường đượcápdụng khi có các dữliệukhôngbìnhthường (quá thấphoặc quá cao) 17
Phân tổcó khoảng cách tổbằng nhau
Xác định khoảng cách tổ
Khoảng cách tổbằng nhau
Khoảng cách tổxấpxỉbằng:
𝑳ượ𝒏𝒈 𝒃𝒊ế𝒏 𝒍ớ𝒏 𝒏𝒉ấ𝒕 𝑳ượ𝒏𝒈 𝒃𝒊ế𝒏 𝒏𝒉ỏ 𝒏𝒉ấ𝒕 𝑺ố 𝒕ổ 18 9 2/25/2024
Phân tổcó khoảng cách tổbằng nhau
•Vídụ:Cósốliệuvềdoanh ố
s bình quân một tháng (triệuđồng) trong năm
2023 của 50 nhân viên trong một doanh nghiệpnhưsau 91 9 78 7 93 9 57 5 75 7 52 5 99 9 80 8 97 9 62 6 71 7 69 6 72 7 89 8 66 6 75 7 79 7 75 7 72 7 76 7 10 1 4 0 74 7 62 6 68 6 97 9 10 1 5 0 77 7 65 6 80 8 10 1 9 0 85 8 97 9 88 8 68 6 83 8 68 6 71 7 69 6 67 6 74 7 62 6 82 8 98 9 10 1 1 0 79 7 10 1 5 0 79 7 69 6 62 6 73 7 19
Phân tổcó khoảng cách tổbằng nhau
Giảsử, chia thành 6 tổ
Khoảng cách tổ= (109 - 52)/6 = 9.5 ≈10
Doanh sốbq (Trđ) Sốnhân viên Khoảngcáchtổ 50-<60 2 =60‐50=10 60-<70 13 Giớihạn 70-<80 16 trên 80-<90 7 90-<100 7 Giớihạn 100-110 5 dưới Tổng số 50 20 10 2/25/2024
Phân tổcó khoảng cách tổkhông bằng nhau
•Vídụ:Lương bình quân tháng (triệuđồng) năm 2023 ủ c a25nhânviêncó
độ tuổitừ25-30 trong một doanh nghiệpnhưsau Lương bq tháng (trđ) Sốnhân viên 5-<6 4 6 - < 8 6 8 - < 9 6 9 - < 12 6 12 - 15 3 Tổng số 25
Mỗitổphảnánhsựkhácbiệttrongbảnchấtcủadữliệu 21
Phân tổcó khoảng cách tổmở
Áp dụng vớidữliệuđịnh lượng có lượng biến liên tục •Vídụ:Cótàili ệuvềmức thu nhậpbì nhquânnăm(t ri ệuđồng) ủ c a30
nhân viên trong một ngân hàng nhưsau 202 277 654 145 361 457 67 44 240 144 310 391 362 437 429 176 325 221 374 216 480 120 274 398 282 153 470 303 338 209 22 11 2/25/2024
Phân tổcó khoảng cách tổmở Thu nhập (trđ) Sốngười <100 2 100 - <200 5 Tổmở, không 200 - <300 có giớihạn 8 dưới 300 - <400 9 400 - <500 5 ≥500 1 Tổng số 30 Tổmở, không có giớihạntrên 23
Dãy sốphân phối(Bảng tầnsốphân bố)
Dãy sốphân phốilà kếtquảcủa phân tổthống kê theo mộttiêuthứcnàođó.
Các loại dãy sốphân phối
Dãy sốphân phốithuộc tính: là kếtquảcủa phân tổthống kê theo tiêu thức thuộc tính
Dãy sốphân phốilượng biến: là kếtquảcủa phân tổthống kê theo tiêu thứcsốlượng
•Đượcsắpxếp theo trình tựbiếnđộng ủ
c alượng biếntiêuthứcphântổ 24 12 2/25/2024
Các thành phầncủadãysốlượng biến tổng quát 𝒙𝒊 𝒇𝒊 𝒅𝒊𝒇𝒊 𝑺𝒊 𝒎𝒊𝒇𝒊
∑𝒇𝒊 𝟏𝟎𝟎 𝒉𝒊 Lượng biến Tầnsố Tầnsuất Tầnsốtích lũy Mậtđộ phân phối Là biểu hiện bằng
Là số lần xuất hiện Là tần số được biểu Là tần số cộng dồn Dùng để so sánh số của tiêu thức số của lượng biến hiện bằng số tương các tầnsốkhi
lượng dùng để phân hoặc số đơn vị phân đối(lần, %) khoảng cách tổ tổ phối vào mỗi tổ không bằng nhau x1 f1 d1 S1= f1 m1 … … … … … xn fn dn Sn = f1+ f2+ … + fn mn Tổng 𝒇𝒊 𝒅𝒊 25
Dãy sốlượng biếntổng quát: các tính toán khác
Tầnsốtích lũy – cho biếtsốlượng đơnvịcó giá trịnhỏhơnhoặcbằng
giớihạntrêncủamộttổ,làtổng tầnsốcủatổđóvàcáctổtrướcđó.
Tầnsuất tích lũy – cho biếttỷlệsốđơnvị(tính theo đơnvịlần) có giá trị
nhỏhơnhoặcbằng giớihạntrêncủamộttổ,làtổng tầnsuấtcủatổđóvà các tổtrướcđó
Tầnsuất(tỷtrọng) tích lũy – cho biếtphầntrămsốđơnvịcó giá trịnhỏ
hơnhoặcbằng giớihạntrêncủamộttổ,làtổng tỷtrọng củatổđóvàcác tổtrướcđó. 26 13 2/25/2024 Ví dụ Doanh số Tầnsố Tầnsuất Tỷtrọng Tầnsốtích Tầnsuất Tầns uất bq (Tr.đ) (%) lũy tích lũy (Tỷtrọng) (lần) tích lũy(%) 50-<60 2 0.04 4 2 0.04 4 60-<70 13 0.26 26 15 0.30 30 70-<80 16 0.32 32 31 0.62 62 80-<90 7 0.14 14 38 0.76 76 90-<100 7 0.14 14 45 0.90 90 100-110 5 0.10 10 50 1.00 100 Tổng 50 1.00 100 7/50 0.76+00 . . 11 44x100 38+7 76+14 27
Đồ thịphân bốvớidữliệuđịnh lượng
•Đồ thịđiểm (Dot plot) •Bi
ểuđồ tầnsốphân bố(Histogram) •Đagiáctầnsố(Polygon)
•Đagiáctầnsốtích lũy(Ogive) 28 14 2/25/2024
Đồ thịđiểm (Dot plot)
•Trụchoànhbiểudiễnbiếnđộngcủacáclượngbiến.
•Mỗigiátrịđượcthểhiệnbằngmộtđiểmtrêntrục. Doanh sốbình quân . . .. . . . . .. .. .. .. . .
. . . ..... .......... .. . .. . . ... . .. . 50 60 70 80 90 50 100 60 70 80 90 110 100 110 Doanh Doanh s s ố(Tr.đ (Tr.đ ) ) 29
Biểuđồ tầnsốphân bố(Histogram) Doanh sốbình quân 18 Biểuđồ hình cột (Histogram) 16 14
• Không có khoảng cách giữacá 12
cộtmàlàgiớihạngiữa hai tổ. 10 •T ổcao thấpbi ểuthịầnsốcủa TT ầ ầ n 8n sốsố mỗitổ. 6
•Độ rộng cộtlàkhoảng cách tổ 4 2 Do D a o n a h n sốbq b (t ( rđ tr ) 50 60 50 70 60 80 70 90 80 90 100-110 100-110 30 15 2/25/2024
Hình dáng của Histogram Đốixứng
Vídụ:chiềucaovàcânnặng(phânphốichuẩn) .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 31
Hình dáng của Histogram Lệchtrái Vídụ:điểmthi .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 32 16 2/25/2024
Hình dáng của Histogram Lệchphải Vídụ:giánhà .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 33
Hình dáng của Histogram Rấtlệchphải Vídụ:thunhập .35 .30 .25 .20 .15 T T ầ ầ n n s s u u ấ ấ t t .10 .05 0 34 17 2/25/2024
Tầm quan trọng của Histogram
• Cho biết hình dáng phân phốicủadữliệu
• Cho biếtvịtrí trung tâm củadữliệu
• Cho biếtsựbiến thiên ủ c adữliệu
• Dùng để xác định dữliệuđộtxuất (outliers) 35
Đagiáctầnsố(Polygon) Polygon 18 16 16 14 13 12 10 8 Tần số 77 6 5 4 2 02 0 2 0 1 0 1 00 0 1 1 2 03 04 5 06 7 08 9 0 Trị số giữa của tổ
Trịsốgiữacủatổ= (Giớihạntrên+ Giớihạndưới) / 2 36 18 2/25/2024
Đagiáctầnsốtích lũy (Ogive) 100 Trục tung: 80 -T ầnsốtích lũy 60 (90, 76) -T ầnsuất tích lũy 40 -T ầnsuất (%) tích lũy 20 Doanh số bq (Trđ (Tr ) 50 60 70 80 90 100 110
Trục hoành: Giớihạntrêncủatổ 37
Bảng dữliệu chéo (cross tabulation - contingency table)
Bảng chéo: biểudiễnmối liên hệgiữa hai biến. Cột1 Cột2 Cột3 … Cộtc Tổng dòng Dòng 1 O11 O12 O13 O1c ΣO1j Dòng 2 O21 O22 O23 O2c ΣO2j … Dòng d Od1 Od2 Od3 Odc Σodj Tổng cột ΣOi1 ΣOi2 ΣOi3 ΣOic n=ΣOij 38 19 2/25/2024 Bảng dữliệuchéo
Ví dụ.Bảng chéo cho biếtmốili ênhệgiữagi áti ềncủamộtsuấtănvà
đánh giá chấtlượng suấtănđó.
Giátiềnmộtsuấtăn(Nghìnđồng) Đánhgiá 50‐60 60‐70 70‐80 80‐90 Tổngsố Tạmđược 42 40 2 0 84 Ngon 34 64 46 6 150 Rấtngon 2 14 28 22 66 Tổngsố 78 118 76 28 300
→Từkếtquảtrên,cóthểtínhđượckếtcấutheocáctiêuthứckhácnhau 39 Bảng dữliệuchéo
Ví dụ.Phầntrăm trong tổng chung.
Giátiềnmộtsuấtăn(Nghìnđồng) Đánhgiá 50‐60 60‐70 70‐80 80‐90 Tổngsố Tạmđược 14.00 13.33 0.67 0.00 28.00 Ngon 11.33 21.33 15.33 2.00 50.00 Rấtngon 0.67 4.67 9.33 7.33 22.00 Tổngsố 26.00 39.33 25.33 9.33 100.00 40 20