THỐNG KÊ CHO KHOA HC XÃ HỘI
Thầy: Nguyễn Hữu Bình
NGÀY 30/11/2022
QUY TRÌNH THC HIN NGUYÊN CU KHOA HC
QUY TRÌNH THC HIN NGUYÊN CU KHOA HC
QUY TRÌNH THC HIN NGUYÊN CU KHOA HC
QUY TRÌNH THC HIN NGUYÊN CU KHOA HCQUY TRÌNH THC HIN NGUYÊN CU KHOA HC
KHÁI NIỆM
- Xu hướng
- Lựa chọn
THUYẾT
- Lưu chọn
1. Thu thập dữ liệu:
- Xây dựng BH
- Chọn mẫu/ Tìm quy mô mẫu
- Khảo sát
2. Phân tích dữ liệu:
- Đọc/ Tổng hợp
- Diễn giả
- Đánh giá/ nhận định
3. Viết báo cáo
CÁC KHÁI NIM CƠ BẢN:
CÁC KHÁI NIM CƠ BẢN:
CÁC KHÁI NIM CƠ BẢN:
CÁC KHÁI NIM CƠ BẢN:CÁC KHÁI NIM CƠ BẢN:
TỔNG THỂ( POPULATION): là tp hp các phn t đưc quan tâm trong
một nghiên cu. Nó có th hu như là mi th=> khách thể toàn bộ
mọi người chúng ta khảo sát.
Ví d: dân s VN, tng th sinh viên ca trưng ĐH KHXH NV hay tng s
sinh viên ca mt khoa
Ví d: Ch đ v thc trng b hc ca sinh viên trưng Nhân n TP HCM
+ Đi tưng nghiên cu: thc trng b hc
+ Khách thể nghiên cứu: học sinh, học sinh bỏ học
MẪU( SAMPLE): là tp hp con ca tng th đưc chn ra đ tiến hành
thu thp d liu nghiên cu. Khi mu đưc chn đm bo tính đi din, s có
th s dng đ suy rng ra các đc trưng ca tng th=> nghiên cu dân s
thì da trên nghiên cu tng th.
Ví d: 1 công ty nghiên cu th trưng tiến hành kho sát 650 ngưi tiêu
dùng đ thu thp thông tin v th hiếu dùng sa ca ngưi dân thành ph
HCM
BIẾN( VARIABLE): là tp hp các đc trưng và giá tr đưc dùng đ ch
một khái nim
dụ: Biến giới tính( 2 giá trị nam, nữ)
Biến tôn giáo( bao gồm Phật giáo, Thiên chúa giáo, Tin lành,
Hòa Hảo, khác không tôn giáo)
Biến ngh nghip( làm nông, kinh doanh buôn bán, ngh nghip chun
n, ngh nghip hành chính văn phòng, ngh khác)
ĐNH Đ( PROPOSITION): một phát biểu về mối liên hệ giữa một
khái niệm
Ví d: hút thuc lá dn đến ung thư phi, hay quan h tình dc không
an toàn dn đến nguy cơ nhim HIV/ AIDs
dụ: Uống rượu bia tham gia giao thông gây tai nạn giao
thông, xả rác bừa bãi gây ô nhiễm môi trường
gói-> mua sắm nhiều
Black Friday-> hết tiền
BIN ĐC LP( INDEPENDENT VARIABLE): là biến đưc dùng đ gii
thích cho ngun nhân ca mt hin tưng
BIẾN PHỤ THUỘC( DEPENDENT VARIABLE): đưc coi là biến kết qu, nó
chu s chi phi ca biến đc lp
Ví d: hút thuc lá-> biến đc lp
ung thư phổi-> biến phụ thuộc
HAI LOI BIN: biến đnh tính( qualitative variable) biến đnh
lưng( quantitative variable)
Đi với biến đnh tính, nhng đc trưng phân bit da trên da trên s
khác bit về đc tính, ch không phi về s lưng hoc đ ln
Các biến đưc gi là đnh lưng khi mà các giá tr ca biến cho thy s
khác bit về đ ln hay s lưng gia chúng.
THAO C HÓA( OPERATIONALIZATION): một phương pháp đ quan
sát ghi nhn nhng khía cnh ca mt cá nhân, khách th, hay mt s kin
có liên quan đ tiến hành kim đnh gi thuyết.
dụ: Thao tác khái niệm “Hạnh phúc”
- Kinh tế- vật cht, môi trưng t nhiên: Đưc ăn ngon, đưc mc
đp, đưc làm công vic mình thích, có đ tin nghi sinh hot, có
s đm bo v mt tài chính, có h thng dch v tt, môi trưng
t nhiên trong lành, an toàn v sinh thc phm tt, có công vic
n đnh.
- Quan h trong gia đình- hi: gia đình hòa thun, quan h h
hàng tt, có bn bè tt, quan h tình yêu tt, quan h nhóm
thành viên tt, có v thế đa v hi, an ninh an toàn xã hi đm
bo, quan h với cnh quan trưng hc tt đp, môi trưng xã
hi t do dân ch.
- Đi sng cá nhân: có sc khe tt, có thành tích hc tp tt, có
thi gian ngh ngơi gii trí, có nim tin vào con ngưi hi,...
ĐO LƯNG( MEASUREMENT): là cách thc gán nhng con s hay giá tr
cho các quan sát theo mt quy tc nht đnh
dụ: Thu thập của anh/ chị( một triệu, hai triệu, ba triệu,
bốn triệu,...)
Trình đ hc vấn( 1,2,3,4,5,...)
Thành viên chung sng trong gia đình( V, chng, con trai, cháu,...)
S thích lúc rnh ri( Đc sách, xem phim, nghe nhc, du lch, gi đin)
7/12/2022
1.
1.
1.
1.1.
KHÁI NIM:
KHÁI NIM:
KHÁI NIM:
KHÁI NIM:KHÁI NIM:
- Khái nim chn mu( sample sampling): Là quá trình chn một s lưng
nh nhng đơn v nghiên cu t mt qun th( dân s) nghiên cu xác
đnh
- Dung lưng mu/ quy mô mu: là tp hp các đơn v mu đưc chn.
Phương pháp chn mu s quyết đnh cách NNC kết lun các kết qu
nghiên cu( có đi din cho tng th đưc không, đi din mức đ nào)
- Tuy nhiên thông tin cá nhân có th không đưc cung cp=> phi chp
nhn.
Mẫu nm trong tng th, là 1
phn tng th, mu đưc chn ra
có kh năng đi din cho tng
th có mang đc đim đc trưng
đi din cho tng th.
Mẫu nm trong tng th, là 1
phn tng th, đưc chn ra t
tng th, nhưng không rõ đưc
chn ra như thế nào, nên không
đi din cho tng th.
Mỗi đơn vị đưc chn ra phi là mt cá nhân. Cá nhân chính là đi
tưng/ ngưi tr li.
Tập hợp mẫu “cá nhân” khác với con số??
Số thì thể số nguyên thập phân, người thì chỉ số
nguyên
- Ngun tc thng đòi hi mt mu có giá tr khi mu đó có kích
thưc đ ln( đ c mu) và mu đi din cho dân s( n>=30)
- Mục tiêu chn mu: phn ánh chính c đc đim ca tng th
- Không khng đnh, kết lun cho tng th nếu chn mu không đúng,
mẫu không mang tính đi din cho tng th( phi xác sut) ch đúng
với nhóm khách th đã kho sát.
- Tổng thể( population): là tp hp các đi tưng có chung đc đim
chúng ta mun áp dng kết qu nghiên cu.
- Mẫu( sample): Tp hp nhng đi tưng đưc kho sát có h thng
nhm ưc lưng đc trưng ca dân s đích
-
- Khối dân mục tiêu: trong nghiên cu cn có cùng mt vn đ
nhưng có nhiu nhóm khác nhau có th cung cp cho mình thông tin.
- Khối dân lấy mẫu: là khi dân cư t đó mt nhóm mu c th đưc
chn da trên khung mu. V mt thc nghim, khung mu chính là đi
din tng th. VD: danh sách sinh viên ca các trưng thành viên
ĐHQG. Danh sách sinh viên lp TKCKHXH 04
- Khung mẫu( sampling frame): tp hp ca nhng đơn v nghiên cu
hơn ..trong dân s
- Ví d: Nghiên cu v thc trng v tình dc trưc hôn nhân ca sinh
viên đi hc quc gia
- Khi dân cư mc tiêu: Chn nhng nhóm có liên quan đến thc trng
trên:
- SV( chủ thể)
- Ph huynh( thái đ ca PH gi s nếu có chuyn đó, cách x lý, cách
giáo dc ca PH về TD, cách chia s ca PH vi SV vi các vn đ trong
cuc sng)
- QLSV/ GVCN/ CVHT( thực trạng, vấn cho các bạn về tâm
tình cảm)
- Chủ nhà nghỉ theo giờ/ khách sạn
- Bác sĩ ph sn/ nhân viên y tế=> nơi nào, ai có th h tr gii quyết
- Khối dân lấy mẫu: Sinh viên ca các trưng thành viên ĐHGQ
- Tổng thể: Toàn b 100.000 sinh viên đi hc quc gia
- Mẫu: sinh viên
- Chọn mẫu: mẫu xác suất, phương pháp chọn mẫu ngẫu nhiên
- Dung lượng/ quy mẫu: 1000 sinh viên
QUÁ TRÌNH CHN MU
QUÁ TRÌNH CHN MU
QUÁ TRÌNH CHN MU
QUÁ TRÌNH CHN MUQUÁ TRÌNH CHN MU
B2 quan trọng nhất
2.
2.
2.
2.2.
CÔNG THC TÍNH QUY MÔ MU:
CÔNG THC TÍNH QUY MÔ MU:
CÔNG THC TÍNH QUY MÔ MU:
CÔNG THC TÍNH QUY MÔ MU:CÔNG THC TÍNH QUY MÔ MU:
- Nếu tng th nh có th biết đưc tng th thì dùng công thc sau:
- Trong đó: n là dung lưng mu, N là s lưng tng th, e là sai s tiêu
chun
- Trưng Nhân Văn có 15000 SV, mc sai s mong mun (e) là 1% (kh
năng nh chn đúng là bao nhiêu %, đ tin cy gn như tuyt đi là
99%). Tính n?
- n= 15000(1+15000*0,01 bình)= 6000
- Nếu e= 5%=> n=?
- n= 15000(1+15000*0,055 bình)= 389,61=> nhưng đơn vị mẫu mới có kh năng
đi din 95% cho tng th v mt s lưng
- Thông thưng chn mc đ sai s 5%
- Thực tế rất nhiều trường hợp sai số( di cư, du lịch..)
-
-
3.
3.
3.
3.3.
PHƯƠNG PHÁP CHN MU:
PHƯƠNG PHÁP CHN MU:
PHƯƠNG PHÁP CHN MU:
PHƯƠNG PHÁP CHN MU:PHƯƠNG PHÁP CHN MU:
Chọn mẫu xác suất Chọn mẫu phi xác suất
Ngu nhiên đơn gin( simple
random)
Lấy mẫu thuận
tiện( convenience)
Hệ thống( systematic)
Ly mẫu phán đoán( judgment)
Phân tầng( stratified random)
Ly mẫu tăng nhanh( viên tuyết
lăn)
Theo nhóm/ cụm( cluster) Lấy mẫu chi tiêu
3.1. Chọn mẫu xác suất:
3.1.1. Ngẫu nhiên đơn giản:
- Ưu đim:
+ Biết trước xác suất xuất hiện của các phần tử vào trong
mẫu
+ Quá trình chn mẫu tuân theo quy lut toán, không th t ý thay
đi
+ Các thông s ca mu có th dùng đ ưc lưng/ kim nghim
các thông s ca tng th
- Nhưc đim:
+ Trong nhiu trưng hp không mang tính kh thi vì không th có
đưc danh sách tt c các đi tưng liên h, hoc nhà nghiên
cu không đ thi gian đ tiếp cn các đi tưng khi h phân tán
nhiu đa bàn cách xa nhau.
12 cung hoàng đo. Mỗi du chm đánh du s bt đu cách nhau 30 đ.
Giao đim ca đưng xích đo và hoàng đo xác đnh các phân đim. VD
Bch Dương và Thiên Bình.
- Phương pháp ly mu mà mi đơn v ly mu đu đưc chn o mẫu
nghiên cu vi c xut bng nhau và đc lp vi vic chn đơn vị ly
mẫu khác.
- Ví d: Rút thăm, lô tô, bng s ngu nhiên, t tin, vé s, phn mm,...
3.1.2. Mẫu ngẫu nhiên hệ thống:
- C phn t th k tiếp sau phn t đu tiên đưc chn ngu nhiên t
danh sách
- ( bước nhảy) k= N/n
3.1.3. Mẫu phân tầng:
- Mẫu phân tng: phi biết thông tin v tng th, phân bit theo đc tính,
xếp o tng tng khác nhau
- Ví d: chn kho sát Nhân văn, phân tng theo gii tính( ¾ n và ¼
nam), din cư trú( thưng trú, tm trú)
- Các cá th trong mi tng đu đng nht
- thể áp dụng chọn mẫu ngẫu nhiên hoặc mẫu hệ thống mỗi
tầng
- S mẫu mỗi tng đưc chn có th bng nhau hoc t l vi nhau
- Ưu đim:
+ Đm bo mỗi nhóm đu có tính đi din trong tng mu
+ Các nhóm đều đưc so sánh và thng kê
+ Giảm sai số hệ thống
- Hạn chế:
+ Yêu cầu thông tin chính xác về tỷ lệ giữa các tầng
+ Tn m chi phí đ có đưc danh sách các tng
3.1.4. Mẫu cụm/ Nhiều giai đoạn:
- Gn ging vi mẫu phân tng khác vi phân tng ch không có
khung mẫu c th. Cm là nhng khi dân cư không đng nht
- Việc chọn nhng nhóm các đơn v nghiên cu( các cm) thay cho vic
chọn cụm các nhân nhng đơn v nghiên cu đưc gi là . Các mẫu cụm
thưng là nhng đơn v đa lý( như, các huyện, các làng) hoc nhng
đơn vị t chc( như, các phòng khám, nhng nhóm đào to).
- Chọn mẫu cụm theo 2 bước:
- Chọn cụm/ chọn thể trong cụm
- Chn mẫu cm nhiu bưc( giai đon)
- Ví d: Đ ly danh sách 15000 SV thì khó và s lưng nhiu quá, NNC
tiến hành chn mu cm: lit kê danh sách 30 khoa b môn( có th ly
thông tin trên website), chn ngu nhiên đơn gin/ h thng mấy khoa/
b n, t đó chn tiếp lp đi din ca mỗi khoa. Sau đó xin danh
sách c th ca lp đó( khung mu c th). Cách này thưng đưc s
dng nht.
- Ưu đim:
+ Chi phí thấp
+ Không yêu cầu danh sách của cả tổng thể, chỉ cần danh
sách cụm, tiểu cụm
+ Sử dụng khi tổng thể quá lớn
- Hạn chế:
+ Sai số lớn hơn
3.2. Chọn mẫu phi xác suất:
- Nhà nghiên cu chn các phn t vào mu không theo quy lut ngu
nhiên, các phn t không có cơ hi ngang nhau trong vic đưc la
chn
- Không biết xác xuất hiện của các phần tử
- Chọn mẫu tùy thuộc vào nhà nghiên cứu
- Mẫu phi c sut( mang tính ch quan ca nhà nghiên cu) dùng nhiu
trong nghiên cu đnh tính, phn ánh chiu sâu ca vn đ( vn đ NC
nhy cm, riêng tư), thưng là khi đim cho 1 nghiên cu khác( khai
phá)
- Ví d đến siêu th phng vn các bà ni tr v chi tiêu hàng ngày cho
lương thc
- Nhưc đim: Vic chn mu phi da vào knăng ca nhà nghiên cu
hay ca nhân viên chn mu.
- Mẫu thuận tiện: Chn phn t da trên s thun tin, d tiếp cn, d
ly thông tin. VD: phng vn các bà ni tr ti các siêu th đ tìm hiu v
hành vi tiêu dùng ca ngưi ni tr
- Mu phán đoán: Nhà nghiên cu t phán đoán s thích hp ca các
phn t đ mời h tham gia vào mu. Đc đim ging như chn mu
thun tin, nếu kh năng/ kinh nghim phán đoán tt s cho mẫu tt
hơn thun tin.
- Mẫu chỉ tiêu: n đnh s lưng, tiêu chí chn mu
- Mu tăng nhanh/ viên tuyết lăn: ngưi tr li đng thi là ngưi tìm
ngưi tr li tiếp theo, nghiên cu nhy cm, khó tiếp cn mu.
14/12/2022
THANG ĐO:
THANG ĐO:
THANG ĐO:
THANG ĐO:THANG ĐO:
- Thang đo hay còn gi là
cấp độ đo
( levels of measurement) là ch thc
chúng ta đo lưng hay nói cách khác là đt câu hi- đáp án
- Thang đo là khái nim quan trng trong tiến thu thp và phân tích d
liu
- Một câu hi có thu thp thông tin đưc hiu qu hay không ph thuc
rt nhiu o thang đo
- Tương ng vi hai loi biến đnh tính và đnh lưng, có 2 loi thang đo
chính:
+ Thang đo biến s ch [đnh tính] ( bao gm thang đo danh nghĩa
thang đo th bc)
+ Thang đo biến s s [đnh lưng] ( bao gm thang đo khong
cách thang đo t l)
Thang đo danh nghĩa( nominal scale)
- Một biến đưc c đnh bi thang đo danh nghĩa gm h thng các ch
báo khác nhau biu th thuc tính hay tính cht ca biến đó
- Các chỉ báo này tính chất ngang nhau không theo một thứ
tự nào
- Một thang đo danh nghĩa phi có 2 ch báo( giá tr) tr lên
Gii tính Tình trng hôn nhân Nơi đến ca anh ch?
1. Nam 1. Đc thân 1. TP HCM
2. Nữ 2. vợ/ chồng
2.Hà Nội
3.Ly thân 3.Khác
4.Ly dị
5.Góa
Thang đo th bc( ordinal scale)
- Là thang đo danh nghĩa nhưng các ch báo hay các phương án tr li
đưc sp xếp theo một trt t nht đnh
- Nói một cách khác, gia các ch báo này có quan h th bc hơn kém,
nhưng thưng thì mc đ hơn kém gia chúng không xác đnh đưc
Ví d: Thu nhp trung bình hàng tháng Kinh tế so vi 5 năm trưc
1.Dưới 500 ngàn 1. Khá hơn rất nhiều
2.T 500 ngàn đến dưi 1 triu 2.Khá hơn chút đnh
3.T 1 triu đến dưi 2 triu 3.Cũng vy
4.T 2 triu đến dưi 3 triu 4.T hơn chút đnh
5.Từ 3 triệu trở lên
5.Tệ hơn nhiều
- Thang đo th bc( ordinal scale) đo lưng nhng d liu đưc sp xếp
theo th t, chng hn như th bc ca sinh viên trong lp hc là th
nht, th hai, th ba th tư tùy thuc vào đim trung bình hc tp
ca h. Tuy nhiên, giá tr thc tế hoc giá tr tương đi ca các thành
phn hay s khác bit trong giá tr ca các thành phn không th đưc
đánh giá. Ví d, th hng ca các hc sinh trong lp không nói lên đim
trung bình c th ca h.
Thang đo khong cách( interval scale)
- Là thang đo có đy đ tính cht ca mt thang đo danh nghĩa và th
bc, nhưng khong cách gia các ch s đưc xác đnh mt cách c th
đu nhau
- Đi với loi thang đo này ta có th s dng mt s các phép tính toán
hc như tính trung bình hay tính toán t l chênh lch gia các ch s
- Đim “không ca thang đo này là tùy ý
- Phát biểu “Những người học vấn cao sẽ thu nhập cao”
1 2 3 4 5 6 7
Rt không rt đng ý
đng ý
- Thang đo này thưng đưc s dng nhiu cho các phân tích chuyên
sâu về đnh lưng như: Phân tích nhân t( EFA) hoc Hi quy tuyến tính.
Thang đo t l( ratio scale)
- Một thang đo t l có tt c nhng phm cht ca nhng loi thang đo
trưc. Ngoài ra thang đo này có mt giá tr 0 thc. .Số 0 thực
- Thu nhập trung bình hàng tháng: 5.000.000
- Năm sinh:...
- Nơi đi:...
- Đim đến:...
- Đây là thang đo dùng đ khai thác d liu theo cách c th nht
- Đi với các nghiên cu KHXH, thang đo này thưng đưc x lý câu tr
li trưc khi tiến hành phân tích d liu
MỘT SỐ BÀI TẬP
MT S VN Đ CN U Ý TRONG VIC XÂY DNG THANG ĐO:
MT S VN Đ CN U Ý TRONG VIC XÂY DNG THANG ĐO:
MT S VN Đ CN U Ý TRONG VIC XÂY DNG THANG ĐO:
MT S VN Đ CN U Ý TRONG VIC XÂY DNG THANG ĐO:MT S VN Đ CN U Ý TRONG VIC XÂY DNG THANG ĐO:
- Tránh thu thập những thông tin quá riêng của người trả
lời
- Phương án trả lời không bao phủ câu hỏi
- Thang đo lp li
- Thang đo khong cách không rõ
1.
1.
1.
1.1.
KHÁI NIM:
KHÁI NIM:
KHÁI NIM:
KHÁI NIM:KHÁI NIM:
- Thng mô t là phương pháp liên quan đến vic t chc, tng
hp trình bày s liu thu thp đưc t mu nghiên cu hoc
tng th
- Một trong nhng lý do chính s dng phương pháp thng kê là
đ tng hp t d liu, làm cho thông tin đưc trình bày rõ
ràng hơn
- Thng mô t đưc chia thành đo lưng xu hưng tp trung và
đo lưng biến đng. Đo lưng xu hưng tp trung có giá trị
trung bình trung vị yếu vị, , trong khi các đo lưng biến
đng gm đ lch chun, phương sai, giá tr nh nht và giá tr
ln nht, đ nhy và .đ lch
Đo lường trong thng kê mô t
Đo lường trong thng kê mô t
Đo lường trong thng kê mô t
Đo lường trong thng kê mô tĐo lường trong thng kê mô t
- Biến Đnh lưng:
+ Đo lưng đ tp trung: Trung bình( Mean), trung v( medium) và
yếu vị( mode).
+ Đo lưng đ phân tán: Khong( Range), phương sai( Variance)
đ lch chun( Standard devitation).
- Biến Đnh tính:
+ Tần số( frequency)
+ Tỷ lệ( proportion/ percentage)
+ Đo lưng đ phân tn: Giá tr IQV
- Dữ liệu thô:
2.
2.
2.
2.2.
PHƯƠNG PHÁP THNG KÊ MÔ T DƯI DNG BNG:
PHƯƠNG PHÁP THNG KÊ MÔ T DƯI DNG BNG:
PHƯƠNG PHÁP THNG KÊ MÔ T DƯI DNG BNG:
PHƯƠNG PHÁP THNG KÊ MÔ T DƯI DNG BNG:PHƯƠNG PHÁP THNG KÊ MÔ T DƯI DNG BNG:
- Bảng Phân phối tần suất liên hệ:
- 1 bng trình s ln xut hin ca mt hay nhiu giá tr đưc quan sát
trong mẫu hoc tng th
- Các kiểu phân phối tần suất
+ Thô( raw)
+ Liên h(relative): t l( proportion) phn trăm( percent)
+ Lũy tin( cumulative)
- Một số hiệu sử dụng trong tính toán phân phối tần suất
+ n= tổng số mẫu quan sát
+ X= biến
+ i= giá trị( thành phần) của biến X
+ fi= tần suất quan sát của giá trị i
2.1. Bảng phân phối tần suất thô
2.2. Bảng phân phối tần suất liên hệ
2.3. Bảng phân phối tần suất lũy tiền
21/12/2022
2.1. Bảng phân phối tần suất thô
2.2. Bảng phân phối tần suất liên hệ
2.3. Bảng phân phối tần suất lũy tiền
3.
3.
3.
3.3.
BẢNG PHÂN PHI TN SUT CHO THANG ĐO TH BC:
BẢNG PHÂN PHI TN SUT CHO THANG ĐO TH BC:
BẢNG PHÂN PHI TN SUT CHO THANG ĐO TH BC:
BẢNG PHÂN PHI TN SUT CHO THANG ĐO TH BC:BẢNG PHÂN PHI TN SUT CHO THANG ĐO TH BC:
4.
4.
4.
4.4.
BẢN
BẢN
BẢN
BẢNBẢN
G PHÂN PHỐI TẦN SUT CHO THANG ĐO KHONG CÁCH- T L
G PHÂN PHỐI TẦN SUT CHO THANG ĐO KHONG CÁCH- T L
G PHÂN PHỐI TẦN SUT CHO THANG ĐO KHONG CÁCH- T L
G PHÂN PHỐI TẦN SUT CHO THANG ĐO KHONG CÁCH- T LG PHÂN PHỐI TẦN SUT CHO THANG ĐO KHONG CÁCH- T L
5.
5.
5.
5.5.
PHƯƠNG PHÁP PHÂN T D LIU
PHƯƠNG PHÁP PHÂN T D LIU
PHƯƠNG PHÁP PHÂN T D LIU
PHƯƠNG PHÁP PHÂN T D LIUPHƯƠNG PHÁP PHÂN T D LIU
- Khi phân t d liu, tùy theo mc đích th hin d liu cũng như phân
b đu đn hay không đu đn ca d liu mà có th tiến hành phân t
đu hoc phân t không đu.
- Khái nim đu hoc không đu liên quan đến khái nim khong cách
ca t
- Chênh lệch giữa giới hạn dưới giới hạn trên trị số
khoảng cách tổ
5.1. Các bước phân tổ
- Xác đnh s t cn chia: k
Không có mt con s quy đnh chính xác con s cn chia( k) là bao
nhiêu, nhưng theo kinh nghim ngưi ta thy nên chia trong khong t
5 đến dưi 15 t
Với n số quan sát của tập dữ liệu, ta công thức:
- Xác đnh tr s khong cách t: h

Preview text:

THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Thầy: Nguyễn Hữu Bình N GÀY 30/11/2022 QU Q Y U TRÌNH Y TRÌNH TH T Ự H C Ự C HI H Ệ I N Ệ N NG N U G Y U Ê Y N Ê N CỨ C U Ứ U KH K O H A O A HỌ H C Ọ KHÁI NIỆM LÝ THUYẾT - Xu hướng - Lưu chọn - Lựa chọn - LT hệ thống TG 1. Thu thập dữ liệu: - Xây dựng BH -
Chọn mẫu/ Tìm quy mô mẫu - Khảo sát 2. Phân tích dữ liệu: - Đọc/ Tổng hợp - Diễn giả - Đánh giá/ nhận định 3. Viết báo cáo CÁC C ÁC KH K ÁI H N ÁI I N Ệ I M Ệ M CƠ C Ơ BẢN BẢ : N ●
TỔNG THỂ( POPULATION): là tập hợp các phần tử được quan tâm trong
một nghiên cứu. Nó có thể hầu như là mọi thứ=> khách thể toàn bộ
mọi người mà chúng ta khảo sát.

Ví dụ: dân số VN, tổng thể sinh viên của trường ĐH KHXH và NV hay tổng số sinh viên của một khoa
Ví dụ: Chủ đề về thực trạng bỏ học của sinh viên trường Nhân văn TP HCM +
Đối tượng nghiên cứu: thực trạng bỏ học +
Khách thể nghiên cứu: học sinh, học sinh bỏ học ●
MẪU( SAMPLE): là tập hợp con của tổng thể được chọn ra để tiến hành
thu thập dữ liệu nghiên cứu. Khi mẫu được chọn đảm bảo tính đại diện, sẽ có
thể sử dụng để suy rộng ra các đặc trưng của tổng thể=> nghiên cứu dân số
thì dựa trên nghiên cứu tổng thể.
Ví dụ: 1 công ty nghiên cứu thị trường tiến hành khảo sát 650 người tiêu
dùng để thu thập thông tin về thị hiếu dùng sữa của người dân thành phố HCM ●
BIẾN( VARIABLE): là tập hợp các đặc trưng và giá trị được dùng để chỉ một khái niệm
Ví dụ: Biến giới tính( có 2 giá trị nam, nữ)
Biến tôn giáo( bao gồm Phật giáo, Thiên chúa giáo, Tin lành,
Hòa Hảo, khác và không tôn giáo)
Biến nghề nghiệp( làm nông, kinh doanh buôn bán, nghề nghiệp chuyên
môn, nghề nghiệp hành chính văn phòng, nghề khác) ●
ĐỊNH ĐỀ( PROPOSITION): là một phát biểu về mối liên hệ giữa một khái niệm
Ví dụ: hút thuốc lá dẫn đến ung thư phổi, hay quan hệ tình dục không
an toàn dẫn đến nguy cơ nhiễm HIV/ AIDs
Ví dụ: Uống rượu bia tham gia giao thông gây tai nạn giao
thông, xả rác bừa bãi gây ô nhiễm môi trường
Mì gói-> mua sắm nhiều Black Friday-> hết tiền ●
BIẾN ĐỘC LẬP( INDEPENDENT VARIABLE): là biến được dùng để giải
thích cho nguyên nhân của một hiện tượng ●
BIẾN PHỤ THUỘC( DEPENDENT VARIABLE): được coi là biến kết quả, nó
chịu sự chi phối của biến độc lập
Ví dụ: hút thuốc lá-> biến độc lập
ung thư phổi-> biến phụ thuộc
HAI LOẠI BIẾN: biến định tính( qualitative variable) và biến định
lượng( quantitative variable)
Đối với biến định tính, những đặc trưng phân biệt dựa trên dựa trên sự
khác biệt về đặc tính, chứ không phải về số lượng hoặc độ lớn
Các biến được gọi là định lượng khi mà các giá trị của biến cho thấy sự
khác biệt về độ lớn hay số lượng giữa chúng. ●
THAO TÁC HÓA( OPERATIONALIZATION): một phương pháp để quan
sát và ghi nhận những khía cạnh của một cá nhân, khách thể, hay một sự kiện
có liên quan để tiến hành kiểm định giả thuyết.
Ví dụ: Thao tác khái niệm “Hạnh phúc”
- Kinh tế- vật chất, môi trường tự nhiên: Được ăn ngon, được mặc
đẹp, được làm công việc mình thích, có đủ tiện nghi sinh hoạt, có
sự đảm bảo về mặt tài chính, có hệ thống dịch vụ tốt, môi trường
tự nhiên trong lành, an toàn vệ sinh thực phẩm tốt, có công việc ổn định.
- Quan hệ trong gia đình- xã hội: gia đình hòa thuận, quan hệ họ
hàng tốt, có bạn bè tốt, quan hệ tình yêu tốt, quan hệ nhóm
thành viên tốt, có vị thế địa vị xã hội, an ninh an toàn xã hội đảm
bảo, quan hệ với cảnh quan trường học tốt đẹp, môi trường xã hội tự do dân chủ.
- Đời sống cá nhân: có sức khỏe tốt, có thành tích học tập tốt, có
thời gian nghỉ ngơi giải trí, có niềm tin vào con người xã hội,.. ●
ĐO LƯỜNG( MEASUREMENT): là cách thức gán những con số hay giá trị
cho các quan sát theo một quy tắc nhất định
Ví dụ: Thu thập của anh/ chị( một triệu, hai triệu, ba triệu, bốn triệu,...)
Trình độ học vấn( 1,2,3,4,5,. .)
Thành viên chung sống trong gia đình( Vợ, chồng, con trai, cháu,. .)
Sở thích lúc rảnh rỗi( Đọc sách, xem phim, nghe nhạc, du lịch, gọi điện…) 7/12/2022 1.1 KH K ÁI H N ÁI I N Ệ I M Ệ : M
- Khái niệm chọn mẫu( sample sampling): Là quá trình chọn một số lượng
nhỏ những đơn vị nghiên cứu từ một quần thể( dân số) nghiên cứu xác định
- Dung lượng mẫu/ quy mô mẫu: là tập hợp các đơn vị mẫu được chọn.
Phương pháp chọn mẫu sẽ quyết định cách NNC kết luận các kết quả
nghiên cứu( có đại diện cho tổng thể được không, đại diện mức độ nào)
- Tuy nhiên thông tin cá nhân có thể không được cung cấp=> phải chấp nhận.
Mẫu nằm trong tổng thể, là 1
Mẫu nằm trong tổng thể, là 1
phần tổng thể, mẫu được chọn ra phần tổng thể, được chọn ra từ
có khả năng đại diện cho tổng
tổng thể, nhưng không rõ được
thể có mang đặc điểm đặc trưng
chọn ra như thế nào, nên không
đại diện cho tổng thể.
đại diện cho tổng thể.
Mỗi đơn vị được chọn ra phải là một cá nhân. Cá nhân chính là đối
tượng/ người trả lời.
Tập hợp mẫu là “cá nhân” khác gì với con số??
Số thì có thể có số nguyên và thập phân, người thì chỉ có số nguyên
- Nguyên tắc thống kê đòi hỏi một mẫu có giá trị khi mẫu đó có kích
thước đủ lớn( đủ cỡ mẫu) và mẫu đại diện cho dân số( n>=30)
- Mục tiêu chọn mẫu: phản ánh chính xác đặc điểm của tổng thể
- Không khẳng định, kết luận cho tổng thể nếu chọn mẫu không đúng,
mẫu không mang tính đại diện cho tổng thể( phi xác suất) mà chỉ đúng
với nhóm khách thể đã khảo sát. -
Tổng thể( population): là tập hợp các đối tượng có chung đặc điểm
mà chúng ta muốn áp dụng kết quả nghiên cứu. -
Mẫu( sample): Tập hợp những đối tượng được khảo sát có hệ thống
nhằm ước lượng đặc trưng của dân số đích - -
Khối dân cư mục tiêu: trong nghiên cứu cần có cùng một vấn đề
nhưng có nhiều nhóm khác nhau có thể cung cấp cho mình thông tin. -
Khối dân cư lấy mẫu: là khối dân cư từ đó một nhóm mẫu cụ thể được
chọn dựa trên khung mẫu. Về mặt thực nghiệm, khung mẫu chính là đại
diện tổng thể. VD: danh sách sinh viên của các trường thành viên
ĐHQG. Danh sách sinh viên lớp TKCKHXH 04 -
Khung mẫu( sampling frame): tập hợp của những đơn vị nghiên cứu hơn . trong dân số
- Ví dụ: Nghiên cứu về thực trạng về tình dục trước hôn nhân của sinh viên đại học quốc gia
- Khối dân cư mục tiêu: Chọn những nhóm có liên quan đến thực trạng trên: - SV( chủ thể)
- Phụ huynh( thái độ của PH giả sử nếu có chuyện đó, cách xử lý, cách
giáo dục của PH về TD, cách chia sẻ của PH với SV với các vấn đề trong cuộc sống)
- QLSV/ GVCN/ CVHT( thực trạng, tư vấn cho các bạn về tâm tư tình cảm)
- Chủ nhà nghỉ theo giờ/ khách sạn
- Bác sĩ phụ sản/ nhân viên y tế=> nơi nào, ai có thể hỗ trợ giải quyết -
Khối dân cư lấy mẫu: Sinh viên của các trường thành viên ĐHGQ -
Tổng thể: Toàn bộ 100.000 sinh viên đại học quốc gia - Mẫu: sinh viên -
Chọn mẫu: mẫu xác suất, phương pháp chọn mẫu ngẫu nhiên -
Dung lượng/ quy mô mẫu: 1000 sinh viên QU Q Á U TRÌNH Á TRÌNH CH C Ọ H N Ọ N MẪ M U Ẫ B2 là quan trọng nhất 2. 2. CÔ C N Ô G N G THỨ TH C Ứ C TÍ T N Í H N H QU Q Y U Y MÔ M Ô MẪ M U Ẫ : U
- Nếu tổng thể nhỏ và có thể biết được tổng thể thì dùng công thức sau:
- Trong đó: n là dung lượng mẫu, N là số lượng tổng thể, e là sai số tiêu chuẩn
- Trường Nhân Văn có 15000 SV, mức sai số mong muốn (e) là 1% (khả
năng mình chọn đúng là bao nhiêu %, độ tin cậy gần như tuyệt đối là 99%). Tính n?
- n= 15000(1+15000*0,01 bình)= 6000 - Nếu e= 5%=> n=?
- n= 15000(1+15000*0,055 bình)= 389,61=> nhưng đơn vị mẫu mới có khả năng
đại diện 95% cho tổng thể về mặt số lượng
- Thông thường chọn mức độ sai số 5%
- Thực tế có rất nhiều trường hợp sai số( di cư, du lịch..) - - 3. 3 PHƯ PH Ơ Ư N Ơ G N G PHÁ PH P Á P CH C Ọ H N Ọ N MẪ M U Ẫ : U
Chọn mẫu xác suất
Chọn mẫu phi xác suất
Ngẫu nhiên đơn giản( simple Lấy mẫu thuận random) tiện( convenience) Hệ thống( systematic)
Lấy mẫu phán đoán( judgment)
Phân tầng( stratified random)
Lấy mẫu tăng nhanh( viên tuyết lăn) Theo nhóm/ cụm( cluster) Lấy mẫu chi tiêu
3.1. Chọn mẫu xác suất:
3.1.1. Ngẫu nhiên đơn giản: - Ưu điểm:
+ Biết trước xác suất xuất hiện của các phần tử vào trong mẫu
+ Quá trình chọn mẫu tuân theo quy luật toán, không thể tự ý thay đổi
+ Các thông số của mẫu có thể dùng để ước lượng/ kiểm nghiệm
các thông số của tổng thể - Nhược điểm:
+ Trong nhiều trường hợp không mang tính khả thi vì không thể có
được danh sách tất cả các đối tượng liên hệ, hoặc nhà nghiên
cứu không đủ thời gian để tiếp cận các đối tượng khi họ phân tán
ở nhiều địa bàn cách xa nhau.
12 cung hoàng đạo. Mỗi dấu chấm đánh dấu sự bắt đầu cách nhau 30 độ.
Giao điểm của đường xích đạo và hoàng đạo xác định các phân điểm. VD
Bạch Dương và Thiên Bình.
- Phương pháp lấy mẫu mà mọi đơn vị lấy mẫu đều được chọn vào mẫu
nghiên cứu với xác xuất bằng nhau và độc lập với việc chọn đơn vị lấy mẫu khác.
- Ví dụ: Rút thăm, lô tô, bảng số ngẫu nhiên, tờ tiền, vé số, phần mềm,. .
3.1.2. Mẫu ngẫu nhiên hệ thống:
- Cứ phần tử thứ k tiếp sau phần tử đầu tiên được chọn ngẫu nhiên từ danh sách - ( bước nhảy) k= N/n
3.1.3. Mẫu phân tầng:
- Mẫu phân tầng: phải biết thông tin về tổng thể, phân biệt theo đặc tính,
xếp vào từng tầng khác nhau
- Ví dụ: chọn khảo sát Nhân văn, phân tầng theo giới tính( ¾ nữ và ¼ nam), diện cư trú( ⅓ thường trú, ⅔ tạm trú)
- Các cá thể trong mỗi tầng đều đồng nhất
- Có thể áp dụng chọn mẫu ngẫu nhiên hoặc mẫu hệ thống ở mỗi tầng
- Số mẫu mỗi tầng được chọn có thể bằng nhau hoặc tỷ lệ với nhau - Ưu điểm:
+ Đảm bảo mỗi nhóm đều có tính đại diện trong tổng mẫu
+ Các nhóm đều được so sánh và thống kê + Giảm sai số hệ thống - Hạn chế:
+ Yêu cầu thông tin chính xác về tỷ lệ giữa các tầng
+ Tốn kém chi phí để có được danh sách các tầng
3.1.4. Mẫu cụm/ Nhiều giai đoạn:
- Gần giống với mẫu phân tầng khác với phân tầng ở chỗ không có
khung mẫu cụ thể. “Cụm” là những khối dân cư không đồng nhất -
Việc chọn những nhóm các đơn vị nghiên cứu( các cụm) thay cho việc
chọn các nhân những đơn vị nghiên cứu được gọi là mẫu cụm. Các cụm
thường là những đơn vị địa lý( như, các huyện, các làng) hoặc những
đơn vị tổ chức( như, các phòng khám, những nhóm đào tạo).
- Chọn mẫu cụm theo 2 bước:
- Chọn cụm/ chọn cá thể trong cụm
- Chọn mẫu cụm nhiều bước( giai đoạn)
- Ví dụ: Để lấy danh sách 15000 SV thì khó và số lượng nhiều quá, NNC
tiến hành chọn mẫu cụm: liệt kê danh sách 30 khoa bộ môn( có thể lấy
thông tin trên website), chọn ngẫu nhiên đơn giản/ hệ thống mấy khoa/
bộ môn, từ đó chọn tiếp lớp đại diện của mỗi khoa. Sau đó xin danh
sách cụ thể của lớp đó( khung mẫu cụ thể). Cách này thường được sử dụng nhất. - Ưu điểm: + Chi phí thấp
+ Không yêu cầu danh sách của cả tổng thể, chỉ cần danh sách cụm, tiểu cụm
+ Sử dụng khi tổng thể quá lớn - Hạn chế: + Sai số lớn hơn
3.2. Chọn mẫu phi xác suất:
- Nhà nghiên cứu chọn các phần tử vào mẫu không theo quy luật ngẫu
nhiên, các phần tử không có cơ hội ngang nhau trong việc được lựa chọn
- Không biết xác xuất hiện của các phần tử
- Chọn mẫu tùy thuộc vào nhà nghiên cứu
- Mẫu phi xác suất( mang tính chủ quan của nhà nghiên cứu) dùng nhiều
trong nghiên cứu định tính, phản ánh chiều sâu của vấn đề( vấn đề NC
nhạy cảm, riêng tư), thường là khởi điểm cho 1 nghiên cứu khác( khai phá)
- Ví dụ đến siêu thị phỏng vấn các bà nội trợ về chi tiêu hàng ngày cho lương thực
- Nhược điểm: Việc chọn mẫu phải dựa vào kỹ năng của nhà nghiên cứu
hay của nhân viên chọn mẫu. -
Mẫu thuận tiện: Chọn phần tử dựa trên sự thuận tiện, dễ tiếp cận, dễ
lấy thông tin. VD: phỏng vấn các bà nội trợ tại các siêu thị để tìm hiểu về
hành vi tiêu dùng của người nội trợ -
Mẫu phán đoán: Nhà nghiên cứu tự phán đoán sự thích hợp của các
phần tử để mời họ tham gia vào mẫu. Đặc điểm giống như chọn mẫu
thuận tiện, nếu khả năng/ kinh nghiệm phán đoán tốt sẽ cho mẫu tốt hơn thuận tiện. -
Mẫu chỉ tiêu: ấn định số lượng, tiêu chí chọn mẫu -
Mẫu tăng nhanh/ viên tuyết lăn: người trả lời đồng thời là người tìm
người trả lời tiếp theo, nghiên cứu nhạy cảm, khó tiếp cận mẫu. ★ 14/12/2022 THANG TH ANG ĐO Đ : O -
Thang đo hay còn gọi là cấp độ đo( levels of measurement) là cách thức
chúng ta đo lường
hay nói cách khác là đặt câu hỏi- đáp án
- Thang đo là khái niệm quan trọng trong tiến thu thập và phân tích dữ liệu
- Một câu hỏi có thu thập thông tin được hiệu quả hay không phụ thuộc rất nhiều vào thang đo
- Tương ứng với hai loại biến định tính và định lượng, có 2 loại thang đo chính:
+ Thang đo biến số chữ [định tính] ( bao gồm thang đo danh nghĩa và thang đo thứ bậc)
+ Thang đo biến số số [định lượng] ( bao gồm thang đo khoảng cách và thang đo tỉ lệ)
Thang đo danh nghĩa( nominal scale)
- Một biến được xác định bởi thang đo danh nghĩa gồm hệ thống các chỉ
báo khác nhau biểu thị thuộc tính hay tính chất của biến đó
- Các chỉ báo này có tính chất ngang nhau và không theo một thứ tự nào
- Một thang đo danh nghĩa phải có 2 chỉ báo( giá trị) trở lên
Giới tính Tình trạng hôn nhân Nơi đến của anh chị?
1. Nam 1. Độc thân 1. TP HCM 2. Nữ 2. Có vợ/ chồng 2.Hà Nội 3.Ly thân 3.Khác 4.Ly dị 5.Góa
Thang đo thứ bậc( ordinal scale)
- Là thang đo danh nghĩa nhưng các chỉ báo hay các phương án trả lời
được sắp xếp theo một trật tự nhất định
- Nói một cách khác, giữa các chỉ báo này có quan hệ thứ bậc hơn kém,
nhưng thường thì mức độ hơn kém giữa chúng không xác định được
Ví dụ: Thu nhập trung bình hàng tháng Kinh tế so với 5 năm trước
1.Dưới 500 ngàn 1. Khá hơn rất nhiều
2.Từ 500 ngàn đến dưới 1 triệu 2.Khá hơn chút đỉnh
3.Từ 1 triệu đến dưới 2 triệu 3.Cũng vậy
4.Từ 2 triệu đến dưới 3 triệu 4.Tệ hơn chút đỉnh 5.Từ 3 triệu trở lên 5.Tệ hơn nhiều
- Thang đo thứ bậc( ordinal scale) đo lường những dữ liệu được sắp xếp
theo thứ tự, chẳng hạn như thứ bậc của sinh viên trong lớp học là thứ
nhất, thứ hai, thứ ba và thứ tư tùy thuộc vào điểm trung bình học tập
của họ. Tuy nhiên, giá trị thực tế hoặc giá trị tương đối của các thành
phần hay sự khác biệt trong giá trị của các thành phần không thể được
đánh giá. Ví dụ, thứ hạng của các học sinh trong lớp không nói lên điểm
trung bình cụ thể của họ.
Thang đo khoảng cách( interval scale)
- Là thang đo có đầy đủ tính chất của một thang đo danh nghĩa và thứ
bậc, nhưng khoảng cách giữa các chỉ số được xác định một cách cụ thể và đều nhau
- Đối với loại thang đo này ta có thể sử dụng một số các phép tính toán
học như tính trung bình hay tính toán tỉ lệ chênh lệch giữa các chỉ số
- Điểm “không” của thang đo này là tùy ý
- Phát biểu “Những người có học vấn cao sẽ có thu nhập cao” 1 2 3 4 5 6 7 Rất không rất đồng ý đồng ý
- Thang đo này thường được sử dụng nhiều cho các phân tích chuyên
sâu về định lượng như: Phân tích nhân tố( EFA) hoặc Hồi quy tuyến tính.
Thang đo tỉ lệ( ratio scale)
- Một thang đo tỉ lệ có tất cả những phẩm chất của những loại thang đo
trước. Ngoài ra thang đo này có một giá trị 0 “thực”. Số 0 có thực.
- Thu nhập trung bình hàng tháng: 5.000.000 - Năm sinh:. . - Nơi đi:. . - Điểm đến:. .
- Đây là thang đo dùng để khai thác dữ liệu theo cách cụ thể nhất
- Đối với các nghiên cứu KHXH, thang đo này thường được xử lý câu trả
lời trước khi tiến hành phân tích dữ liệu MỘT SỐ BÀI TẬP MỘ M T Ộ S T Ố S Ố VẤ V N Ấ N ĐỀ Đ Ề CẦ C N Ầ N LƯU LƯ U Ý Ý TR T O R N O G N G VI V Ệ I C Ệ C XÂ X Y Â Y DỰ D N Ự G N G TH T A H N A G N G ĐO Đ : O
- Tránh thu thập những thông tin quá riêng tư của người trả lời
- Phương án trả lời không bao phủ câu hỏi - Thang đo lặp lại
- Thang đo khoảng cách không rõ 1.1 KH K ÁI H N ÁI I N Ệ I M Ệ : M
- Thống kê mô tả là phương pháp liên quan đến việc tổ chức, tổng
hợp và trình bày số liệu thu thập được từ mẫu nghiên cứu hoặc tổng thể
- Một trong những lý do chính sử dụng phương pháp thống kê là
để tổng hợp và mô tả dữ liệu, làm cho thông tin được trình bày rõ ràng hơn
- Thống kê mô tả được chia thành đo lường xu hướng tập trung và
đo lường biến động. Đo lường xu hướng tập trung có giá trị
trung bình
, trung vị và yếu vị, trong khi các đo lường biến
động gồm độ lệch chuẩn, phương sai, giá trị nhỏ nhất và giá trị
lớn nhất, độ nhạy và độ lệch. Đo Đ olườ l n ườ g n gtr t o r n o g n gth t ố h n ố g n gkê k êmô m ôtả t
- Biến Định lượng:
+ Đo lường độ tập trung: Trung bình( Mean), trung vị( medium) và yếu vị( mode).
+ Đo lường độ phân tán: Khoảng( Range), phương sai( Variance) và
độ lệch chuẩn( Standard devitation).
- Biến Định tính: + Tần số( frequency)
+ Tỷ lệ( proportion/ percentage)
+ Đo lường độ phân tản: Giá trị IQV - Dữ liệu thô: 2. PHƯ PH Ơ Ư N Ơ G N G PHÁ PH P Á P TH T Ố H N Ố G N G KÊ K Ê MÔ M Ô TẢ T Ả DƯ D Ớ Ư I Ớ I DẠ D N Ạ G N G BẢ B N Ả G N : G
- Bảng Phân phối tần suất liên hệ:
- 1 bảng trình số lần xuất hiện của một hay nhiều giá trị được quan sát
trong mẫu hoặc tổng thể
- Các kiểu phân phối tần suất + Thô( raw)
+ Liên hệ(relative): tỉ lệ( proportion) và phần trăm( percent) + Lũy tiền( cumulative)
- Một số ký hiệu sử dụng trong tính toán phân phối tần suất
+ n= tổng số mẫu quan sát + X= biến
+ i= giá trị( thành phần) của biến X
+ fi= tần suất quan sát của giá trị i
2.1. Bảng phân phối tần suất thô
2.2. Bảng phân phối tần suất liên hệ
2.3. Bảng phân phối tần suất lũy tiền ★ 21/12/2022
2.1. Bảng phân phối tần suất thô
2.2. Bảng phân phối tần suất liên hệ
2.3. Bảng phân phối tần suất lũy tiền 3. 3 BẢNG BẢNG PHÂN P PH H ÂN P Ố H I Ố I TẦ T N Ầ N SU S Ấ U T Ấ T CH C O H O TH T A H N A G N G ĐO Đ O TH T Ứ H Ứ BẬ B C Ậ : C 4. BẢNG G PHÂN PH PHỐ ÂN I PHỐ I TẦN TẦ N SU S Ấ U T Ấ T CH C O H O TH T A H N A G N G ĐO Đ O KH K O H Ả O N Ả G N G CÁ C C Á H C - H -TỶ T Ỷ LỆ L 5. 5 PHƯ PH Ơ Ư N Ơ G N G PHÁ PH P Á P PH P Â H N Â N TỔ T Ổ DỮ D Ữ LIỆ LI U Ệ
- Khi phân tổ dữ liệu, tùy theo mục đích thể hiện dữ liệu cũng như phân
bố đều đặn hay không đều đặn của dữ liệu mà có thể tiến hành phân tổ
đều hoặc phân tổ không đều.
- Khái niệm đều hoặc không đều liên quan đến khái niệm khoảng cách của tổ
- Chênh lệch giữa giới hạn dưới và giới hạn trên là trị số khoảng cách tổ
5.1. Các bước phân tổ
- Xác định số tổ cần chia: k
Không có một con số quy định chính xác con số cần chia( k) là bao
nhiêu, nhưng theo kinh nghiệm người ta thấy nên chia trong khoảng từ 5 đến dưới 15 tổ
Với n là số quan sát của tập dữ liệu, ta có công thức:
- Xác định trị số khoảng cách tổ: h