Bài Tập Thống Kê Chương 5 - Chọn mẫu - Phỏng đinh trị số dân số (K47 2022) - Tài liệu tham khảo | Đại học Hoa Sen

Bài Tập Thống Kê Chương 5 - Chọn mẫu - Phỏng đinh trị số dân số (K47 2022) - Tài liệu tham khảo | Đại học Hoa Sen và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả

Th y Lý Minh Tiên. Bài t p Th n mống kê Chương 5. Chọ u Phỏng định tr s dân s (gi SV K47 Tháng 5/2022) Trang.1
HP Th ng D ng Trong Nghiên C u Khoa H c Xã H i (3TC) ng Kê
SV TLHGD K47 (năm 1), Khoa Tâm Lý học, ĐHSP TP HCM
GV ph trách: ThS. Lý Minh Tiên
Ngày g i bài: 02 5/2022 /0
TÓM T T BÀI H C & BÀI T P RÈN LUY N
CHN MU, PHỎNG ĐỊNH TR S DÂN S
Tóm t t n th kiế c
A. CÁC PHƯƠNG PHÁP CH N M U
Sinh viên đọc trong tài liu các m c sau:
I. Vì sao ph i ch n m u?
Do dân s quá l n nhân l c, tài l c, th i gian, vv.. c a nhóm NCKH không th thu
thp d ki n trên toàn dân s . Ngoài ra th b m t d ki n ho c sai sót khi nh p vào
máy tính do ph i x lý quá nhi u d n. ki
Ngày nay nh k t ch n m u phát tri n, có nhi n trong m t dân s thu ều phương pháp chọ
nh, v a hay ch n m u xuyên các qu c gia, nên th c m u chọn đư đạt các tr s m u
đại din cho dân s.
II. Nguyên t c chung khi ch n m u
Có nhiu nguyên t theo khi ch n m n chú ý hai nguyên t c: c phi tuân u, trong đó cầ
a) Tính khách quan: Nh ng ch u hoàn toàn theo l th dược đưa vào m ối tư, không
theo ý mun c quan c i nghiên c u. a ch ủa ngườ
b) B m xác su u khi chảo đả ất đồng đề n. M n t n b ng nhau. i ph cơ hội được ch
Nếu tuân theo đúng hai nguyên tắc trên, mu được ch n s i di n cho dân s v đạ ới đặc
tính c c tính c a dân s . a mẫu không khác gì đặ
III. Sai s chn mu và sai s không do ch n m u
1. Sai s n m ch u là lo i sai s x y ra do ta ch ch n 1 mu để thu th p d ki n ph c v
nghiên c u mà không th n trên toàn dân s . c hi
Sai s này g n li n v i vi c ch n m u, v i b n thân cu c nghiên c g ng ứu, cho đã cố
tha mãn tối đa các điều ki n khi n m u. ch
2. Sai s không do ch n m u loi sai s ph i ch do u các đáp ng ca ch th thay
đổi (mt m i, lãng tránh tr l i, c ý tr l i sai khi ch n u t nh ), ạm đế ức, điề ế ch th
tr l i do thiên v , hoc hiu không u câu hđúng yêu cầ i, vv Sai s này x y ra
chn toàn dân s .
Hai lo i sai s này cùng t n t i. Có th áp d ng m t s bi n pháp gi m các sai s này. Thí
d: gi m sai sĐể do chn m u, nên ch n c m u càng l n càng t t (nếu có th). Để gim
sai s không do ch n m u, c n xây d ng dàn bài (bám sát m c tiêu), so n th t c n th n
các câu h i trong phi u kh o sát (questionnaires). N u c nghi m (test) ph i tuân th ế ế tr eo
đúng, đầy đủ các bước trong k thut son test).
IV. M t s phương pháp chn mu thông dng
nhi n m u t n ph c t p. ng h p n ều phương pháp chọ đơn giản đế trườ ch
mu đại di n (theo xác su n m u phi xác su t s t) ch t. Dưới đây mộ phương pháp
chn m n d áp d ng trong ph m vi dân s không quá l n. ẫu đại di
Th y Lý Minh Tiên. Bài t p Th n mống kê Chương 5. Chọ u Phỏng định tr s dân s (gi SV K47 Tháng 5/2022) Trang.2
1. Ch u ng n m ẫu nhiên đơn gin:
a. Rút thăm.
b. Dùng b ng s u nhiên trong sách toán th ng kê. ng
c. Dùng hàm ng các u nhiên (trong phn m m máy tính). Ví d EXCEL.
Hiện nay để tin li, nên dùng cách c/ Hàm ng u nhiên trong EXCEL . S dng
hàm RANDBEETWEN(bottom, top).
Danh sách dân s t s p nh t n h t dân s được đánh số th (s Bottom) đế ế (s
Top). S b u (th p nh t đ ất) được chn tùy ý, thích h p v i quy mô N trong dân s .
Thí d i, nên dùng 4 ch s , b u tùy ý, có th s 1357 cho N = 3758 ngườ ắt đầ là
người đầ o đếu tiên trong danh sách, tiếp tc 1358, 1359, vv.. ch n 5115 cui danh sách.
Khi cn c m u = n thì dùng n s do hàm ng u nhiên nói trên cung c p (dùng l nh copy).
2. Ch u theo h n m thng:
Theo cách này, trước hết các phn t được xếp trong danh sách theo mt trt t định
trước. Gi s trong dân s có N phn t và ta mun chn ra 1 mu c n.
T l n m u là
ch
n
N
. Ta tìm sao cho mt s nguyên dương K
n
N
1
K
. .
Sau đó bắt đầu t mt phn t bt k trong danh sách, c K ph n t thì ch n mt để đưa
vào m u. Ti p t c ch n khi h t danh sách. ế ọn cho đế ế
3. Ch l theo t n m u t ng lp:
Dân s u t ng l p, m ng có N ph n t . N được chia ra nhi i t
h
T l m ng l p trong dân s là: W = N i t
h h
/ N.
N
ếu ch n m u c n có t l m i t ng l p gi trong dân s thì = ống như W
h
=
N
h
N
=
n
h
n
Suy ra trong m ng l p c n ch n c m u là
i t n
h
= n
N
h
N
.
V. n mCh u theo nhóm (cùng c )
Vi l i ch n ng u nhiên, các ph n t i vào cu nghiên c u s r i rác trong dân được m c
s ho c trong các t ng l gây ng i khi dân s là khá l ớp. Điều đó tr n ( dthí c thành ph
hay m t khu v c g m nhi u t nh, thành). Khi thu th p d ki n ph i m t nhi u nhân l c,
thi gian gp h.
Để khc ph i ta dục, ngườ a vào tính ch n có trong tất “nhóm” v chc hành chính, trưng
hc, ví d : h p h c, tgia đình, lớ s n xu vv.. t,
Đơn vị chn bây gi không theo cá nhân mà theo nhóm .
Trong thc tế, các nhóm thường không đồng c.
Để n, chđơn giả ng h ng cxét trườ ợp nhóm đồ hoc gần như đồng c .
d l p h c, s h c sinh m i l ng không b p x : p thườ ằng nhau, nhưng cũng xấ ch
không chênh nhau nhi u (ví d l p 40, l p 38, l số ớp 41,...), do đó thể áp
dụng nhóm đồng c - . đơn vị chn là lp hc
Phương p các phương pháp chọháp chn mu theo nhóm cũng áp dng ging như n tng
cá nhân đã nói ở trên, ch khác đơn vị ọn là nhóm đã xác đị ch nh.
Th y Lý Minh Tiên. Bài t p Th n mống kê Chương 5. Chọ u Phỏng định tr s dân s (gi SV K47 Tháng 5/2022) Trang.3
BÀI TP CHN MU:
Bài 1: M t tr ng m u giáo 390 cháu, t ng c a 13 l p (g m 4 l p m m, 5 l p ch i, 4 ườ
lp coi m i l p va đúng 30 cháu). Ta mu n ch n ra m t m u 60 cháu đại din
cho c c nghi 3 kh m, Ch làm m t thi M i, Lá để m.
Hi có th chn theo nh ng cách nào?
Bài 2: M đt nhà nghiên cu dùng trc nghim để o trí nh hình nh c a tr mu giáo
thuc 2 l p B (có 40 cháu) Lá E (có 35 cháu). Do yêu c u c a cu c nghiên c u, ch
chn ra m i l p 15 cháu. H i ph i làm nh nào c hai m u i di n cho hai ư thế để đượ đạ
lp Lá B v ? à Lá E
B. PHNG ĐỊNH TR S DÂN S
* Nhu c u ph ỏng định tr s dân s :
Khi chn mu để thc hi n nghiên c u khoa h c, chúng ta ch chn m t ph n c a
dân s nên các tr s m c ch ẫu thu đượ các s ng (statistics) trên m u hi n th .
Không bi . ết được các tr s dân s (parameters)
Trong nhi ng h i nghiên c u c n bi n tr s dân s . Thí d : Chi u ều trườ ợp, ngườ ết đế
cao trung bình c a dân s i Vi t hi n nay là bao nhiêu? So v ngườ ới cách đây 30 năm (giữa
2 th h cha m và con cái c ), chi ế a h ều cao này có tăng lên không?
Do đó vic dùng tr s m ng) tr s dân s ẫu để phỏng định (ước lượ nhu cu
thc tế trong thng kê.
I. Hai cách phỏng định
1. Điể ỏng địm ph nh
Dùng điểm ph nh, ta . ỏng đị ly tr s m u gán cho tr s dân s
Thí d nh trung bình dân s phỏng đị : điểm trung nh bài thi toán ca mu HS lp
10 trường A, 𝑋
= 8.3. N m ph nh thì trung bình c a dân s HS kh i l p ếu dùng điể ỏng đị
10 trường A là: µ = 𝑋
8.3. =
Trườ ng hp t l dân s cũng tương tự: Gi s t l HS đạt điểm thi Toán t 8 đến 10
mu nói trên là 30%. Suy ra ph nh t l % dân s HS kh m t 8 ỏng đị ối 10 trường A đạt điể
tr lên là p = 30%.
2. Kho ng ph ỏng định
Dùng điể ỏng định nhược điểm ph m là thiếu chính xác, vi mt tr s mu thu
được trong cuc nghiên cu thì hiu s 𝑋
- µ > 0, ho c
𝑋
𝑛
- p > 0.
Gii thích: V lý thuy t, khi ch n 1 m u c = n t m t dân s có N ph n t thì s m u có ế
th chn tính theo công th c gi i tích t h p là: 𝐶
𝑁
𝑛
=
𝑁!
𝑛! 𝑁−𝑛
( )
!
nghĩa số mu cùng
nhiều. Trong đó chmt s mu (chiếm t l % bé) cho ra các tr s mu = tr s dân s,
các mu còn l cho tr s m u l s dân s . i (chiếm đa số) s ớn hơn hay bé hơn trị
Do vậy, thườ ỏng địng dùng khong ph nh.
Khong ph nh ỏng đị mt kho ng m s điể ngườ ứu đưa rai nghiên c , hy v ng
tr s dân s rơi vào khoả ất tin tưởng định trưng này vi mc xác su c (còn g ọi là độ
tin cy ).
Thông t ng ch n = 95% ho c 99%. hườ
Th y Lý Minh Tiên. Bài t p Th n mống kê Chương 5. Chọ u Phỏng định tr s dân s (gi SV K47 Tháng 5/2022) Trang.4
Công thc chung c a kho ng ph nh: ỏng đị
Tr s mu dân s- < Tr s
< Tr s m u +
II. Phỏng định trung bình dân s
1. n (n 30). Trường h p m u l
Phân b xác su a dân s trung bình m u: . t c phân b Z
Công thc kho ng ph nh: ỏng đị
𝝁 = 𝑿
± 𝒁
𝒔
𝒏
Tr s Z đọc trong bng Z v y . ới độ tin c
2. u nh (n < 30). Trường h p m
Phân b xác su a dân s trung bình m u: . t c phân b t
Công thc kho ng ph nh: ỏng đị
𝝁 = 𝑿
± 𝒕
𝒔
𝒏
Tr s t đọc trong b ng t v t do df = n 1 và xác su = 100% - (two-tailed). ới độ t
III. Phỏng định t l dân s
Vi s t l , khi xem xét c ác trường h p hai bi u hi n nh : Có/Không, ư Trúng
tuyn/Không, vv.. phân b x dân s t l m u ng là ph nh ác su a t c thườ ân b thc.
Vì s ng i khi t xác su t c a phân b ng kê cho ph xem m t ph tr ính nh thc ên n th ép ân
b nh thc là phân b g ng (phân b ần như bình thườ Z) khi th u ki n sau: ỏa các điề
- D có N r n. ân s t l
- M u n l ng > 100). ch à lớn (n thườ
- T l p không quá g n 0 ho c 1.
Vi ph n m th ng nh ó th yêu c u ki m ch ng phân b m s m x ư SPSS, ta c điể
thu th t ình thp có th u ki n cđược a đi a m phân b b ưng hay không.
Trong điều ki n tính toán công, các nhà th ng k ngh quy t u ki n áp th ê đề c kiểm tra điề
dng phân b p) > 15. Z như sau: n * p và n * (1
Công thc kho ng ph nh: ỏng đị
𝑝 =
𝑋
𝑛
± 𝑍
𝑋
𝑛
(1
𝑋
𝑛
)
𝑛
X/n = t l m u. Tr s c trong b ng Z v y . Z đọ ới độ tin c
Bài t p rèn luy n
Bài tp v ng ph kho ỏng định cho trung bình dân s và t l dân s
1. Tìm kho ng ph nh cho µ v y 95%. Bi ỏng đ ới độ tin c ết 𝑋
= 70.4, s = 5 và n= 36.
2. Tìm kho ng ph nh cho µ v y 95%. Bi ỏng đ ới độ tin c ết 𝑋
= 84.2, s = 7.3 và n= 40.
3. Tìm kho ng ph nh cho µ v y 99%. Bi ỏng đ ới độ tin c ết 𝑋
= 98.6, s = 2 và n= 100.
Th y Lý Minh Tiên. Bài t p Th n mống kê Chương 5. Chọ u Phỏng định tr s dân s (gi SV K47 Tháng 5/2022) Trang.5
4. Trong 1 nghiên c u v s d ng th i gian, m t m i qu c ch n ng u ẫu 20 ngườ n đượ
nhiên dành trung bình 2.4 gi m i ngày cho th t c gi y t l ch tiêu chu n 1.3 đã ờ, độ
gi. Hãy l p kho ng ph nh v tin c y 95% cho trung bình th ỏng đị ới độ i gian th t c gi y
t c a dân s nhà qu n lý.
5. a tác gi c h n gi (tính b ng ms) cho 25 cu n khác đĩa y tính củ đã đượ c gọi đế
nhau. Trung nh và đ lch tiêu chun ca mu đưc tính ra, theo th t200.45 ms và
0.24 ms. Hãy l p kho ng ph nh v tin c y 99% cho trung bình c a dân s nh ng ỏng đị ới đ
ln g y. i như vậ
6. Ch n m t m u ng calo c a 24 chai bia , l ch tiêu chu n hàm lượ nhẹ” trung bình độ
được tìm thy l t là 107.3 calories và 3.9 calories. Hãy lần lượ p khong ph nh v ỏng đị ới độ
tin cậy 98% cho trung bình hàm lượng calo ca dân s các chai bia như trên.
7. Hãy tìm kho ng ph nh cho t l dân s p v tin c y 95%, bi t n = 900, X = ỏng đị ới độ ế
400.
8. M u ch n ng ng h p t vong do tai n n t nhà tìm th y 180 trong ẫu nhiên 650 trườ i
s đó nguyên nhân do té ngã. ỏng đị ới độHãy lp khong ph nh v tin cy 95% cho t l
dân s nh ng h p t vong t ững trườ i nhà có nguyên nhân do té ngã.
9. Kh o sát m i l n cho k t qu i nói r ng an ninh ột nhóm 1998 ngườ ế 53% ngườ
mt khía c nh quan tr ng c a ti n b c. T m u d ki n này, hãy l p kho ng ph nh ỏng đị
với độ tin c y 95% cho t l % ca toàn dân s n. người l
HT
| 1/5

Preview text:

HP Thng Kê ng Dng Trong Nghiên Cu Khoa Hc Xã Hi (3TC)
SV TLHGD K47 (năm 1), Khoa Tâm Lý học, ĐHSP TP HCM
GV ph
trách: ThS. Lý Minh Tiên
Ngày g
i bài: 02/05/2022
TÓM TT BÀI HC & BÀI TP RÈN LUYN
CHN MU, PHỎNG ĐỊNH TR S DÂN S
Tóm t
t kiến thc
A. CÁC PHƯƠNG PHÁP CHN MU
Sinh viên đọc trong tài liệu các mục sau:
I. Vì sao phi chn mu?
Do dân số quá lớn mà nhân lực, tài lực, thời gian, vv.. của nhóm NCKH không thể thu
thập dữ kiện trên toàn dân số. Ngoài ra có thể bị mất dữ kiện hoặc sai sót khi nhập vào
máy tính do phải xử lý quá nhiều dữ kiện.
Ngày nay nhờ kỹ thuật chọn mẫu phát triển, có nhiều phương pháp chọn trong một dân số
nhỏ, vừa hay chọn mẫu xuyên các quốc gia, nên có thể chọn được mẫu đạt các trị số mẫu đại diện cho dân số.
II. Nguyên tc chung khi chn mu
Có nhiều nguyên tắc phải tuân theo khi chọn mẫu, trong đó cần chú ý hai nguyên tắc:
a) Tính khách quan: Những chủ thể dược đưa vào mẫu hoàn toàn theo lối vô tư, không
theo ý muốn của chủ quan của người nghiên cứu.
b) Bảo đảm xác suất đồng đều khi chn. Mỗi phần tử có cơ hội được chọn bằng nhau.
Nếu tuân theo đúng hai nguyên tắc trên, mẫu được chọn sẽ đại diện cho dân số với đặc
tính của mẫu không khác gì đặc tính của dân số.
III. Sai s chn mu và sai s không do chn mu
1. Sai s chn mu là loại sai số xảy ra do ta ch chn 1 mu để thu thập dữ kiện phục vụ
nghiên cứu mà không thực hiện trên toàn dân số.
Sai số này gắn liền với việc chọn mẫu, với bản thân cuộc nghiên cứu, cho dù đã cố gắng
thỏa mãn tối đa các điều kiện khi chọn mẫu.
2. Sai s không do chn mu là loại sai số phải chịu do các đáp ứng ca ch th thay
đổi (mệt mỏi, lãng tránh trả lời, cố ý trả lời sai khi chạm đến ký ức, điều tế nhị), chủ thể
tr li do thiên vị, hoặc hiu không đúng yêu cầu câu hi, vv… Sai số này xảy ra dù chọn toàn dân số.
Hai loại sai số này cùng tồn tại. Có thể áp dụng một số biện pháp giảm các sai số này. Thí
dụ: Để giảm sai số do chọn mẫu, nên chọn cỡ mẫu càng lớn càng tốt (nếu có thể). Để giảm
sai số không do chọn mẫu, cần xây dựng dàn bài (bám sát mục tiêu), soạn thật cẩn thận
các câu hỏi trong phiếu khảo sát (questionnaires). Nếu là trắc nghiệm (test) phải tuân theo
đúng, đầy đủ các bước trong kỹ thuật soạn test).
IV. Mt s phương pháp chọn mu thông dng
Có nhiều phương pháp chọn mẫu từ đơn giản đến phức tạp. Có trường hợp chọn
mẫu đại diện (theo xác suất
) và chọn mẫu phi xác suất. Dưới đây là một số phương pháp
chọn mẫu đại diện dễ áp dụng trong phạm vi dân số không quá lớn.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.1
1. Chn mu ngẫu nhiên đơn giản : a. Rút thăm.
b. Dùng bảng số ngẫu nhiên trong sách toán thống kê.
c. Dùng hàm ngẫu nhiên (trong các phần mềm máy tính). Ví dụ EXCEL.
Hiện nay để tiện lợi, nên dùng cách c/ Hàm ngu nhiên trong EXCEL. Sử dụng
hàm RANDBEETWEN(bottom, top).
Danh sách dân số được đánh số từ số thấp nhất (số Bottom) đến hết dân số (số Top). Số bắt ầ
đ u (thấp nhất) được chọn tùy ý, thích hợp với quy mô N trong dân số.
Thí dụ có N = 3758 người, nên dùng 4 chữ số, bắt đầu tùy ý, có thể là số 1357 cho
người đầu tiên trong danh sách, tiếp tục 1358, 1359, vv.. cho đến 5115 là cuối danh sách.
Khi cần cỡ mẫu = n thì dùng n số do hàm ngẫu nhiên nói trên cung cấp (dùng lệnh copy).
2. Chn mu theo h thng :
Theo cách này, trước hết các phần tử được xếp trong danh sách theo một trật tự định
trước. Giả sử trong dân số có N phần tử và ta muốn chọn ra 1 mẫu cỡ n. n n Tỉ lệ chọn mẫu là ≈ 1
N . Ta tìm mt s nguyên dương K sao cho N K . .
Sau đó bắt đầu từ một phần tử bất kỳ trong danh sách, c K phn t thì chn mt để đưa
vào mẫu. Tiếp tục chọn cho đến khi hết danh sách.
3. Chn mu t l theo tng lp:
Dân số N được chia ra nhiều tầng lớp, mỗi tầng có Nh phần tử.
Tỉ lệ mỗi tầng lớp trong dân số là: Wh = Nh / N .
Nếu chọn mẫu cỡ = n có tỉ lệ mỗi tầng lớp giống như trong dân số thì Wh = Nh = nh N n
Suy ra trong mỗi tầng lớp cần chọn cỡ mẫu là nh = n ∗ Nh N .
V. Chn mu theo nhóm (cùng c)
Với lối chọn ngẫu nhiên, các phần tử được mời vào cuộc nghiên cứu sẽ ở rải rác trong dân
số hoặc trong các tầng lớp. Điều đó gây trở ngại khi dân số là khá lớn (th í dụ cả thành phố
hay một khu vực gồm nhiều tỉnh, thành). Khi thu thập dữ kiện phải mất nhiều nhân lực, thời gian gặp họ.
Để khắc phục, người ta dựa vào tính chất “nhóm” vốn có trong tổ chức hành chính, trường
học, ví dụ : hộ gia đình, lớp học, tổ sản xuất, vv..
Đơn vị chn bây gi không theo cá nhân mà là t heo nhóm.
Trong thực tế, các nhóm thường không đồng cỡ.
Để đơn giản, chỉ xét trường hợp nhóm đồng cỡ hoặc gần như đồng cỡ.
Ví dụ: Ở lớp học, số học sinh mỗi lớp thường không bằng nhau, nhưng cũng xấp xỉ chứ
không chênh nhau nhiều (ví dụ sĩ số có lớp 40, có lớp 38, có lớp 41,...), do đó có thể áp
dụng nhóm đồng cỡ - đơn vị chn là lp hc.
Phương pháp chọn mẫu theo nhóm cũng áp dụng giống như các phương pháp chọn từng
cá nhân đã nói ở trên, chỉ khác ở đơn vị chọn là nhóm đã xác định.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.2
BÀI TP CHN MU:
Bài 1: Một trường mẫu giáo có 390 cháu, tổng của 13 lớp (gồm 4 lớp mầm, 5 lớp chồi, 4
lớp lá và coi mỗi lớp vừa đúng 30 cháu). Ta muốn chọn ra một mẫu có 60 cháu đại diện
cho cả 3 khối Mầm, Chồi, Lá để làm một thực nghiệm.
Hỏi có thể chọn theo những cách nào?
Bài 2: Một nhà nghiên cứu dùng trắc nghiệm để đo trí nhớ hình ảnh của trẻ mẫu giáo
thuộc 2 lớp Lá B (có 40 cháu) và Lá E (có 35 cháu). Do yêu cầu của cuộc nghiên cứu, chỉ
chọn ra mỗi lớp 15 cháu. Hỏi phải làm như thế nào để có được hai mẫu đại diện cho hai lớp Lá B và Lá E?
B. PHNG ĐỊNH TR S DÂN S
* Nhu cu phỏng định tr s dân s:
Khi chn mu để thực hiện nghiên cứu khoa học, chúng ta chỉ chọn một phần của
dân số nên các trị số mẫu thu được chỉ là các s thng kê (statistics) trên mu hin có.
Không biết được các tr s dân s (parameters).
Trong nhiều trường hợp, người nghiên cứu cần biết đến trị số dân số. Thí dụ: Chiều
cao trung bình của dân số người Việt hiện nay là bao nhiêu? So với cách đây 30 năm (giữa
2 thế hệ cha mẹ và con cái của họ), chiều cao này có tăng lên không?
Do đó việc dùng tr s mẫu để phỏng định (ước lượng) tr s dân số là nhu cầu
thực tế trong thống kê.
I. Hai cách phỏng định
1. Điểm phỏng định
Dùng điểm phỏng định, ta ly tr s mu gán cho tr s dân số.
Thí d phỏng định trung bình dân số: Có điểm trung bình bài thi toán của mẫu HS lớp
10 trường A, 𝑋 = 8.3. Nếu dùng điểm phỏng định thì trung bình của dân số HS khối lớp
10 trường A là: µ = 𝑋 = 8.3.
Trường hp t l dân s cũng tương tự: Giả sử tỉ lệ HS đạt điểm thi Toán từ 8 đến 10 ở
mẫu nói trên là 30%. Suy ra phỏng định tỉ lệ % dân số HS khối 10 trường A đạt điểm từ 8 trở lên là p = 30%.
2. Khong phỏng định
Dùng điểm phỏng định có nhược điểm là thiếu chính xác, vì với một trị số mẫu thu
được trong cuộc nghiên cứu thì hiệu số 𝑋 - µ > 0, hoặc  𝑋 - p > 0. 𝑛
Gii thích: Về lý thuyết, khi chọn 1 mẫu cỡ = n từ một dân số có N phần tử thì số mẫu có
thể chọn tính theo công thức giải tích tổ hợp là: 𝐶𝑛𝑁 = 𝑁!
nghĩa là số mẫu vô cùng 𝑛!(𝑁−𝑛)!
nhiều. Trong đó chỉ có một số mẫu (chiếm tỉ lệ % bé) cho ra các trị số mẫu = trị số dân số,
các mẫu còn lại (chiếm đa số) sẽ cho trị số mẫu lớn hơn hay bé hơn trị số dân số.
Do vậy, thường dùng khoảng phỏng định.
Khoảng phỏng định là mt khong điểm số mà người nghiên cứu đưa ra, hy vng
tr s dân s rơi vào khoảng này vi mc xác suất tin tưởng định trước (còn gọi là độ tin cậy ).
Thông thường chọn  = 95% hoặc 99%.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.3
Công thức chung của khoảng phỏng định:
Tr s mu -
< Tr s dân s < Tr s mu +
II. Phỏng định trung bình dân s
1. Trường hp mu ln (n 30).
Phân bố xác suất của dân số trung bình mẫu: phân b Z.
Công thức khoảng phỏng định: 𝒔
𝝁 = 𝑿 ± 𝒁 √𝒏
Trị số Z đọc trong bảng Z với độ tin cậy .
2. Trường hp mu nh (n < 30).
Phân bố xác suất của dân số trung bình mẫu: phân b t.
Công thức khoảng phỏng định: 𝝁 = 𝑿 𝒔 ± 𝒕 √𝒏
Trị số t đọc trong bảng t với độ tự do df = n – 1 và xác suất  = 100% -  (two-tailed).
III. Phỏng định t l dân s
Với số tỉ lệ, khi xem xét các trường hợp có hai biểu hiện như: Có/Không, Trúng
tuyển/Không, vv.. phân bố xác suất của dân số tỉ lệ mẫu thường là phân bố nhị thức.
Vì sự trở ngại khi tín
h xác suất của phân bố nhị thức nên thống kê cho phép xem một phân
bố nhị thức là phân bố gần như bình thường (phân bố Z) khi thỏa các điều kiện sau:
- Dân số có N rất lớn.
- Mẫu chọn là lớn (n thường > 100).
- Tỉ lệ p không quá gần 0 hoặc 1.
Với phần mềm xử lý thống kê như SPSS, ta có thể yêu cầu kiểm chứng phân bố điểm số
thu thập được có thỏa điều kiện của một phân bố bình thường hay không.
Trong điều kiện tính toán thủ công, các nhà thống kê đề nghị quy tắc kiểm tra điều kiện áp
dụng phân bố Z như sau: n * p và n * (1 – p) > 15.
Công thức khoảng phỏng định: 𝑋 𝑋 𝑝 = 𝑛 ∗ (1 − 𝑋𝑛) 𝑛 ± 𝑍√ 𝑛
X/n = tỉ lệ mẫu. Trị số Z đọc trong bảng Z với độ tin cậy .
Bài tp rèn luyn
Bài tp v khong phỏng định cho trung bình dân s và t l dân s
1. Tìm khoảng phỏng định cho µ với độ tin cậy 95%. Biết 𝑋 = 70.4, s = 5 và n= 36.
2. Tìm khoảng phỏng định cho µ với độ tin cậy 95%. Biết 𝑋 = 84.2, s = 7.3 và n= 40.
3. Tìm khoảng phỏng định cho µ với độ tin cậy 99%. Biết 𝑋 = 98.6, s = 2 và n= 100.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.4
4. Trong 1 nghiên cứu về sử dụng thời gian, một mẫu 20 người quản lý được chọn ngẫu
nhiên đã dành trung bình 2.4 giờ mỗi ngày cho thủ tục giấy tờ, độ lệch tiêu chuẩn là 1.3
giờ. Hãy lập khoảng phỏng định với độ tin cậy 95% cho trung bình thời gian thủ tục giấy
tờ của dân số nhà quản lý.
5. Ổ đĩa máy tính của tác giả đã được hẹn giờ (tính bằng ms) cho 25 cuộc gọi đến khác
nhau. Trung bình và độ lệch tiêu chuẩn của mẫu được tính ra, theo thứ tự là 200.45 ms và
0.24 ms. Hãy lập khoảng phỏng định với độ tin cậy 99% cho trung bình của dân số những lần gọi như vậy.
6. Chọn một mẫu hàm lượng calo của 24 chai bia “nhẹ”, trung bình và độ lệch tiêu chuẩn
được tìm thấy lần lượt là 107.3 calories và 3.9 calories. Hãy lập khoảng phỏng định với độ
tin cậy 98% cho trung bình hàm lượng calo của dân số các chai bia như trên.
7. Hãy tìm khoảng phỏng định cho tỉ lệ dân số p với độ tin cậy 95%, biết n = 900, X = 400.
8. Mẫu chọn ngẫu nhiên 650 trường hợp tử vong do tai nạn tại nhà và tìm thấy 180 trong
số đó có nguyên nhân do té ngã. Hãy lập khoảng phỏng định với độ tin cậy 95% cho tỉ lệ
dân số những trường hợp tử vong tại nhà có nguyên nhân do té ngã.
9. Khảo sát một nhóm 1998 người lớn cho kết quả là có 53% người nói rằng an ninh là
một khía cạnh quan trọng của tiền bạc. Từ mẫu dữ kiện này, hãy lập khoảng phỏng định
với độ tin cậy 95% cho tỉ lệ % của toàn dân số người lớn. HT
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.5