Bài Tập Thống Kê Chương 5 - Chọn mẫu - Phỏng đinh trị số dân số (K47 2022) - Tài liệu tham khảo | Đại học Hoa Sen
Bài Tập Thống Kê Chương 5 - Chọn mẫu - Phỏng đinh trị số dân số (K47 2022) - Tài liệu tham khảo | Đại học Hoa Sen và thông tin bổ ích giúp sinh viên tham khảo, ôn luyện và phục vụ nhu cầu học tập của mình cụ thể là có định hướng, ôn tập, nắm vững kiến thức môn học và làm bài tốt trong những bài kiểm tra, bài tiểu luận, bài tập kết thúc học phần, từ đó học tập tốt và có kết quả
Preview text:
HP Thống Kê Ứng Dụng Trong Nghiên Cứu Khoa Học Xã Hội (3TC)
SV TLHGD K47 (năm 1), Khoa Tâm Lý học, ĐHSP TP HCM
GV phụ trách: ThS. Lý Minh Tiên
Ngày gửi bài: 02/05/2022
TÓM TẮT BÀI HỌC & BÀI TẬP RÈN LUYỆN
CHỌN MẪU, PHỎNG ĐỊNH TRỊ SỐ DÂN SỐ
Tóm tắt kiến thức
A. CÁC PHƯƠNG PHÁP CHỌN MẪU
Sinh viên đọc trong tài liệu các mục sau:
I. Vì sao phải chọn mẫu?
Do dân số quá lớn mà nhân lực, tài lực, thời gian, vv.. của nhóm NCKH không thể thu
thập dữ kiện trên toàn dân số. Ngoài ra có thể bị mất dữ kiện hoặc sai sót khi nhập vào
máy tính do phải xử lý quá nhiều dữ kiện.
Ngày nay nhờ kỹ thuật chọn mẫu phát triển, có nhiều phương pháp chọn trong một dân số
nhỏ, vừa hay chọn mẫu xuyên các quốc gia, nên có thể chọn được mẫu đạt các trị số mẫu đại diện cho dân số.
II. Nguyên tắc chung khi chọn mẫu
Có nhiều nguyên tắc phải tuân theo khi chọn mẫu, trong đó cần chú ý hai nguyên tắc:
a) Tính khách quan: Những chủ thể dược đưa vào mẫu hoàn toàn theo lối vô tư, không
theo ý muốn của chủ quan của người nghiên cứu.
b) Bảo đảm xác suất đồng đều khi chọn. Mỗi phần tử có cơ hội được chọn bằng nhau.
Nếu tuân theo đúng hai nguyên tắc trên, mẫu được chọn sẽ đại diện cho dân số với đặc
tính của mẫu không khác gì đặc tính của dân số.
III. Sai số chọn mẫu và sai số không do chọn mẫu
1. Sai số chọn mẫu là loại sai số xảy ra do ta chỉ chọn 1 mẫu để thu thập dữ kiện phục vụ
nghiên cứu mà không thực hiện trên toàn dân số.
Sai số này gắn liền với việc chọn mẫu, với bản thân cuộc nghiên cứu, cho dù đã cố gắng
thỏa mãn tối đa các điều kiện khi chọn mẫu.
2. Sai số không do chọn mẫu là loại sai số phải chịu do các đáp ứng của chủ thể thay
đổi (mệt mỏi, lãng tránh trả lời, cố ý trả lời sai khi chạm đến ký ức, điều tế nhị), chủ thể
trả lời do thiên vị, hoặc hiểu không đúng yêu cầu câu hỏi, vv… Sai số này xảy ra dù chọn toàn dân số.
Hai loại sai số này cùng tồn tại. Có thể áp dụng một số biện pháp giảm các sai số này. Thí
dụ: Để giảm sai số do chọn mẫu, nên chọn cỡ mẫu càng lớn càng tốt (nếu có thể). Để giảm
sai số không do chọn mẫu, cần xây dựng dàn bài (bám sát mục tiêu), soạn thật cẩn thận
các câu hỏi trong phiếu khảo sát (questionnaires). Nếu là trắc nghiệm (test) phải tuân theo
đúng, đầy đủ các bước trong kỹ thuật soạn test).
IV. Một số phương pháp chọn mẫu thông dụng
Có nhiều phương pháp chọn mẫu từ đơn giản đến phức tạp. Có trường hợp chọn
mẫu đại diện (theo xác suất
) và chọn mẫu phi xác suất. Dưới đây là một số phương pháp
chọn mẫu đại diện dễ áp dụng trong phạm vi dân số không quá lớn.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.1
1. Chọn mẫu ngẫu nhiên đơn giản : a. Rút thăm.
b. Dùng bảng số ngẫu nhiên trong sách toán thống kê.
c. Dùng hàm ngẫu nhiên (trong các phần mềm máy tính). Ví dụ EXCEL.
Hiện nay để tiện lợi, nên dùng cách c/ Hàm ngẫu nhiên trong EXCEL. Sử dụng
hàm RANDBEETWEN(bottom, top).
Danh sách dân số được đánh số từ số thấp nhất (số Bottom) đến hết dân số (số Top). Số bắt ầ
đ u (thấp nhất) được chọn tùy ý, thích hợp với quy mô N trong dân số.
Thí dụ có N = 3758 người, nên dùng 4 chữ số, bắt đầu tùy ý, có thể là số 1357 cho
người đầu tiên trong danh sách, tiếp tục 1358, 1359, vv.. cho đến 5115 là cuối danh sách.
Khi cần cỡ mẫu = n thì dùng n số do hàm ngẫu nhiên nói trên cung cấp (dùng lệnh copy).
2. Chọn mẫu theo hệ thống :
Theo cách này, trước hết các phần tử được xếp trong danh sách theo một trật tự định
trước. Giả sử trong dân số có N phần tử và ta muốn chọn ra 1 mẫu cỡ n. n n Tỉ lệ chọn mẫu là ≈ 1
N . Ta tìm một số nguyên dương K sao cho N K . .
Sau đó bắt đầu từ một phần tử bất kỳ trong danh sách, cứ K phần tử thì chọn một để đưa
vào mẫu. Tiếp tục chọn cho đến khi hết danh sách.
3. Chọn mẫu tỉ lệ theo tầng lớp:
Dân số N được chia ra nhiều tầng lớp, mỗi tầng có Nh phần tử.
Tỉ lệ mỗi tầng lớp trong dân số là: Wh = Nh / N .
Nếu chọn mẫu cỡ = n có tỉ lệ mỗi tầng lớp giống như trong dân số thì Wh = Nh = nh N n
Suy ra trong mỗi tầng lớp cần chọn cỡ mẫu là nh = n ∗ Nh N .
V. Chọn mẫu theo nhóm (cùng cỡ)
Với lối chọn ngẫu nhiên, các phần tử được mời vào cuộc nghiên cứu sẽ ở rải rác trong dân
số hoặc trong các tầng lớp. Điều đó gây trở ngại khi dân số là khá lớn (th í dụ cả thành phố
hay một khu vực gồm nhiều tỉnh, thành). Khi thu thập dữ kiện phải mất nhiều nhân lực, thời gian gặp họ.
Để khắc phục, người ta dựa vào tính chất “nhóm” vốn có trong tổ chức hành chính, trường
học, ví dụ : hộ gia đình, lớp học, tổ sản xuất, vv..
Đơn vị chọn bây giờ không theo cá nhân mà là t heo nhóm.
Trong thực tế, các nhóm thường không đồng cỡ.
Để đơn giản, chỉ xét trường hợp nhóm đồng cỡ hoặc gần như đồng cỡ.
Ví dụ: Ở lớp học, số học sinh mỗi lớp thường không bằng nhau, nhưng cũng xấp xỉ chứ
không chênh nhau nhiều (ví dụ sĩ số có lớp 40, có lớp 38, có lớp 41,...), do đó có thể áp
dụng nhóm đồng cỡ - đơn vị chọn là lớp học.
Phương pháp chọn mẫu theo nhóm cũng áp dụng giống như các phương pháp chọn từng
cá nhân đã nói ở trên, chỉ khác ở đơn vị chọn là nhóm đã xác định.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.2
BÀI TẬP CHỌN MẪU:
Bài 1: Một trường mẫu giáo có 390 cháu, tổng của 13 lớp (gồm 4 lớp mầm, 5 lớp chồi, 4
lớp lá và coi mỗi lớp vừa đúng 30 cháu). Ta muốn chọn ra một mẫu có 60 cháu đại diện
cho cả 3 khối Mầm, Chồi, Lá để làm một thực nghiệm.
Hỏi có thể chọn theo những cách nào?
Bài 2: Một nhà nghiên cứu dùng trắc nghiệm để đo trí nhớ hình ảnh của trẻ mẫu giáo
thuộc 2 lớp Lá B (có 40 cháu) và Lá E (có 35 cháu). Do yêu cầu của cuộc nghiên cứu, chỉ
chọn ra mỗi lớp 15 cháu. Hỏi phải làm như thế nào để có được hai mẫu đại diện cho hai lớp Lá B và Lá E?
B. PHỎNG ĐỊNH TRỊ SỐ DÂN SỐ
* Nhu cầu phỏng định trị số dân số:
Khi chọn mẫu để thực hiện nghiên cứu khoa học, chúng ta chỉ chọn một phần của
dân số nên các trị số mẫu thu được chỉ là các số thống kê (statistics) trên mẫu hiện có.
Không biết được các trị số dân số (parameters).
Trong nhiều trường hợp, người nghiên cứu cần biết đến trị số dân số. Thí dụ: Chiều
cao trung bình của dân số người Việt hiện nay là bao nhiêu? So với cách đây 30 năm (giữa
2 thế hệ cha mẹ và con cái của họ), chiều cao này có tăng lên không?
Do đó việc dùng trị số mẫu để phỏng định (ước lượng) trị số dân số là nhu cầu
thực tế trong thống kê.
I. Hai cách phỏng định
1. Điểm phỏng định
Dùng điểm phỏng định, ta lấy trị số mẫu gán cho trị số dân số.
Thí dụ phỏng định trung bình dân số: Có điểm trung bình bài thi toán của mẫu HS lớp
10 trường A, 𝑋 = 8.3. Nếu dùng điểm phỏng định thì trung bình của dân số HS khối lớp
10 trường A là: µ = 𝑋 = 8.3.
Trường hợp tỉ lệ dân số cũng tương tự: Giả sử tỉ lệ HS đạt điểm thi Toán từ 8 đến 10 ở
mẫu nói trên là 30%. Suy ra phỏng định tỉ lệ % dân số HS khối 10 trường A đạt điểm từ 8 trở lên là p = 30%.
2. Khoảng phỏng định
Dùng điểm phỏng định có nhược điểm là thiếu chính xác, vì với một trị số mẫu thu
được trong cuộc nghiên cứu thì hiệu số 𝑋 - µ > 0, hoặc 𝑋 - p > 0. 𝑛
Giải thích: Về lý thuyết, khi chọn 1 mẫu cỡ = n từ một dân số có N phần tử thì số mẫu có
thể chọn tính theo công thức giải tích tổ hợp là: 𝐶𝑛𝑁 = 𝑁!
nghĩa là số mẫu vô cùng 𝑛!(𝑁−𝑛)!
nhiều. Trong đó chỉ có một số mẫu (chiếm tỉ lệ % bé) cho ra các trị số mẫu = trị số dân số,
các mẫu còn lại (chiếm đa số) sẽ cho trị số mẫu lớn hơn hay bé hơn trị số dân số.
Do vậy, thường dùng khoảng phỏng định.
Khoảng phỏng định là một khoảng điểm số mà người nghiên cứu đưa ra, hy vọng
trị số dân số rơi vào khoảng này với mức xác suất tin tưởng định trước (còn gọi là độ tin cậy ).
Thông thường chọn = 95% hoặc 99%.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.3
Công thức chung của khoảng phỏng định:
Trị số mẫu -
< Trị số dân số < Trị số mẫu +
II. Phỏng định trung bình dân số
1. Trường hợp mẫu lớn (n ≥ 30).
Phân bố xác suất của dân số trung bình mẫu: phân bố Z.
Công thức khoảng phỏng định: 𝒔
𝝁 = 𝑿 ± 𝒁 √𝒏
Trị số Z đọc trong bảng Z với độ tin cậy .
2. Trường hợp mẫu nhỏ (n < 30).
Phân bố xác suất của dân số trung bình mẫu: phân bố t.
Công thức khoảng phỏng định: 𝝁 = 𝑿 𝒔 ± 𝒕 √𝒏
Trị số t đọc trong bảng t với độ tự do df = n – 1 và xác suất = 100% - (two-tailed).
III. Phỏng định tỉ lệ dân số
Với số tỉ lệ, khi xem xét các trường hợp có hai biểu hiện như: Có/Không, Trúng
tuyển/Không, vv.. phân bố xác suất của dân số tỉ lệ mẫu thường là phân bố nhị thức.
Vì sự trở ngại khi tín
h xác suất của phân bố nhị thức nên thống kê cho phép xem một phân
bố nhị thức là phân bố gần như bình thường (phân bố Z) khi thỏa các điều kiện sau:
- Dân số có N rất lớn.
- Mẫu chọn là lớn (n thường > 100).
- Tỉ lệ p không quá gần 0 hoặc 1.
Với phần mềm xử lý thống kê như SPSS, ta có thể yêu cầu kiểm chứng phân bố điểm số
thu thập được có thỏa điều kiện của một phân bố bình thường hay không.
Trong điều kiện tính toán thủ công, các nhà thống kê đề nghị quy tắc kiểm tra điều kiện áp
dụng phân bố Z như sau: n * p và n * (1 – p) > 15.
Công thức khoảng phỏng định: 𝑋 𝑋 𝑝 = 𝑛 ∗ (1 − 𝑋𝑛) 𝑛 ± 𝑍√ 𝑛
X/n = tỉ lệ mẫu. Trị số Z đọc trong bảng Z với độ tin cậy .
Bài tập rèn luyện
Bài tập về khoảng phỏng định cho trung bình dân số và tỉ lệ dân số
1. Tìm khoảng phỏng định cho µ với độ tin cậy 95%. Biết 𝑋 = 70.4, s = 5 và n= 36.
2. Tìm khoảng phỏng định cho µ với độ tin cậy 95%. Biết 𝑋 = 84.2, s = 7.3 và n= 40.
3. Tìm khoảng phỏng định cho µ với độ tin cậy 99%. Biết 𝑋 = 98.6, s = 2 và n= 100.
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.4
4. Trong 1 nghiên cứu về sử dụng thời gian, một mẫu 20 người quản lý được chọn ngẫu
nhiên đã dành trung bình 2.4 giờ mỗi ngày cho thủ tục giấy tờ, độ lệch tiêu chuẩn là 1.3
giờ. Hãy lập khoảng phỏng định với độ tin cậy 95% cho trung bình thời gian thủ tục giấy
tờ của dân số nhà quản lý.
5. Ổ đĩa máy tính của tác giả đã được hẹn giờ (tính bằng ms) cho 25 cuộc gọi đến khác
nhau. Trung bình và độ lệch tiêu chuẩn của mẫu được tính ra, theo thứ tự là 200.45 ms và
0.24 ms. Hãy lập khoảng phỏng định với độ tin cậy 99% cho trung bình của dân số những lần gọi như vậy.
6. Chọn một mẫu hàm lượng calo của 24 chai bia “nhẹ”, trung bình và độ lệch tiêu chuẩn
được tìm thấy lần lượt là 107.3 calories và 3.9 calories. Hãy lập khoảng phỏng định với độ
tin cậy 98% cho trung bình hàm lượng calo của dân số các chai bia như trên.
7. Hãy tìm khoảng phỏng định cho tỉ lệ dân số p với độ tin cậy 95%, biết n = 900, X = 400.
8. Mẫu chọn ngẫu nhiên 650 trường hợp tử vong do tai nạn tại nhà và tìm thấy 180 trong
số đó có nguyên nhân do té ngã. Hãy lập khoảng phỏng định với độ tin cậy 95% cho tỉ lệ
dân số những trường hợp tử vong tại nhà có nguyên nhân do té ngã.
9. Khảo sát một nhóm 1998 người lớn cho kết quả là có 53% người nói rằng an ninh là
một khía cạnh quan trọng của tiền bạc. Từ mẫu dữ kiện này, hãy lập khoảng phỏng định
với độ tin cậy 95% cho tỉ lệ % của toàn dân số người lớn. HẾT
Thầy Lý Minh Tiên. Bài tập Thống kê Chương 5. Chọn mẫu – Phỏng định trị số dân số (gửi SV K47 – Tháng 5/2022) Trang.5