lOMoARcPSD| 59062190
Phần 1: (bỏ qua, không cần làm)
1. Tạo form nhập số liệu dựa vào mẫu phiếu thu thập thông tin về“Bảng câu hỏi thu thập
số liệu đặc điểm bệnh nhân mắc sỏitiết niệu”
2. Từ form nhập số liệu đã được xây dựng hoàn chỉnh, nhập 3 phiếu với số liệu giả định.
Phần 2:
2.1. Sử dụng các kỹ thuật làm sạch số liệu để tìm lỗi sai ở các biến: cân nặng, chiều cao,
vòng đ
ầu, vòng ngực (đo lần 1), vòng ngực (đolần 2), vòng cánh tay, hồng cầu, Hemoglobin,
huyết cầu tố.
-Sử dụng bảng tần suất Frequencies
-
Chuột phải vào tên biến có lỗi ở màn hình Data View -> Sort Ascending để tìm ra các msp lỗi.
2.2. Sử dụng các kỹ thuật làm sạch số liệu để tìm lỗi sai ở các biến: Nguồn thu nhập, các
triệu c hứng thiếu máu (da xanh xao, niêm mạcmắt nhợt nhạt, lòng bàn tay nhợt nhạt,
lưỡi mất gai, mó ng tay nhợtnhạt, gan to).
-Sử dụng Frequencies đưa các biến vào
-Biến nguồn thu nhập lỗi nhập sai giá trị đã mã hóa ở msp 32
2.3. Kiểm tra tính logic của số liệu giữa 2 biến: Trình độ học vấn mẹ(tdhv) và Nghề
nghiệp mẹ ( nghe).
lOMoARcPSD| 59062190
-Sử dụng Crosstab để m lỗi sai
-Lỗi logic mẹ mù chữ nhưng làm cán bộng chức
Trinh do hv me * Nghe nghiep me Crosstabulation
Count
Nghe nghiep me
Total
noi tro / khong
nghe
nong dan
kinh doanh /
buon ban
cong nhan
can bo cong
chuc
Trinh do hv me
mu chu
biet doc / viet
tieu hoc
12
2
5
127
136
113
0
4
3
0
0
0
1
0
0
140
142
121
THCS
5
108
2
0
0
115
THPT
5
66
0
2
2
75
TC, DH
0
0
0
6
1
7
Total
29
550
9
8
4
600
1.Biến số nào chứa lỗi sai trong những biến số kể trên?
2.Mã số phiếu chứa lỗi sai trong những trường hợp trên?
Phần 3:
3.1. Chia 5 nhóm cân nặng từ biến cân nặng:
•nhóm 1: < 10 kg
•nhóm 2: 10 - <20 kg
•nhóm 3: 20 - <30 Kg
•nhóm 4: 30 - <40 Kg
•nhóm 5: ≥ 40 Kg
-Sử dụng Transform/Recode into Different Variable -Đưa
biến Cân nặng vào ô to, đặt tên biến và nhãn của biến -Vào
Old and New Value chia như sau:
Nhóm 1: LOWEST thru value 9.99
Nhóm 2: Range 10 đến 19.99
Nhóm 3: Range 20 đến 29.99
Nhóm 4: Range 30 đến 39.99
Nhóm 5: All others values
lOMoARcPSD| 59062190
-Tích vào ô Output variables are string, chỉnh >8
3.2. Chia trình độ học vấn mẹ thành 3 nhóm:
•HV thấp : Mù chữ + biết đọc, viết
•HV trung bình : Tiểu học + THCS
•HV cao : THPT + TC, ĐH
(tương tự như trên)
Dùng Analyze/Descriptive Statistics/Frequencies, đưa biến mới Recode vào.
Cho biết số lượng và tỷ lệ mỗi nhóm sau khi mã hóa lại biến số?
BGTH2:
https://drive.google.com/file/d/1aylO_5jNBdaXQswjvNoPbUNvISKaTFbN/view
Bài tập 1. Phân nhóm tình trạng thiếu máu của trẻ dựa vào giá trị Hemoglobin theo tiêu chuẩn:
•Bình thường >11 g/dl
•Thiếu máu nhẹ: khi Hb từ > 9 g/dl đến 11 g/dl •Thiếu
máu trung bình: khi Hb từ 6 g/dl đến 9 g/dl
•Thiếu máu nặng: khi Hb từ < 6 g/dl.
(sử dụng Recode into different variables, tương tự như tn)
1.Tính số lượng và tỷ lệ % của các mức độ thiếu máu.
(sử dụng bảng Frequencies, tương tự như trên)
lOMoARcPSD| 59062190
2.Tính tỷ lệ các mức độ thiếu máu ở trẻ em nam và trẻ em nữ. Vẽ biểu đồminh họa.
-Sử dụng Crosstab đưa biến Giới tính và nhóm thiếu máu (mới recode) vào Row và Column
(không phân biệt)
-Sử dụng Graph/Legacy/Bar/Clustered/nhấn Define/đưa biến nhóm thiếu máu và giới tính vào
Category Axis và Define Clusters by
lOMoARcPSD| 59062190
Bài tập 2. Tính chỉ số khối cơ thể (BMI) dựa trên các biến số cân nặng và chiềucao.
-Sử dụng Transform/Compute Variable/đặt tên biến ở Target Variable
-Ở Numeric Expression: (cannang)/((chieucao/100)*(chieucao/100)) (vì BMI = cân nặng/
(chiều cao (m))^2
1.Tính giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất và lớn nhất của BMI
-Sử dụng Frequencies/đưa biến BMI vào ô to/Statistics/tích vào các ô Mean, Std.Deviation,
Minimum, Maximum
2.Tính giá trị trung bình của BMI theo các mức độ thiếu máu
lOMoARcPSD| 59062190
-Sử dụng Analyze/Descriptive Statistics/Explore/đưa biến BMI vào Dependent List/đưa biến
nhóm thiếu máu vào Factor List/trong phần Statistic tích vào ô Descriptive/nhấn Continue và
OK.
Descriptives
nhom thieu mau
Statistic
Std. Error
BMI
binhthuo
Mean
95% Confidence Interval for
Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Lower Bound
Upper Bound
15.325
3
15.044
0
15.606
7
15.141
5
14.987
8
8.318
2.8840
2
.14313
Minimum
6.73
Maximum
34.72
Range
27.98
Interquartile Range
2.65
Skewness
2.015
.121
Kurtosis
10.232
.242
nang
Mean
95% Confidence Interval for
Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Lower Bound
Upper Bound
13.922
7
10.258
5
17.586
8
13.924
1
14.567
9
8.708
2.9510
0
1.31973
Minimum
9.92
lOMoARcPSD| 59062190
Maximum
17.90
Range
7.98
Interquartile Range
5.08
Skewness
-.053
.913
Kurtosis
.443
2.000
nhe
Mean
14.9125
.20705
95% Confidence Interval for
Mean
Lower Bound
Upper Bound
14.5036
15.3213
5% Trimmed Mean
14.7913
Median
14.6092
Variance
6.988
Std. Deviation
2.64342
Minimum
6.66
Maximum
25.83
Range
19.17
Interquartile Range
2.42
Skewness
1.032
.190
Kurtosis
3.450
.378
trungbin
Mean
95% Confidence Interval for Lower Bound
Mean Upper Bound
5% Trimmed Mean
Median
Variance
Std. Deviation
15.352
0
14.501
7
16.202
2
15.404
3
15.408
0
4.431
2.1050
4
.41283
Minimum
9.69
lOMoARcPSD| 59062190
Maximum
19.64
Range
9.95
Interquartile Range
2.88
Skewness
-.365
.456
Kurtosis
.975
.887
Bài tập 3. Khảo sát các đặc điểm lâm sàng thiếu máu bao gồm: da xanh, niêm mạc mắt nhợt,
móng tay nhợt, lưỡi mất gai, gan to, lách to.
-Recode lại biến lách to thành lách to 2, với 1-> 0, các giá trị khác-> 2 (vì biến lách to ban đầu
là theo mức độ, giừ phải chuyển biến ni thành biến bị hoặc không bị giống mấy biến trên)
-Chuyển 6 biến da xanh,niêm mạc mắt nhợt, móng tay nhợt, lưỡi mất gai, gan to, lách to 2 từ
String thành Numeric (ở màn hình Variable View).
-Sử dụng Transform/Count Values within Cases/rồi làm theo ảnh (<3), đưa 6 biến vào
-Ở Define Values, là gõ giá trị để được đếm, gõ 2 (nghĩa là 2 quy ước cho bị 6 triệu chứng trên,
giừ đếm số triệu chứng bị thì gõ 2 vô đây)/ Nhấn OK.
1. Tỷ lệ trẻ có ít nhất 1 triệu chứng trên là bao nhiêu %.
-Sử dụng Frequencies như bình thường thôi, lấy 100- tỉ lệ 0 mắc triệu chứng nào là ra.
nhom trieu chung
Frequency
Percent
Valid Percent
Cumulative
Percent
Valid
.00
1.00
2.00
3.00
374
41
108
10
62.3
6.8
18.0
1.7
62.3
6.8
18.0
1.7
62.3
69.2
87.2
88.8
4.00
21
3.5
3.5
92.3
5.00
10
1.7
1.7
94.0
lOMoARcPSD| 59062190
6.00
36
6.0
6.0
100.0
Total
600
100.0
100.0
2. Triệu chứng nào là phổ biến nhất?
-Sử dụng Analyze/Multiple Response/Define Variables Set/rồi làm như ảnh
-Counted value vẫn là 2 (vì quy ước 2 là bị bệnh), đặt tên biến ở dưới nữa hi/nhấn Add
-Lại sử dụng Analyze/Multiple Response/lúc này thấy hiện ra thêm dòng Frequencies/bấm vào.
-Chuyển biến sang rồi nhấn OK.
$trieuchungthieumau Frequencies
Responses
Percent of
Cases
N
Percent
Da xanh xao
Niem mac mat nhot nhat
Luoi mat gai
$trieuchungthieumau
a
220
182
65
34.5%
28.6%
10.2%
97.3%
80.5%
28.8%
Mong tay nhot nhat
74
11.6%
32.7%
Gan to
47
7.4%
20.8%
lachto2
49
7.7%
21.7%
Total
637
100.0%
281.9%
a. Dichotomy group tabulated at value 2.
lOMoARcPSD| 59062190
-Dựa vô bảng tự kết luận
Bài tập 4. Xác định tỷ lệ thiếu máu cận lâm sàng theo quy định của TCYTTG năm 2001
•Trẻ < 6 tuổi: Hb < 110 g/l
•Trẻ 6-15 tuổi: Hb < 120g/l
-Sử dụng Data/Select Cases/chọn If condition is satisfied/làm như ảnh
-Theo ycbt thì ta chọn những trường hợp “tuổi <6 có Hb<11” và”tuổi>= 6 có Hb<12 (vì
bài tuổi max của bệnh nhân là 15 nên để ri hoặc tổng quát thì để thành 6<= tuoi <=
15”/nhấn Continue/OK
=> Hiện ra biến mới với quy ước 0(không được chọn, nghĩa là không thiếu máu) 1(được
chọn nghĩa là thiếu máu)
1.Tỷ lệ thiếu máu trẻ em tại vùng A?
-Sử dụng Frequencies với biến mới ở trên (nhớ vào Select Cases chọn lại All Case để xét
toàn bộ trường hợp cho bảng Frequencies)
(tuoi < 6) & (Hb < 11) | (tuoi >= 6) & (Hb < 12) (FILTER)
Frequency
Percent
Valid Percent
Cumulative
Percent
Valid
Not Selected
Selected
363
237
60.5
39.5
60.5
39.5
60.5
100.0
Total
600
100.0
100.0
2.Khoảng tin cậy 95% và 99% tỷ lệ thiếu máu trẻ em tại vùng A?
-Sử dụng Analyze/Compare Means/One Sample T Test đối với biến mới tạo
One-Sample Test
Test Value = 0
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the
Difference
lOMoARcPSD| 59062190
Lower
Upper
(tuoi < 6) & (Hb < 11) | (tuoi
>= 6) & (Hb < 12) (FILTER)
19.776
599
.000
.395
.36
.43
-Khoảng tin cậy là đoạn Lower và Upper ở trên
3.Giá trị trung bình của Hb ở những trẻ mắc thiếu máu tại vùng A?
-Sử dụng Frequencies chọn Mean ở Statistics rồi nhấn OK.
Statistics
(tuoi < 6) & (Hb
< 11) | (tuoi >=
6) & (Hb < 12)
(FILTER)
Hemoglobin
(g/dl)
N
Valid 600
600
Missing
0
0
Mean
.40
11.574
4.Khoảng tin cậy 95% và 99% giá trị trung bình của Hb ở những trẻ mắc thiếu máu tại vùng
A?
-Sử dụng Explore/đư a biến Hb vào ô phụ thuộc/đư a biến mới tạo vào ô độc lập
Descriptives
(tuoi < 6) & (Hb < 11) | (tuoi >= 6) & (Hb < 12) (FILTER)
Statistic
Std. Error
Hemoglobin (g/dl)
Not Selected
Mean
95% Confidence Interval for
Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Lower Bound
Upper Bound
12.424
12.332
12.516
12.385
12.300
.799
.8940
11.0
15.6
4.6
1.2
.496
.211
.0469
.128
.255
lOMoARcPSD| 59062190
Selected
Mean
95% Confidence Interval for
Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Lower Bound
Upper Bound
10.272
10.093
10.452
10.429
10.600
1.964
1.4013
.0910
Minimum
2.4
Maximum
11.9
Range
9.5
Interquartile Range
1.3
Skewness
-2.545
.158
Kurtosis
9.797
.315
- Tương tự với khoảng tin cậy 99% he, đổi khoảng tin cậy ở Explore/Statistics
BGTH3:
https://drive.google.com/file/d/1W6cyCfZYWvN2SodgNm5YE1Dj5LLgyOxE/view
Phần A:
¡1. Kiểm định xem tỷ lthiếu máu ở trẻ em ở nghiên cứu này cókhác với tỷ lệ thiếu máu ở trẻ e
m tại Thành phố A 20% hay không với độ tin cậy 95%? (kiểm định 1 tỷ lệ nghiên cứu với 1
tỷ lệ cho trước => sử dụng Chi-square)
(thiếu dữ kiện, thêm quy ước cho bài ni, thiếu máu <11Hb, bình thường >=11, dùng Recode into
Different Variables)
-Sử dụng Analyze/Nonparametric Test/Legacy Dialog/Chi-square
lOMoARcPSD| 59062190
- 0,8 và 0,2 là tỉ lệ bình thường, thiếu máu đem đi kiểm định (để theo thứ tự quy ước, ở trên
quyước 0 là bình thường, 1 là thiếu máu)
¡2. Tình trạng thiếu máu có liên quan đến nhóm cân nặng lúc sinh (< 2.500 gram và ≥ 2.500
gram) hay không với độ tin cậy 95%. (kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs) -
Sử dụng Recode into Different variables để chia nhóm cnls.
-Sử dụng Analyze/Descriptive Statistics/Crosstabs.
lOMoARcPSD| 59062190
-Nhấn Continue/OK.
lOMoARcPSD| 59062190
-Thấy rằng các quan sát đều độc lập nhau, bảng 2x2 các giá trị kỳ vọng > 5(Expected Count >5)
nên giả định Chi-square được thỏa mãn, ta đọc p-value ở Pearson Chi-square, còn trường hợp
trên bị vi phạm thì dùng Fishers Exact Test, lúc đó ta đọc p-value ở hàng Exact Sig (bài tới
gặp).
¡3. Trình độ học vấn của mẹ có liên quan đến nhóm cân nặng lúcsinh của trẻ hay không với độ t
in cậy 95%? (kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs) -Sử dụng Crosstab tương
tự như trên.
Trinh do hv me * nhomcnls Crosstabulation
nhomcnls
Total
.00
1.00
Trinh do hv me
mu chu
Count
Expected Count
% within Trinh do hv me
8
6.0
7.8%
94
96.0
92.2%
102
102.0
100.0%
lOMoARcPSD| 59062190
% within nhomcnls
28.6%
21.1%
21.6%
% of Total
1.7%
19.9%
21.6%
biet doc / viet
Count
Expected Count
% within Trinh do hv me
3
~5.0
3.6%
81
79.0
96.4%
84
84.0
100.0%
% within nhomcnls
10.7%
18.2%
17.8%
% of Total
0.6%
17.1%
17.8%
tieu hoc
Count
Expected Count
% within Trinh do hv me
3
6.2
2.9%
101
97.8
97.1%
104
104.0
100.0%
% within nhomcnls
10.7%
22.7%
22.0%
% of Total
0.6%
21.4%
22.0%
THCS
Count
Expected Count
% within Trinh do hv me
8
6.1
7.8%
95
96.9
92.2%
103
103.0
100.0%
% within nhomcnls
28.6%
21.3%
21.8%
% of Total
1.7%
20.1%
21.8%
THPT
Count
Expected Count
% within Trinh do hv me
4
4.4
5.4%
70
69.6
94.6%
74
74.0
100.0%
% within nhomcnls
14.3%
15.7%
15.6%
% of Total
0.8%
14.8%
15.6%
TC, DH
Count
Expected Count
% within Trinh do hv me
2
.4
33.3%
4
5.6
66.7%
6
6.0
100.0%
% within nhomcnls
7.1%
0.9%
1.3%
% of Total
0.4%
0.8%
1.3%
Total
Count
Expected Count
% within Trinh do hv me
28
28.0
5.9%
445
445.0
94.1%
473
473.0
100.0%
% within nhomcnls
100.0%
100.0%
100.0%
% of Total
5.9%
94.1%
100.0%
lOMoARcPSD| 59062190
-Theo báo cáo có 3 giá trị kỳ vọng (Expected Count) <5, giá trị nhỏ nhất của giá trị kỳ vọng
0,36 nên ta sử dụng kiểm định chính xác của Fisher (Fishers Exact Test).
-Sử dụng Crosstab.
-Các lựa chọn vẫn giống như của Chi-square, chỉ khác ở đoạn Exact, lựa chọn Exact với thời
gian tính toán giới hạn là 5 phút/Continue/OK.
lOMoARcPSD| 59062190
-Do làm tròn đến 2 chữ số thập phân nên giá trị của Exact Sig ~0,078 (không có sự chênh lệch
đáng kể), bấm đúp chuột 2 lần vào bảng Chi-quare test thì ta thấy được giá trị p=0,077614 thấp
hơn so với giá trị ý nghĩa p-value của Chi-square ban đầu. Trong trường hợp này có p<0.05 nên
ta bác bỏ giả thuyết Ho.
¡4. Tình trạng thiếu máu có liên quan đến trình độ học vấn của mẹhay không với độ tin cậy 95%
(kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs) -Tương tự như trên, vẫn dính hai giá trị
kỳ vọng <5 he.
¡5. Phương pháp sinh có liên quan đến đến nhóm cân nặng lúc sinhcủa trẻ (<2500
g và >=2500g) hay không với độ tin cậy 95%? (kiểm định 2 tỷ lệ ở hai nhóm độc lập =>
Crosstabs)
-Tương tự như trên, vẫn dính 1 giá trị kỳ vọng <5.
Phần B:
1.Kiểm định xem chiều cao của các trẻ > 10 tuổi có khác biệtvới chiều cao 140
cm với độ tin cậy 95%? (kiểm định 1 trung bình lý thuyết với một trung bình nghiên cứu
cho trước => One-Samples T-test)
-Sử dụng Data/Select Cases (để chọn các trường hợp trẻ có tuoi > 10)
-Sử dụng Analyze/Compare Means/One-Samples T-Test
-Test Value 140 là giá trị trung bình nghiên cứu cho trước (140cm)
2.Cho biết số lượng và tỷ lệ các trẻ nhẹ cân (cân nặng lúc sinh< 2500g) và không nhẹ cân (≥
2.500g). Kiểm định xemtrung bình chu vi vòng cánh tay của trẻ >
10 tuổi có khácnhau giữa tình trạng lúc sinh nhẹ cân và không nhẹ cânvới độ tin cậy 95%?
(kiểm định 2 mẫu độc lập => Independent Samples T Test)
-Sử dụng Select Cases để chọn các trường hợp tuoi > 10
-Recode into Different variables để chia 2 nhóm
-Sử dụng Analyze/Compare Means/Independent Sample T Test
lOMoARcPSD| 59062190
-Vì Tuấn Recode nhóm cnls thành 0 là nhẹ cân 1 là không nhẹ cân nên Tuấn để 0 và 1 vào
Define Group/nhấn Continue/OK
-Cách đọc kết quả:
(1) xem kết quả ở Levene (trong bảng Independent Samples Test), đọc Sig p=0,331>0,05 nên
phương sai tương đương, p<0,05 thì ngược lại
(2) phương sai tương đương nên đọc kết quả ở “Equal variances assumed”. Đọc ở ô Sig
(2tailed) => p-value = 0,651>0,05 => kết luận giả thuyết
3.Phân nhóm cân nặng lúc sinh của trẻ làm 3 nhóm: nhóm 1: < 2.500g; nhóm 2: 2.500 -
4.000g; nhóm 3: > 4.000g.
Cho biết số lượng và tỷ lệ các nhóm cân nặng lúc sinh. Kiểmđịnh xem trung bình chu vi vòng
cánh tay của trẻ > 10 tuổicó khác nhau giữa các nhóm cân nặng lúc sinh với độ tin cậy 95%?
(kiểm định phương sai 1 chiều => One-way ANOVA)
-Recode into different variables để chia 3 nhóm cân nặng lúc sinh.
-Select Cases để chọn những trường hợp tuổi >10
-Sử dụng Analyze/Compare Means/One-way ANOVA
lOMoARcPSD| 59062190
BGTH4:
Câu 1.Phân nhóm tính trạng thiếu máu của trẻ dựa vào giá trị Hemoglobin theo tiêu chuẩn
*Bình thường > 11g/dl *Thiếu máu <= 11g/dl
1.Kiểm định xem tỷ lệ thiếu máu ở trẻ em ở nghiên cứu này có khác với tỷ lệ thiếu máu ở trẻ
em tại Thành phố A là 20% hay không với độ tin cậy 95%?
2.Tình trạng thiếu máu có liên quan đến nhóm cân nặng lúc sinh (< 2500 gram và >= 2500
gram) hay không với độ tin cậy 95%
3.Tình trạng thiếu máu có liên quan đến trình độ học vấn của mẹ hay không (chia nhóm học vấn
từ từ tiểu học trở xuống, thcs, trên thcs) với độ tin cậy 95%.
Câu 2.
1.Mô tả đặc điểm biến số phụ thuộc Hemoglobin (Hb), TB, độ lệch chuẩn, phân bố khoảng tin
cậy 95%.

Preview text:

lOMoAR cPSD| 59062190
Phần 1: (bỏ qua, không cần làm) 1.
Tạo form nhập số liệu dựa vào mẫu phiếu thu thập thông tin về“Bảng câu hỏi thu thập
số liệu đặc điểm bệnh nhân mắc sỏitiết niệu” 2.
Từ form nhập số liệu đã được xây dựng hoàn chỉnh, nhập 3 phiếu với số liệu giả định. Phần 2:
2.1. Sử dụng các kỹ thuật làm sạch số liệu để tìm lỗi sai ở các biến: cân nặng, chiều cao, vòng đ
ầu, vòng ngực (đo lần 1), vòng ngực (đolần 2), vòng cánh tay, hồng cầu, Hemoglobin, huyết cầu tố.
-Sử dụng bảng tần suất Frequencies -
Chuột phải vào tên biến có lỗi ở màn hình Data View -> Sort Ascending để tìm ra các msp lỗi.
2.2. Sử dụng các kỹ thuật làm sạch số liệu để tìm lỗi sai ở các biến: Nguồn thu nhập, các
triệu c hứng thiếu máu (da xanh xao, niêm mạcmắt nhợt nhạt, lòng bàn tay nhợt nhạt,
lưỡi mất gai, mó ng tay nhợtnhạt, gan to).
-Sử dụng Frequencies đưa các biến vào
-Biến nguồn thu nhập lỗi nhập sai giá trị đã mã hóa ở msp 32
2.3. Kiểm tra tính logic của số liệu giữa 2 biến: Trình độ học vấn mẹ(tdhv) và Nghề nghiệp mẹ ( nghe). lOMoAR cPSD| 59062190
-Sử dụng Crosstab để tìm lỗi sai
-Lỗi logic mẹ mù chữ nhưng làm cán bộ công chức
Trinh do hv me * Nghe nghiep me Crosstabulation Count Total Nghe nghiep me nong dan cong nhan noi tro / khong kinh doanh / can bo cong nghe buon ban chuc mu chu 12 127 0 0 1 140 biet doc / viet 2 136 4 0 0 142 tieu hoc 5 113 3 0 0 121 Trinh do hv me THCS 5 108 2 0 0 115 THPT 5 66 0 2 2 75 TC, DH 0 0 0 6 1 7 Total 29 550 9 8 4 600
1.Biến số nào chứa lỗi sai trong những biến số kể trên?
2.Mã số phiếu chứa lỗi sai trong những trường hợp trên? Phần 3:
3.1. Chia 5 nhóm cân nặng từ biến cân nặng: •nhóm 1: < 10 kg •nhóm 2: 10 - <20 kg •nhóm 3: 20 - <30 Kg •nhóm 4: 30 - <40 Kg •nhóm 5: ≥ 40 Kg
-Sử dụng Transform/Recode into Different Variable -Đưa
biến Cân nặng vào ô to, đặt tên biến và nhãn của biến -Vào
Old and New Value chia như sau:
Nhóm 1: LOWEST thru value 9.99
Nhóm 2: Range 10 đến 19.99
Nhóm 3: Range 20 đến 29.99
Nhóm 4: Range 30 đến 39.99 Nhóm 5: All others values lOMoAR cPSD| 59062190
-Tích vào ô Output variables are string, chỉnh >8
3.2. Chia trình độ học vấn mẹ thành 3 nhóm:
•HV thấp : Mù chữ + biết đọc, viết
•HV trung bình : Tiểu học + THCS •HV cao : THPT + TC, ĐH (tương tự như trên)
Dùng Analyze/Descriptive Statistics/Frequencies, đưa biến mới Recode vào.
Cho biết số lượng và tỷ lệ mỗi nhóm sau khi mã hóa lại biến số? BGTH2:
https://drive.google.com/file/d/1aylO_5jNBdaXQswjvNoPbUNvISKaTFbN/view
Bài tập 1. Phân nhóm tình trạng thiếu máu của trẻ dựa vào giá trị Hemoglobin theo tiêu chuẩn:
•Bình thường >11 g/dl
•Thiếu máu nhẹ: khi Hb từ > 9 g/dl đến 11 g/dl •Thiếu
máu trung bình: khi Hb từ 6 g/dl đến 9 g/dl
•Thiếu máu nặng: khi Hb từ < 6 g/dl.
(sử dụng Recode into different variables, tương tự như trên)
1.Tính số lượng và tỷ lệ % của các mức độ thiếu máu.
(sử dụng bảng Frequencies, tương tự như trên) lOMoAR cPSD| 59062190
2.Tính tỷ lệ các mức độ thiếu máu ở trẻ em nam và trẻ em nữ. Vẽ biểu đồminh họa.
-Sử dụng Crosstab đưa biến Giới tính và nhóm thiếu máu (mới recode) vào Row và Column (không phân biệt)
-Sử dụng Graph/Legacy/Bar/Clustered/nhấn Define/đưa biến nhóm thiếu máu và giới tính vào
Category Axis và Define Clusters by lOMoAR cPSD| 59062190
Bài tập 2. Tính chỉ số khối cơ thể (BMI) dựa trên các biến số cân nặng và chiềucao.
-Sử dụng Transform/Compute Variable/đặt tên biến ở Target Variable
-Ở Numeric Expression: (cannang)/((chieucao/100)*(chieucao/100)) (vì BMI = cân nặng/ (chiều cao (m))^2
1.Tính giá trị trung bình, độ lệch chuẩn, giá trị nhỏ nhất và lớn nhất của BMI
-Sử dụng Frequencies/đưa biến BMI vào ô to/Statistics/tích vào các ô Mean, Std.Deviation, Minimum, Maximum
2.Tính giá trị trung bình của BMI theo các mức độ thiếu máu lOMoAR cPSD| 59062190
-Sử dụng Analyze/Descriptive Statistics/Explore/đưa biến BMI vào Dependent List/đưa biến
nhóm thiếu máu vào Factor List/trong phần Statistic tích vào ô Descriptive/nhấn Continue và OK. Descriptives nhom thieu mau Statistic Std. Error BMI Mean Lower Bound 15.325 .14313 3
95% Confidence Interval for Upper Bound 15.044 Mean 0 5% Trimmed Mean 15.606 Median 7 Variance 15.141 5 Std. Deviation 14.987 8 8.318 2.8840 binhthuo 2 Minimum 6.73 Maximum 34.72 Range 27.98 Interquartile Range 2.65 Skewness 2.015 .121 Kurtosis 10.232 .242 Mean Lower Bound 13.922 1.31973 7
95% Confidence Interval for Upper Bound 10.258 Mean 5 5% Trimmed Mean 17.586 Median 8 Variance 13.924 1 Std. Deviation 14.567 9 8.708 2.9510 nang 0 Minimum 9.92 lOMoAR cPSD| 59062190 Maximum 17.90 Range 7.98 Interquartile Range 5.08 Skewness -.053 .913 Kurtosis .443 2.000 nhe Mean 14.9125 .20705
95% Confidence Interval for Lower Bound 14.5036 Mean Upper Bound 15.3213 5% Trimmed Mean 14.7913 Median 14.6092 Variance 6.988 Std. Deviation 2.64342 Minimum 6.66 Maximum 25.83 Range 19.17 Interquartile Range 2.42 Skewness 1.032 .190 Kurtosis 3.450 .378 Mean 15.352 .41283 0 95% Confidence Interval for Lower Bound 14.501 Mean Upper Bound 7 5% Trimmed Mean 16.202 Median 2 Variance 15.404 3 Std. Deviation 15.408 0 4.431 2.1050 trungbin 4 Minimum 9.69 lOMoAR cPSD| 59062190 Maximum 19.64 Range 9.95 Interquartile Range 2.88 Skewness -.365 .456 Kurtosis .975 .887
Bài tập 3. Khảo sát các đặc điểm lâm sàng thiếu máu bao gồm: da xanh, niêm mạc mắt nhợt,
móng tay nhợt, lưỡi mất gai, gan to, lách to.
-Recode lại biến lách to thành lách to 2, với 1-> 0, các giá trị khác-> 2 (vì biến lách to ban đầu
là theo mức độ, giừ phải chuyển biến ni thành biến bị hoặc không bị giống mấy biến trên)
-Chuyển 6 biến da xanh,niêm mạc mắt nhợt, móng tay nhợt, lưỡi mất gai, gan to, lách to 2 từ
String thành Numeric (ở màn hình Variable View).
-Sử dụng Transform/Count Values within Cases/rồi làm theo ảnh (<3), đưa 6 biến vào
-Ở Define Values, là gõ giá trị để được đếm, gõ 2 (nghĩa là 2 quy ước cho bị 6 triệu chứng trên,
giừ đếm số triệu chứng bị thì gõ 2 vô đây)/ Nhấn OK.
1. Tỷ lệ trẻ có ít nhất 1 triệu chứng trên là bao nhiêu %.
-Sử dụng Frequencies như bình thường thôi, lấy 100- tỉ lệ 0 mắc triệu chứng nào là ra. nhom trieu chung Frequency Percent Valid Percent Cumulative Percent .00 374 62.3 62.3 62.3 1.00 41 6.8 6.8 69.2 2.00 108 18.0 18.0 87.2 3.00 10 1.7 1.7 88.8 Valid 4.00 21 3.5 3.5 92.3 5.00 10 1.7 1.7 94.0 lOMoAR cPSD| 59062190 6.00 36 6.0 6.0 100.0 Total 600 100.0 100.0
2. Triệu chứng nào là phổ biến nhất?
-Sử dụng Analyze/Multiple Response/Define Variables Set/rồi làm như ảnh
-Counted value vẫn là 2 (vì quy ước 2 là bị bệnh), đặt tên biến ở dưới nữa hi/nhấn Add
-Lại sử dụng Analyze/Multiple Response/lúc này thấy hiện ra thêm dòng Frequencies/bấm vào.
-Chuyển biến sang rồi nhấn OK.
$trieuchungthieumau Frequencies Responses Percent of Cases N Percent Da xanh xao 220 34.5% 97.3% Niem mac mat nhot nhat 182 28.6% 80.5% Luoi mat gai 65 10.2% 28.8% $trieuchungthieumaua Mong tay nhot nhat 74 11.6% 32.7% Gan to 47 7.4% 20.8% lachto2 49 7.7% 21.7% Total 637 100.0% 281.9%
a. Dichotomy group tabulated at value 2. lOMoAR cPSD| 59062190
-Dựa vô bảng tự kết luận
Bài tập 4. Xác định tỷ lệ thiếu máu cận lâm sàng theo quy định của TCYTTG năm 2001
•Trẻ < 6 tuổi: Hb < 110 g/l
•Trẻ 6-15 tuổi: Hb < 120g/l
-Sử dụng Data/Select Cases/chọn If condition is satisfied/làm như ảnh
-Theo ycbt thì ta chọn những trường hợp “tuổi <6 có Hb<11” và”tuổi>= 6 có Hb<12 (vì
bài tuổi max của bệnh nhân là 15 nên để ri hoặc tổng quát thì để thành 6<= tuoi <= 15”/nhấn Continue/OK
=> Hiện ra biến mới với quy ước 0(không được chọn, nghĩa là không thiếu máu) 1(được
chọn nghĩa là thiếu máu)
1.Tỷ lệ thiếu máu trẻ em tại vùng A?
-Sử dụng Frequencies với biến mới ở trên (nhớ vào Select Cases chọn lại All Case để xét
toàn bộ trường hợp cho bảng Frequencies)
(tuoi < 6) & (Hb < 11) | (tuoi >= 6) & (Hb < 12) (FILTER) Frequency Percent Valid Percent Cumulative Percent Not Selected 363 60.5 60.5 60.5 Selected 237 39.5 39.5 100.0 Valid Total 600 100.0 100.0
2.Khoảng tin cậy 95% và 99% tỷ lệ thiếu máu trẻ em tại vùng A?
-Sử dụng Analyze/Compare Means/One Sample T Test đối với biến mới tạo One-Sample Test Test Value = 0 t df Sig. (2-tailed) Mean Difference
95% Confidence Interval of the Difference lOMoAR cPSD| 59062190 Lower Upper
(tuoi < 6) & (Hb < 11) | (tuoi
>= 6) & (Hb < 12) (FILTER) 19.776 599 .000 .395 .36 .43
-Khoảng tin cậy là đoạn Lower và Upper ở trên
3.Giá trị trung bình của Hb ở những trẻ mắc thiếu máu tại vùng A?
-Sử dụng Frequencies chọn Mean ở Statistics rồi nhấn OK. Statistics Hemoglobin (tuoi < 6) & (Hb (g/dl) < 11) | (tuoi >= 6) & (Hb < 12) (FILTER) N Valid 600 600 Missing 0 0 Mean .40 11.574
4.Khoảng tin cậy 95% và 99% giá trị trung bình của Hb ở những trẻ mắc thiếu máu tại vùng A?
-Sử dụng Explore/đư a biến Hb vào ô phụ thuộc/đư a biến mới tạo vào ô độc lập Descriptives
(tuoi < 6) & (Hb < 11) | (tuoi >= 6) & (Hb < 12) (FILTER) Statistic Std. Error Lower Bound Mean 12.424 .0469 Upper Bound 95% Confidence Interval for 12.332 Mean 12.516 5% Trimmed Mean 12.385 Median 12.300 Variance .799 Not Selected Std. Deviation .8940 Minimum 11.0 Maximum 15.6 Range 4.6 Interquartile Range 1.2 Skewness .496 .128 Kurtosis .211 .255 Hemoglobin (g/dl) lOMoAR cPSD| 59062190 Mean Lower Bound 10.272 .0910
95% Confidence Interval for Upper Bound 10.093 Mean 10.452 5% Trimmed Mean 10.429 Median 10.600 Variance 1.964 Selected Std. Deviation 1.4013 Minimum 2.4 Maximum 11.9 Range 9.5 Interquartile Range 1.3 Skewness -2.545 .158 Kurtosis 9.797 .315
- Tương tự với khoảng tin cậy 99% he, đổi khoảng tin cậy ở Explore/Statistics BGTH3:
https://drive.google.com/file/d/1W6cyCfZYWvN2SodgNm5YE1Dj5LLgyOxE/view Phần A:
¡1. Kiểm định xem tỷ lệ thiếu máu ở trẻ em ở nghiên cứu này cókhác với tỷ lệ thiếu máu ở trẻ e
m tại Thành phố A là 20% hay không với độ tin cậy 95%? (kiểm định 1 tỷ lệ nghiên cứu với 1
tỷ lệ cho trước => sử dụng Chi-square)
(thiếu dữ kiện, thêm quy ước cho bài ni, thiếu máu <11Hb, bình thường >=11, dùng Recode into Different Variables)
-Sử dụng Analyze/Nonparametric Test/Legacy Dialog/Chi-square lOMoAR cPSD| 59062190
- 0,8 và 0,2 là tỉ lệ bình thường, thiếu máu đem đi kiểm định (để theo thứ tự quy ước, ở trên
quyước 0 là bình thường, 1 là thiếu máu)
¡2. Tình trạng thiếu máu có liên quan đến nhóm cân nặng lúc sinh (< 2.500 gram và ≥ 2.500
gram) hay không với độ tin cậy 95%. (kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs) -
Sử dụng Recode into Different variables để chia nhóm cnls.
-Sử dụng Analyze/Descriptive Statistics/Crosstabs. lOMoAR cPSD| 59062190 -Nhấn Continue/OK. lOMoAR cPSD| 59062190
-Thấy rằng các quan sát đều độc lập nhau, bảng 2x2 các giá trị kỳ vọng > 5(Expected Count >5)
nên giả định Chi-square được thỏa mãn, ta đọc p-value ở Pearson Chi-square, còn trường hợp
trên bị vi phạm thì dùng Fisher’s Exact Test, lúc đó ta đọc p-value ở hàng Exact Sig (bài tới gặp).
¡3. Trình độ học vấn của mẹ có liên quan đến nhóm cân nặng lúcsinh của trẻ hay không với độ t
in cậy 95%? (kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs) -Sử dụng Crosstab tương tự như trên.
Trinh do hv me * nhomcnls Crosstabulation nhomcnls Total .00 1.00 Count 8 94 102 Expected Count 6.0 96.0 102.0 100.0% % within Trinh do hv me 7.8% 92.2% Trinh do hv me mu chu lOMoAR cPSD| 59062190 % within nhomcnls 28.6% 21.1% 21.6% % of Total 1.7% 19.9% 21.6% Count 3 81 84 Expected Count ~5.0 79.0 84.0 100.0% % within Trinh do hv me 3.6% 96.4% biet doc / viet % within nhomcnls 10.7% 18.2% 17.8% % of Total 0.6% 17.1% 17.8% Count 3 101 104 Expected Count 6.2 97.8 104.0 100.0% % within Trinh do hv me 2.9% 97.1% tieu hoc % within nhomcnls 10.7% 22.7% 22.0% % of Total 0.6% 21.4% 22.0% Count 8 95 103 Expected Count 6.1 96.9 103.0 100.0% % within Trinh do hv me 7.8% 92.2% THCS % within nhomcnls 28.6% 21.3% 21.8% % of Total 1.7% 20.1% 21.8% Count 4 70 74 Expected Count 4.4 69.6 74.0 100.0% % within Trinh do hv me 5.4% 94.6% THPT % within nhomcnls 14.3% 15.7% 15.6% % of Total 0.8% 14.8% 15.6% Count 2 4 6 Expected Count .4 5.6 6.0 % within Trinh do hv me 33.3% 66.7% 100.0% TC, DH % within nhomcnls 7.1% 0.9% 1.3% % of Total 0.4% 0.8% 1.3% Count 28 445 473 Expected Count 28.0 445.0 473.0 100.0% % within Trinh do hv me 5.9% 94.1% Total % within nhomcnls 100.0% 100.0% 100.0% % of Total 5.9% 94.1% 100.0% lOMoAR cPSD| 59062190
-Theo báo cáo có 3 giá trị kỳ vọng (Expected Count) <5, giá trị nhỏ nhất của giá trị kỳ vọng là
0,36 nên ta sử dụng kiểm định chính xác của Fisher (Fisher’s Exact Test). -Sử dụng Crosstab.
-Các lựa chọn vẫn giống như của Chi-square, chỉ khác ở đoạn Exact, lựa chọn Exact với thời
gian tính toán giới hạn là 5 phút/Continue/OK. lOMoAR cPSD| 59062190
-Do làm tròn đến 2 chữ số thập phân nên giá trị của Exact Sig ~0,078 (không có sự chênh lệch
đáng kể), bấm đúp chuột 2 lần vào bảng Chi-quare test thì ta thấy được giá trị p=0,077614 thấp
hơn so với giá trị ý nghĩa p-value của Chi-square ban đầu. Trong trường hợp này có p<0.05 nên
ta bác bỏ giả thuyết Ho.
¡4. Tình trạng thiếu máu có liên quan đến trình độ học vấn của mẹhay không với độ tin cậy 95%
(kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs) -Tương tự như trên, vẫn dính hai giá trị kỳ vọng <5 he.
¡5. Phương pháp sinh có liên quan đến đến nhóm cân nặng lúc sinhcủa trẻ (<2500
g và >=2500g) hay không với độ tin cậy 95%? (kiểm định 2 tỷ lệ ở hai nhóm độc lập => Crosstabs)
-Tương tự như trên, vẫn dính 1 giá trị kỳ vọng <5. Phần B:
1.Kiểm định xem chiều cao của các trẻ > 10 tuổi có khác biệtvới chiều cao 140
cm với độ tin cậy 95%? (kiểm định 1 trung bình lý thuyết với một trung bình nghiên cứu
cho trước => One-Samples T-test)
-Sử dụng Data/Select Cases (để chọn các trường hợp trẻ có tuoi > 10)
-Sử dụng Analyze/Compare Means/One-Samples T-Test
-Test Value 140 là giá trị trung bình nghiên cứu cho trước (140cm)
2.Cho biết số lượng và tỷ lệ các trẻ nhẹ cân (cân nặng lúc sinh< 2500g) và không nhẹ cân (≥
2.500g). Kiểm định xemtrung bình chu vi vòng cánh tay của trẻ >
10 tuổi có khácnhau giữa tình trạng lúc sinh nhẹ cân và không nhẹ cânvới độ tin cậy 95%?
(kiểm định 2 mẫu độc lập => Independent Samples T Test)
-Sử dụng Select Cases để chọn các trường hợp tuoi > 10
-Recode into Different variables để chia 2 nhóm
-Sử dụng Analyze/Compare Means/Independent Sample T Test lOMoAR cPSD| 59062190
-Vì Tuấn Recode nhóm cnls thành 0 là nhẹ cân 1 là không nhẹ cân nên Tuấn để 0 và 1 vào
Define Group/nhấn Continue/OK -Cách đọc kết quả: (1)
xem kết quả ở Levene (trong bảng Independent Samples Test), đọc Sig p=0,331>0,05 nên
phương sai tương đương, p<0,05 thì ngược lại (2)
phương sai tương đương nên đọc kết quả ở “Equal variances assumed”. Đọc ở ô Sig
(2tailed) => p-value = 0,651>0,05 => kết luận giả thuyết
3.Phân nhóm cân nặng lúc sinh của trẻ làm 3 nhóm: nhóm 1: < 2.500g; nhóm 2: 2.500 - 4.000g; nhóm 3: > 4.000g.
Cho biết số lượng và tỷ lệ các nhóm cân nặng lúc sinh. Kiểmđịnh xem trung bình chu vi vòng
cánh tay của trẻ > 10 tuổicó khác nhau giữa các nhóm cân nặng lúc sinh với độ tin cậy 95%?
(kiểm định phương sai 1 chiều => One-way ANOVA)
-Recode into different variables để chia 3 nhóm cân nặng lúc sinh.
-Select Cases để chọn những trường hợp tuổi >10
-Sử dụng Analyze/Compare Means/One-way ANOVA lOMoAR cPSD| 59062190 BGTH4:
Câu 1.Phân nhóm tính trạng thiếu máu của trẻ dựa vào giá trị Hemoglobin theo tiêu chuẩn
*Bình thường > 11g/dl *Thiếu máu <= 11g/dl
1.Kiểm định xem tỷ lệ thiếu máu ở trẻ em ở nghiên cứu này có khác với tỷ lệ thiếu máu ở trẻ
em tại Thành phố A là 20% hay không với độ tin cậy 95%?
2.Tình trạng thiếu máu có liên quan đến nhóm cân nặng lúc sinh (< 2500 gram và >= 2500
gram) hay không với độ tin cậy 95%
3.Tình trạng thiếu máu có liên quan đến trình độ học vấn của mẹ hay không (chia nhóm học vấn
từ từ tiểu học trở xuống, thcs, trên thcs) với độ tin cậy 95%. Câu 2.
1.Mô tả đặc điểm biến số phụ thuộc Hemoglobin (Hb), TB, độ lệch chuẩn, phân bố khoảng tin cậy 95%.