Hướng dẫn dạy phân tích dữ liệu | Đại học Ngoại Ngữ - Tin Học Thành Phố Hồ Chí Minh

Hướng dẫn dạy phân tích dữ liệu | Đại học Ngoại Ngữ - Tin Học Thành Phố Hồ Chí Minh được sưu tầm và soạn thảo dưới dạng file PDF để gửi tới các bạn sinh viên cùng tham khảo, ôn tập đầy đủ kiến thức, chuẩn bị cho các buổi học thật tốt. Mời bạn đọc đón xem

A. ĐÁNH GIÁ ĐỘ TIN CẬY THANG ĐO cronbach’s alpha
I. Điều kiện
- Thang đo Likert (thang đo Scale nhưng cột Values không gán gtri thì khong phải
Likert)
- Mỗi thang đo phải từ 3 biến quan sát trở lên
- Làm từng thang đo một (Độc lập X và Phụ thuộc Y)
II. Bước đầu tiên
Vào Edit Options General Display names OK
Output Names Labels Names Labels OK
III. Bước thực hiện
Vào Scales Reliability Analyzis Đưa các biến cùng gtri vào ô Iteams Analyze
Vào Statitistics Scales if Item Delected (tìm ra những biến <0.6 để loại bỏ)
OK
IV. Đánh giá độ tin cậy thang đo cần kiểm tra 3 điều kiện sau:
1. Hệ số (tương quan biến tổng) Corrected Item -Total ≥ 0,3
2. Hệ số (nếu loại biến) cả thag đo CRON Alpha if Item Delected ≤ hệ số Cronbach’s Alpha
3. Hệ số cả thang đo Cronbach’s Alpha ≥ 0,6
LƯU Ý:
- 1 thang đo tối thiểu phải có ít nhất 3 biến quan sát.
- Nếu loại đi 1 biến mà số biến còn lại nhỏ hơn 3 thì loại cả thang đo đó.
Đặt tên:VD: NT L1_LOAI NT2_DK1
Điều kiện 1
(Hệ số tương quan
biến - tổng)
TH 1 Nếu tất cả đều thỏa (≥ 0,3) Chuyển sang điều kiện 2
TH 2 Nếu 1 biến < 0,3 Loại đi biến đó
TH 3 Nếu có nhiều biến < 0,3 Loại đi biến nào có hệ số
nhỏ nhất
Điều kiện 2
(Hệ số Alpha nếu
loại biến)
TH 1 Nếu tất cả đều thoả
(≤ hệ số Alpha)
Chuyển sang điều kiện 3
TH 2 Nếu có 1 biến không thoả Loại đi biến đó
TH 3 Nếu có nhiều biến không
thoả
Loại đi biến có hệ số
Alpha loại biến cao nhất
Điều kiện 3
(hệ số Alpha)
TH 1 Thoả điệu kiện Chuyển sang thang đo tiếp
theo
TH 2 Hệ số Alpha < 0,6 Loại thang đo
NHỮNG BIẾN ĐÃ LOẠI Ở CRONBACH’S ALPHA THÌ KHÔNG ĐƯỢC DÙNG TIẾP
B. PHÂN TÍCH NHÂN TỐ EFA
I. Điều kiện
− Chỉ kiểm tra cho thang đo Likert (cả độc lập X và phụ thuộc Y)
− Chỉ phân tích các biến đã thoả điều kiện sau khi phân tích Cronbach’s Alpha Chạy X riêng,
chạy Y riêng
II. Bước thực hiện
Vào Dismension Reduction Factors Analyze
Chọn biến Y trước_rồi làm biến X sau
Descriptives chọn ô 1,2,3,6 Continue
Rotation Varimax Continue
Scores Display Factor.. Continue
Options Sorted by size + Suppress Small Coefficient Continue
OK
III. 5 ĐIỀU KIỆN CẦN XÉT:
Vào KMO nằm trong đoạn (Để xem nhân tố có thích hợp với dữ liệu không) [0,5;1]
Sig (Barttlet) ≤ α (α = 0.05, Xét mối quan hệ giữa các biến quan sát trong tổng thể)
Vào _ Cumulative (Tổng phương sai trích) chỉ số EigenvaluesTotal Variance 0,5
(Total) ≥ 1
(Điều kiện 4, 5_ làm của biến X, bắt đầu làm ma trận xoay)
- Vào nhấp vào bảng Coppy qua Excel nhấp vào tam giácRotated Compoment Matrix
bên trên_tay trái PAST
- Ctrl + H (Bỏ gtri âm) Find what gõ dấu (-) Replace All Close Replace
Đạt giá trị hội tụ ≥ 0,5 (hệ số tải lớn I ≥ 0,5)
Công thức: =MAX(_)
Đạt giá trị phân biệt >0,3 (Số lớn nhất Số lớn nhì >0,3
Công thức: =Gtri lớn nhất
ĐK4 – LARGE(Bôi dòng 1_ Các cột; 2)
- Bôi dòng chữ ĐK4, 5 so sánh các Biến không thỏa ĐK
Chọn Sort Filter Filter
nào thì LOẠI
ĐẶT TÊN: VD: EFA L1_LOAI DL1_DK4
KMO TH 1 Nằm trong khoảng [0,5;1] Chuyển sang ĐK 2
TH 2 Không nằm trong khoảng [0,5;1] Ngưng
Sig (Barttlet) TH 1 Sig (Barttlet) ≤ α Chuyển sang ĐK 3
TH 2 Không thoả Ngưng
Tổng phương
sai trích
TH 1 Tổng phương sai trích ≥50% -
- Chỉ số Eigenvalues ≥ 1
Chuyển sang ĐK 4
TH 2 Không thoả Ngưng
Cách kiểm tra biến đạt như sau: Giá trị hội tụ Phân biệt
Nhìn vào bảng Rotated để kiểm tra giá trị hội tụ và giá trị phân biệt của các biến quan
sát.
Một biến đạt giá trị hội tụ khi có hệ số tải nhân tố lớn nhất của biến đó ≥0,5
Một biến đạt giá trị phân biệt khi biến đó hiệu số 2 hệ số tải nhân tố lớn nhất
(lấy hệ số tải lớn nhất – hệ số tải lớn kế tiếp) >0,3
Kiểm tra điều kiện trước rồi mới kiểm tra đk
Điều kiện 4
(Hệ số tải lớn nhất
≥ 0,5)
TH 1 Nếu tất cả đều
thỏa (≥ 0,5)
Chuyển sang điều kiện 5
TH 2 Nếu 1 biến
không thoả
Loại đi biến đó
TH 3 Nếu nhiều biến không thoả ĐK 4. Xét ĐK 5 cho
những biến không thoả, ta có TH 3.1, TH 3.2, TH 3.3
TH 3.1 Tất cả những biến không thỏa đều thỏa
Quay lại đk , loại biến hệ số tải nhất trong
những biến không thỏa.
TH 3.2
Chỉ có 1 biến không thỏa đk Loại đi biến đó
=>
TH 3.3 Tất cả những biến không thỏa nhưng không thỏa
Quay lại kiểm đk , loại biến có hệ số tải bé nhất
trong những biến không thỏa .
Điều kiện 5
TH 1 Tất cả đều
thoả
Hoàn thành bài
(Số lớn nhất – Số
lớn nhì > 0,3)
TH 2 1 biến không
thoả
Loại biến đó
TH 3 Nhiều biến
không thoả
Loại biến chênh lệch hệ số tải
(giá trị lớn nhất giá trị lớn thứ 2)
bé nhất
C. GOM BIẾN
- Lấy bảng Excel cuối cùng đã thỏa ĐK 4, 5 những giá trị hội tụ có giá trị cao chung 1
Bôi
cột (với ĐK ≥ 0,5).
- Vào File Output Tranform Compute Variable
Cột Target Variable (Đặt tên biến theo thứ tự Excel)
Cột Numberic Expression MEAN (...,...,...) Gom các giá trị theo bảng Exel.
(GOM CẢ X VÀ Y)
D. CHẠY HỒI QUY
1. Vào bảng Dữ Liệu: Analyze Regression Linear (dùng những biến đã gộp)
+ Dependent: Cho biến Y (SL ít)
+ Independent: Cho biến X (SL nhiều)
Vào Statistic chọn Durbin – Watson + Collinearity diagnostics Continuen OK
2. Vào bảng OutPut
Điều kiện Bảng Xét
1/ Kiểm tra các
giả định
Vào Regression
Model Summary
- Phần tự tương quan: Kiểm định Durbin
Watson (1;3): nằm trong khoảng Không sự
tương quan giữa các phần dư.
Coefficients
- Hiện tượng đa cộng tuyến HOẶC: VIF<10
giá trị của Tolerance > 0,5: Không hiện
tượng đa cộng tuyến.
2/ Sự tương
quan giữa biến
độc lập và biến
phụ thuộc (r)
Analyze Correlate
Bivariate
Đưa biến Y qua ô
Variables trước rồi
đưa các biến X (lấy
Biến đã gom) OK
NHÌN HÀNG Y
Sig. (2-tailed) α (0.05): giữa biến độc lập
biến phụ thuộc có sự tương quan.
Pearson Correlation (r) : Chiều tương quan:
r>0: tương quan thuận chiều r<0: tương
quan ngược chiều. Cho biết chiều mức độ
tương quan giữa biến phụ thuộc biến độc
lập
Mức độ tương quan:
|𝑟| < 0,2: không có tương quan tuyến tính
0,2 ≤ |𝑟| < 0,4: tương quan yếu
0,4 ≤ |𝑟| < 0,6: tương quan trung bình
0,6 ≤ |𝑟| < 0,8: tương quan mạnh
|𝑟| 0,8: Tương quan rất mạnh
3/ Đánh giá độ
phù hợp của
hình:
Model Summary
Adjusted R square
+ 𝑹
𝟐
hiệu chỉnh ≥ 0.5=> Viết được pt hồi quy
+ 𝑹
𝟐
hiệu chỉnh < 0.5=> KHÔNG Viết pt hồi quy
càng lớn thì sự phù hợp của mô hình với dữ liệu
càng cao và cho biết mức độ phù hợp với dữ liệu
bao nhiêu %. Mô hình phù hợp với dữ liệu. Các
biến quan sát giải thích được % sự thay đổi của
dữ liệu
4/ Kiểm định sự
phù hợp của mô
hình:
ANOVA
Sig. Fα : Mô hình hồi quy tuyến tính phù hơp
với tổng thể
5/ Kiểm định
mối quan hệ
giữa biến độc lập
và phụ thuộc
Coefficient - So sánh của từng biến độc lập với mức ý Sig.
nghĩa , nếu < thì biến độc lập có ý nghĩa.α Sig α
- (Lưu: Nếu không phù hợp thì loại
HQ1_LOAI... vì sig. = ... α=0,05) Trả biến
đã loại về xong chạy lại.
6/ Viết phương
trình hồi quy:
Coefficient Dựa vao hệ số Beta chưa chuẩn hóa
(Unstandardized B), chỉ viết phương trình hồi
quy khi tất cả các biến độc lập có ý nghĩa.
7/ Mức độ tác
động của các yếu
tố trong mô
hình:
Coefficient Dựa vào hệ số Beta chuẩn hóa (Standardized
Coefficient Beta), Beta càng cao thì mức độ tác
động của biến độc lâp đến biến phụ thuộc càng lớn.
| 1/5

Preview text:

A. ĐÁNH GIÁ ĐỘ TIN CẬY THANG ĐO cronbach’s alpha I. Điều kiện
- Thang đo Likert (thang đo Scale nhưng ở cột Values không có gán gtri thì khong phải Likert)
- Mỗi thang đo phải từ 3 biến quan sát trở lên
- Làm từng thang đo một (Độc lập X và Phụ thuộc Y) II. Bước đầu tiên Vào Edit Options   General Display names  OK 
 Output  Names  Labels  Names Labels  OK   III. Bước thực hiện Vào Analyze  Scales  Reliability Analyzis
 Đưa các biến có cùng gtri vào ô Iteams
 Vào Statitistics  Scales if Item Delected (tìm ra những biến <0.6 để loại bỏ) OK
IV. Đánh giá độ tin cậy thang đo cần kiểm tra 3 điều kiện sau:
1. Hệ số Corrected Item -Total (tương quan biến tổng) ≥ 0,3
2. Hệ số CRON Alpha if Item Delected
(nếu loại biến) ≤ hệ số Cronbach’s Alpha cả thag đo
3. Hệ số Cronbach’s Alpha cả thang đo ≥ 0,6 LƯU Ý:
- 1 thang đo tối thiểu phải có ít nhất 3 biến quan sát.
- Nếu loại đi 1 biến mà số biến còn lại nhỏ hơn 3 thì loại cả thang đo đó.
Đặt tên:VD: NT L1_LOAI NT2_DK1 TH 1
Nếu tất cả đều thỏa (≥ 0,3) Chuyển sang điều kiện 2 Điều kiện 1 (Hệ số tương quan TH 2 Nếu 1 biến < 0,3 Loại đi biến đó biến - tổng) TH 3
Nếu có nhiều biến < 0,3
Loại đi biến nào có hệ số nhỏ nhất TH 1
Nếu tất cả đều thoả
Chuyển sang điều kiện 3 Điều kiện 2 (≤ hệ số Alpha) (Hệ số Alpha nếu TH 2
Nếu có 1 biến không thoả Loại đi biến đó loại biến) TH 3
Nếu có nhiều biến không
Loại đi biến có hệ số thoả
Alpha loại biến cao nhất Điều kiện 3 TH 1 Thoả điệu kiện Chuyển sang thang đo tiếp (hệ số Alpha) theo TH 2 Hệ số Alpha < 0,6 Loại thang đo
NHỮNG BIẾN ĐÃ LOẠI Ở CRONBACH’S ALPHA THÌ KHÔNG ĐƯỢC DÙNG TIẾP
B. PHÂN TÍCH NHÂN TỐ EFA I. Điều kiện
− Chỉ kiểm tra cho thang đo Likert (cả độc lập X và phụ thuộc Y)
− Chỉ phân tích các biến đã thoả điều kiện sau khi phân tích Cronbach’s Alpha − Chạy X riêng, chạy Y riêng II. Bước thực hiện
Vào Analyze Dismension Reduction Factors  Chọn biến Y trước_rồi làm biến X sau
 Descriptives  chọn ô 1,2,3,6  Continue
 Rotation  Varimax  Continue
 Scores  Display Factor..  Continue
 Options  Sorted by size + Suppress Small Coefficient  Continue  OK
III. 5 ĐIỀU KIỆN CẦN XÉT:
Vào KMO nằm trong đoạn [0,5;1] (Để xem nhân tố có thích hợp với dữ liệu không) ②
Sig (Barttlet) ≤ α (α = 0.05, Xét mối quan hệ giữa các biến quan sát trong tổng thể) ③
Vào Total Variance_ Cumulative (Tổng phương sai trích) ≥ 0,5 và chỉ số Eigenvalues (Total) ≥ 1
(Điều kiện 4, 5_ làm của biến X, bắt đầu làm ma trận xoay)
- Vào Rotated Compoment Matrix nhấp vào bảng Coppy  qua Excel nhấp vào tam giác bên trên_tay trái  PAST
- Ctrl + H (Bỏ gtri âm)  Replace Find what  gõ dấu (-)  Replace All  Close  ④
Đạt giá trị hội tụ ≥ 0,5 (hệ số tải lớn I ≥ 0,5)  Công thức: =MAX(_) ⑤
Đạt giá trị phân biệt >0,3 (Số lớn nhất – Số lớn nhì >0,3  Công thức: =Gtri lớn nhất
ĐK4 – LARGE(Bôi dòng 1_ Các cột; 2)
- Bôi dòng có chữ ĐK4, 5  Chọn Sort Filter
Filter so sánh các Biến không thỏa ĐK nào thì LOẠI
ĐẶT TÊN: VD: EFA L1_LOAI DL1_DK4
① KMO TH 1 Nằm trong khoảng [0,5;1] Chuyển sang ĐK 2 TH 2
Không nằm trong khoảng [0,5;1] Ngưng ② Sig (Barttlet) TH 1 Sig (Barttlet) ≤ α Chuyển sang ĐK 3 TH 2 Không thoả Ngưng TH 1
- Tổng phương sai trích ≥50% Chuyển sang ĐK 4 ③ Tổng phương
- Chỉ số Eigenvalues ≥ 1 sai trích TH 2 Không thoả Ngưng
Cách kiểm tra biến đạt Giá trị hội tụ và như sau: Phân biệt
Nhìn vào bảng Rotated để kiểm tra giá trị hội tụ và giá trị phân biệt của các biến quan sát.
Một biến đạt giá trị hội tụ khi có hệ số tải nhân tố lớn nhất của biến đó ≥0,5
Một biến đạt giá trị phân biệt khi biến đó có hiệu số 2 hệ số tải nhân tố lớn nhất
(lấy hệ số tải lớn nhất – hệ số tải lớn kế tiếp) >0,3
Kiểm tra điều kiện trước rồi mới kiểm tra đk ④ ⑤ Điều kiện 4 TH 1 Nếu tất cả đều
Chuyển sang điều kiện 5
(Hệ số tải lớn nhất thỏa (≥ 0,5) ≥ 0,5) TH 2 Nếu 1 biến Loại đi biến đó không thoả TH 3
Nếu có nhiều biến không thoả ĐK 4. Xét ĐK 5 cho
những biến không thoả, ta có TH 3.1, TH 3.2, TH 3.3 TH 3.1
Tất cả những biến không thỏa ④ đều thỏa ④ ⑤ ⑤ Quay lại đk ④,
④ loại biến có hệ số tải bé nhất trong những biến không thỏa. TH 3.2
Chỉ có 1 biến không thỏa đk ⑤ => Loại đi biến đó TH 3.3
Tất cả những biến không thỏa ④ ④ nhưng không thỏa
⑤ Quay lại kiểm đk ④, loại biến có hệ số tải bé nhất
trong những biến không thỏa ⑤. ⑤ TH 1 Tất cả đều Hoàn thành bài Điều kiện 5 thoả ⑤
(Số lớn nhất – Số TH 2 1 biến không lớn nhì > 0,3) thoả ⑤ Loại biến đó TH 3 Nhiều biến
Loại biến có chênh lệch hệ số tải không thoả ⑤ ⑤
(giá trị lớn nhất – giá trị lớn thứ 2) bé nhất C. GOM BIẾN
- Lấy bảng Excel cuối cùng đã thỏa ĐK 4, 5  Bôi những giá trị hội tụ có giá trị cao chung 1 cột (với ĐK ≥ 0,5).
- Vào File Output  Tranform  Compute Variable
Cột Target Variable (Đặt tên biến theo thứ tự Excel)
 Cột Numberic Expression  MEAN (...,...,...)  Gom các giá trị theo bảng Exel. (GOM CẢ X VÀ Y) D. CHẠY HỒI QUY
1. Vào bảng Dữ Liệu: Analyze  Regression Linear (dùng những biến đã gộp) 
+ Dependent: Cho biến Y (SL ít)
+ Independent: Cho biến X (SL nhiều)
 Vào Statistic  chọn Durbin – Watson + Collinearity diagnostics  Continuen  OK 2. Vào bảng OutPut Điều kiện Bảng Xét 1/ Kiểm tra các Vào Regression
- Phần dư tự tương quan: Kiểm định Durbin giả định Model Summary
Watson nằm trong khoảng (1;3): Không có sự
tương quan giữa các phần dư. Coefficients
- Hiện tượng đa cộng tuyến: VIF<10 HOẶC
giá trị của Tolerance > 0,5: Không có hiện tượng đa cộng tuyến. 2/ Sự tương Analyze  Correlate  NHÌN HÀNG Y quan giữa biến Bivariate Sig.
(2-tailed) ≤ α (0.05): giữa biến độc lập và
độc lập và biến Đưa biến Y qua ô
biến phụ thuộc có sự tương quan. phụ thuộc (r) Variables trước rồi  đưa các biến X (lấy
Pearson Correlation (r) : Chiều tương quan: Biến đã gom)  OK
r>0: tương quan thuận chiều và r<0: tương
quan ngược chiều. Cho biết chiều và mức độ
tương quan giữa biến phụ thuộc và biến độc lập Mức độ tương quan:
 |𝑟| < 0,2: không có tương quan tuyến tính
 0,2 ≤ |𝑟| < 0,4: tương quan yếu
 0,4 ≤ |𝑟| < 0,6: tương quan trung bình
 0,6 ≤ |𝑟| < 0,8: tương quan mạnh
 |𝑟| 0,8: Tương quan rất mạnh
3/ Đánh giá độ Model Summary 
+ 𝑹𝟐 hiệu chỉnh ≥ 0.5=> Viết được pt hồi quy
phù hợp của mô Adjusted R square
+ 𝑹𝟐 hiệu chỉnh < 0.5=> KHÔNG Viết pt hồi quy hình:
càng lớn thì sự phù hợp của mô hình với dữ liệu
càng cao và cho biết mức độ phù hợp với dữ liệu
bao nhiêu %. Mô hình phù hợp với dữ liệu. Các
biến quan sát giải thích được % sự thay đổi của
dữ liệu 4/ Kiểm định sự ANOVA
Sig. F ≤ α : Mô hình hồi quy tuyến tính phù hơp phù hợp của mô với tổng thể hình: 5/ Kiểm định Coefficient - So sánh
của từng biến độc lập với mức ý Sig. mối quan hệ
nghĩa α, nếu Sig < α thì biến độc lập có ý nghĩa.
giữa biến độc lập
- Nếu không phù hợp thì loại (Lưu: và phụ thuộc
HQ1_LOAI... vì sig. = ... α=0,05)  Trả biến
đã loại về xong chạy lại. 6/ Viết phương Coefficient
Dựa vao hệ số Beta chưa chuẩn hóa trình hồi quy:
(Unstandardized B), chỉ viết phương trình hồi
quy khi tất cả các biến độc lập có ý nghĩa. 7/ Mức độ tác Coefficient
Dựa vào hệ số Beta chuẩn hóa (Standardized
động của các yếu
Coefficient Beta), Beta càng cao thì mức độ tác tố trong mô
động của biến độc lâp đến biến phụ thuộc càng lớn. hình: