
Cc phương php lm sch d liu: SPSS
1. Kiểm tra v xử lý gi trị thiếu (Missing Values)
Cch kiểm tra
Analyze → Descriptive Statistics → Frequencies / Descriptives / Explore
Xem: Missing, Valid, Percent.
Cch xử lý
Loi bỏ (Listwise / Pairwise deletion)
Thay thế bằng gi trị
o Mean/Median/Mode (thường dùng cho thang đo Likert)
o Regression imputation (dự đoán bằng biến khác)
o Multiple imputation (Analyze → Multiple Imputation)
2. Pht hin v xử lý ngoi l (Outliers)
Cch kiểm tra trong SPSS
Analyze → Descriptive Statistics → Explore
o Xem Boxplot (giá trị > 1.5 IQR hoặc > 3SD)
Graphs → Chart Builder → Boxplot
Kiểm tra Z-score:
o |Z| > 3 → nghi ngờ ngoại lệ
o Tính bằng Descriptives → Save standardized values
Xử lý
Loại bỏ quan sát có outlier quá lớn
Winsorizing (đưa về gần ngưỡng)
Kiểm tra nhập liệu sai và sửa lại
3. Kiểm tra d liu nhập sai (Data Entry Errors)

Ví dụ lỗi:
Giá trị ngoài phạm vi (ví dụ thang 1–5 nhưng có 7)
Sai định dạng (string thay vì numeric)
SPSS hỗ trợ:
Data → Validation → Validate Data
o Kiểm tra: range, loại dữ liệu, giá trị lặp
Thiết lập Variable View:
o Values, Measure, Decimals, Missing, Range
4. Pht hin trường hợp trả lời thiếu trung thực / không nhất qun
Công cụ trong SPSS:
Kiểm tra response pattern:
Analyze → Descriptive → Frequencies (xem tất cả trả lời giống nhau)
Tính Mahalanobis Distance để lọc trường hợp bất thường khi phân tích nhiều
biến:
o Analyze → Regression → Linear → Save → Mahalanobis
Xử lý
Loại các dòng có:
o Trả lời 1 kiểu (straight-line)
o Thời gian quá nhanh (nếu có dữ liệu)
o Mâu thuẫn logic (ví dụ tuổi = 5 nhưng “thu nhập 20 triệu”)
5. Kiểm tra trùng lặp (Duplicates)
SPSS thao tc
Data → Identify Duplicate Cases
o Chọn ID (hoặc các biến định danh)
o SPSS sẽ tạo biến Duplicates = 0/1
Xử lý
Giữ lại bản ghi đúng
Xóa bản ghi trùng
6. Chuẩn hóa d liu (Coding & Recoding)

Cc thao tc trong SPSS
Recode into Same Variables / Different Variables
o Gom nhóm (ví dụ tuổi thành 3 nhóm)
o Chuẩn hóa mã hóa (Nam = 1, Nữ = 0)
Compute Variable
o Tạo biến tổng, trung bình (ví dụ điểm FOMO chung)
Xử lý vấn đề không đồng nhất
Các biến cùng ý nghĩa nhưng mã khác nhau (VD: nam/nữ được nhập 1–2, 0–1, M–
F)
→ cần chuẩn hóa lại.
7. Pht hin phân phối bất thường
Kiểm tra Skewness – Kurtosis
Analyze → Descriptives
Kiểm tra Histogram
Graphs → Legacy Dialogs → Histogram
Xử lý (nếu cần phân phối chuẩn cho phân tích tuyến tính):
Log-transform, Square-root, Box-Cox…
Bấm Tải xuống để xem toàn bộ.
Preview text:
Các phương pháp làm sạch dữ liệu: SPSS
1. Kiểm tra và xử lý giá trị thiếu (Missing Values)
Cách kiểm tra
- Analyze → Descriptive Statistics → Frequencies / Descriptives / Explore
- Xem: Missing, Valid, Percent.
Cách xử lý
- Loại bỏ (Listwise / Pairwise deletion)
- Thay thế bằng giá trị
- Mean/Median/Mode (thường dùng cho thang đo Likert)
- Regression imputation (dự đoán bằng biến khác)
- Multiple imputation (Analyze → Multiple Imputation)
2. Phát hiện và xử lý ngoại lệ (Outliers)
Cách kiểm tra trong SPSS
- Analyze → Descriptive Statistics → Explore
- Xem Boxplot (giá trị > 1.5 IQR hoặc > 3SD)
- Graphs → Chart Builder → Boxplot
- Kiểm tra Z-score:
- |Z| > 3 → nghi ngờ ngoại lệ
- Tính bằng Descriptives → Save standardized values
Xử lý
- Loại bỏ quan sát có outlier quá lớn
- Winsorizing (đưa về gần ngưỡng)
- Kiểm tra nhập liệu sai và sửa lại
3. Kiểm tra dữ liệu nhập sai (Data Entry Errors)
Ví dụ lỗi:
- Giá trị ngoài phạm vi (ví dụ thang 1–5 nhưng có 7)
- Sai định dạng (string thay vì numeric)
SPSS hỗ trợ:
- Data → Validation → Validate Data
- Kiểm tra: range, loại dữ liệu, giá trị lặp
- Thiết lập Variable View:
- Values, Measure, Decimals, Missing, Range
4. Phát hiện trường hợp trả lời thiếu trung thực / không nhất quán
Công cụ trong SPSS:
- Kiểm tra response pattern:
Analyze → Descriptive → Frequencies (xem tất cả trả lời giống nhau) - Tính Mahalanobis Distance để lọc trường hợp bất thường khi phân tích nhiều biến:
- Analyze → Regression → Linear → Save → Mahalanobis
Xử lý
- Loại các dòng có:
- Trả lời 1 kiểu (straight-line)
- Thời gian quá nhanh (nếu có dữ liệu)
- Mâu thuẫn logic (ví dụ tuổi = 5 nhưng “thu nhập 20 triệu”)
5. Kiểm tra trùng lặp (Duplicates)
SPSS thao tác
- Data → Identify Duplicate Cases
- Chọn ID (hoặc các biến định danh)
- SPSS sẽ tạo biến Duplicates = 0/1
Xử lý
- Giữ lại bản ghi đúng
- Xóa bản ghi trùng
6. Chuẩn hóa dữ liệu (Coding & Recoding)
Các thao tác trong SPSS
- Recode into Same Variables / Different Variables
- Gom nhóm (ví dụ tuổi thành 3 nhóm)
- Chuẩn hóa mã hóa (Nam = 1, Nữ = 0)
- Compute Variable
- Tạo biến tổng, trung bình (ví dụ điểm FOMO chung)
Xử lý vấn đề không đồng nhất
- Các biến cùng ý nghĩa nhưng mã khác nhau (VD: nam/nữ được nhập 1–2, 0–1, M–F)
→ cần chuẩn hóa lại.
7. Phát hiện phân phối bất thường
- Kiểm tra Skewness – Kurtosis
Analyze → Descriptives - Kiểm tra Histogram
Graphs → Legacy Dialogs → Histogram
Xử lý (nếu cần phân phối chuẩn cho phân tích tuyến tính):
- Log-transform, Square-root, Box-Cox…