Cc phương php lm sch d liu: SPSS
1. Kiểm tra v xử lý gi trị thiếu (Missing Values)
Cch kiểm tra
Analyze → Descriptive Statistics → Frequencies / Descriptives / Explore
Xem: Missing, Valid, Percent.
Cch xử lý
Loi bỏ (Listwise / Pairwise deletion)
Thay thế bằng gi trị
o Mean/Median/Mode (thường dùng cho thang đo Likert)
o Regression imputation (dự đoán bằng biến khác)
o Multiple imputation (Analyze → Multiple Imputation)
2. Pht hin v xử lý ngoi l (Outliers)
Cch kiểm tra trong SPSS
Analyze → Descriptive Statistics → Explore
o Xem Boxplot (giá trị > 1.5 IQR hoặc > 3SD)
Graphs → Chart Builder → Boxplot
Kiểm tra Z-score:
o |Z| > 3 → nghi ngờ ngoại lệ
o Tính bằng Descriptives → Save standardized values
Xử lý
Loại bỏ quan sát có outlier quá lớn
Winsorizing (đưa về gần ngưỡng)
Kiểm tra nhập liệu sai và sửa lại
3. Kiểm tra d liu nhập sai (Data Entry Errors)
Ví dụ lỗi:
Giá trị ngoài phạm vi (ví dụ thang 1–5 nhưng có 7)
Sai định dạng (string thay vì numeric)
SPSS hỗ trợ:
Data → Validation → Validate Data
o Kiểm tra: range, loại dữ liệu, giá trị lặp
Thiết lập Variable View:
o Values, Measure, Decimals, Missing, Range
4. Pht hin trường hợp trả lời thiếu trung thực / không nhất qun
Công cụ trong SPSS:
Kiểm tra response pattern:
Analyze → Descriptive → Frequencies (xem tất cả trả lời giống nhau)
Tính Mahalanobis Distance để lọc trường hợp bất thường khi phân tích nhiều
biến:
o Analyze → Regression → Linear → Save → Mahalanobis
Xử lý
Loại các dòng có:
o Trả lời 1 kiểu (straight-line)
o Thời gian quá nhanh (nếu có dữ liệu)
o Mâu thuẫn logic (ví dụ tuổi = 5 nhưng “thu nhập 20 triệu”)
5. Kiểm tra trùng lặp (Duplicates)
SPSS thao tc
Data → Identify Duplicate Cases
o Chọn ID (hoặc các biến định danh)
o SPSS sẽ tạo biến Duplicates = 0/1
Xử lý
Giữ lại bản ghi đúng
Xóa bản ghi trùng
6. Chuẩn hóa d liu (Coding & Recoding)
Cc thao tc trong SPSS
Recode into Same Variables / Different Variables
o Gom nhóm (ví dụ tuổi thành 3 nhóm)
o Chuẩn hóa mã hóa (Nam = 1, Nữ = 0)
Compute Variable
o Tạo biến tổng, trung bình (ví dụ điểm FOMO chung)
Xử lý vấn đề không đồng nhất
Các biến cùng ý nghĩa nhưng mã khác nhau (VD: nam/nữ được nhập 1–2, 0–1, M–
F)
→ cần chuẩn hóa lại.
7. Pht hin phân phối bất thường
Kiểm tra Skewness – Kurtosis
Analyze → Descriptives
Kiểm tra Histogram
Graphs → Legacy Dialogs → Histogram
Xử lý (nếu cần phân phối chuẩn cho phân tích tuyến tính):
Log-transform, Square-root, Box-Cox…

Preview text:

Các phương pháp làm sạch dữ liệu: SPSS

1. Kiểm tra và xử lý giá trị thiếu (Missing Values)

Cách kiểm tra

  • Analyze → Descriptive Statistics → Frequencies / Descriptives / Explore
  • Xem: Missing, Valid, Percent.

Cách xử lý

  • Loại bỏ (Listwise / Pairwise deletion)
  • Thay thế bằng giá trị
    • Mean/Median/Mode (thường dùng cho thang đo Likert)
    • Regression imputation (dự đoán bằng biến khác)
    • Multiple imputation (Analyze → Multiple Imputation)

2. Phát hiện và xử lý ngoại lệ (Outliers)

Cách kiểm tra trong SPSS

  • Analyze → Descriptive Statistics → Explore
    • Xem Boxplot (giá trị > 1.5 IQR hoặc > 3SD)
  • Graphs → Chart Builder → Boxplot
  • Kiểm tra Z-score:
    • |Z| > 3 → nghi ngờ ngoại lệ
    • Tính bằng Descriptives → Save standardized values

Xử lý

  • Loại bỏ quan sát có outlier quá lớn
  • Winsorizing (đưa về gần ngưỡng)
  • Kiểm tra nhập liệu sai và sửa lại

3. Kiểm tra dữ liệu nhập sai (Data Entry Errors)

Ví dụ lỗi:

  • Giá trị ngoài phạm vi (ví dụ thang 1–5 nhưng có 7)
  • Sai định dạng (string thay vì numeric)

SPSS hỗ trợ:

  • Data → Validation → Validate Data
    • Kiểm tra: range, loại dữ liệu, giá trị lặp
  • Thiết lập Variable View:
    • Values, Measure, Decimals, Missing, Range

4. Phát hiện trường hợp trả lời thiếu trung thực / không nhất quán

Công cụ trong SPSS:

  • Kiểm tra response pattern:
    Analyze → Descriptive → Frequencies (xem tất cả trả lời giống nhau)
  • Tính Mahalanobis Distance để lọc trường hợp bất thường khi phân tích nhiều biến:
    • Analyze → Regression → Linear → Save → Mahalanobis

Xử lý

  • Loại các dòng có:
    • Trả lời 1 kiểu (straight-line)
    • Thời gian quá nhanh (nếu có dữ liệu)
    • Mâu thuẫn logic (ví dụ tuổi = 5 nhưng “thu nhập 20 triệu”)

5. Kiểm tra trùng lặp (Duplicates)

SPSS thao tác

  • Data → Identify Duplicate Cases
    • Chọn ID (hoặc các biến định danh)
    • SPSS sẽ tạo biến Duplicates = 0/1

Xử lý

  • Giữ lại bản ghi đúng
  • Xóa bản ghi trùng

6. Chuẩn hóa dữ liệu (Coding & Recoding)

Các thao tác trong SPSS

  • Recode into Same Variables / Different Variables
    • Gom nhóm (ví dụ tuổi thành 3 nhóm)
    • Chuẩn hóa mã hóa (Nam = 1, Nữ = 0)
  • Compute Variable
    • Tạo biến tổng, trung bình (ví dụ điểm FOMO chung)

Xử lý vấn đề không đồng nhất

  • Các biến cùng ý nghĩa nhưng mã khác nhau (VD: nam/nữ được nhập 1–2, 0–1, M–F)
    → cần chuẩn hóa lại.

7. Phát hiện phân phối bất thường

  • Kiểm tra Skewness – Kurtosis
    Analyze → Descriptives
  • Kiểm tra Histogram
    Graphs → Legacy Dialogs → Histogram

Xử lý (nếu cần phân phối chuẩn cho phân tích tuyến tính):

  • Log-transform, Square-root, Box-Cox…