Lỗi missing và cách xử lý trong SPSS

Bài viết này được đăng tải duy nhất và thuộc bản quyền của Phạm Lộc Blog. Việc chia sẻ lại nội dung lên website khác vui lòng dẫn nguồn link bài viết gốc này. Xin cảm ơn!
Lỗi missing gây ra những hậu quả không tốt như các thống kê bị sai lệch Một số kiểm định không thực hiện được do giá trị không đủ giá trị cần thiết,....

Xử lý lỗi missing trong SPSS

Các lý do xuất hiện missing hay gặp + cách xử lý missing trong SPSS:

1. Do người được phỏng vấn không trả lời

Nguyên nhân: Những câu hỏi quá dài, khó hiểu, liên quan đến vấn đề nhạy cảm hoặc cách thiết kế các câu hỏi dày đặt, không rõ ràng sẽ khiến người được khảo sát mệt mỏi nên đôi khi họ không đánh giá hoặc bỏ sót do không nhìn thấy.

Cách xử lý: Nếu missing chỉ ở một tỷ lệ nhỏ trong tập dữ liệu, cách lấp đầy các ô missing là sử dụng giá trị trung bình đáp án trả lời của câu hỏi đó. Ví dụ ở data gồm 10 quan sát hình bên dưới, biến TN4 ở quan sát số 6 có missing. Để xử lý chúng ta sẽ lấy trung bình cộng của 9 quan sát còn lại, làm tròn và điền vào ô thiếu giá trị. Trung bình cộng của 9 quan sát là (3+4+3+5+2+3+5+1+5)/9 = 3.4444. Làm tròn là 3, như vậy điền 3 vào ô còn thiếu.

Lỗi missing và cách xử lý trong SPSS

2. Do tính chất câu hỏi

Nguyên nhân: Một số dạng câu hỏi được thiết kế nếu đáp viên không có câu trả lời thì sẽ để trống, việc này làm xuất hiện missing trong data.

Cách xử lý: Khi thiết kế đáp án, bổ sung thêm đáp án "Không có câu trả lời". Ví dụ, chúng ta có câu hỏi như sau: Anh/Chị đã từng sử dụng điện thoại của hãng nào rồi? (Tích vào lựa chọn)
1. Apple         ◻
2. Samsung    ◻
3. Huawei      ◻

Khi mã hóa, những ai chọn Apple, bạn sẽ nhập vào giá trị 1 - Có, những ai không chọn Apple bạn sẽ thường để ô trống, việc này dẫn đến missing. Bạn có thể thiết kế lại câu hỏi thành: Anh/Chị đã từng sử dụng điện thoại của hãng nào rồi? (Tích vào lựa chọn)
1. Apple         ◻ 1. Rồi        ◻ 0. Chưa
2. Samsung    ◻ 1. Rồi        ◻ 0. Chưa
3. Huawei      ◻ 1. Rồi        ◻ 0. Chưa

Nếu đáp viên chưa dùng sản phẩm của Apple thì sẽ tích vào ô 0 - Chưa. Khi nhập liệu, thay vì để ô trống thì hãy nhập vào số 0. Ở hình thức câu ban đầu bạn để 1 ô vuông như vậy cũng được, đến khi nhập liệu, nếu đáp viên không tích thì bạn sẽ nhập vào số 0. Tuy nhiên, cách nhập liệu như vậy sẽ khiến bạn mất thời gian để suy nghĩ giá trị cần nhập vào là bao nhiêu thay vì con số trực quan như hình thức câu số 2.

3. Do lỗi hàng trống cuối dữ liệu 

Nguyên nhân: Vô tính việc xóa giá trị ở các hàng cuối hoặc vấn đề khi thao tác dẫn đến các hàng cuối của dữ liệu bị trống nhưng SPSS vẫn báo là missing. Đây là một lỗi khá phổ biến. 

Cách xử lý: Trong khuôn dữ liệu, các bạn nhìn ở các hàng cuối sẽ thấy con số thứ tự hàng từ 213 đến 223 sáng màu đen, kèm them đó là xuất hiện dấu chấm ở các ô dữ liệu. Từ hàng 224 trở đi, con số thứ tự hàng là dạng xám mờ và không có các dấu chấm.

Lỗi missing và cách xử lý trong SPSS

Thực hiện thống kê tần số, mặc dù cỡ mẫu chỉ là 212 và trong khuôn dữ liệu, con số nhập cũng chỉ tới 212 nhưng SPSS báo missing 11.


Lỗi missing và cách xử lý trong SPSS
Lý do nằm ở 11 hàng chứa dấu chấm từ 213 đến 223. Di chuột vào các con số đầu hàng, bôi chọn 11 hàng này (click vào con số 213 và giữ chuột kéo đến 223), nhấn phải chuột vào vùng được bôi, chọn Clear. 

Lỗi missing và cách xử lý trong SPSS

Thực hiện lại thống kê mô tả, sẽ không còn xuất hiện giá trị missing 11 nữa.

Lỗi missing và cách xử lý trong SPSS

Bài viết liên quan