Quy tắc loại biến xấu trong phân tích nhân tố khám phá EFA

Trước khi đi vào quy tắc loại biến xấu trong EFA. Các bạn cần nắm rõ điều kiện cần để bảng kết quả ma trận xoay có ý nghĩa thống kê là: 

- Hệ số KMO phải nằm trong đoạn từ 0.5 đến 1
- Kiểm định Barlett có sig phải nhỏ hơn 0.05
- Giá trị Eigenvalue lớn hơn hoặc bằng 1
- Tổng phương sai trích lớn hơn hoặc bằng 50%. 

Nếu một trong các tiêu chí trên bị vi phạm, bảng ma trận xoay sẽ không có ý nghĩa. Chính vì vậy, trước khi đến với việc chọn biến nào, loại biến nào các bạn cần kiểm tra xem các tiêu chí ở trên đã thỏa mãn chưa. Mọi thứ OK hết mới đi đến phần loại biến ở ma trận xoay. Nếu bạn chưa rõ về cách chạy EFA và các tiêu chuẩn trong phân tích nhân tố khám phá, bạn nên xem qua bài viết này.

Quy tắc loại biến xấu trong EFA

Trước khi đi vào loại biến các bạn cần nắm rõ tiêu chuẩn hệ số tải Factor Loading của bài là bao nhiêu: 0.3 hay 0.5... Phần này khá quan trọng, bởi vì chọn sai giá trị có thể sẽ dẫn đến việc bỏ oan biến, biến có ý nghĩa nhưng chúng ta lại loại khỏi nghiên cứu. Cách chọn hệ số tải các bạn xem bài này.

Các dạng biến xấu trong phân tích EFA:
Biến xấu 1: Hệ số tải Factor Loading nhỏ hơn hệ số tải tiêu chuẩn
Biến xấu 2: Tải lên 2 hay nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.3
Biến xấu 3: Nằm tách biệt duy nhất ở một nhân tố
Có nhiều phương thức loại biến xấu tùy theo lập luận của tác giả, có người sẽ loại cùng lúc những biến xấu cùng xuất hiện, có người sẽ loại lần lượt từng biến xấu. Không có quy chuẩn chung về nguyên tắc loại biến, bài viết này mình sẽ chia sẻ 2 trong những cách loại biến được dùng khá nhiều hiện nay.

Cách 1: Loại lần lượt từng biến

Bước 1: Xác định các biến xấu ở lần chạy EFA đầu tiên
Bước 2: Phân loại 3 dạng biến xấu 1, 2, 3
Bước 3: Loại tất cả các biến xấu dạng 1 trước tiên và chạy lại EFA
Bước 4: Nếu tiếp tục xuất hiện biến xấu dạng 1, vẫn loại các biến này trước và chạy tiếp EFA. Nếu không còn biến xấu dạng 1, loại biến xấu dạng 2 và chạy lại EFA.
Bước 5: Nếu tiếp tục xuất hiện biến xấu dạng 2, vẫn loại các biến này trước và chạy tiếp EFA. Nếu không còn biến xấu dạng 2, loại biến xấu dạng 3 và chạy lại EFA.

Cách 2: Loại một lượt các biến xấu trong một lần phân tích EFA

Bước 1: Xác định các biến xấu ở lần chạy EFA đầu tiên
Bước 2: Loại tất cả các dạng biến xấu cùng lúc và chạy lại EFA
Bước 3: Nếu tiếp tục xuất hiện biến xấu, loại tất cả các biến đó và chạy tiếp EFA đến khi có kết quả cuối cùng.

Cùng xem xét ví dụ với kết quả ma trận xoay như sau:

Quy tắc loại biến xấu trong EFA

1. Biến quan sát không đảm bảo hệ số tải tiêu chuẩn

Biến xấu: DN4 - Hệ số tải Factor Loading nhỏ hơn 0.5. 

Tập data ví dụ được sử dụng có cỡ mẫu là 220. Do vậy, hệ số tải tiêu chuẩn được chọn là 0.5. Khi thực hiện xoay nhân tố, biến DN4 không hiển thị kết quả trong bảng ma trận xoay. Như vậy, DN4 có hệ số tải nhỏ hơn 0.5 và sẽ được loại bỏ đầu tiên.

2. Biến quan sát tải lên ở cả 2 nhân tố và không đảm bảo mức chênh lệch hệ số tải từ 0.3

Biến xấu: CV3, LD5 - Tải lên 2 nhóm nhân tố và hệ số tải trong 1 biến chênh lệch nhau dưới 0.3.

Nếu 1 biến quan sát tải lên ở cả 2 nhân tố, chúng ta cần xem xét 2 trường hợp nhỏ.

Trường hợp 1, biến quan sát tải lên ở cả 2 nhân tố, chúng ta cần lưu ý chênh lệch hệ số tải Factor Loading của biến quan sát giữa 2 nhóm nhân tố. Theo Nguyễn Đình Thọ, Phương pháp nghiên cứu khoa học trong kinh doanh, NXB Tài chính, Tái bản lần 2, Trang 420, nếu chênh lệch hệ số tải nhỏ hơn 0.3, chúng ta cần loại bỏ biến quan sát đó. 

Trường hợp 2, 2 hệ số tải chênh nhau từ 0.3 trở lên, khi đó biến quan sát sẽ được giữ lại và sẽ nằm ở nhóm nhân tố có hệ số tải cao hơn.

Trong kết quả ma trận xoay ở ví dụ, CV3 có chênh lệch hệ số tải là 0.721 - 0.513 = 0.208 < 0.3; LD5 có chênh lệch hệ số tải là 0.660 - 0.516 = 0.144 < 0.3, do vậy 2 biến này sẽ được loại bỏ và phân tích lại EFA.

** Trường hợp có từ 2 biến trở lên cùng tải lên 2 nhân tố

Nếu dùng cách thức loại biến lần lượt, chúng ta sẽ cần xác định CV3 và LD5 biến nào sẽ loại trước. Dựa vào hệ số tải tối đa của một từng biến quan sát là 1 cách. Cụ thể ở ví dụ trên, có 2 biến quan sát là CV3 và LD5 cùng tải lên 2 nhóm. Chúng ta sẽ xem hệ số tải tối đa của từng biến quan sát:
  • Biến CV3 có hệ số tải tối đa là: 0.721
  • Biến LD5 có hệ số tải lớn nhất là 0.660
Hệ số tải tối đa của LD5 nhỏ hơn hệ số tải tối đa của biến CV3, ta sẽ loại biến LD5 trước và chạy lại phân tích nhân tố EFA.

3. Biến quan sát chỉ nằm tách biệt một mình ở một nhân tố

Biến xấu: DK1 - Nằm tách biệt một mình ở 1 nhân tố.

Trong thống kê, không tồn tại thang đo chỉ gồm 1 biến quan sát. Do vậy, nếu kết quả ma trận xoay xuất hiện cột nhân tố mà ở đó chỉ có 1 biến quan sát. Chúng ta cần loại bỏ nhân tố này đi.

XEM VIDEO CHI TIẾT:

Trên đây, mình đã trình bày về cách thực hiện loại biến trong phân tích EFA, Cám ơn các bạn đã quan tâm, nhớ LIKE + SHARE bài viết cho bạn bè đang gặp khúc mắc về vấn đề này nhé.

--------
Nếu bạn gặp khó khăn khi thực hiện phân tích EFA vì số liệu khảo sát xấu dẫn đến bảng ma trận xoay lung tung, biến bị loại rất nhiều, bạn có thể tham khảo dịch vụ phân tích SPSS của mình ở đây hoặc liên hệ trực tiếp email phamlocblog@gmail.com. Dịch vụ mình cung cấp giúp bạn nâng hệ số KMO, đảm bảo ma trận xoay hội tụ như mong muốn, không bị loại quá nhiều biến, khắc phục lỗi không xuất hiện bảng KMO, bị tách nhân tố, biến nhảy lung tung.
Bài viết liên quan