Website hiện chỉ đăng tải bài viết và cung cấp dịch vụ, không hỗ trợ tư vấn các vấn đề ngoài dịch vụ. Mong bạn thông cảm!
😄

Đánh giá hiện tượng cộng tuyến trong phân tích SEM trên AMOS

Một hạn chế lớn của AMOS là không có báo cáo về các chỉ số đánh giá hiện tượng cộng tuyến trong mô hình SEM (ví dụ như chỉ số VIF, Tolerance....). Chính vì vậy khi mô hình tồn tại vấn đề cộng tuyến gây ra sai lệch các ước lượng trong phân tích SEM, chúng ta sẽ loay hoay không biết vấn đề đến từ đâu.

danh gia da cong tuyen SEM AMOS

1. Hậu quả của cộng tuyến/đa cộng tuyến trong mô hình SEM

Lý thuyết về cộng tuyến và đa cộng tuyến các bạn vui lòng xem lại ở bài viết Đa cộng tuyến: Nguyên nhân, hậu quả, dấu hiệu và cách khắc phục.

- Cộng tuyến (Collinearity): Cộng tuyến xảy ra khi hai biến độc lập có mối tương quan tuyến tính quá mạnh với nhau. 

- Đa cộng tuyến (Multicollinearity): Đa cộng tuyến xảy ra khi ba biến độc lập trở lên có tương quan tuyến tính quá mạnh với nhau. Nó là một trường hợp tổng quát hơn của cộng tuyến.

Trong mô hình hồi quy tuyến tính hay mô hình cấu trúc tuyến tính SEM đi nữa, việc tồn tại vấn đề cộng tuyến sẽ gây ra các hậu quả nặng nề:

  • Quan hệ tác động có ý nghĩa trở thành không có ý nghĩa, quan hệ không có ý nghĩa lại trở thành có ý nghĩa;
  • Biến tác động dương trở thành biến tác động âm, biến tác động âm trở thành dương;
  • Biến tác động mạnh trở thành biến tác động yếu, biến tác động yếu thành tác động mạnh;
  • Hệ số hồi quy chuẩn hóa vượt ngưỡng 1, giá trị R2 vượt ngưỡng 1....

Có thể thấy những hệ quả mà cộng tuyến gây ra ở trên, phần đánh giá và kết luận mô hình SEM sẽ hoàn toàn sai lệch.

2. Đánh giá hiện tượng cộng tuyến trong phân tích SEM trên AMOS

Khi tiến hành phân tích mô hình SEM nhưng xuất hiện các dấu hiệu như: hệ số hồi quy chuẩn hóa vượt ngưỡng 1, giá trị R2 vượt ngưỡng 1, quan hệ tác động trên lý thuyết là dương nhưng kết quả chạy ra lại là âm và rất mạnh ..., đây là biểu khả năng rất cao tồn tại cộng tuyến trong mô hình SEM. Như ví dụ ở dữ liệu bên dưới, hệ số tác động chuẩn hóa có tới bốn giá trị trên 1, giá trị R bình phương của biến X cũng lớn hơn 1.

danh gia da cong tuyen SEM AMOS

(Bảng hệ số hồi quy chuẩn hóa)

danh gia da cong tuyen SEM AMOS

(Bảng hệ số R bình phương)

Bời vì AMOS không có báo cáo về chỉ số VIF để phát hiện vấn đề cộng tuyến trong mô hình SEM nên chúng ta sẽ mượn hồi quy tuyến tính trên SPSS để đánh giá hiện tượng này của mô hình SEM. Cách thức thực hiện sẽ như sau.

Bước 1: Quy đổi mô hình SEM phức tạp thành từng mô hình hồi quy đơn giản

Nhắc lại, cộng tuyến là vấn đề xảy ra giữa các biến độc lập với nhau. Nhưng trong một mô hình SEM phức tạp gồm nhiều loại biến độc lập, trung gian, điều tiết, phụ thuộc thì có phải chỉ xét giữa các biến độc lập thôi không?

Các biến độc lập được đề cập ở đây là xét trong ngữ cảnh các biến này cùng tác động lên một biến khác trong mô hình. Nghĩa là chúng ta sẽ tách mô hình SEM phức tạp ra thành từng mô hình hồi quy đơn giản rồi mới đi xét cộng tuyến giữa các biến độc lập trong một mô hình hồi quy đơn giản này.

Xét mô hình của kết quả phân tích phía trên:

danh gia da cong tuyen SEM AMOS

Mô hình này xét trong ngữ cảnh mô hình SEM tổng thể, biến A-B-C gọi là độc lập, biến X-Z gọi là trung gian, biến Y gọi là phụ thuộc. Bây giờ chúng ta sẽ quy đổi mô hình phức tạp này ra thành các mô hình hồi quy đơn giản.

Hồi quy là mô hình có một/nhiều biến độc lập cùng tác động lên một biến phụ thuộc. Như vậy trong mô hình SEM phức tạp, bao nhiêu biến có vai trò phụ thuộc sẽ có bấy nhiêu mô hình hồi quy. Cũng lưu ý rằng, biến trung gian là loại biến vừa có vai trò độc lập, vừa có vai trò phụ thuộc.

Biến có vai trò phụ thuộc trong mô hình là biến nhận mũi tên hướng vào nó. Cụ thể trong mô hình ví dụ ở trên, các biến nhận mũi tên hướng vào nó gồm X, Z, Y. Như vậy, tồn tại 3 biến có vai trò phụ thuộc, tương ứng mô hình SEM này sẽ gồm 3 mô hình hồi quy đơn giản.

- Mô hình hồi quy 1: biến độc lập A, B, C tác động lên biến phụ thuộc X;

- Mô hình hồi quy 2: biến độc lập A, B, C tác động lên biến phụ thuộc Z;

- Mô hình hồi quy 3: biến độc lập X, Z tác động lên biến phụ thuộc Y.

Bước 2: Xác định cách đánh giá hiện tượng cộng tuyến

Từ bước trước chúng ta đã xác định có ba mô hình hồi quy đơn giản. Việc đánh giá hiện tượng cộng tuyến chúng ta sẽ thực hiện giữa các biến độc lập trong cùng một mô hình hồi quy đơn giản

- Đánh giá hiện tượng cộng tuyến giữa biến A, B, C (thuộc mô hình 1);

- Đánh giá hiện tượng cộng tuyến giữa biến A, B, C (thuộc mô hình 2);

- Đánh giá hiện tượng cộng tuyến giữa biến X, Z (thuộc mô hình 3).

Bởi vì các biến độc lập trong mô hình hồi quy 1 và 2 giống nhau, nên chúng ta chỉ thực hiện một lần thôi. Như vậy, để đánh giá hiện tượng cộng tuyến của mô hình SEM phức tạp ban đầu chúng ta sẽ cần:

- Đánh giá hiện tượng cộng tuyến giữa biến A, B, C;

- Đánh giá hiện tượng cộng tuyến giữa biến X, Z.

Bước 3: Chuẩn bị dữ liệu các biến để tiến hành phân tích mô hình hồi quy đơn giản

Với SEM trên AMOS các biến tiềm ẩn sẽ được phần mềm tính toán trực tiếp từ dữ liệu các biến quan sát trên diagram chứ không có dữ liệu riêng dành cho các biến tiềm ẩn. Còn hồi quy trên SPSS cần phải tính toán dữ liệu cho các biến tiềm ẩn để đưa vào phần khai báo biến.

Dữ liệu các biến tiềm ẩn (biến đại diện) thường sẽ được tính theo hai cách là lấy tổng các biến quan sát con hoặc lấy trung bình cộng các biến quan sát con, bạn xem hai cách thực hiện tại bài viết này. Khi tính toán dữ liệu biến đại diện bạn nhớ loại bỏ các biến quan sát đã bị loại ở những bước trước SEM như Cronbach Alpha, EFA, CFA... 

Khi đặt tên biến đại diện trong dữ liệu SPSS, bạn lưu ý là cần đặt tên khác với tên khai báo cho biến tiềm ẩn ở diagram AMOS. Bởi vì biến tiềm ẩn trong AMOS là biến được tính trực tiếp từ dữ liệu của biến quan sát và không cần sự hiện diện dữ liệu của nó trong tập dữ liệu đầu vào. Khi chúng ta tạo biến đại diện trên SPSS là tạo ra dữ liệu các biến tiềm ẩn này, vô tình sẽ làm xung đột với dữ liệu tính toán biến tiềm ẩn của AMOS. Ví dụ như ảnh bên dưới, mình đã đặt tên biến tiềm ẩn trên diagram AMOS là A-B-C-X-Y-Z thì biến đại diện trên SPSS mình thêm tiền tố f_ trước tên biến để khác với tên biến tiềm ẩn ở diagram.

danh gia da cong tuyen SEM AMOS

danh gia da cong tuyen SEM AMOS

Bước 4: Phân tích hồi quy đơn giản + đánh giá hiện tượng cộng tuyến qua chỉ số VIF

Ở bước 1 chúng ta đã xác định mô hình SEM được cấu thành từ ba mô hình hồi quy đơn giản. Chúng ta sẽ phân tích ba hồi quy để lấy ba bảng kết quả Coefficients bởi vì đây là bảng chứa chỉ số VIF đánh giá hiện tượng cộng tuyến của các biến độc lập. Có rất nhiều ngưỡng VIF được nhiều công trình đề xuất là xuất hiện cộng tuyến như VIF > 3, VIF  >3.3, VIF > 5, VIF > 10... Sử dụng ngưỡng VIF nào chúng ta sẽ còn dựa vào thực tế dữ liệu đang phân tích hiện tại. Nếu kết quả phân tích SEM cho những biểu hiện của sự cộng tuyến thì chúng ta đã xác định là tồn tại cộng tuyến và phải đi xử lý vấn đề này, chứ không phải sử dụng một ngưỡng VIF lớn như 10 để đánh giá là không tồn tại cộng tuyến.

- Mô hình hồi quy 1: biến độc lập A, B, C tác động lên biến phụ thuộc X;

danh gia da cong tuyen SEM AMOS

→ Đánh giá hiện tượng cộng tuyến giữa biến A, B, C: biến A và B có VIF lớn hơn 3 (mình sử dụng ngưỡng 3 để nhận diện sự cộng tuyến trong mô hình). Như vậy A-B có cộng tuyến với nhau. 

danh gia da cong tuyen SEM AMOS

→ Đánh giá hiện tượng cộng tuyến giữa biến A, B, C: có thể thấy giá trị VIF của các biến A, B, C ở bảng thứ hai này hoàn toàn giống với bảng thứ nhất bởi vì VIF là giá trị quan hệ giữa các biến độc lập, bất kể biến phụ thuộc là gì. Do vậy, khi đánh giá vấn đề cộng tuyến chúng ta sử dụng một trong hai bảng là đủ.

xu ly cong tuyen sem amos

→ Đánh giá hiện tượng cộng tuyến giữa biến X, Z: biến X và Z có VIF nhỏ hơn 3. Như vậy X-Z không có hiện tượng cộng tuyến với nhau. Đối chiếu với kết quả hệ số tác động chuẩn hóa từ X, Z lên Y cũng như là giá trị R2 của Y, các giá trị này đều không vượt quá 1 nên chúng ta càng thêm khẳng định không tồn tại vấn đề cộng tuyến giữa hai biến này.

3. Khắc phục cộng tuyến/đa cộng tuyến trong mô hình SEM trên AMOS

- Giải pháp 1: Loại bỏ biến có hệ số VIF vượt qua giá trị tiêu chuẩn. Bạn nên bỏ biến có VIF lớn nhất rồi chạy lại phân tích SEM xem thử có còn hiện tượng đa cộng tuyến hay không. Trong ví dụ ở trên, bởi vì biến A và biến B có sự cộng tuyến mạnh với nhau, nghĩa là hai biến này bản chất thực sự chỉ là một biến. Mình sẽ chấp nhận loại bỏ biến B (VIF cao hơn) và giữ lại biến A, hiệu chỉnh lại mô hình mới bỏ biến B đi và phân tích lại.

- Giải pháp 2: Bởi vì cộng tuyến là vấn đề dữ liệu của hai biến khá tương đồng nhau. Như vậy, mặc dù trên hình thức đây là hai biến nhưng bản chất chỉ là một biến. Do đó thay vì loại bỏ một trong hai, chúng ta có thể tạo một biến mới bằng cách kết hợp hai biến bị cộng tuyến này lại với nhau. Trong ví dụ ở trên, mình sẽ gộp biến A và B lại với nhau thành một nhân tố mới gồm tất cả các biến quan sát của A và B, hiệu chỉnh lại mô hình mới và phân tích lại.

- Giải pháp 3: Có thể đa cộng tuyến xảy ra do cỡ mẫu thu thập nhỏ. Bạn hãy thử thu thập thêm phiếu trả lời để tăng cỡ mẫu lên khoảng gấp 1,5 đến 2 lần. Khi cỡ mẫu lớn hơn sẽ làm giảm phương sai và ý nghĩa các kiểm định cũng sẽ có giá trị hơn.

- Giải pháp 4: Nếu vấn đề xuất phát từ chính bước chọn mô hình nghiên cứu và lập bảng khảo sát. Bạn có thể sẽ phải hủy bỏ dữ liệu thu thập và điều chỉnh lại mô hình, tiến hành khảo sát lại. Cho nên, bước lập cơ sở lý luận để đưa ra mô hình đề xuất và bảng khảo sát là rất quan trọng, các bạn nên làm cho thật tốt phần này qua sự hướng dẫn của giảng viên, những người có chuyên môn.

Nếu bạn gặp vấn đề về cộng tuyến dữ liệu gây ra sai lệch ước lượng mô hình SEM như: quá nhiều quan hệ không có ý nghĩa, chiều tác động ngược với giả thuyết nghiên cứu, hệ số chuẩn hóa lớn hơn 1, giá trị R bình phương lớn hơn 1...., mô hình không có độ tin cậy, bạn có thể tham khảo qua dịch vụ AMOS của Phạm Lộc Blog để bên mình có thể hỗ trợ bạn xử lý vấn đề cộng tuyến trong mô hình SEM nhé.

Đăng nhận xét