Phân tích nhân tố khẳng định (Confirmatory Factor Analysis - CFA) trên phần mềm AMOS là một bước quan trọng trong kiểm định mô hình đo lường (measurement model), thường được sử dụng để kiểm tra mức độ phù hợp của dữ liệu thực tế với cấu trúc lý thuyết đã giả định và kiểm định mối quan hệ giữa các biến quan sát (observed variables) và các cấu trúc tiềm ẩn (latent constructs) mà chúng đại diện.
1. Mục đích của phân tích nhân tố khẳng định CFA
Phân tích nhân tố khẳng định - Confirmatory Factor Analysis (CFA) là kiểm định được sử dụng để thực hiện các mục đích sau:
a. Kiểm định mô hình đo lường (measurement model)
Khác với EFA (phân tích nhân tố khám phá), CFA không khám phá mà kiểm định cấu trúc nhân tố đã được xác định trước.
CFA được sử dụng để xác nhận xem liệu các biến quan sát (các câu hỏi trong bảng khảo sát, các chỉ báo) có thực sự đo lường đúng các khái niệm hoặc cấu trúc nhân tố tiềm ẩn mà chúng được thiết kế để đo lường hay không.
b. Đánh giá độ phù hợp của mô hình (Model Fit)
Một trong những mục đích quan trọng nhất của CFA là đánh giá xem mô hình lý thuyết được đề xuất có phù hợp với dữ liệu thực tế hay không.
CFA cung cấp một loạt các chỉ số độ phù hợp (như Chi-square, CMIN/df, GFI, CFI, TLI, RMSEA, PCLOSE, SRMR...) để đánh giá mức độ khớp giữa cấu trúc mô hình lý thuyết và cấu trúc thực tế của dữ liệu. Nếu mô hình có độ phù hợp tốt, điều đó có nghĩa là dữ liệu xử lý thực tế phản ánh khá chính xác với mô hình cấu trúc lý thuyết.
c. Đánh giá chất lượng của thang đo (reliability và validity)
CFA giúp kiểm tra chất lượng của các thang đo được sử dụng trong phân tích.
- Độ tin cậy (Reliability): Đánh giá mức độ nhất quán của các biến quan sát khi đo lường cùng một nhân tố. Thường chúng ta sẽ sử dụng chỉ số độ tin cậy tổng hợp (Composite Reliability - CR) để đánh giá.
- Tính hội tụ (Convergent Validity): Đảm bảo rằng các biến quan sát cùng thuộc một nhân tố thực sự đo lường cùng một khái niệm. Thường chúng ta sử dụng chỉ số Phương sai trích trung bình (Average Variance Extracted - AVE) để đánh giá.
- Tính phân biệt (Discriminant Validity): Đảm bảo rằng các nhân tố khác nhau thực sự độc lập và không bị trùng lặp, tức là chúng đo lường các khái niệm khác nhau. Điều này thường được kiểm tra bằng cách so sánh chỉ số MSV với AVE thuộc một nhân tố, hoặc dùng bảng HTMT, bảng Fornell and Larcker.
2. Những hiểu lầm phổ biến về phân tích CFA
Hiểu lầm 1: Phải thực hiện EFA trước rồi mới CFA
Nhiều nghiên cứu hiện nay thường áp dụng quy trình phân tích định lượng theo thứ tự: Cronbach’s Alpha → EFA → CFA → SEM. Điều này dễ dẫn đến một quan niệm phổ biến nhưng chưa hoàn toàn chính xác, rằng bất kỳ nghiên cứu nào cũng phải thực hiện EFA trước rồi mới tiến hành CFA. Trên thực tế, điều này không phải lúc nào cũng cần thiết và phụ thuộc vào mục tiêu nghiên cứu cũng như cơ sở lý thuyết ban đầu.
EFA (Exploratory Factor Analysis) là kỹ thuật dùng để khám phá cấu trúc tiềm ẩn trong dữ liệu khi bạn chưa có cơ sở lý thuyết rõ ràng về mối quan hệ giữa các biến quan sát và nhân tố. CFA (Confirmatory Factor Analysis) là kỹ thuật dùng để kiểm định một mô hình nhân tố đã được xác định trước trên cơ sở lý thuyết.
Nếu bạn đã có mô hình lý thuyết rõ ràng, hoàn toàn không cần thực hiện EFA trước. Bạn có thể đi thẳng theo quy trình: Cronbach's Alpha → CFA → SEM. Ngược lại, nếu bạn chưa chắc chắn mô hình lý thuyết, bạn có thể dùng: Cronbach’s Alpha → EFA → CFA (nếu cần) → SEM.
Việc hiểu đúng chức năng của EFA và CFA giúp chúng ta áp dụng phương pháp phù hợp với mục tiêu nghiên cứu và tránh lãng phí thời gian, công sức vào những bước không cần thiết.
Hiểu lầm 2: Phải có ma trận xoay từ EFA thì mới vẽ được mô hình CFA hoặc SEM
Có nhiều video hướng dẫn hoặc bài viết về phân tích CFA thường thấy các tác giả sử dụng plugin Pattern Matrix Builder để vẽ sơ đồ CFA từ ma trận xoay sau bước EFA. Từ đó, một số bạn hiểu nhầm rằng muốn thực hiện CFA thì bắt buộc phải chạy EFA trước để có được ma trận xoay.
Thực tế không phải như vậy. Phần mềm AMOS đã tích hợp đầy đủ các công cụ cho phép chúng ta trực tiếp xây dựng mô hình CFA mà không cần đến plugin hay kết quả từ EFA. Việc sử dụng plugin chỉ đơn giản là để tự động hóa và rút ngắn thao tác vẽ diagram Giả sử bạn không chạy EFA hay AMOS của bạn không có sẵn plugin Pattern Matrix Builder, bạn hoàn toàn có thể vẽ thủ công diagram CFA, SEM và tiến hành phân tích bài bình thường.
3. Cách phân tích nhân tố khẳng định CFA trên AMOS
Phần hướng dẫn bên dưới sẽ sử dụng ví dụ mô hình như sau:
Cấu trúc biến:
- QC gồm 5 biến quan sát.
- QH gồm 5 biến quan sát.
- KM gồm 4 biến quan sát.
- BH gồm 6 biến quan sát. Trong đó BH6 bị loại ở bước Cronbach's Alpha nên không sử dụng lại ở CFA.
- NB gồm 4 biến quan sát.
- TT gồm 5 biến quan sát.
Bước 1: Khai báo dữ liệu SPSS cho phần mềm AMOS, vẽ diagram CFA
Ở bài viết Cách sử dụng AMOS để vẽ diagram CFA, SEM mình đã hướng dẫn cách khai báo dữ liệu SPSS vào phần mềm AMOS và vẽ diagram CFA, nếu bạn chưa biết cách thực hiện bước ban đầu này, bạn xem lại bài viết này rồi mới xem tiếp nội dung bên dưới.
Các macro model fit hay dùng:
Chi-square/df=\cmindf
GFI=\gfi; CFI=\cfi; TLI=\tli
RMSEA=\rmsea
PCLOSE=\pclose
Mình sẽ sử dụng lại tệp dữ liệu DATA AMOS.sav đã được giới thiệu tại bài viết vừa đề cập trên để hướng dẫn tiếp phần phân tích CFA sau đây. Diagram CFA sau khi được vẽ và khai báo hoàn thiện sẽ như sau:
Từ giao diện AMOS, chọn vào biểu tượng Analysis Properties để thiết lập cài đặt CFA.
Chuyển sang thẻ Output, tích chọn vào các mục như ảnh bên dưới. Một số mục đáng lưu ý:
- Standardized estimates: hiển thị hệ số chuẩn hóa.
- Squared multiple correlations: hiển thị hệ số xác định R bình phương.
- Residual moments: hiển thị phần dư.
- Modification indices: hiển thị chỉ số MI xác định các vấn đề làm giảm độ phù hợp của mô hình. Xem chi tiết cách sử dụng chỉ số này tại bài viết Chỉ số MI - Modification Indices trong AMOS.
Sau khi tích chọn xong, nhấp vào nút X ở góc trên bên phải để xác nhận tùy chọn và thoát khỏi giao diện.
Bước 3: Thực hiện phân tích CFA
Chọn vào biểu tượng Calculate Estimates để tiến hành chạy phân tích CFA.
Ngoài các thông số cơ bản được hiển thị trực tiếp trên diagram, các bạn nhấp vào nút View Text để xem các đầy đủ toàn bộ kết quả phân tích CFA.
4. Đọc kết quả phân tích CFA trên AMOS
Chúng ta sẽ đọc kết quả CFA qua các tiêu chí: độ phù hợp mô hình tổng thể, ý nghĩa biến quan sát, độ tin cậy, tính hội tụ, tính phân biệt các cấu trúc biến.
4.1 Độ phù hợp mô hình (model fit)
CFA là phân tích nhân tố khẳng định, nhiệm vụ của nó là khẳng định các cấu trúc nhân tố khai báo ban đầu là phù hợp hay chưa. Nếu các cấu trúc nhân tố khai báo này là phù hợp, model fit của mô hình sẽ đảm bảo, ngược lại, nếu cấu trúc nhân tố khai báo là chưa phù hợp, model fit mô hình sẽ vi phạm.
Đánh giá độ phù hợp mô hình bản chất là đánh giá về nội bộ cấu trúc nhân tố và quan hệ giữa các cấu trúc nhân tố với nhau. Những yếu tố làm giảm độ phù hợp mô hình gồm: các biến quan sát trong một nhân tố trùng lặp nhau, biến quan sát trong một nhân tố giải thích yếu cho nhân tố mẹ, biến quan sát thuộc nhân tố này nhưng giải thích mạnh cho nhân tố khác, có sự cộng tuyến giữa nhân tố này với nhân tố khác...
Sau khi chạy xong phân tích, để hiện thông số chuẩn hoá trên diagram, bạn nhấp vào mục Standardized estimates.
Một số chỉ số cơ bản về độ phù hợp mô hình như Chi-square/df, GFI, CFI, TLI, RMSEA, PCLOSE được hiển thị ngay trên phần macro chèn vào diagram để chúng ta đánh giá nhanh.
Để xem thêm các chỉ số độ phù hợp mô hình khác, chúng ta xem ở mục Model Fit trong View Text.
Nhấp vào mục Model Fit ở bên trái. Giao diện bên phải sẽ hiển thị toàn bộ các bảng liên quan đến độ phù hợp mô hình. CMIN chính là Chi-square.
Theo Hu & Bentler (1999), Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives, Structural Equation Modeling các chỉ số được xem xét để đánh giá Model Fit phổ biến gồm
- CMIN/df ≤ 3 là tốt, CMIN/df ≤ 5 là chấp nhận được
- CFI ≥ 0.9 là tốt, CFI ≥ 0.95 là rất tốt, CFI ≥ 0.8 là chấp nhận được (CFA dao động trong vùng 0 đến 1)
- GFI ≥ 0.9 là tốt, GFI ≥ 0.95 là rất tốt (chỉ số này bạn cần đọc thêm phần lưu ý cuối bài viết)
- TLI ≥ 0.9 là tốt
- RMSEA ≤ 0.06 là tốt, RMSEA ≤ 0.08 là chấp nhận được
- PCLOSE ≥ 0.05 là tốt, PCLOSE ≥ 0.01 là chấp nhận được
Trường hợp riêng của GFI lớn hơn 0.8 và nhỏ hơn 0.9
Một số đề tài do sự giới hạn về cỡ mẫu nên trị số GFI khó đạt được mức 0.9 bởi chỉ số này phụ thuộc rất nhiều vào số nhân tố, số biến quan sát và cỡ mẫu. Chính điều này mà GFI trở lên ít được đưa vào đánh giá độ phù hợp mô hình trong những năm gần đây, thậm chí là được khuyến cáo không nên sử dụng (Kline, 2005; Sharma et al., 2005).
Nếu bạn bắt buộc phải đánh giá chỉ số này trong bài luận, nhưng ngưỡng của nó dưới 0.9, bạn có thể chấp nhận ngưỡng 0.8 theo 2 công trình nghiên cứu của Baumgartner and Homburg (1995) và của Doll, Xia, and Torkzadeh (1994). Nguồn trích dẫn:
1. Baumgartner, H., Homburg, C.: Applications of Structural Equation Modeling in Marketing and Consumer Research: a review. International Journal of Research in Marketing 13(2), 139-161 (1996).
2. Doll, W.J., Xia, W., Torkzadeh, G.: A confirmatory factor analysis of the end-user computing satisfaction instrument, MIS Quarterly 18(4), 357–369 (1994).
Với các trường hợp các chỉ số không đạt được các ngưỡng chấp nhận, để cải thiện độ phù hợp mô hình Model Fit trong CFA, chúng ta sẽ sử dụng tới chỉ số MI, xem chi tiết tại đây.
4.2 Ý nghĩa các biến quan sát (Indicator reliability)
Với CFA, chúng ta xác định biến quan sát nào thuộc nhân tố nào ngay từ đầu. Tuy nhiên, việc xác định này là chúng ta đang dựa vào cơ sở lý thuyết. Chúng ta cần kiểm nghiệm lại nó với dữ liệu thực tế của chính đề tài mà các bạn đang thực hiện. Do vậy, chúng ta sẽ cần đánh giá xem các biến quan sát của nhân tố đó có thực sự là phù hợp chưa.
a. Hệ số Regression Weights
Cũng từ giao diện Amos Output (View Text), nhấp vào mục Estimates > Scalars > Regression Weights (bảng hệ số tác động chưa chuẩn hóa) để đánh giá các biến quan sát có ý nghĩa thống kê hay không.
- Cột Estimate: Hệ số tác động chưa chuẩn hóa từ nhân tố mẹ lên biến quan sát. Ví dụ hệ số tác động chưa chuẩn hóa từ BH lên BH2 là 0.992. Ở cột này, một số hệ số mang giá trị 1.000 bởi vì các quan hệ này là quan hệ tham chiếu trong nhân tố đó. Quay lại diagram vẽ từ đầu, các bạn để ý sẽ thấy mũi tên từ BH lên BH4 hay từ TT lên TT1 đều được gán giá trị tham chiếu 1 lên Regression Weights. Nên ở trong bảng kết quả Regression Weights, mặc định các quan hệ này đều có Estimate là 1.000. Bạn có thể tùy ý đổi giá trị tham chiếu 1 cho bất cứ mũi tên nào trong nhân tố đó mà không làm thay đổi bản chất chỉ số của mô hình. Tuy nhiên, việc thay đổi quan hệ tham chiếu, các quan hệ khác trong nhân tố phải thay đổi theo nên giá trị Estimate bảng Regression Weights cũng bị thay đổi. Chính vì vậy, dù cùng một bộ dữ liệu, cùng số lượng biến đó nhưng khi khai báo quan hệ tham chiếu 1 ở mũi tên các biến quan sát khác nhau trong một nhân tố thì giá trị Estimate ở bảng này sẽ khác nhau.
- Cột C.R.: Đây là critical ratio của phép kiểm định ý nghĩa hệ số tác động, giá trị này giống như t-value ở nhiều phần mềm khác.
- Cột P.: Đây là p-value của phép kiểm định ý nghĩa hệ số tác động, giá trị này giống như sig ở nhiều phần mềm khác. Đây là cột giá trị trọng tâm trong bảng Regression Weights chúng ta thường sử dụng để đánh giá ý nghĩa các biến quan sát. Nếu P nhỏ hơn 0.05 (nghiên cứu này sử dụng mức ý nghĩa 5%), biến quan sát có ý nghĩa giải thích cho nhân tố mẹ. Trong AMOS, khi P = 0.000 sẽ được ký hiệu là ba dấu ***. Ở cột này, một số vị trí không có giá trị P bởi vì các quan hệ này là quan hệ tham chiếu trong nhân t, mặc định P của nó nhỏ hơn 0.05. Vấn đề đặt ra lúc này, lỡ biến quan sát tham chiếu không có ý nghĩa thì làm sao nhận diện được? Chúng ta sẽ dựa tiếp vào bảng thứ hai ngay sau đây.
b. Hệ số Standardized Regression Weights
Cũng từ giao diện Amos Output (View Text), nhấp vào mục Estimates > Scalars > Standardized Regression Weights (bảng hệ số tác động chưa chuẩn hóa) để đánh giá mức độ giải thích của biến quan sát lên nhân tố mẹ.
Hair và cộng sự (2009), Multivariate Data Analysis, 7th Edition, Prentice Hall, Upper Saddle River cho rằng nếu biến quan sát có hệ số tác động chuẩn hóa ở cột Estimate lớn hơn hoặc bằng 0.5 thì biến quan sát có ý nghĩa giải thích tốt cho nhân tố mẹ. Đối với bảng này, dù bạn gán giá trị tham chiếu cho quan hệ nào nào đi nữa thì hệ số chuẩn hóa ở các quan hệ vẫn không thay đổi.
4.3 Độ tin cậy, tính hội tụ, tính phân biệt thang đo
Theo Hair và cộng sự (2010) và Hair và cộng sự (2016) chúng ta sử dụng các chỉ số AVE, MSV, bảng Fornell and Larcker để đánh giá tính hội tụ, tính phân biệt thang đo và chỉ số CR để đánh giá độ tin cậy tổng hợp.
Độ tin cậy (Reliability)
- Độ tin cậy tổng hợp (Composite Reliability) ≥ 0.7. Xem chi tiết chỉ số này tại đây
Tính hội tụ (Convergent Validity)
- Phương sai trung bình được trích Average Variance Extracted (AVE) ≥ 0.5. Xem chi tiết chỉ số này tại đây
Tính phân biệt (Discriminant Validity)
- Phương sai chia sẻ lớn nhất Maximum Shared Variance (MSV) < Average Variance Extracted (AVE)
- Căn bậc hai phương sai trung bình được trích Square Root of AVE (SQRTAVE) > Tương quan giữa các cấu trúc Inter-Construct Correlations trong bảng Fornell and Larcker. Xem chi tiết tại đây
Phần mềm AMOS không tích hợp tính toán các chỉ số này, chúng ta sẽ phải dùng plugin phụ bên ngoài gắn vào AMOS hoặc dùng package Excel Macro của tác giả James Gaskin. Do phần hướng dẫn cài plugin và sử dụng package rất dài nên mình trình bày riêng tại bài viết Đánh giá độ tin cậy tính hội tụ, tính phân biệt trong phân tích CFA AMOS, dưới đây sẽ là phần hướng dẫn đọc kết quả và nhận xét.
Cấu trúc bảng kết quả gồm hai phần: các chỉ số CR, AVE, MSV, MaxR(H) (phần 1 khoanh màu hồng) và bảng Fornell and Larcker (phần 2 khoanh màu xanh)
Để đánh giá độ tin cậy chúng ta dựa vào:
- Chỉ số CR xem có lớn hơn 0.7 không, nếu lớn hơn tính hội tụ được đảm bảo.
- Nếu CR vi phạm dưới ngưỡng, công cụ sẽ báo bên dưới ngay phần Validity Concerns. Trong ví dụ thực hành ở trên, toàn bộ các nhân tố đều đảm bảo độ tin cậy.
Để đánh giá tính hội tụ chúng ta dựa vào:
- Chỉ số AVE xem có lớn hơn 0.5 không, nếu lớn hơn tính hội tụ được đảm bảo.
- Nếu AVE vi phạm dưới ngưỡng, công cụ sẽ báo bên dưới ngay phần Validity Concerns. Cụ thể trong ví dụ ở trên, thang đo QH vi phạm tính hội tụ do AVE nhỏ hơn 0.5. Công cụ để xuất thử loại bỏ biến QH1 để tăng AVE. Bạn thử thực hiện xóa biến QH1 khỏi diagram CFA và đánh giá lại.
Để đánh giá tính phân biệt chúng ta dựa vào:
- Chỉ số MSV xem có nhỏ hơn AVE không, nếu đảm bảo nhỏ hơn thì tính phân biệt được đảm bảo.
- Giá trị căn bậc hai AVE của một biến (giá trị bôi đậm đầu mỗi cột dọc theo mũi tên trong bảng Fornell and Larcker) lớn hơn tương quan giữa biến đó với các biến khác trong mô hình (vùng tô vàng trong bảng), tính phân biệt sẽ được đảm bảo.
Phần giá trị in đậm đầu mỗi cột chính là căn bậc hai chỉ số AVE của các nhân tố: căn bậc hai AVE của BH là 0.739, của TT là 0.751, của QH là 0.702... Phần giá trị nền vàng còn lại của cột là tương quan giữa nhân tố đó với các nhân tố khác trong mô hình: tương quan của BH và TT là 0.670, giữa BH với QH là 0.545, giữa TT và QH là 0.594...
Khi đọc kết quả, chúng ta sẽ xét hệ số tương quan của một cặp biến có nhỏ hơn 2 giá trị căn bậc hai AVE của cặp biến đó không, nếu có thì 2 biến này đảm bảo tính phân biệt, ngược lại vi phạm tính phân biệt. Ví dụ:
- Tương quan của BH và TT là 0.670
- Căn bậc hai AVE của BH là 0.739
- Căn bậc hai AVE của TT là 0.751
Do 0.670 nhỏ hơn 0.739 và 0.751, nên BH và NB đảm bảo tính phân biệt. Xem thêm lý thuyết và cách đọc bảng này tại đây