Các nhà nghiên cứu đã đề xuất một số phương pháp để xác định và ước lượng các khái niệm bậc hai trong PLS-SEM. Những phương pháp nổi bật nhất là phương pháp chỉ báo lặp lại hoặc chỉ báo lặp lại mở rộng (repeated indicator approach) và phương pháp hai giai đoạn (two-stage approach) (Ringle và cộng sự, 2012).
Trước khi đi vào nội dung chính của bài, các bạn vui lòng đọc kỹ để hiểu các ký hiệu viết tắt, thuật ngữ mô hình bậc cao sau:
- HOC: higher-order component (hoặc higher-order construct) (ý nói đến biến hai chứa các biến bậc một bên trong)
- LOC: lower-order component (hoặc lower-order construct) (ý nói đến biến bậc một trong một biến bậc hai)
- Repeated Indicators Approach: Phương pháp tiếp cận chỉ báo lặp lại (hoặc lặp biến quan sát)
- Two-Stage Approach: Phương pháp tiếp cận hai giai đoạn
- Formatitve: Thang đo dạng nguyên nhân
- Reflective: Thang đo dạng kết quả
Khi gọi "biến bậc hai nguyên nhân" hoặc "biến bậc hai formative" nghĩa là quan hệ của biến bậc hai với biến bậc một thành phần là dạng nguyên nhân (formative). Còn quan hệ của biến bậc một thành phần với các biến quan sát của nó có thể ở bất kỳ dạng nào (reflective hay formative đều được).
Khi gọi "biến bậc hai kết quả" hoặc "biến bậc hai reflective" nghĩa là quan hệ của biến bậc hai với biến bậc một thành phần là dạng kết quả (reflective). Còn quan hệ của biến bậc một thành phần với các biến quan sát của nó có thể ở bất kỳ dạng nào (reflective hay formative đều được).
1. So sánh phương pháp lặp chỉ báo và phương pháp hai giai đoạn
Becker và cộng sự (2012) cho rằng rằng hai phương pháp chỉ báo lặp lại và hai giai đoạn thường cho kết quả rất tương đồng khi kích thước mẫu đủ lớn. Với phương pháp chỉ báo lặp lại tương đối dễ áp dụng trong PLS-SEM, nhưng việc sử dụng nó trở nên gặp nhiều vấn đề khi biến bậc hai ở dạng nguyên nhân (formative). Chính vì vậy, các nhà nghiên cứu đã đề xuất phương pháp hai giai đoạn như một phương án thay thế cho phương pháp chỉ báo lặp lại (Wetzels và cộng sự, 2009).
Ringle và cộng sự (2019) qua nghiên cứu của mình đã chỉ ra rằng số lượng các công trình sử dụng kỹ thuật hai giai đoạn khi xử lý biến bậc hai cao hơn nhiều so với hướng tiếp cận biến quan sát lặp lại.
Dưới đây là so sánh nhanh về mặt ứng dụng của hai kỹ thuật xử lý biến bậc hai này:
Tiêu chí | Repeated Indicators Approach | Two-Stage Approach |
---|---|---|
1. Nguyên lý | Sử dụng toàn bộ các chỉ báo (indicators) của các construct bậc một làm chỉ báo cho construct bậc hai. | Gồm hai giai đoạn: - Giai đoạn 1: Ước lượng construct bậc một và lấy latent variable scores. - Giai đoạn 2: Dùng các latent scores đó làm chỉ báo cho construct bậc hai. |
2. Công việc thực hiện | Thiết lập đơn giản, dễ thực hiện, không yêu cầu nhiều công đoạn. | Phức tạp hơn về thao tác. Cần thực hiện hai giai đoạn riêng biệt, đòi hỏi hiểu biết về quy trình phân tích. |
3. Phạm vi ứng dụng | Chỉ phù hợp dạng biến bậc hai kết quả (reflective). | Xử lý tốt biến bậc hai ở dạng kết quả (reflective) lẫn nguyên nhân (formative). |
4. Quan hệ của biến bậc một với bậc hai | Không đánh giá được đầy đủ quan hệ của biến bậc một với biến bậc hai. Đặc biệt ở biến bậc hai nguyên nhân. | Đánh giá được quan hệ giữa biến bậc một với biến bậc hai. |
5. Đọc kết quả | Dễ dàng khi toàn bộ xử lý trong 1 mô hình duy nhất. |
Phức tạp hơn nhưng đầy đủ hơn, khi phải đánh giá kết quả ở 2 mô hình trong 2 giai đoạn. |
2. Nhiệm vụ của mỗi giai đoạn trong phương pháp hai giai đoạn
Kỹ thuật xử lý biến bậc hai theo phương pháp hai giai đoạn (Two-Stage Approach) trong PLS-SEM gồm hai bước riêng biệt, mỗi bước có nhiệm vụ cụ thể. Dưới đây là phần giải thích rõ ràng nhiệm vụ của từng giai đoạn:
Giai đoạn 1: Ước lượng các biến bậc một (Lower-Order Constructs – LOCs)
Mục tiêu chính của giai đoạn này là ước lượng các cấu trúc bậc một và trích xuất latent variable scores của chúng để sử dụng cho giai đoạn 2.
a. Đánh giá chất lượng mô hình đo lường của LOCs:
- Độ tin cậy của các thang đo (Reliability): Đánh giá độ tin cậy nội bộ của từng LOC thông qua các chỉ số như Cronbach's Alpha, Composite Reliability (CR).
- Giá trị hội tụ (Convergent Validity): Đảm bảo rằng các biến quan sát đo lường cùng một LOC có sự hội tụ, thường được kiểm tra bằng Average Variance Extracted (AVE).
- Giá trị phân biệt (Discriminant Validity): Đảm bảo rằng mỗi LOC khác biệt rõ ràng với các LOC khác, thường được kiểm tra bằng tiêu chí Fornell-Larcker hoặc HTMT.
- Vấn đề cộng tuyến (Collinearity) (đối với LOCs đo lường formative): Nếu các LOCs được đo lường formative, cần kiểm tra VIF (Variance Inflation Factor) để đảm bảo không có vấn đề đa cộng tuyến nghiêm trọng giữa các biến quan sát của LOC đó.
b. Lấy điểm số biến tiềm ẩn (Latent Variable Scores) cho các LOCs:
Sau khi đánh giá và xác nhận các mô hình đo lường của các LOCs đạt yêu cầu, phần mềm PLS-SEM sẽ tạo ra các điểm số biến tiềm ẩn cho từng LOC. Các điểm số này chính là giá trị tổng hợp đại diện cho từng biến bậc một.
Giai đoạn 2: Mô hình hóa biến bậc hai (Higher-Order Construct – HOC)
Mục tiêu chính của giai đoạn này là sử dụng các điểm số biến tiềm ẩn của các LOCs đã được tính toán ở giai đoạn 1 để đại diện cho biến bậc hai (HOC) và đánh giá các mối quan hệ trong mô hình cấu trúc.
a. Xây dựng mô hình mới với HOC:
Các điểm số biến tiềm ẩn của các LOCs (thu được từ giai đoạn 1) được sử dụng làm các biến quan sát để đo lường biến bậc hai (HOC).
Mô hình cấu trúc được vẽ lại, trong đó HOC được kết nối với các biến khác trong mô hình (biến độc lập, biến phụ thuộc, hoặc biến trung gian, biến điều tiết khác).
b. Đánh giá mô hình đo lường của HOC:
Nếu HOC được hình thành từ các LOCs theo kiểu kết quả (reflective), cần:
- Kiểm tra ý nghĩa giải thích của các LOCs cho HOC:
- biếnVIF giữa các LOCs (lúc này đóng vai trò là "chỉ số" của HOC) để đảm bảo không có vấn đề cộng tuyến.
Nếu HOC được hình thành từ các LOCs theo kiểu nguyên nhân (formative), cần kiểm tra VIF giữa các LOCs (lúc này đóng vai trò là "chỉ số" của HOC) để đảm bảo không có vấn đề cộng tuyến.
c. Đánh giá mô hình cấu trúc:
Đánh giá ý nghĩa thống kê của các mối quan hệ (Path Coefficients): Kiểm tra các hệ số đường dẫn (path coefficients) giữa HOC và các biến khác trong mô hình bằng cách sử dụng phương pháp Bootstrap để xác định giá trị p và hệ số t.
Kiểm tra R-squared (R2) và Q2: Đánh giá khả năng giải thích và khả năng dự đoán của mô hình.
Đánh giá mức độ ảnh hưởng (f2): Xác định tầm quan trọng tương đối của HOC trong việc giải thích biến phụ thuộc.
Phân tích độ phù hợp của mô hình (Model Fit): Mặc dù PLS-SEM không dựa trên các chỉ số phù hợp mô hình chặt chẽ như CB-SEM, nhưng vẫn có thể xem xét các chỉ số như SRMR để đánh giá mức độ phù hợp.
3. Các phiên bản của phương pháp hai giai đoạn
Ưu điểm của phương pháp tiếp cận hai giai đoạn là có thể sử dụng cho tất cả các dạng mô hình bậc cao, nên chúng ta sẽ ưu tiên lựa chọn kỹ thuật này khi xử lý mô hình có biến bậc hai mà không cần quan tâm biến bậc hai ở dạng kết quả hay nguyên nhân. Trong phạm vi bài viết này, tác giả cũng chỉ hướng dẫn phần xử lý mô hình bậc cao bằng kỹ thuật hai giai đoạn.
Có hai phiên bản của phương pháp hai giai đoạn được đề xuất:
(1) phương pháp hai giai đoạn nhúng (embedded two-stage approach – Ringle và cộng sự, 2012) và
(2) phương pháp hai giai đoạn tách biệt (disjoint two-stage approach – Agarwal & Karahanna, 2000; Becker và cộng sự, 2012)
với một vài khác biệt nhỏ trong cách thiết lập mô hình ở cả hai giai đoạn.
Trong khi phương pháp nhúng mô hình hóa toàn bộ khái niệm bậc hai ngay từ giai đoạn 1, thì phương pháp tách biệt ban đầu chỉ sử dụng các thành phần bậc thấp (vì thế có tên gọi “nhúng” và “tách biệt”). Vì cả hai phiên bản của phương pháp hai giai đoạn đều cho ra kết quả tương tự nhau (Cheah và cộng sự, 2019), nên không có lý do rõ ràng để ưu tiên phương pháp này so với phương pháp kia.
2.1. Phương pháp hai giai đoạn nhúng (embedded two-stage approach)
Xét ví dụ mô hình nghiên cứu như Hình 1, Hình 2 bên dưới. Mô hình có biến Y5 là dạng biến bậc một, biến Y4 là dạng biến bậc hai (HOC) gồm 3 biến bậc một thành phần Y1, Y2, Y3 (các LOCs).
Giai đoạn 1 của phương pháp hai giai đoạn nhúng giống với phương pháp chỉ báo lặp lại. Đó là tất cả biến quan sát của các biến bậc một được gán cho biến bậc hai. Như vậy, các biến quan sát được sử dụng hai lần: một lần cho các biến bậc một và một lần nữa cho biến bậc hai (x1 - x9 trong Hình 1, Hình 2).
Cần lưu ý rằng:
- Các biến quan sát của biến bậc một gán vào biến bậc hai chỉ có chức năng khai báo nhận diện cho biến bậc hai trên phần mềm. Chúng không phải là thang đo đo lường thực sự của biến bậc hai.
- Thang đo đo lường của biến bậc hai thực chất được xác định bởi mối quan hệ giữa biến bậc hai với biến bậc một.
- Nếu có bất kỳ biến quan sát nào của biến bậc một bị loại do không đạt tiêu chuẩn kiểm định, khi xóa nó khỏi LOC cũng sẽ cần xóa nó khỏi HOC.
Hình 2: Giai đoạn 1 - Biến bậc hai kết quả (reflective)
Giai đoạn 2 (Stage 2)
Từ kết quả phân tích ước lượng giai đoạn 1, chúng ta lưu lại điểm số biến tiềm ẩn (latent variable scores) của tất cả các cấu trúc nhân tố trong mô hình và thêm chúng vào tập dữ liệu dưới dạng các biến mới. Ở giai đoạn hai, các điểm số này sẽ được sử dụng như các chỉ báo trong mô hình đo lường của khái niệm bậc hai như minh họa trong Hình 3.
Các nhân tố còn lại trong mô hình (ví dụ, Y5 trong Hình 3) sẽ được đo lường bằng biến đơn một chỉ báo, với chỉ báo (biến quan sát) này cũng lấy điểm số biến tiềm ẩn của nhân tố đó từ giai đoạn 1.
Hình 3: Giai đoạn 2 của phương pháp nhúng embedded
Ví dụ, trong trường hợp các cấu trúc nhân tố bậc hai hiển thị trong Hình 1 và Hình 2, thành phần bậc hai Y4 sẽ được đo lường bằng ba chỉ báo hình thành đại diện cho điểm số biến tiềm ẩn của Y1, Y2 và Y3 từ giai đoạn một.
2.2. Phương pháp hai giai đoạn tách biệt (disjoint two-stage approach)
Phương pháp hai giai đoạn tách biệt khác với phương pháp nhúng ở cách thiết lập mô hình trong cả hai giai đoạn.
Giai đoạn 1 (Stage 1)
Thay vì sử dụng phương pháp chỉ báo lặp lại ở giai đoạn 1, phương pháp tách biệt chỉ xét đến các biến bậc một thành phần của biến bậc hai (tức là không có sự xuất hiện của biến bậc hai cùng lúc với các biến bậc một) trong mô hình đường dẫn. Các biến bậc một thành phần này được liên kết trực tiếp với tất cả các biến khác trong mô hình mà biến bậc hai có mối quan hệ lý thuyết.
Hình 5: Giai đoạn 1 - Chỉ có biến bậc một thành phần, không có biến bậc hai
Giai đoạn 2 (Stage 2)
Sau khi phân tích ước lượng mô hình ở giai đoạn 1, chúng ta lưu lại điểm số biến tiềm ẩn (latent variable scores) nhưng chỉ của các biến thành phần bậc một (ví dụ: điểm số của các nhân tố Y1, Y2 và Y3 trong ví dụ này). Ở giai đoạn hai, các điểm số này sẽ được sử dụng như các chỉ báo trong mô hình đo lường của khái niệm bậc hai như minh họa trong Hình 6.
Khác với phương pháp nhúng, các nhân tố còn lại trong mô hình đường dẫn sẽ được giữ nguyên cấu trúc biến quan sát ban đầu chứ không chuyển đổi sang dạng biến đơn một chỉ báo (ví dụ: Y5 trong Hình 6 vẫn giữ nguyên ba biến quan sát từ giai đoạn 1, còn ở phương pháp nhúng thì chuyển đổi về chỉ còn một biến quan sát).
Hình 6: Giai đoạn 2 của phương pháp tách biệt disjoint
----------
Nguồn tham khảo:
Sarstedt, M., Hair, J. F., Cheah, J.-H., Becker, J.-M., & Ringle, C. M. (2019). How to Specify, Estimate, and Validate Higher-Order Constructs in PLS-SEM. Australasian Marketing Journal, 27(3), 197-211.