Các thắc mắc ngoài dịch vụ, bạn vui lòng thảo luận tại nhóm Facebook này nhé.
😄

Kiểm định Bootstrap trên AMOS, so sánh với SEM thông thường

Kiểm định Bootstrap trên AMOS là một kỹ thuật mạnh để hỗ trợ xử lý mô hình SEM khi dữ liệu vi phạm phân phối chuẩn đa biến, cũng như hỗ trợ phân tích tác động gián tiếp trong mô hình. Bài viết này tác giả sẽ đi sâu vào phân biệt SEM thông thường và SEM bằng Bootstrap trên AMOS để các bạn hiểu rõ hơn khi nào sẽ sử dụng Bootstrap.

Kiểm định Bootstrap trên AMOS

1. Giả định phân phối chuẩn đa biến trong phân tích AMOS

Kiểm định SEM thông thường trong AMOS là một kỹ thuật thống kê mạnh mẽ dùng để kiểm tra mối quan hệ giữa các biến tiềm ẩn (latent variables) và các biến quan sát (observed variables) trong mô hình sử dụng phương pháp ước lượng Maximum Likelihood làm mặc định. Phương pháp ước lượng này yêu cầu dữ liệu phải có phân phối chuẩn đa biến - multivariate normality (Barbara M. Byrne, 2016; Joel Collier, 2020).

Tuy nhiên trên thực tế, hầu hết dữ liệu không thể đáp ứng được giả định phân phối chuẩn đa biến này (West và cộng sự, 1995). Việc đánh giá các quan hệ trong mô hình bằng phương pháp Maximum Likelihood sẽ dẫn đến các sai lệch ước lượng. Và sự xuất hiện của Bootstrap (Hancock & Liu, 2012; West và cộng sự, 1995; Yung & Bentler, 1996; Zhu, 1997) chính là một hướng tiếp cận tối ưu nhất cho tới hiện tại để xử lý vấn đề dữ liệu vi phạm phân phối chuẩn đa biến. 

Kiểm định Bootstrap trong AMOS là một phương pháp thống kê không tham số (non-parametric) được sử dụng rộng rãi để ước lượng độ tin cậy của các tham số trong mô hình thống kê. Thay vì dựa vào các giả định về phân phối của dữ liệu, Bootstrap tiến hành lấy mẫu lại (resampling) từ dữ liệu ban đầu để tạo ra nhiều mẫu dữ liệu mới. Từ đó, ta có thể tính toán lại các tham số trên mỗi mẫu mới và sử dụng phân phối của các ước lượng này để đánh giá độ tin cậy của ước lượng ban đầu. Bootstrap không cần giả định phân phối chuẩn dữ liệu đầu vào.

Để tránh nhầm lẫn về thuật ngữ, tác giả đặt 2 tên gọi sau:

- SEM-Maximum Likelihood (SEM thông thường) phương pháp ước lượng mô hình SEM mặc định của AMOS mà chúng ta thường sử dụng.

- SEM-Bootstrap: phương pháp ước lượng mô hình SEM bằng kỹ thuật Bootstrapping.

2. Sử dụng SEM-Maximum Likelihood hay SEM-Bootstrap?

2.1 Sự khác biệt giữa SEM-Maximum Likelihood và SEM-Bootstrap

Cả SEM-Maximum Likelihood và SEM-Bootstrap đều có cùng chức năng là đánh giá ý nghĩa thống kê của những quan hệ tác động trong mô hình. Tuy nhiên, giả định dữ liệu đầu vào cũng như cơ chế đánh giá của hai kỹ thuật này khác nhau, cùng xem qua bảng so sánh bên dưới:

Yếu tố SEM-Maximum Likelihood SEM-Bootstrap
Phương pháp ước lượng Maximum Likelihood (ML) Bootstrap
Yêu cầu về phân phối dữ liệu Phân phối chuẩn đa biến Không yêu cầu phân phối chuẩn
Ước lượng tham số Trực tiếp từ dữ liệu gốc Từ các mẫu Bootstrap
Sai số chuẩn Ước lượng từ dữ liệu gốc Sai số chuẩn Bootstrap (SE-Bias)
Khoảng tin cậy Dựa trên phân phối chuẩn Khoảng tin cậy Bootstrap
Kiểm định ý nghĩa thống kê Dựa trên phân phối chuẩn Dựa trên phân phối của các mẫu Bootstrap
Khi nào sử dụng Dữ liệu có phân phối chuẩn Dữ liệu không có phân phối chuẩn, kích thước mẫu nhỏ

2.2 Nếu dữ liệu không có phân phối chuẩn đa biến thì thực hiện SEM-Maximum Likelihood được không?

Như đã đề cập ở mục đầu, nghiên cứu của West và cộng sự (1995) nêu rằng hầu hết dữ liệu trên thực tế đều vi phạm giả định phân phối chuẩn đa biến, trong khi đó SEM thông thường cần dữ liệu đảm bảo điều kiện này, vậy thì SEM thông thường không thể sử dụng được?

Có rất nhiều nghiên cứu đăng tải trên các tạp chí lớn, luận văn thạc sĩ, luận án tiến sĩ thực hiện SEM thông thường trên AMOS để đánh giá quan hệ tác động trong mô hình mà không kiểm tra xem dữ liệu có đảm bảo giả định phân phối chuẩn đa biến hay không. Đây là cách làm không đúng nhưng vẫn được sử dụng rộng rãi bởi vì:

(1) Sự tiếp nối cái sai từ người đi trước.

Giai đoạn từ sau năm 2000, các công trình nghiên cứu về giả định phân phối chuẩn đa biến trong SEM thông thường mới được đề cập nhiều, còn ở giai đoạn trước đó, giả định này ít được quan tâm. Do đó, một số nhà nghiên cứu không biết được rằng phải đảm bảo giả định này thì SEM thông thường mới nên được thực hiện.

Về sau, các nghiên cứu mới thừa kế lại các công trình nghiên cứu này và không đi sâu vào các giả định của SEM-Maximum Likelihood, dẫn đến sai nối tiếp sai.

(2) Rất khó khăn để có được một bộ dữ liệu có phân phối chuẩn đa biến.

Như West và cộng sự (1995), Barbara M. Byrne (2016) đã nói tới, phần lớn dữ liệu thực tế ở trạng thái không có phân phối chuẩn đa biến. Chính vì vậy, nhiều nhà nghiên cứu chấp nhận điều này và tiến hành phân tích SEM mà không cần xét tới dữ liệu có hay không có phân phối chuẩn đa biến.

(3) Không phải không có phân phối chuẩn thì SEM sẽ cho ra kết quả "vô dụng"

Việc dữ liệu không hoàn toàn tuân theo phân phối chuẩn không phải là rào cản quá lớn để thực hiện phân tích thống kê. Mặc dù phương pháp Maximum Likelihood sử dụng mặc định trong AMOS thường giả định phân phối chuẩn, nhưng đây không phải là một yêu cầu tuyệt đối. Việc vi phạm giả định này có thể ảnh hưởng đến kết quả phân tích, nhưng không nhất thiết làm cho kết quả trở nên vô dụng. Bởi vì phương pháp Maximum Likelihood trong ước lượng mô hình độ bền tương đối tốt đối với sự vi phạm giả định về phân phối chuẩn."Độ bền" ở đây mang ý nghĩa là ngay cả khi dữ liệu không hoàn toàn chuẩn, các ước lượng vẫn có thể cung cấp kết quả khá chính xác.

Một số chỉ số thống kê trong AMOS, như chỉ số phù hợp mô hình, thường không chênh lệch nhiều với sự vi phạm giả định về phân phối chuẩn đa biến. 

Kiểm định ý nghĩa thống kê hệ số hồi quy trong SEM-Maximum Likelihood qua giá trị tới hạn C.R và trị số ý nghĩa P-value dựa trên phân phối chuẩn của dữ liệu. Chính vì vậy, đây là phần sẽ bị ảnh hưởng nhiều nếu mức độ vi phạm phân phối chuẩn là quá lớn. Chúng ta có thể hạn chế điều này bằng cách tăng lượng mẫu nghiên cứu lớn để phục vụ cho phân tích SEM. Bởi vì khi mẫu nghiên cứu lớn, dữ liệu sẽ có xu hướng tiến gần về phân phối chuẩn hơn.

Tóm lại, về nguyên tắc khi phân tích quan hệ trong mô hình bằng SEM trên AMOS, chúng ta cần theo thứ tự quy trình:
Bước 1: Đánh giá giả định phân phối chuẩn đa biến của dữ liệu
Bước 2: Chia làm 2 trường hợp:
- Nếu dữ liệu đảm bảo phân phối chuẩn đa biến, tiến hành phân tích SEM-Maximum Likelihood mặc định.
- Nếu dữ liệu không đảm bảo phân phối chuẩn đa biến, tiến hành phân tích SEM-Bootstrap.

3. Ứng dụng khác của kiểm định Bootstrap trên AMOS

Một ứng dụng phổ biến của kiểm định Bootstrap trên AMOS chính là phân tích biến trung gian (quan hệ gián tiếp) trong mô hình.

Kết quả từ kiểm định Bootstrap sẽ cung cấp 2 cách đánh giá ý nghĩa quan hệ trung gian: 

1. Khoảng tin cậy Bootstrap của quan hệ trung gian: Kiểm tra khoảng tin cậy Bootstrap của tác động trung gian. Nếu khoảng tin cậy này không chứa giá trị 0, có thể kết luận rằng biến trung gian có vai trò ý nghĩa thống kê trong mô hình.

2. Giá trị sig Bootstrap của quan hệ trung gian: Dựa vào giá trị sig Bootstrap quan hệ trung gian và so sánh với mức ý nghĩa (ví dụ 0.05).

Xem chi tiết bài phân tích quan hệ trung gian bằng Bootstrap trên AMOS tại đây.

Đăng nhận xét