Một biến được gọi là biến trung gian khi nó tham gia giải thích cho mối quan hệ giữa biến độc lập và phụ thuộc (Baron & Kenny, 1986). Xem thêm thông tin ba loại biến biến trung gian, điều tiết, kiểm soát tại bài viết này.
1. Lý thuyết về biến trung gian và quan hệ gián tiếp
Một mô hình trung gian cơ bản được biểu diễn như ảnh bên dưới với X là biến độc lập, Y là biến phụ thuộc, M là biến trung gian.
Biến trung gian (mediator) được coi là biến số thứ ba can thiệp vào mối liên hệ giữa hai biến số.
Phân tích mô hình biến trung gian nghĩa là chúng ta phân tích sự can thiệp của biến trung gian, sự can thiệp đó sẽ tạo ra một loại tác động gọi là "tác động gián tiếp" (indirect effect).
Trong mô hình biến trung gian, có ba loại tác động sau được hình thành:
- c': Tác động trực tiếp direct effect từ X lên Y
- a*b: Tác động gián tiếp indirect effect từ X lên Y
- c: Tác động tổng hợp total effects từ X lên Y
a. Đánh giá mô hình biến trung gian theo cách truyền thống
Một trong những phương pháp đầu tiên dùng để đánh giá mô hình biến trung gian, và cũng được giới nghiên cứu áp dụng rộng rãi sau đó, là cách tiếp cận của Baron và Kenny (1986). Theo quan điểm của hai tác giả này, một biến được xem là biến trung gian khi đồng thời thỏa mãn ba điều kiện sau:
- Điều kiện 2: Biến trung gian M có tác động lên biến phụ thuộc Y.
- Điều kiện 3: Biến độc lập X có tác động lên biến phụ thuộc Y + Khi điều kiện 1 và 2 thỏa mãn, sự xuất hiện của biến trung gian sẽ làm giảm sự tác động từ biến độc lập lên biến phụ thuộc.
Để kiểm tra một biến trung gian có thỏa được 3 điều kiện ở trên hay không, Baron & Kenny đề xuất thực hiện 3 phép hồi quy như sau:
1. Hồi quy đơn X → M
Yêu cầu: Hệ số tác động a ≠ 0 hay sig kiểm định t của biến X nhỏ hơn 0.05 (nếu sử dụng độ tin cậy là 95%).
Giải quyết điều kiện 1.
2. Hồi quy bội X, M → Y
Yêu cầu: Hệ số tác động b ≠ 0 hay sig kiểm định t của biến M nhỏ hơn 0.05.
Trong kết quả hồi quy thứ hai này, chúng ta sẽ có được hệ số tác động c' từ X lên Y.
Giải quyết điều kiện 2.
3. Hồi quy đơn: X → Y
Yêu cầu 1: Hệ số tác động c ≠ 0 hay sig kiểm định t của biến X nhỏ hơn 0.05.
Yêu cầu 2: Hệ số tác động c' < c.
Giải quyết điều kiện 3.
Nếu 1 trong 3 điều kiện trên bị vi phạm, kết luận biến M không đóng vai trò trung gian can thiệp vào sự tác động từ X lên Y.
Xem thêm: Xử lý biến điều tiết moderator trong SPSS
b. Đánh giá mô hình biến trung gian theo cách mới (chính xác hơn)
Các nghiên cứu sau này của nhiều học giả như Collins, Graham & Flaherty (1998), Kenny và cộng sự (1998), MacKinnon (2000), Shrout & Bolger (2002), Preacher & Hayes (2008)... đã chỉ ra rằng điều kiện thứ ba trong mô hình của Baron & Kenny – tức tác động tổng hợp (total effect) giữa biến độc lập và biến phụ thuộc – không nhất thiết phải có ý nghĩa thống kê thì mới kết luận được có mối quan hệ trung gian. Từ đó, các tác giả đề xuất cần có một cách tiếp cận chính xác và linh hoạt hơn trong việc đánh giá vai trò trung gian.
Preacher & Hayes (2008) cho rằng kỹ thuật bootstrapping là một phương pháp hiệu quả, trong đó việc lấy mẫu lặp lại từ tập dữ liệu ban đầu giúp ước lượng chính xác tác động gián tiếp (indirect effect – tích số a*b) trong mỗi lần lấy mẫu.
Nhiều công trình nghiên cứu đã chứng minh bootstrapping vượt trội hơn so với các phương pháp truyền thống trong việc kiểm định quan hệ trung gian (Williams & MacKinnon, 2008; Preacher & Hayes, 2008; Zhao, Lynch & Chen, 2010), nhờ ưu điểm không yêu cầu dữ liệu tuân theo phân phối chuẩn và có thể áp dụng cho cả các mẫu có kích thước nhỏ. Cách tiếp cận này hoàn toàn phù hợp với phương pháp bootstrapping trên macro PROCESS.
Tóm lại, theo cách tiếp cận truyền thống, để kiểm định vai trò trung gian thì bắt buộc phải có mối quan hệ trực tiếp giữa biến độc lập X và biến phụ thuộc Y. Tuy nhiên, với cách tiếp cận hiện đại sử dụng bootstrapping, mối quan hệ trung gian vẫn có thể được đánh giá ngay cả khi không có đường tác động trực tiếp giữa X và Y.
Nếu bạn đang gặp khó khăn trong xử lý dữ liệu trên SPSS liên quan đến biến trung gian, điều tiết, kiểm soát. Bạn có thể tham khảo dịch vụ hỗ trợ SPSS của Phạm Lộc Blog để tối ưu về thời gian và có được kết quả phù hợp.
2. Xử lý biến trung gian mediator bằng Sobel Test
Sobel Test đánh giá ý nghĩa của biến trung gian hoàn toàn dựa theo lý thuyết của Baron & Kenny (1986) với ba điều kiện sau đây:
- Điều kiện 2: Biến trung gian M có tác động lên biến phụ thuộc Y.
- Điều kiện 3: Biến độc lập X có tác động lên biến phụ thuộc Y + Khi điều kiện 1 và 2 thỏa mãn, sự xuất hiện của biến trung gian sẽ làm giảm sự tác động từ biến độc lập lên biến phụ thuộc.
Trên cơ sở lý thuyết này, chúng ta sẽ đi vào thực hiện đánh giá quan hệ trung gian bằng Sobel Test (Sobel, 1982) trên SPSS bằng cách giải quyết lần lượt từng hồi quy như đã đề cập ở lý thuyết trong phần 1 của bài viết.
Thực hành trên một tập dữ liệu ví dụ, dữ liệu này gồm 3 biến X, M, Y tương ứng biến độc lập, trung gian, phụ thuộc. Biến độc lập là chất lượng dịch vụ, biến trung gian là sự hài lòng và biến phụ thuộc là ý định quay lại. Cả 3 biến đều được đánh giá bằng thang đo Likert 5 mức độ.
Thực hiện phân tích biến trung gian bằng Sobel Test để xem Sự hài lòng có vai trò trung gian tác động lên mối quan hệ giữa Chất lượng dịch vụ với Ý định quay lại của khách hàng hay không.
Bước 1: Thực hiện hồi quy đơn X → M
Xem cách thực hiện hồi quy trên SPSS tại bài viết này. Chúng ta có sig kiểm định t của biến X bằng 0.000 < 0.05, biến X có tác động lên M. Hệ số tác động chưa chuẩn hóa và sai số chuẩn của X lần lượt: a = 0.305 và sa = 0.026 (các ký hiệu a, sa chúng ta sẽ dùng ở Sobel Test).
Bước 2: Thực hiện hồi quy bội X, M → Y
Chúng ta có sig kiểm định t của biến M bằng 0.000 < 0.05, biến M có tác động lên Y. Hệ số tác động chưa chuẩn hóa và sai số chuẩn của M lần lượt: b = 0.104 và sb = 0.027. Hệ số tác động chưa chuẩn hóa của X trong phép hồi quy này là c' = 0.626.
Bước 3: Thực hiện hồi quy đơn X → Y
Chúng ta có hệ số tác động chưa chuẩn hóa c = 0.657 > c' = 0.626, điều này cho thấy biến trung gian M đã làm giảm tác động của biến độc lập lên biến phụ thuộc. Tại đây, theo lý thuyết của Barron (1986) chúng ta sẽ kết luận biến M đóng vai trò trung gian tác động lên mối quan hệ của X và Y.
Hiệu số c - c' = 0.657 - 0.626 = 0.031 (cũng chính bằng tích số a*b) cho chúng ta thấy có sự khác biệt. Tuy nhiên, sự khác biệt này có ý nghĩa thống kê hay không, c lớn hơn c' có ý nghĩa thống kê hay không, chúng ta cần phải thực hiện kiểm định t để đánh giá. Phép kiểm định t đánh giá hiệu số c - c' có nghĩa thống kê hay không được gọi là Sobel Test (xem thêm tại đây). Do đó, chúng ta sẽ tiếp tục thực hiện bước 4.
Bước 4: Đánh giá sự khác biệt c - c' bằng Sobel Test.
SPSS không tích hợp sẵn Sobel Test, chúng ta sẽ thực hiện kiểm định tại website này. Sau khi truy cập vào website, chúng ta sẽ chú ý tới phần Input với 4 giá trị cần khai báo đầu vào là a, b, sa, sb. Với:
- a, sa: lần lượt là hệ số hồi quy chưa chuẩn hóa và sai số chuẩn của X trong phương trình hồi quy đơn X → M.
- b, sb: lần lượt là hệ số hồi quy chưa chuẩn hóa và sai số chuẩn của M trong phương trình hồi quy bội X, M → Y.
Nhập 4 giá trị a, b, sa, sb tương ứng vào các ô trên bảng Sobel Test, sau đó nhấn vào Calculate để tiến hành phân tích. Chúng ta sẽ đọc kết quả giá trị p-value ở phần bôi vàng.
Giá trị sig (p-value) của kiểm định Sobel bằng 0.000 < 0.05, như vậy M là biến trung gian tác động lên mối quan hệ từ X lên Y.
3. Xử lý biến trung gian mediator bằng Bootstrap với macro PROCESS
Để thực hiện phân tích biến trung gian bằng Bootstrap trên SPSS, chúng ta sẽ dụng Hayes Process Macro. Các bạn tải Macro này tại https://www.afhayes.com/public/processv43.zip, cách tải và cài đặt vào SPSS, các bạn xem ở video bên dưới.
Mở tệp dữ liệu SPSS cần chạy phân tích trung gian, vào Analyze > Regression > PROCESS v3.5 by Andrew F. Hayes (macro cập nhật liên tục theo thời gian, do vậy số phiên bản 3.5 có thể thay đổi).
Cửa sổ PROCESS xuất hiện, chúng ta đưa biến phụ thuộc vào Y variable, biến độc lập vào X variable, biến trung gian vào Mediator(s). Nếu có nhiều biến trung gian cùng tác động lên mối quan hệ X, Y, chúng ta có thể đưa tất cả vào cùng lúc. Chọn các tùy chọn giống như mục số 2, sau đó nhấp vào Options mục 3.
Trong Options, tích vào 2 lựa chọn ở mục 1 và thiết lập mục 2 như ảnh. Nhấp Continue để quay lại cửa sổ ban đầu, sau đó nhấp OK để xuất kết quả ra Output.
Tương tự như Sobel Test, Macro PROCESS cũng xuất kết quả các phép hồi quy X → M (hồi quy 1) và X, M → Y (hồi quy 2). Bởi vì mỗi lần chạy Bootstrap, phần mềm sẽ lấy mẫu khác nhau nên kết quả có sự sai biệt giữa ảnh bên dưới với phần thực hành là bình thường, không phải lỗi.
(Kết quả phép hồi quy từ X, M lên Y)
Chúng ta quan tâm nhiều nhất vào mối quan hệ gián tiếp của X lên Y. Do vậy, cần tập trung vào bảng TOTAL, DIRECT AND INDIRECT EFFECTS OF X ON Y.
- Total effect of X on Y: Tổng tác động từ X lên Y (hệ số c)
- Direct effect of X on Y: Tác động trực tiếp từ X lên Y (hệ số c')
- Indirect effect(s) of X on Y: Tác động gián tiếp từ X lên Y qua M (tích số a*b)
Phần Indirect effects chúng ta sẽ đánh giá có sự tác động gián tiếp hay không dựa vào khoảng tin cậy phép bootstrap cho tích số a*b .
- Nếu khoảng tin cậy phép bootstrap tích số a*b chứa giá trị 0, chúng ta kết luận không có tác động gián tiếp từ X lên Y.
- Nếu khoảng tin cậy phép bootstrap tích số a*b không chứa giá trị 0, chúng ta kết luận có tác động gián tiếp từ X lên Y.
Cụ thể trong ví dụ thực hành, từ đầu chúng ta chọn độ tin cậy là 95%, kết quả cho gá trị dưới BootLLCI (Lower-Level Confidence Interval) bằng 0.0139 và giá trị trên BootULCI (Upper-Level Confidence Interval) bằng 0.0509. Khoảng tin cậy [0.0139; 0.0509] không bao gồm giá trị 0, như vậy có tác động gián tiếp từ X lên Y qua M với mức tác động là 0.0317. Như vậy, biến M có vai trò trung gian tác động lên mối quan hệ từ X tới Y.