Phân tích biến trung gian mediator trong SMARTPLS


Trước khi đi vào phần xử lý biến trung gian mediator trong SMARTPLS, lưu ý rằng bài viết này sẽ sử dụng các thuật ngữ Tiếng Anh trong đánh giá mô hình PLS-SEM. Nếu bạn không hiểu các khái niệm bên dưới, vui lòng xem bài viết Mô hình cấu trúc và mô hình đo lường trong PLS-SEM.

Xử lý biến trung gian trong SMARTPLS

1. Lý thuyết về biến trung gian

Biến xen giữa vào mối quan hệ nhân - quả từ độc lập lên phụ thuộc gọi là biến trung gian (mediator hoặc mediating variable). Xử lý biến trung gian nghĩa là chúng ta sẽ đi đánh giá biến trung gian đó có thực sự can thiệp vào mối quan hệ của độc lập - phụ thuộc hay không, nếu có thì sự can thiệp đó thế nào.

Trong mô hình quan hệ trung gian đơn giản bên dưới, X là biến độc lập, Y là phụ thuộc và M là biến trung gian. 

Xử lý biến trung gian trong SMARTPLS

Xử lý biến trung gian trong SMARTPLS

Trong mô hình biến trung gian, có hai mối tác động từ X lên Y là trực tiếp (direct) và gián tiếp (indirect). Đường trực tiếp là X → Y, và đường gián tiếp là X → M → Y. 

Mô hình biến trung gian cơ bản nhất gồm các biến và các mối tác động như sau:

Xử lý biến trung gian trong SMARTPLS

Trong đó:

  • c': Tác động trực tiếp direct effect từ X lên Y
  • a*b: Tác động gián tiếp indirect effect từ X lên Y
  • c: Tác động tổng hợp total effects từ X lên Y

Theo Baron & Kenny (1986), một biến được xác định là đóng vai trò trung gian nếu thỏa mãn cùng lúc 3 điều kiện sau đây:

  1. Điều kiện 1: Biến độc lập có tác động lên biến trung gian (a ≠ 0).
  2. Điều kiện 2: Biến trung gian có tác động lên biến phụ thuộc (b ≠ 0).
  3. Điều kiện 3: Khi điều kiện 1 và 2 thỏa mãn, sự xuất hiện của biến trung gian sẽ làm giảm sự tác động từ biến độc lập lên biến phụ thuộc (c' < c), trong đó c là hệ số hồi quy từ X lên Y khi chưa có sự hiện diện của biến trung gian M.

Để kiểm tra một biến trung gian có thỏa được 3 điều kiện ở trên hay không, chúng ta sẽ thực hiện 3 phép hồi quy như sau:

1. Hồi quy đơn: X → M: Để biết biến độc lập có tác động lên biến trung gian hay không (điều kiện 1). Kết quả mong đợi là sig kiểm định t của biến X nhỏ hơn 0.05.

M = hằng số 1 + aX + e1

2. Hồi quy bội: X, M → Y: Để biết biến trung gian có tác động lên biến phụ thuộc hay không (điều kiện 2). Kết quả mong đợi là sig kiểm định t của biến M nhỏ hơn 0.05.

Y = hằng số 2 + c'X + bM + e2

3. Hồi quy đơn: X → Y: Để biết sự xuất hiện của biến trung gian có làm giảm sự tác động từ biến độc lập lên biến phụ thuộc hay không. Kết quả mong đợi là hệ số c' < c.

Y = hằng số 3 + cX + e3

Nếu 1 trong 3 điều kiện trên bị vi phạm, biến M không đóng vai trò trung gian can thiệp vào sự tác động từ X lên Y.

Tuy nhiên, một số tác giả (Collins, Graham, & Flaherty, 1998; Judd & Kenny, 1981; Kenny et al., 1998; MacKinnon, 1994, 2000; MacKinnon, Krull, & Lockwood, 2000; Shrout & Bolger, 2002) đã đưa ra tranh cãi rằng, mối tác động tổng hợp total effects không nhất thiết phải có ý nghĩa thì mới có mối quan hệ trung gian. Do đó, chúng ta cần có một hướng đánh giá mối quan hệ trung gian chính xác hơn.

Bootstrapping là một kỹ thuật liên quan đến việc lấy mẫu lặp lại từ tập dữ liệu mẫu và ước tính tác động gián tiếp indirect (tích số a*b) trong mỗi tập dữ liệu được lấy mẫu lại.

Nhiều nghiên cứu đã chứng minh kỹ thuật Bootstrapping tốt hơn các kỹ thuật khác khi đánh giá mối quan hệ trung gian (Williams & MacKinnon, 2008; Preacher & Hayes, 2008; Zhao, Lynch & Chen, 2010) vì nó không yêu cầu dữ liệu phải có phân phối chuẩn và có thể áp dụng cho các cỡ mẫu nhỏ. Cách tiếp cận này hoàn toàn phù hợp với phương pháp PLS-SEM và thuật toán của SMARTPLS cũng sử dụng kỹ thuật này trong đánh giá biến trung gian.

2. Phân tích biến trung gian mediator trên SMARTPLS

Để trực quan hơn khi hướng dẫn, chúng ta sẽ đi qua một mô hình nghiên cứu với các biến như sau:

Xử lý biến trung gian trong SMARTPLS

CLDV - Chất lượng dịch vụ: Được đo bằng 4 chỉ báo CLDV1, CLDV2, CLDV3, CLDV4

GTCN - Giá trị cảm nhận: Được đo bằng 2 chỉ báo GTCN1, GTCN2

SHL - Sự hài lòng khách hàng: Được đo bằng 1 chỉ báo SHL1

YDQL - Ý định quay lại: Được đo bằng 3 chỉ báo YDQL1, YDQL2, YDQL3

Tất cả các mối tác động trực tiếp trong mô hình đều mang dấu dương - tác động thuận chiều.

Chúng ta sẽ đánh giá mối tác động gián tiếp từ CLDV lên YDQL thông qua hai biến trung gian GTCN và SHL.

2.1 Total Indirect Effects và Specific Indirect Effects

Với mô hình ở trên có thể thấy rằng có tới 2 biến trung gian trong mối quan hệ từ CLDV lên YDQL:
CLDV → GTCN → YDQL và CLDV → SHL → YDQL. Trường hợp này chúng ta xuất hiện hai loại tác động gián tiếp là riêng biệt và tổng hợp.

  • Tác động gián tiếp tổng hợp (Total Indirect Effects): xét chung mối quan hệ gián tiếp từ CLDV lên YDQL ở tất cả các biến trung gian.
  • Tác động gián tiếp riêng biệt (Specific Indirect Effects): xét từng mối quan hệ gián tiếp từ CLDV lên YDQL qua mỗi biến trung gian.

Tác động gián tiếp tổng hợp từ CLDV lên YDQL sẽ bằng tổng tất cả các mối quan hệ gián tiếp riêng biệt cộng lại. 

2.2 Đánh giá mối quan hệ gián tiếp trên SMARTPLS

Thực hiện phân tích bootstrap trên SMARTPLS theo hướng dẫn tại bài viết này. Trong output kết quả, dễ dàng nhìn thấy 2 lựa chọn Total Indirect Effects và Specific Indirect Effects.

Xử lý biến trung gian trong SMARTPLS

a. Specific Indirect Effects

Chúng ta sẽ tích vào Specific Indirect Effects để đánh giá từng mối quan hệ gián tiếp riêng biệt trước.

Xử lý biến trung gian trong SMARTPLS

Tại đây sẽ hiển thị kết quả của tất cả các mối quan hệ gián tiếp riêng biệt, cụ thể trong tình huống này là 2 mối quan hệ gián tiếp riêng biệt CLDV → GTCN → YDQL và CLDV → SHL → YDQL.

- Original Sample: Hệ số hồi quy chuẩn hóa mối tác động theo mẫu gốc. Hệ số này âm hay dương tùy thuộc vào dấu hệ số hồi quy từ biến độc lập lên trung gian (X→M: hệ số hồi quy là a) và từ trung gian lên phụ thuộc (M→Y: hệ số hồi quy là b). Nếu a*b mang dấu dương thì Original Sample mang dấu dương, nếu a*b mang dấu âm thì Original Sample mang dấu âm.

- Sample Mean: Trung bình hệ số hồi quy chuẩn hóa mối tác động từ tất cả mẫu bootstrap. Ví dụ, cỡ mẫu của dữ liệu là 200, chạy bootstrap 1000, kết quả sẽ có 1000 tập dữ liệu có cỡ mẫu 200 được sinh ra. Mỗi cỡ mẫu đó sẽ có hệ số hồi quy chuẩn hóa Original Sample tương ứng, lấy trung bình cộng 1000 giá trị Original Sample này sẽ ra giá trị Sample Mean.

- Standard Deviation: Độ lệch chuẩn của hệ số hồi quy.

- T Statistics: Kiểm định student T ý nghĩa thống kê của hệ số hồi quy.

- P Values: Đánh giá mức ý nghĩa của phép kiểm định. Nếu P Value < 0.05, mối tác động gián tiếp có ý nghĩa, nếu P Value > 0.05, mối tác động gián tiếp không có ý nghĩa (ở độ tin cậy 95%).

Cụ thể trong ví dụ ở trên, cả 2 mối tác động gián tiếp riêng biệt đều có P Value nhỏ hơn 0.05, như vậy, GTCN và SHL có vai trò trung gian trong mối quan hệ tác động từ CLDV lên YDQL.

Hệ số hồi quy của mối tác động gián tiếp CLDV → GTCN → YDQL bằng 0.126 lớn hơn 0.107 là hệ số hồi quy mối tác động gián tiếp CLDV → SHL → YDQL. Như vậy, biến GTCN đóng vai trò trung gian mạnh hơn so với SHL.

b. Total Indirect Effects

Tại kết quả output, nhấp vào Total Indirect Effects. Giao diện kết quả như sau:

Xử lý biến trung gian trong SMARTPLS

Như đã đề cập ở mục 2.1, Total của mối quan hệ trung gian sẽ bằng tất cả các Specific cộng lại. Ở đây, tác động gián tiếp tổng hợp từ CLDV → YDQL có P Value bằng 0.000 < 0.05. Như vậy, tồn tại mối quan hệ gián tiếp từ CLDV lên YDQL. 

Lưu ý rằng, mối quan hệ tác động trong bất cứ phần mềm thống kê nào, dù là trực tiếp, gián tiếp, điều tiết, tổng hợp, riêng biệt thì mối tác động nào sẽ có kiểm định đánh giá mối quan hệ đó, không được suy diễn kiểm định từ tổng hợp sang thành phần hoặc từ thành phần sang tổng hợp. Ví dụ, không được suy diễn Specific các mối quan hệ có ý nghĩa sang Total cũng có ý nghĩa, mà phải kiểm định cho từng loại.

Hệ số hồi quy chuẩn hóa Original Sample bằng 0.233, chính bằng tổng Original Sample của hai Specific Indirect Effects là 0.126 + 0.107. Lưu ý, một số trường hợp cộng lại sẽ không bằng chính xác mà sẽ có sự chênh lệch rất nhỏ ở phần thập phân thứ 2, thứ 3, điều này là bình thường do cơ chế làm tròn số của phần mềm.