Phạm Lộc Blog thông báo lịch nghỉ Tết nguyên đán 2026. XEM CHI TIẾT!
😄

Điều kiện có thể đưa biến kiểm soát lên mô hình hồi quy, SEM

Trong mô hình hồi quy và SEM, biến kiểm soát (control variable) chỉ nên được đưa vào khi đó là biến định lượng (hoặc đã được mã hóa thành dạng định lượng phù hợp). 

Điều này là cần thiết vì cả hồi quy lẫn SEM đều ước lượng mối quan hệ dựa trên các tham số số học như hệ số β, phương sai và hiệp phương sai. Nếu biến kiểm soát không ở dạng định lượng (ví dụ biến định tính thuần túy chưa mã hóa), mô hình sẽ không thể tính toán chính xác mức độ ảnh hưởng và dễ dẫn đến sai lệch trong ước lượng. Trong trường hợp biến định tính (như giới tính, nghề nghiệp…), cần chuyển đổi sang biến giả (dummy) trước khi đưa vào phân tích. 

Do đó, điều kiện tiên quyết để một biến được xem xét là biến kiểm soát trong hồi quy và SEM là nó phải tồn tại dưới dạng biến định lượng có thể đo lường và xử lý bằng các phép toán thống kê.

biến kiểm soát trong SEM, Hồi quy

1. Biến kiểm soát là gì?

Biến kiểm soát là những biến không phải trọng tâm nghiên cứu chính nhưng có khả năng ảnh hưởng đến biến phụ thuộc, từ đó làm sai lệch hoặc che khuất mối quan hệ thực sự giữa biến độc lập và biến phụ thuộc nếu không được kiểm soát.

Nói cách khác, biến kiểm soát được đưa vào mô hình nhằm mục đích loại trừ ảnh hưởng nhiễu, giúp kết quả ước lượng phản ánh “tác động thuần” của các biến độc lập chính.

Ví dụ:

  • Khi nghiên cứu tác động của chất lượng dịch vụ đến sự hài lòng, độ tuổi và thu nhập của khách hàng có thể ảnh hưởng đến mức độ hài lòng.
  • Khi nghiên cứu ý định mua xe điện, kinh nghiệm sử dụng xe điện hoặc trình độ học vấn có thể tác động đến ý định mua.

Trong các trường hợp này, độ tuổi, thu nhập, trình độ học vấn… không phải biến nghiên cứu chính nhưng cần được kiểm soát để tránh kết luận sai lệch.

2. Biến kiểm soát dạng định tính và định lượng

Xét về bản chất đo lường, biến kiểm soát cũng tuân theo phân loại chung của biến trong nghiên cứu định lượng, bao gồm biến định lượngbiến định tính.

2.1. Biến kiểm soát định lượng (quantitative variable)

Biến định lượng là các biến mà giá trị thể hiện là con số thực, có thể dùng trực tiếp trong phân tích hồi quy hay SEM. Biến này có thể là liên tục (ví dụ: thu nhập) hoặc rời rạc (ví dụ: số con cái). Biến định lượng có thể thực hiện các phép toán toán học có ý nghĩa như cộng, trừ, trung bình, độ lệch chuẩn.

Ví dụ:

  • Tuổi (số năm tuổi cụ thể)
  • Thu nhập (giá trị tiền tệ cụ thể)
  • Số năm kinh nghiệm làm việc

Đây là dạng biến kiểm soát lý tưởng nhất khi đưa vào mô hình hồi quy hoặc SEM vì không cần xử lý mã hóa phức tạp, dễ diễn giải hệ số và ít gây mất thông tin so với việc chia nhóm.

2.2. Biến kiểm soát định tính (qualitative / categorical variable)

Biến định tính là biến dùng để phân loại đối tượng nghiên cứu thành các nhóm, hạng mục khác nhau. Các giá trị thường được mã hoá bằng số (1,2,3…) để tiện xử lý nhưng con số đó chỉ mang tính quy ước, không phản ánh đại lượng thực sự.

Ví dụ:

  • Độ tuổi (chia các nhóm: Dưới 30 tuổi, Từ 31-50 tuổi, Trên 50 tuổi)
  • Trình độ học vấn (chia các nhóm: Cao đẳng, Đại học, Sau đại học)
  • Khu vực sinh sống (chia các nhóm: miền Bắc, miền Trung, miền Nam)

Các biến này không thể đưa trực tiếp vào mô hình hồi quy hoặc SEM dưới dạng gốc, vì bản thân chúng không mang ý nghĩa số học. Do đó, nếu muốn sử dụng biến định tính làm biến kiểm soát, bắt buộc phải mã hóa về dạng biến giả (dummy variable).

Chốt lại điểm trọng tâm:

- Biến kiểm soát phải ở dạng định lượng chúng ta mới có thể đưa vào phân tích chung với các biến khác trong mô hình hồi quy, SEM.

- Biến kiểm soát ở dạng định tính không thể đưa vào phân tích chung với các biến khác trong mô hình hồi quy, SEM. Thường sẽ dùng phân tích One-way ANOVA để đánh giá sự khác biệt của biến trong mô hình với biến kiểm soát.

3. Khác biệt của phân tích biến kiểm soát trong Hồi quy-SEM so với One-way ANOVA

3.1 Phân tích biến kiểm soát trong Hồi quy và SEM

Trong hồi quy và SEM, biến kiểm soát được đưa trực tiếp vào cùng mô hình với biến độc lập và biến phụ thuộc. Khi đó, ảnh hưởng của biến kiểm soát được ước lượng đồng thời, giúp giữ cố định tác động của yếu tố này khi tính toán hệ số của biến độc lập. Vì vậy, hệ số hồi quy phản ánh tác động thuần (net effect), tức là đã loại trừ ảnh hưởng nhiễu.

Nếu biến kiểm soát là định tính, cần mã hóa thành biến giả (dummy) hoặc recode lại biến về dạng 2 đáp án để quy đổi về biến định lượng. Với cách sử dụng biến giả, hướng đi này sẽ sinh ra số lượng biến kiểm soát giả nhiều hơn số lượng biến kiểm soát ban đầu sẽ gây rối phần nào cho người nghiên cứu. 

3.2 Phân tích biến kiểm soát trong ANOVA

Khi một biến kiểm soát là biến định tính (ví dụ: giới tính, trình độ học vấn, nghề nghiệp) và được phân tích riêng bằng ANOVA, thì thực chất ta chỉ đang kiểm tra xem biến phụ thuộc có khác nhau giữa các nhóm hay không. Ví dụ, ta kiểm tra xem mức độ hài lòng có khác nhau giữa nam và nữ hay không.

Tuy nhiên, việc làm này không có nghĩa là ta đã “kiểm soát” biến đó như trong mô hình hồi quy hoặc SEM. Vì ANOVA được chạy riêng, nên khi phân tích mô hình chính (ví dụ X → Y), ảnh hưởng của giới tính vẫn chưa được giữ cố định trong quá trình ước lượng hệ số. Nói đơn giản: ANOVA chỉ giúp ta biết biến đó có ảnh hưởng hay không, nhưng không loại bỏ ảnh hưởng đó khỏi mô hình chính.

Do đó, phân tích ANOVA chỉ mang tính chất kiểm tra bổ sung. Nếu kết quả cho thấy không có sự khác biệt giữa các nhóm, ta có thể yên tâm rằng biến này ít gây nhiễu. Nếu có sự khác biệt đáng kể, ta nên cân nhắc đưa biến đó vào mô hình chính (ví dụ mã hóa thành biến giả hoặc recode biến lại còn dạng 2 nhóm đáp án) để kiểm soát đúng nghĩa.

3. Lưu ý khi xem tham khảo bài mẫu có đưa biến kiểm soát vào hồi quy, SEM

Lưu ý 1: Biến kiểm soát có 2 đáp án vừa là biến định tính vừa là biến định lượng.

Những biến chỉ có 2 giá trị như giới tính (nam/nữ), quyết định mua (mua/không mua)… thường được xem là trường hợp đặc biệt. Về bản chất, chúng là biến định tính vì thể hiện nhóm hoặc loại. Tuy nhiên, do chỉ có hai giá trị nên ta có thể mã hóa chúng thành 0 và 1 để đưa vào các mô hình yêu cầu biến định lượng. Vì vậy, trong thực hành phân tích, biến hai giá trị có thể sử dụng linh hoạt trong nhiều kiểm định khác nhau.

Ví dụ, trong một nghiên cứu xem xét sự kiểm soát của giới tính đến sự hài lòng, ta có hai cách xử lý:

  • Nếu muốn kiểm tra sự khác biệt mức độ hài lòng giữa nam và nữ, ta có thể dùng Independent Samples T-test hoặc One-way ANOVA. Khi đó, giới tính là biến định tính, còn sự hài lòng là biến định lượng.

  • Nếu muốn xem giới tính có ảnh hưởng đến sự hài lòng trong mô hình hồi quy hoặc SEM hay không, ta có thể mã hóa giới tính thành 0 (nam) và 1 (nữ) rồi đưa vào mô hình như một biến định lượng.

Lưu ý 2: Biến kiểm soát định tính hay định lượng được quyết định bởi dữ liệu của nó chứ không phải bằng tên biến.

Một biến là định tính hay định lượng không phụ thuộc vào tên gọi của nó, mà phụ thuộc vào cách dữ liệu được thu thập và nhập vào.

Ví dụ, biến độ tuổi:

  • Nếu ghi chính xác số tuổi (18, 25, 40…), đó là biến định lượng → được đưa vào hồi quy, vẽ trên mô hình SEM.
  • Nếu chia thành nhóm (dưới 25, 25–35, trên 35…), đó là biến định tính → KHÔNG được đưa vào hồi quy, vẽ trên mô hình SEM.

Tương tự với biến thu nhập:

  • Nếu ghi con số cụ thể (15 triệu, 22 triệu…), đó là biến định lượng → được đưa vào hồi quy, vẽ trên mô hình SEM.
  • Nếu chia nhóm (dưới 10 triệu, 10–20 triệu, trên 20 triệu…), đó là biến định tính  → KHÔNG được đưa vào hồi quy, vẽ trên mô hình SEM.

Do vậy, khi xem tham khảo một bài nghiên cứu nào đó bạn thấy tác giả vẽ biến kiểm soát vào mô hình SEM hay cho vào chạy hồi quy nghĩa là biến kiểm soát đó DỮ LIỆU CỦA NÓ ở dạng định lượng. 

Bạn cũng có biến kiểm soát cùng tên như vậy, nhưng khi lập bảng khảo sát bạn chia nó thành các nhóm đáp án (nhóm tuổi, nhóm thu nhập...) thì DỮ LIỆU CỦA NÓ đang ở dạng định tính, không thể đưa vào hồi quy, SEM giống bài mẫu.

Lưu ý 3: Chuyển đổi biến định tính về biến định lượng.

Chúng ta đã nói đến việc một biến có hai giá trị thì biến đó sẽ vừa là định tính vừa là định lượng. Cơ chế chuyển đổi biến định tính sang biến định lượng cũng dựa vào điều này. 

Hướng chuyển đổi 1: Bạn mã hóa lại biến định tính từ nhiều nhóm đáp án chỉ còn 2 đáp án.

Lấy ví dụ với biến Tuổi, bạn đang chia làm 3 nhóm đáp án: dưới 20 tuổi, từ 20-30, trên 30 tuổi. Lúc này biến Tuổi là biến kiểm soát định tính, không thể biểu diễn nó lên mô hình SEM và hồi quy. 

Nhưng giáo viên hướng dẫn yêu cầu bạn phải chạy biến kiểm soát chung với mô hình SEM. Bạn sẽ recode (mã hóa lại) biến Tuổi về dạng chỉ còn 2 đáp án là từ 30 tuổi trở xuống và trên 30 tuổi (gộp hai nhóm dưới 30 tuổi và từ 20-30 ban đầu lại với nhau). Sau đó, gán nhóm dưới 30 tuổi giá trị 0 và nhóm trên 30 tuổi giá trị 1, biến Tuổi lúc này đã trở thành biến định lượng.

Hướng chuyển đổi 2: Bạn mã hóa lại biến định tính từ nhiều nhóm đáp án chỉ còn 2 đáp án.

Kỹ thuật chuyển đổi thứ hai tạo biến giả (dummy variable). Hướng đi này sẽ vẫn giữ nguyên số lượng đáp án của biến gốc nhưng biến đổi nó thành nhiều biến giả cho từng đáp án của biến gốc.

Lấy ví dụ với biến Tuổi đã đề cập ở phần trước. Số biến giả sẽ bằng số đáp án của biến gốc trừ đi 1. Biến Tuổi có 3 đáp án dưới 20 tuổi, từ 20-30, trên 30 tuổi nên sẽ có 2 biến giả.

Chọn nhóm dưới 20 tuổi làm nhóm tham chiếu, hai nhóm còn lại sẽ là biến giả: 

  • Biến giả 1 (Tuoi_20_30): gán giá trị 1 nếu thuộc nhóm 20–30, giá trị 0 nếu không phải.
  • Biến giả 2 (Tuoi_tren30):  gán giá trị 1 nếu thhộc nhóm trên 30, giá trị 0 nếu không phải.

Chi tiết về cách triển khai bạn có thể tìm hiểu tại bài viết Hồi quy với biến giả dummy trên SPSS.

Quy trình tiến hành, bạn sẽ cần mã hóa biến kiểm soát định tính về các biến giả trước. Sau đó mới dùng các biến giả để đưa vào hồi quy, SEM.

4. Biểu diễn biến kiểm soát lên mô hình SEM, Hồi quy

Khi đảm bảo các biến kiểm soát là dạng định lượng rồi, bạn sẽ đưa vào Hồi quy, SEM như sau.

Với mô hình SEM (ví dụ SMARTPLS):

biến kiểm soát trong SEM

Ở mô hình trên, biến Service Type là biến kiểm soát dạng định lượng (2 đáp án 0-1). Tác giả muốn đánh giá sự kiểm soát của biến này lên biến phụ thuộc CUSL. Khi vẽ mô hình SEM, chúng ta sẽ vẽ mũi tên từ biến tiềm ẩn Service Type hướng về phía biến CUSL.

Với mô hình hồi quy (ví dụ SPSS):

biến kiểm soát trong hồi quy

Ở mô hình trên, biến Giới tính là biến kiểm soát dạng định lượng (2 đáp án 0-1). Tác giả muốn đánh giá sự kiểm soát của biến này lên biến phụ thuộc HL. Khi chạy phân tích hồi quy, chúng ta sẽ đưa biến Giới tính này vào chung với các biến độc lập khác như LD, DN, CV.

Đăng nhận xét