Cách viết phương trình hồi quy tuyến tính trong SPSS

Trong phân tích định lượng, hồi quy tuyến tính là một trong những kỹ thuật quan trọng nhất để xác định mức độ tác động của các biến độc lập lên biến phụ thuộc. Tuy nhiên, nhiều người sau khi chạy SPSS lại lúng túng trong việc viết phương trình hồi quy sao cho đúng chuẩn học thuật. Bài viết này sẽ hướng dẫn chi tiết cách viết phương trình hồi quy tuyến tính trong SPSS, bao gồm cách lấy hệ số, cách trình bày và cách diễn giải.

1. Lý thuyết tuyến tính

Trong nghiên cứu, chúng ta thường phải kiểm định các giả thuyết về mối quan hệ giữa hai hay nhiều biến, trong đó có một biến phụ thuộc và một hay nhiều biến độc lập. Nếu chỉ có một biến độc lập, mô hình được gọi là mô hình hồi quy đơn biến SLR (Simple Linear Regression). Trường hợp có từ hai biến độc lập trở lên, mô hình được gọi là hồi quy bội MLR (Multiple Linear Regression). Những nội dung tiếp theo ở bài viết này chỉ đề cập đến hồi quy bội, hồi quy đơn biến tính chất tương tự với hồi quy bội

- Phương trình hồi quy đơn biến: Y = β₀ + β₁X + e

- Phương trình hồi quy bội: Y = β₀ + β₁X₁ + β₂X₂ + … + β_nX_n + e

Trong đó:

Y: biến phụ thuộc, là biến chịu tác động của biến khác.
X, X₁, X₂, X_n: biến độc lập, là biến tác động lên biến khác.
β₀: hằng số hồi quy, hay còn được gọi là hệ số chặn. Đây là chỉ số nói lên giá trị của Y sẽ là bao nhiêu nếu tất cả X cùng bằng 0. Nói cách khác, chỉ số này cho chúng ta biết giá trị của Y là bao nhiêu nếu không có các X. Khi biểu diễn trên đồ thị Oxy, β₀ là điểm trên trục Oy mà đường hồi quy cắt qua.
β₁, β_2,β_n: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho chúng ta biết về mức thay đổi của Y gây ra bởi X tương ứng. Nói cách khác, chỉ số này nói lên có bao nhiêu đơn vị Y sẽ thay đổi nếu X tăng hoặc giảm một đơn vị.
e: sai số. Chỉ số này càng lớn càng khiến cho khả năng dự đoán của hồi quy trở nên kém chính xác hơn hoặc sai lệch nhiều hơn so với thực tế. Sai số trong hồi quy tổng thể hay phần dư trong hồi quy mẫu đại diện cho hai giá trị, một là các biến độc lập ngoài mô hình, hai là các sai số ngẫu nhiên.

Trong thống kê, vấn đề chúng ta muốn đánh giá là các thông tin của tổng thể. Tuy nhiên vì tổng thể quá lớn, chúng ta không thể có được các thông tin này. Vì vậy, chúng ta dùng thông tin của mẫu nghiên cứu để ước lượng hoặc kiểm định thông tin của tổng thể. Với hồi quy tuyến tính cũng như vậy, các hệ số hồi quy tổng thể như β₁, β₂ … hay hằng số hồi quy β₀ là những tham số chúng ta muốn biết nhưng không thể đo lường được. Do đó, chúng ta sẽ sử dụng tham số tương ứng từ mẫu để ước lượng và từ đó suy diễn ra tổng thể. Phương trình hồi quy trên mẫu nghiên cứu:

Y = B₀ + B₁X₁ + B₂X₂ + … + B_nX_n + ε

Trong đó:

Y: biến phụ thuộc
X, X₁, X₂, X_n: biến độc lập
B₀: hằng số hồi quy
B₁, B_2,B_n: hệ số hồi quy
ε: phần dư

Tất cả các nội dung hồi quy tiếp sau đây chỉ nói về hồi quy trên tập dữ liệu mẫu. Do vậy, thuật ngữ sai số sẽ không được đề cập mà chỉ nói về phần dư.

2. Hệ số hồi quy chuẩn hóa và chưa chuẩn hóa

Trong kết quả hồi quy tuyến tính của SPSS, bảng Coefficients cung cấp hai loại hệ số quan trọng: hệ số chưa chuẩn hóa (B) và hệ số chuẩn hóa (Beta). Cả hai đều phản ánh mức độ tác động của biến độc lập lên biến phụ thuộc nhưng phục vụ mục đích khác nhau.

Hệ số chưa chuẩn hóa (B) giữ nguyên đơn vị đo ban đầu và được dùng để viết phương trình hồi quy chính thức. Khi một biến độc lập tăng 1 đơn vị thì biến phụ thuộc thay đổi một lượng bằng hệ số B tương ứng, trong điều kiện các biến khác không đổi. Vì vậy, B được sử dụng để dự báo và giải thích ý nghĩa thực tiễn của mô hình.
Hệ số chuẩn hóa (Beta) được tính sau khi các biến đã được đưa về cùng một thang đo chuẩn. Beta không còn đơn vị đo và được dùng để so sánh mức độ ảnh hưởng tương đối giữa các biến độc lập. Biến nào có giá trị tuyệt đối của Beta lớn hơn thì có tác động mạnh hơn trong mô hình.

3. Cách viết phương trình hồi quy tuyến tính trong SPSS

3.1 Viết phương trình hồi quy theo B hay Beta?

Khi viết phương trình hồi quy, về mặt thống kê chuẩn thì phải dùng hệ số chưa chuẩn hóa (B). Vì đây là dạng mô hình gốc của hồi quy tuyến tính, giữ nguyên đơn vị đo của các biến và có thể dùng để dự báo giá trị thực tế của biến phụ thuộc. Đồng thời, cách viết này cũng có ý nghĩa thực tiễn và kinh tế rõ ràng khi diễn giải kết quả.

Tuy nhiên, trong nhiều luận văn, nhiều người nghiên cứu lại viết phương trình hồi quy chuẩn hóa. Lý do chủ yếu là do thói quen trình bày trong quá trình học và vì trong SPSS, hệ số Beta (chuẩn hóa) rất tiện để so sánh mức độ ảnh hưởng giữa các biến độc lập. Thấy Beta lớn – nhỏ rõ ràng nên nhiều người nhầm tưởng đó là hệ số “chính” của mô hình.

Về học thuật, phương trình hồi quy đúng chuẩn phải dựa trên hệ số B (chưa chuẩn hóa) và thể hiện đầy đủ mô hình có sai số ε. Còn phương trình chuẩn hóa chỉ dùng để so sánh mức độ tác động tương đối giữa các biến, không phải dạng phương trình mặc định trong lý thuyết hồi quy.

3.2 Thực hành viết phương trình hồi quy trong SPSS

Thực hành phân tích hồi quy tuyến tính trên SPSS ví dụ với một tập dữ liệu gồm các biến tham gia như sau:

- Biến độc lập: GC, CSVC, SP, PV, KM

- Biến phụ thuộc: HL

Kết quả hồi quy sẽ có bảng Coefficients như bên dưới, đây là bảng cho chúng ta các biến và tham số để viết phương trình hồi quy.

Như đã đề cập về cấu trúc của phương trình hồi quy ở phần 1, phương trình hồi quy sẽ gồm: biến phụ thuộc, biến độc lập, hằng số, hệ số hồi quy và phần dư. Trong bảng Coefficients phía trên:

Biến phụ thuộc: HL
Biến độc lập: GC, CSVC, SP, PV, KM
Hằng số: Giá trị Constant trong cột hệ số hồi quy B
Hệ số hồi quy: Cột B và Beta. SPSS cung cấp hai loại hệ số hồi quy là chưa chuẩn hóa (B) và đã chuẩn hóa (Beta).

Một số lưu ý quan trọng khi viết phương tình hồi quy:

Nếu một biến độc lập không có ý nghĩa thống kê trong kết quả hồi quy, chúng ta sẽ kết luận biến độc lập đó không có sự tác động lên biến phụ thuộc mà không cần thực hiện loại biến và phân tích lại hồi quy lần hai. Khi viết phương trình hồi quy, chúng ta sẽ không đưa biến độc lập không có ý nghĩa thống kê vào phương trình.
Nếu biến độc lập có hệ số hồi quy âm, chúng ta sẽ mang cả dấu trừ (-) trước hệ số hồi quy vào phương trình.
Luôn có phần dư ε cuối phương trình hồi quy dù là phương trình chuẩn hóa hay chưa chuẩn hóa.
Phương trình hồi quy chuẩn hóa sẽ không có hằng số do đã bị triệt tiêu khi chuẩn hóa hệ số hồi quy.

Tiến hành viết phương trình hồi quy dựa vào bảng Coefficients bên dưới:

Phân tích các điểm lưu ý:

- Biến CSVC có giá trị sig kiểm định t bằng 0.655 > 0.05, biến này không có ý nghĩa trong mô hình hồi quy, do đó chúng ta không đưa biến này vào phương trình.

- Biến GC có hệ số hồi quy mang dấu âm, biến này tác động nghịch chiều lên biến phụ thuộc HL. Khi viết phương trình, chúng ta sẽ mang cả dấu âm này vào.

Tiến hành viết phương trình:

Chưa chuẩn hóa: HL = 1.531 - 0.278*GC + 0.253*SP + 0.110*PV + 0.397*KM + ε

Chuẩn hóa: HL = -0.336*GC + 0.281*SP + 0.126*PV + 0.425*KM + ε

Tham khảo:

⭕ Dịch vụ SPSS | Xử Lý SPSS Từ A-Z

⭕ Dịch vụ AMOS | Xử Lý AMOS Từ A-Z

⭕ Dịch vụ SMARTPLS | Xử Lý SMARTPLS Từ A-Z

Phạm Lộc Blog

Cách viết phương trình hồi quy tuyến tính trong SPSS

1. Lý thuyết tuyến tính

2. Hệ số hồi quy chuẩn hóa và chưa chuẩn hóa

3. Cách viết phương trình hồi quy tuyến tính trong SPSS

3.1 Viết phương trình hồi quy theo B hay Beta?

3.2 Thực hành viết phương trình hồi quy trong SPSS

Đăng nhận xét

Cách tải SPSS 27 miễn phí và hướng dẫn cài đặt chi tiết

Link download SPSS 20, SPSS 21, SPSS 22, SPSS 26, SPSS 27 Full

Phân tích độ tin cậy Cronbach's Alpha trong SPSS

Sinh viên ơi! Hãy cẩn thận với những công ty đa cấp lừa đảo!

Cách sử dụng SPSS trong nghiên cứu khoa học từ A-Z

Phạm Lộc Blog