Một số câu hỏi phản biện về SPSS trước hội đồng


Đa phần các luận văn, bài nghiên cứu hiện nay sau khi hoàn thành đều sẽ trải qua bước phản biện từ hội đồng đánh giá. Phản biện tốt sẽ giúp bài luận đạt được số điểm cao hơn khá nhiều. Do đó, trước buổi bảo vệ luận văn, chúng ta cần có sự chuẩn bị kỹ lưỡng về kiến thức nội dung bài luận lẫn kiến thức về sử dụng phần mềm. Việc chuẩn bị sẵn các câu hỏi phản biện, câu hỏi bào vệ luận văn là một khâu rất quan trọng.

Một số câu hỏi phản biện về SPSS trước hội đồng

Luận văn có sử dụng phân tích định lượng bằng SPSS sẽ gồm hai phần kiến thức được các thầy, cô yêu cầu bạn trả lời khi bảo vệ. Với phần kiến thức về nội dung bài bạn sẽ cần xem lại các điểm nội dung quan trọng của bài luận. Với kiến thức phần định lượng và phân tích SPSS, chúng ta sẽ cần nắm được các chỉ số quan trọng và ý nghĩa của chỉ số đó khi đánh giá kết quả kiểm định. Dưới đây là một số câu hỏi tiêu biểu liên quan đến SPSS mà hội đồng thường hỏi:

#1: Tại sao lại lấy hệ số Beta (hệ số hồi quy chuẩn hóa) để kết luận mức độ tác động của các biến độc lập lên phụ thuộc?

Trả lời: 
Trong hồi quy, thường chúng ta sẽ có hai hệ số hồi quy: chưa chuẩn hóa (trong SPSS gọi là B) và đã chuẩn hóa (trong SPSS gọi là Beta). Mỗi hệ số hồi quy này có vai trò khác nhau trong việc diễn giải hàm ý quản trị của mô hình hồi quy. 

Hệ số hồi quy (trọng số hồi quy) chưa chuẩn hóa phản ánh sự thay đổi của biến phụ thuộc khi một đơn vị biến độc lập Xi thay đổi và các biến độc lập còn lại được giữ nguyên. Chúng ta không nhận xét thứ tự tác động của các biến độc lập lên biến phụ thuộc dựa vào hệ số hồi quy chưa chuẩn hóa bởi các biến độc lập không đồng nhất về đơn vị hoặc nếu đồng nhất về đơn vị thì độ lệch chuẩn các biến tham gia vào hồi quy cũng khác nhau. Sự khác biệt về độ lệch chuẩn hoặc đơn vị đo khiến việc đưa các biến độc lập vào cùng một phép so sánh là hoàn toàn không chính xác, do lúc này các biến không cùng nằm trong một hệ quy chiếu. 

Hệ số hồi quy chuẩn hóa Beta đã thực hiện chuyển đổi để đưa tất cả các biến về cùng một hệ quy chiếu, lúc này các biến sẽ cùng đơn vị và được đưa về chung một hệ quy chiếu, do vậy mà chúng ta có thể so sánh sự lớn/nhỏ của hệ số hồi quy với nhau.


#2: Ý nghĩa R bình phương và R bình phương hiệu chỉnh là gì?

Trả lời: 
Một thước đo sự phù hợp của mô hình hồi quy tuyến tính thường dùng là hệ số xác định R bình phương (R2, R square). Khi phần lớn các điểm dữ liệu tập trung sát vào đường hồi quy, giá trị R2 sẽ cao, ngược lại, nếu các điểm dữ liệu phân bố rải rác cách xa đường hồi quy, R2 sẽ thấp.

Trong SPSS, bên cạnh chỉ số R2, chúng ta còn có thêm chỉ số R2 Adjusted (R2 hiệu chỉnh). Chỉ số R2 hiệu chỉnh không nhất thiết tăng lên khi nhiều biến độc lập được thêm vào hồi quy, do đó R2 hiệu chỉnh phản ánh độ phù hợp của mô hình chính xác hơn hệ số R2

R2 hay R2 hiệu chỉnh đều có mức dao động trong đoạn từ 0 đến 1. Nếu R2 càng tiến về 1, các biến độc lập giải thích càng nhiều cho biến phụ thuộc, và ngược lại, R2 càng tiến về 0, các biến độc lập giải thích càng ít cho biến phụ thuộc. 


#3: Hệ số tải Factor Loading trong EFA có ý nghĩa gì?

Trả lời: 
Hệ số tải (hay còn gọi là trọng số nhân tố) có thể hiểu là mối tương quan giữa biến quan sát với nhân tố. Trị tuyệt đối hệ số tải của biến quan sát càng cao, nghĩa là tương quan giữa biến quan sát đó với nhân tố càng lớn và ngược lại. 

Trường hợp trong cùng một nhân tố, có sự xuất hiện của hệ số tải âm, nghĩa là biến quan sát đó tải ngược chiều so với phần lớn các biến quan sát còn lại trong nhân tố, biến quan sát này tương quan âm với các biến quan sát có hệ số tải dương trong nhân tố.


#4: Hiện tượng cộng tuyến, đa cộng tuyến là gì, ảnh hưởng của nó lên kết quả hồi quy thế nào?

Trả lời: 
Đa cộng tuyến (multicollinearity) là hiện tượng các biến độc lập tham gia vào hồi quy có sự tương quan mạnh với nhau. Nếu hai biến độc lập tương quan mạnh với nhau, nó được gọi là hiện tượng cộng tuyến (collinearity); nếu hiện tượng cộng tuyến xảy ra giữa ba biến trở lên, nó được gọi là đa cộng tuyến. 

Theo Hair và cộng sự (2014), nếu xảy ra hiện tượng cộng tuyến hoặc đa cộng tuyến, các kết quả ước lượng liên quan đến biến độc lập sẽ bị sai lệch: biến có ý nghĩa trở thành không có ý nghĩa, biến tác động mạnh lại trở thành biến tác động yếu,… 


#5: Hệ số Durbin-Watson trong hồi quy có ý nghĩa gì?

Trả lời: 
Trị số Durbin–Watson (DW) là một đại lượng thống kê dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau). 

DW có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần dư không có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ dao động ở mức 2, nếu giá trị càng nhỏ, gần về 0 thì phần dư có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là phần dư có tương quan nghịch. 

Andy Field (2009) cho rằng, nếu DW nhỏ hơn 1 và lớn hơn 3, chúng ta cần thực sự lưu ý bởi khả năng rất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất. Yahua Qiao (2011) cho rằng, thường giá trị DW nằm trong khoảng 1.5 – 2.5 sẽ không xảy ra hiện tượng tự tương quan chuỗi bậc nhất.


#6: Kiểm định F trong bảng ANOVA ở hồi quy có ý nghĩa gì?

Trả lời: 
Chúng ta cần đánh giá độ phù hợp mô hình một cách chính xác qua kiểm định giả thuyết. Để kiểm định độ phù hợp mô hình hồi quy, chúng ta đặt giả thuyết H0: R2 = 0. Phép kiểm định F được sử dụng để kiểm định giả thuyết này. Kết quả kiểm định:

• Sig < 0.05: Bác bỏ giả thuyết H0, nghĩa là R2 ≠ 0 một cách có ý nghĩa thống kê, mô hình hồi quy là phù hợp.
• Sig > 0.05: Chấp nhận giả thuyết H0, nghĩa là R2 = 0 một cách có ý nghĩa thống kê, mô hình hồi quy không phù hợp.

Trong SPSS, các số liệu của kiểm định F được lấy từ bảng phân tích phương sai ANOVA.


#7: Mẫu nghiên cứu của đề tài lấy trên cơ sở nào?

Trả lời: 
Kích thước mẫu (cỡ mẫu) của nghiên cứu càng lớn, sai số trong các ước lượng sẽ càng thấp, khả năng đại diện cho tổng thể càng cao. Tuy nhiên, việc thu thập cỡ mẫu lớn sẽ làm tiêu tốn nhiều thời gian, công sức, tiền bạc ở toàn bộ các khâu từ thu thập, kiểm tra, phân tích. Do đó việc chọn kích thước mẫu cần phải được xem xét một cách có cân nhắc để mọi thứ được cân bằng và hiệu quả. Sự lựa chọn cỡ mẫu sẽ phụ thuộc vào:

• Độ tin cậy cần có của dữ liệu. Nghĩa là mức độ chắc chắn rằng các đặc điểm của cỡ mẫu được chọn phải khái quát được cho đặc điểm tổng thể.
• Sai số mà nghiên cứu có thể chấp nhận được. Đó là độ chính xác chúng ta yêu cầu cho bất ký ước lượng được thực hiện trên mẫu.
• Các loại kiểm định, phân tích sẽ thực hiện. Một số kỹ thuật thống kê yêu cầu cỡ mẫu phải đạt một ngưỡng nhất định thì các ước lượng mới có ý nghĩa.
• Kích thước của tổng thể. Mẫu nghiên cứu sẽ cần chiếm một tỷ lệ nhất định so với kích thước của tổng thể.

Việc xác định cỡ mẫu theo ước lượng tổng thể thường yêu cầu cỡ mẫu lớn. Tuy nhiên, nhà nghiên cứu lại có quỹ thời gian giới hạn và nếu không có nguồn tài chính tài trợ thì khả năng lấy mẫu theo ước lượng tổng thể sẽ khó có thể thực hiện. Do đó, các nhà nghiên cứu thường sử dụng công thức lấy mẫu dựa vào phương pháp định lượng được sử dụng để phân tích dữ liệu. Hai phương pháp yêu cầu cỡ mẫu lớn thường là hồi quy và phân tích nhân tố khám phá (EFA).

Nếu một bài nghiên cứu sử dụng kết hợp nhiều phương pháp xử lý thì sẽ lấy kích thước mẫu cần thiết lớn nhất trong các phương pháp. Ví dụ, nếu bài nghiên cứu vừa sử dụng phân tích EFA và vừa phân tích hồi quy. Kích thước mẫu cần thiết của EFA là 200, kích thước mẫu cần thiết của hồi quy là 100, chúng ta sẽ chọn kích thước mẫu cần thiết của nghiên cứu là 200 hoặc từ 200 trở lên. Thường chúng ta sử dụng phân tích EFA cùng với phân tích hồi quy trong cùng một bài luận văn, một bài nghiên cứu. EFA luôn đòi hỏi cỡ mẫu lớn hơn rất nhiều so với hồi quy, chính vì vậy chúng ta có thể sử dụng công thức tính kích thước mẫu tối thiểu cho EFA làm công thức tính kích thước mẫu cho nghiên cứu.


#8: Ý nghĩa của kiểm định độ tin cậy thang đo Cronbach's Alpha?

Trả lời: 
Trước tiên, chúng ta cần hiểu được khái niệm tính nhất quán nội bộ của một yếu tố. Tính nhất quán nội bộ nghĩa là các biến quan sát trong một thang đo phải có sự tương quan chặt chẽ nhau, cùng giải thích cho một khái niệm. Cronbach' Alpha là một chỉ số đo lường tính nhất quán nội bộ này. Như vậy, nếu một thang đo mà các biến quan sát có sự tương quan càng chặt chẽ, thang đo đó càng có tính nhất quán cao, hệ số Cronbach’s Alpha sẽ càng cao. 

Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn [0,1]. Mức 0 nghĩa là các biến quan sát trong nhóm gần như không có một sự tương quan nào, mức 1 nghĩa là các biến quan sát tương quan hoàn hảo với nhau, hai mức 0 và 1 hiếm khi xảy ra trong phân tích dữ liệu. Một số trường hợp xuất hiện hệ số Cronbach’s Alpha âm vượt ngoài đoạn giới hạn [0,1], lúc này thang đo hoàn toàn không có độ tin cậy, không có tính đơn hướng, các biến quan sát trong thang đo đối lập, ngược chiều nhau. 

>> Xem thêm bài viết: Phân tích độ tin cậy Cronbach's Alpha trong SPSS

#9: Ý nghĩa của phân tích nhân tố khám phá EFA?

Trả lời: 
Phân tích nhân tố (Factor Analysis) hay phân tích nhân tố khám phá (Exploratory Factor Analysis) là một kỹ thuật xử lý định lượng với mục đích rút gọn một tập hợp k biến quan sát thành một tập F (với F < k) các nhân tố có ý nghĩa hơn. 

Trong nghiên cứu, chúng ta xây dựng nhiều câu hỏi đo lường, mỗi câu hỏi đại diện cho một biến quan sát. Khi vấn đề nghiên cứu càng đi sâu, lượng câu hỏi và các biến quan sát sẽ tăng lên, dẫn đến việc phân tích vấn đề nghiên cứu qua từng biến quan sát như vậy trở nên vô cùng phức tạp và gặp nhiều khó khăn. Các nhà nghiên cứu nhận ra rằng, không phải toàn bộ các biến quan sát đều mang một ý nghĩa tách biệt hoàn toàn, mà một số biến có cùng tính chất với nhau, tương quan chặt chẽ nhau. Những biến quan sát cùng tính chất như vậy có thể được xếp chung với nhau thành 1 nhân tố, và thay vì đi đo lường một số lượng lớn biến quan sát ban đầu, các nhà nghiên cứu chỉ cần đo lường một số lượng ít hơn các nhân tố mới được hình thành, điều này giúp tiết kiệm thời gian, công sức và kinh phí cho người nghiên cứu.

>> Xem thêm bài viết: Phân tích nhân tố khám phá EFA trong SPSS