Độ lệch chuẩn (Standard Deviation) hay độ lệch tiêu chuẩn là một chỉ số dùng để đo mức độ phân tán của một tập dữ liệu quanh giá trị trung bình (Mean). Trong các phần mềm thống kê, độ lệch chuẩn thường được ký hiệu là hoặc S.D hoặc Std. Deviation.
1. Độ lệch chuẩn (Standard Deviation) là gì?
1.1 Khái niệm độ lệch chuẩn
Độ lệch chuẩn (Standard Deviation) là một chỉ số thống kê dùng để đo mức độ phân tán hoặc biến động của dữ liệu quanh giá trị trung bình (mean). Khi bạn nhìn vào một bộ dữ liệu, độ lệch chuẩn cho biết các điểm dữ liệu đó “lan rộng” hay “tập trung” xung quanh trung bình như thế nào.
Trong các phần mềm thống kê như SPSS, AMOS, SMARTPLS, độ lệch chuẩn thường xuất hiện ở bảng Descriptive Statistics cùng với các chỉ số như trung bình (mean), min–max, … để giúp người dùng nhận biết đặc điểm phân phối dữ liệu.
Cách tính độ lệch chuẩn: Độ lệch chuẩn là căn bậc hai của phương sai, tức là trung bình của bình phương độ lệch giữa từng giá trị và trung bình.
Điểm trọng tâm cần nắm:
Độ lệch chuẩn càng lớn → dữ liệu phân tán càng rộng.
Độ lệch chuẩn càng nhỏ → dữ liệu càng tập trung quanh trung bình.
Ví dụ: Giả sử bạn thu thập điểm thi toán của 100 sinh viên. Nếu đa số điểm tập trung quanh 7–8 và chỉ một vài điểm thấp hoặc cao → độ lệch chuẩn sẽ nhỏ. Nếu điểm thi phân bố rất khác nhau (từ 3 đến 10 đều có) → độ lệch chuẩn sẽ cao.
Xem thêm: Cách xử lý số liệu SPSS toàn tập mới nhất
1.2 Tại sao độ lệch chuẩn lại quan trọng?
Độ lệch chuẩn là chỉ số được sử dụng rộng rãi trong thống kê, kinh doanh và nghiên cứu bởi vì nó:
- Thể hiện biến động dữ liệu: cho biết dữ liệu có ổn định hay không.
- Dễ hiểu: vì nó cùng đơn vị với dữ liệu gốc, nên dễ diễn giải hơn phương sai.
- Hỗ trợ đánh giá phân phối: ví dụ trong chuẩn phân phối chuẩn (normal distribution), độ lệch chuẩn dự đoán các tỷ lệ dữ liệu nằm trong ±1 SD, ±2 SD,…
- Ứng dụng trong kiểm định học thuật: nhiều chỉ số mô tả mức độ tin cậy, kiểm định giả thuyết đều dựa vào mức biến động của dữ liệu.
3. Độ lệch chuẩn bao nhiêu là tốt?
Câu trả lời là: Không có ngưỡng cố định nào nói rõ độ lệch chuẩn là “tốt/xấu” "đạt/vi phạm".
Điều này bởi vì:
- Độ lệch chuẩn phụ thuộc hoàn toàn vào đặc thù của dữ liệu và mục tiêu phân tích.
- Không thể so sánh độ lệch chuẩn giữa các bộ dữ liệu khác nhau (ví dụ giữa điểm thi toán với thời gian giao hàng) vì đơn vị khác nhau.
- Cùng một độ lệch chuẩn, dữ liệu có thể chấp nhận ở nghiên cứu này nhưng bị coi là “biến động quá lớn” ở nghiên cứu khác tùy mục đích.
Độ lệch chuẩn không đánh giá tốt/xấu, mà chỉ phản ánh độ biến động của dữ liệu. Còn đánh giá là tốt hay xấu phụ thuộc vào sự kỳ vọng của người nghiên cứu là chủ yếu. Lấy ví dụ một câu hỏi đo theo Likert 5 mức độ đồng ý.
- Với câu hỏi đó, bạn mong các câu trả lời có sự ổn định và tập trung, chẳng hạn đa số đáp viên chọn mức 3, 4 hoặc 5 (nghiêng về đồng ý), thay vì phân tán đều từ 1 đến 5. Nếu cùng một nhóm đối tượng có đặc điểm nhân khẩu học tương đồng nhưng người thì cho điểm rất cao (nhiều 4,5), người lại cho điểm rất thấp (nhiều 1,2), thì câu trả lời bị phân tán mạnh. Khi đó, độ lệch chuẩn sẽ cao. Trong bối cảnh bạn kỳ vọng sự đồng nhất, độ lệch chuẩn cao là điều không mong muốn vì nó cho thấy mức độ trả lời thiếu ổn định so với giả thuyết hoặc nền tảng lý thuyết ban đầu.
- Ngược lại, cũng với câu hỏi đó, nếu mục tiêu của bạn là so sánh sự khác biệt giữa các nhóm nhân khẩu học (ví dụ nam – nữ, trẻ – lớn tuổi), thì bạn kỳ vọng các nhóm sẽ có mức độ trả lời khác nhau rõ rệt. Sự khác biệt này thường dựa trên cơ sở lý thuyết hoặc nghiên cứu định tính trước đó. Tuy nhiên, nếu tất cả đáp viên đều trả lời khá giống nhau, chủ yếu quanh mức 3, 4, 5 và ít có sự chênh lệch, thì dữ liệu trở nên “đều đều”, thiếu biến động. Khi đó, độ lệch chuẩn thấp lại là điều không tốt, vì nó không phản ánh được sự khác biệt mà bạn kỳ vọng tìm thấy giữa các nhóm.
4. Khi nào độ lệch chuẩn được coi là “lớn” hay “nhỏ”?
Mặc dù không có ngưỡng cố định, nhưng có cách để đánh giá tương đối độ biến động thông qua Hệ số biến động (Coefficient of Variation – CV).
Hệ số biến động – CV là tỉ lệ giữa độ lệch chuẩn và giá trị trung bình, được tính bằng:
CV = (S.D/Mean)*100%.
Trong đó:
- CV (Coefficient of Variation): Hệ số biến động
- S.D: Độ lệch chuẩn
- Mean: Giá trị trung bình
Không có ngưỡng đánh giá CV thống nhất do giá trị này phụ thuộc nhiều vào đặc thù của từng lĩnh vực và mục tiêu nghiên cứu cụ thể. Trong ấn phẩm Classification of the coefficients of variation of parameters evaluated in Japanese quail experiments (2014), tác giả Braz. J. Poult có đề cập tới đề xuất phân loại CV của Gomes (2000) trong nghiên cứu về chim cút Nhật Bản:
- CV < 10%: thấp
- 10% ≤ CV < 20%: trung bình
- 20% ≤ CV < 30%: cao
- CV ≥ 30%: rất cao
Ví dụ: Môn Toán của 50 học sinh có điểm trung bình là 7.65 và độ lệch chuẩn là 1.112. Áp dụng công thức tính CV chúng ta có giá trị CV = 1.112/6.65 * 100% = 16.7%.
Xem thêm: Giáo trình xử lý SPSS có dữ liệu thực hành
5. Độ lệch chuẩn trong thang đo Likert 1–5
Trong các nghiên cứu sử dụng thang đo Likert 1–5, bên cạnh giá trị trung bình (Mean), độ lệch chuẩn (Standard Deviation – SD) là chỉ số quan trọng giúp đánh giá mức độ phân tán của câu trả lời. Nếu Mean cho biết xu hướng chung của người trả lời (nghiêng về đồng ý hay không đồng ý), thì SD cho biết mức độ đồng thuận hay khác biệt giữa các ý kiến.
Với thang đo Likert 1–5 (1 = Hoàn toàn không đồng ý, 5 = Hoàn toàn đồng ý), độ lệch chuẩn sẽ dao động trong một khoảng giới hạn nhất định vì dữ liệu chỉ nằm từ 1 đến 5. Khi các câu trả lời tập trung quanh một mức điểm (ví dụ phần lớn chọn 4), SD sẽ nhỏ. Ngược lại, nếu câu trả lời trải rộng từ 1 đến 5, SD sẽ lớn hơn.
Ví dụ: Khảo sát 150 người về phát biểu “Tôi hài lòng với dịch vụ”.
- Trường hợp 1: Mean = 4.2, SD = 0.55
Điều này cho thấy đa số người trả lời nghiêng về mức “Đồng ý” hoặc “Hoàn toàn đồng ý”, và mức độ đồng thuận cao vì độ lệch chuẩn thấp. - Trường hợp 2: Mean = 3.8, SD = 1.20
Dù trung bình vẫn ở mức khá cao, nhưng SD lớn cho thấy tồn tại sự khác biệt đáng kể giữa các nhóm người trả lời (có thể có người rất hài lòng, có người không hài lòng).
Trong thực tế nghiên cứu xã hội học và quản trị, SD của thang Likert 1–5 thường nằm trong khoảng từ 0.5 đến 1.2. Không có ngưỡng cứng nào quy định SD bao nhiêu là “tốt” hay “xấu”. Tuy nhiên có thể hiểu tương đối như sau:
- SD < 0.6: Mức độ đồng thuận cao, câu trả lời tập trung.
- 0.6 ≤ SD ≤ 1.0: Mức phân tán trung bình, phổ biến trong nghiên cứu.
- SD > 1.0: Mức phân tán lớn, cho thấy ý kiến còn khác biệt đáng kể.
Cần lưu ý rằng SD lớn không đồng nghĩa với dữ liệu “xấu”. Trong nhiều nghiên cứu khám phá, sự phân tán cao có thể phản ánh sự tồn tại của các nhóm quan điểm khác nhau trong mẫu khảo sát, đây lại là thông tin có giá trị.
Khi báo cáo kết quả trong luận văn hoặc bài báo khoa học, nên trình bày Mean và SD song song, ví dụ: “Biến HL1 có giá trị trung bình 4.12 và độ lệch chuẩn 0.63, cho thấy người trả lời có xu hướng đồng ý và mức độ đồng thuận tương đối cao.”
Tóm lại, trong thang đo Likert 1–5, độ lệch chuẩn giúp đánh giá mức độ thống nhất trong nhận thức của người tham gia khảo sát. Việc diễn giải cần đặt trong bối cảnh nghiên cứu cụ thể, không nên đánh giá SD theo hướng tốt – xấu một cách máy móc.
-----
Nguồn tham khảo:
Braz. J. Poult, Classification of the coefficients of variation of parameters evaluated in Japanese quail experiments, 2014, Brazilian Journal of Poultry Science.

