Việc dữ liệu bị lỗi trong quá trình chạy spss là điều khó có thể tránh khỏi. Chính vì vậy, trong bài viết này Luận văn 24 sẽ chia sẻ đến bạn các cách sửa dữ liệu spss chuẩn nhất và khắc phục nhanh chóng. Chỉnh sửa dữ liệu spss mà Luận văn 24 muốn đề cập đến bao gồm có: sửa hệ số Cronbach Alpha, cách sửa số liệu EFA, ma trận xoay và giá trị R bình phương hiệu chỉnh.
- 1. Kiểm định hệ số Cronbach Alpha nhỏ hơn 0.6
- 2. Tương quan biến tổng bị thấp hơn 0.3
- 3. EFA lỗi – không hiển thị bảng KMO
- 4. EFA không thỏa mãn các yêu cầu về kiểm định
- 5. Ma trận xoay lộn xộn – nhân tố ban đầu không còn tồn tại
- 6. Giá trị R bình phương hiệu chỉnh thấp
- 7. 3 bí quyết sửa dữ liệu SPSS
- KẾT LUẬN
1. Kiểm định hệ số Cronbach Alpha nhỏ hơn 0.6
Kiểm định hệ số Cronbach Alpha (gọi tắt là CA) là bước đầu tiên trong quá trình thực hiện phân tích định lượng bằng spss. Một nhân tố trong CA sẽ bao gồm rất nhiều biến quan sát nhỏ, phản ánh tính chất của nhân tố mẹ. Khi đó giá trị CA mà nhỏ hơn 0,6 chứng tỏ thang đo này không đạt yêu cầu.
Sau đây là 3 nguyên nhân khiến cho Cronbach Alpha gặp lỗi:
- Do số liệu thu thập không đảm bảo sự trung thực: người tham gia khảo sát trả lời câu hỏi một cách lung tung, bừa bãi, đánh cho có để hoàn thành…
- Do việc thiết kế nội dung câu hỏi chưa được phù hợp.
- Do nội dung của các câu hỏi về một nhân tố không có mối quan hệ chặt chẽ với nhau.
Cách khắc phục sửa dữ liệu spss mắc lỗi Cronbach Alpha nhỏ hơn 0.6:
- Kiểm tra lại các câu hỏi quan sát của các nhân tố con có phản ánh được tính chất của nhân tốt mẹ cần phân tích hay không.
- Những câu hỏi không có nguồn gốc rõ ràng cần phải được loại bỏ ngay lập tức, đồng thời chỉnh sửa lại bảng câu hỏi để có thể tiến hành thực hiện khảo sát lại.
Một số lưu ý khi thực hiện khảo sát thu thập dữ liệu:
- Bảng câu hỏi khảo sát phải được lấy từ nguồn gốc rõ ràng, từ các chuyên gia uy tín trong lĩnh vực.
- Các câu hỏi này cần được giảng viên xem xét và đánh giá, nếu giảng viên chấp nhận thì lỗi này sẽ thuộc về người tham gia khảo sát.
- Do chi phí khảo sát tốn kém nên rất khó để tiến hành khảo sát lại. Chính vì vậy, cần tập trung vào việc loại bỏ những câu hỏi xấu để cải thiện số liệu.
2. Tương quan biến tổng bị thấp hơn 0.3
Tương quan biến tổng phản ánh các số liệu hiện tại đóng góp ít hay nhiều vào thang đo chung. Nếu số liệu nào đóng góp không nhiều có tương quan biến tổng thấp hơn 0.3 thì cần phải loại ngay. Bởi số liệu này có khả năng trở thành “biến rác” nếu đưa vào phân tích spss.
Chỉ có một cách duy nhất để làm chỉnh sửa số liệu spss có trong tương quan biến tổng đó là loại bỏ các biến yếu. Vậy làm như thế nào để biết đâu là biến xấu cần phải xóa?
Ta căn cứ vào những ngưỡng mức được đề xuất bởi những chuyên gia hàng đầu trong ngành là có thể loại bỏ được các biến số quan sát yếu:
- 0.5 by Kim and Stoel (2004) và Francis and White (2002).
- 0.4 by Loiacono et al (2002).
- 0.3 by Nunnally, J.C & Bernstein, I.H (1994).
- 0.3 by Cristobal et al (2007)
Khi chọn ngưỡng mức để loại bỏ biến yếu cần chú ý 2 vấn đề sau:
- Nếu tầm quan sát trên 7 thì nên chọn ngưỡng 0.4 hoặc 0.5 để lựa chọn được biến quan sát tốt nhất.
- Còn nếu thang đo có ít biến quan sát thì mức 0.3 là tốt nhất bởi mức này sẽ giữ lại được nhiều biến quan sát nhất có thể. Do các biến này đều phản ánh được những đặc tính của nhân tố mẹ.
Với đội ngũ chuyên gia có nhiều năm kinh nghiệm trong việc chạy spss chắc chắn Luận văn 24 sẽ là một đơn vị hỗ trợ spss uy tín dành cho bạn. Nếu bạn gặp khó khăn trong quá trình thực hiện chạy spss và không biết cách giải quyết như thế nào thì hãy liên hệ ngay với chúng mình nhé!
3. EFA lỗi – không hiển thị bảng KMO
EFA bị lỗi không hiển thị bảng KMO đồng thời hiển thị dòng chữ “This matrix is not positive definite” là một lỗi tương đối phổ biến khi chạy phân tích spss.
Nguyên nhân: Do dữ liệu có sự chồng chéo giữa các nhân tố độc lập với nhau. Giá trị biến quan sát của các nhân tố độc lập 1 gần bằng với giá trị biến quan sát 2, 3, 4… Sự trùng lặp này sẽ khiến cho tính phân biệt của EFA bị loại bỏ, nguyên nhân gây ra thông báo “This matrix is not positive definite”.
Cách sửa số liệu EFA bị lỗi:
- Tìm và loại bớt những biến có mối tương quan mạnh với nhau.
- Nếu không thể loại bỏ câu hỏi thì chỉ còn cách duy nhất là thay đổi số liệu, làm sao cho số liệu biến quan sát của nhân tố này không giống đến hơn 70% số liệu biến quan sát của nhân tố khác.
- Sử dụng thủ thuật tương quan Pearson để nhận biết lỗi dữ liệu trùng lặp. Nếu kết quả xuất hiện có giá trị sig bé hơn 0.05 và cặp nhân tố nào có hệ số tương quan r lớn hơn 0.6 thì đồng nghĩa với việc giữa 2 biến đó đang có sự trùng lặp dữ liệu.
Quá trình xử lý số liệu spss luôn mất rất nhiều thời gian và nếu không cẩn thận có thể gây ra sai sót. Vì vậy, Luận văn 24 đã tổng hợp toàn bộ kiến thức liên quan đến cách xử lý số liệu spss để bạn có thể dễ dàng vận dụng và tránh được những lỗi sai sót khi tiến hành việc xử lý số liệu spss. Cùng tham khảo ngay nhé!
4. EFA không thỏa mãn các yêu cầu về kiểm định
EFA không thỏa mãn các yêu cầu về kiểm định cũng là một trong những lỗi khá phổ biến khi thực hiện phân tích spss. EFA không thỏa mãn các yêu cầu về thẩm định có nghĩa là tình trạng số nhân tố được trích từ EFA nhiều hơn hoặc ít hơn so với lý thuyết ban đầu, đồng thời kết quả thu được không thỏa mãn các yêu cầu thẩm định như mong muốn.
Nguyên nhân khiến cho EFA gặp lỗi không thỏa mãn các yêu cầu về kiểm định trong quá trình thực hiện phân tích spss:
- Người nghiên cứu: Quá trình nhập dữ liệu lỗi, không tiến hành làm sạch dữ liệu trước khi thực hiện phân tích, lựa chọn phương pháp không phù hợp…
- Bảng câu hỏi khảo sát: Trong quá trình xây dựng bảng câu hỏi khảo sát, người nghiên cứu đặt ra những câu hỏi không logic, rõ ràng dẫn đến trường hợp người trả lời hiểu nhầm câu hỏi và đưa ra câu trả lời không được chính xác.
- Người tham gia khảo sát: Trả lời qua loa, không thực sự chú tâm vào việc trả lời câu hỏi…
Tiến hành thực hiện 2 bước sau đây để sửa lỗi dữ liệu spss – EFA không thỏa mãn các yêu cầu về kiểm định:
Bước 1: Chuẩn bị bảng câu hỏi thật chất lượng. Đáp ứng toàn bộ những yêu cầu dưới đây:
- Xác định đúng đối tượng cũng như mục đích được khảo sát.
- Thiết kế bảng câu hỏi ngắn gọn, xúc tích và dễ hiểu.
- Không nên thêm hoặc bớt câu hỏi dựa vào cảm tính, tất cả đều phải căn cứ vào cơ sở lý luận.
- Nếu có điều kiện thì nên tham khảo các ý kiến của chuyên gia trong lĩnh vực, giảng viên, những người đã có kinh nghiệm…
- Kết hợp giữa câu hỏi “đảo đáp án” và câu hỏi “gài”
Bước 2: Lựa chọn phương pháp lấy mẫu phù hợp nhất, áp dụng các kỹ thuật câu hỏi gài để loại bỏ đi những phiếu khảo sát có chất lượng không tốt, tiến hành làm sạch dữ liệu trước khi thực hiện phân tích spss.
5. Ma trận xoay lộn xộn – nhân tố ban đầu không còn tồn tại
Ma trận xoay lộn xộn tức là khi phân tích các nhân tố khám phá trong ma trận xoay, các biến quan sát nhảy loạn xạ, lung tung từ 5 nhân tố xuất hiện thành 6,7,8… nhân tố, biến quan sát thuộc nhóm này lại được gom chung với nhóm khác, các nhân tố ban đầu gần như không còn tồn tại.
Nguyên nhân của lỗi dữ liệu này là:
- Do các biến quan sát trong một nhóm tương đồng giá trị với biến quan sát của nhóm khác. Điều đó đồng nghĩa với việc, biến quan sát được đưa ra không rõ ràng, trung lập, vừa có một phần thuộc nhân tố độc lập 1 vừa có một phần thuộc nhân tố độc 2.
- Trong trường hợp biến quan sát này được lấy ra từ bảng câu hỏi chuẩn thì lỗi ma trận xoay lộn xộn xuất hiện là do dữ liệu thu thập. Có thể do những người được khảo sát trả lời cho có dẫn đến số liệu gặp nhiều vấn đề trục trặc.
Cách sửa dữ liệu spss mắc lỗi này, chúng ta sẽ thực hiện lần lượt các bước sau:
- Bước 1: Tiến hành chạy thống kê trung bình để kiểm tra lại xem có biến nào có giá trị lỗi không bằng với đáp án trong thang đo hay không hoặc có biến nào xuất hiện dấu hiệu bất thường về min, max, mean hoặc độ lệch chuẩn không.
- Bước 2: Để loại bỏ biến rác, chúng ta thực hiện theo quy tắc loại bỏ biến xấu trong EFA. Tốt nhất nên thử loại bỏ lần lượt từng biến để xem có xuất hiện trường hợp nào khiến ma trận xoay được tốt hơn, những cái nào tốt hơn thì nên thực hiện.
- Bước 3: Nếu quá trình thực hiện có quá nhiều biến bị loại và thang đo không cải thiện nhiều thì nên thực hiện tìm kiếm và loại bỏ các biến quan sát kém bằng cách sử dụng biểu đồ scatter, boxplot…
Việc xử lý giá trị missing trong spss thường gây ra khá nhiều khó khăn cho người thực hiện. Chính vì vậy, việc tìm hiểu kỹ các thông tin liên quan đến xử lý giá trị missing trong spss sẽ giúp bạn dễ dàng xử lý kịp thời những trường hợp không mong muốn xảy ra.
6. Giá trị R bình phương hiệu chỉnh thấp
Giá trị R bình phương hiệu chỉnh là hệ số phản ánh mức độ, giải thích biến phụ thuộc của những biến độc lập. Giá trị R bình phương hiệu chỉnh càng tịnh tiến về 1 chứng tỏ các biến độc lập trong mô hình càng tốt (tốt nhất nằm trong khoảng từ 0.5 đến 1). Còn trong trường hợp, mức trung gian nhỏ hơn 0.5 thì các biến độc lập này không còn phù hợp với quá trình nghiên cứu nữa.
Để sửa lỗi dữ liệu spss làm tăng giá trị bình phương hiệu chỉnh trong spss thì điều cần làm đó là rà soát lại toàn bộ dữ liệu, bảng câu hỏi khảo sát. Từ đó, xác định đâu là “dữ liệu” rác để loại bỏ.
Khi tiến hành sửa lỗi giá trị R bình phương hiệu chỉnh cần chú ý tới 3 vấn đề sau:
- Không có tiêu chuẩn chính xác để giá trị R bình phương hiệu chỉnh ở mức bao nhiêu thì mô hình sẽ đạt tới yêu cầu. Chỉ số này nếu càng tịnh tiến đến 1 chứng tỏ mô hình càng có ý nghĩa, càng tiến tới số 0 thì mô hình có ý nghĩa yếu.
- Có một số ít tình huống, yêu cầu giá trị R2 phải to hơn 0.5 là bị đi ngược so với lý thuyết thống kê.
- Có một số trường hợp ngoại lệ, kết quả hồi quy có giá trị R bình phương hiệu chỉnh nhỏ hơn 0.5 vẫn được chấp nhận.
7. 3 bí quyết sửa dữ liệu SPSS
Bên cạnh những cách chỉnh sửa số liệu spss ở trên, bạn hoàn toàn có thể chủ động phòng ngừa cũng như kiểm tra loại số liệu để cho ra kết quả chính xác, như mong muốn. Dưới đây, Luận văn 24 sẽ chia sẻ đến bạn 3 bí quyết chủ động sửa dữ liệu spss.
7.1. Phòng ngừa chúng
Đây là cách đơn giản nhất để phòng việc xảy ra dữ liệu bị lỗi trong quá trình tiến hành thực hiện spss.
Để chủ động sửa dữ liệu spss theo cách này có nghĩa là đáp ứng toàn bộ những yêu cầu sau:
- Quá trình thiết kế bảng câu hỏi khảo sát phải rành mạch, dễ nhìn, rõ ràng và dễ trả lời.
- Bảng khảo sát nên ngắn gọn nhất có thể để người được khảo sát không bị “lười” khi tham gia trả lời.
- Khi thực hiện phỏng vấn trực tiếp cần phải chuẩn bị thật kỹ càng, cẩn thận để quá trình tiến hành hỏi được dễ hiểu, rõ ràng, không bị đứt quãng.
- Các câu hỏi sau quá trình thu thập cần được kiểm tra kỹ lưỡng một lượt trước khi tiến hành nhập liệu.
- Mã hóa phải được thống nhất các cách thức, quy tắc để tránh xảy ra nhầm lẫn.
7.2. Thống kê tần số để kiểm tra số liệu lỗi
Thống kê tần số để kiểm tra số liệu lỗi là việc lập lần lượt từng bảng tần số một cho từng biến để kiểm tra những giá trị bất thường, các lỗi có dạng “.” hoặc “0” hoặc nằm ngoài vùng giá trị…
Sau khi lập được bảng tần số và xác định được các giá trị bất thường thì sẽ thực hiện việc tìm chính xác vị trí của các lỗi này bằng lệnh Find trong Data View.
Quá trình sửa dữ liệu spss bao gồm 3 bước chi tiết dưới đây:
- Bước 1: Bôi đen cột có chứa giá trị lỗi.
- Bước 2: Trên thanh công cụ, chọn mục Edit – Find.
- Bước 3: Nhập giá trị lỗi vào Find What sau đó bấm tìm và con trỏ sẽ xác định được giá trị bị lỗi nằm ở đâu.
7.3. Dùng bảng phối hợp các biến để kiểm tra số liệu lỗi
Dùng bảng phối hợp các biến là cách thức được sử dụng phổ biến trong việc tìm những lỗi bất thường trong quá trình chạy spss. Bởi vì bảng phối hợp các biến cho phép chọn nhiều điều kiện kết hợp được cùng một lúc để lọc giá trị.
Để thực hiện sửa dữ liệu spss này sẽ dùng lệnh Select Cases:
- Bước 1: Mở Select Cases để xác định vị trí lỗi nằm ở đâu.
- Bước 2: Trên thanh công cụ, chọn Data/Select Cases và trong hộp thoại này chọn If conditions is satisfied/If.
- Bước 3: Nhập các điều kiện để tìm dữ liệu lỗi: Trong ô điều kiện chọn các điều kiện cần kết hợp.
- Bước 4: Sửa số liệu spss để chạy lạp spss:
- Bấm OK, sẽ có một biến mới filter được tạo (trong đó biến bằng 0 là không thỏa mãn lệnh If và biến bằng 1 là thỏa mãn lệnh If, tức là hàng điều kiện biến có xuất hiện lỗi).
- Vào mục Data View để kiểm tra lại các biến thỏa mãn lệnh If (biến bị lỗi) thì sẽ không có gạch chéo, tiến hành xem hàng đó và đồng thời chỉnh sửa lại giá trị cho phù hợp nhất.
- Tích vào All Cases ở trên cửa sở Select Cases để thực hiện quá trình chạy kiểm định.
- Nếu rơi vào trường hợp mẫu quá lớn hoặc rất nhiều trường hợp lỗi thì nên sử dụng thêm lệnh Sort Cases để bổ sung thêm filter.
- Chọn mục Data – Sort Cases trên thanh công cụ để thực hiện sắp xếp lại dữ liệu, nếu lựa chọn sắp xếp theo thứ tự giảm dần thì giá trị filter bằng 1 ở trên đầu tức hàng có xuất hiện biến bị lỗi.
KẾT LUẬN
Trên đây là 6 cách sửa số liệu spss và 3 bí kíp sửa dữ liệu spss mà Luận văn 24 muốn chia sẻ đến bạn. Hy vọng rằng qua bài viết này đã giúp bạn nắm rõ hơn về các bí quyết sửa dữ liệu spss. Đồng thời áp dụng thành công những cách sửa dữ liệu spss này trong quá trình tiến hành thực hiện spss để có được kết quả như ý.
Tôi là Thu Trà, hiện tại tôi là Quản lý nội dung của Luận Văn 24 – Chuyên cung cấp dịch vụ làm luận văn uy tín. Chúng tôi đặt lợi ích của khách hàng là ưu tiên hàng đầu. Website: https://luanvan24.com/ – Hotline: 0988552424.