SPSS là một công cụ được sử dụng rất phổ biến hiện nay giúp tối ưu quá trình phân tích, học tập và làm việc. Trong bài viết này, chúng tôi sẽ cung cấp cho bạn đọc cách xử lý giá trị missing trong spss một cách hiệu quả và đơn giản nhất để bạn đọc dễ dàng thực hiện theo. Theo dõi ngay!
1. Nguyên nhân dẫn đến giá trị missing
Tại sao lại dẫn đến tình huống giá trị missing trong quá trình thực hiện chạy SPSS? Dưới đây là 2 nguyên nhân chính gây ra hiện tượng giá trị missing:
1.1. Giá trị missing do hệ thống (SPSS System Missing Values)
- Định nghĩa: Các giá trị missing hệ thống là các giá trị hoàn toàn không có trong dữ liệu.
- Dấu hiệu giá trị missing: Các giá trị bị thiếu của hệ thống được hiển thị dưới dạng dấu chấm trong chế độ xem dữ liệu như hình dưới đây.
Các giá trị missing của hệ thống chỉ được tìm thấy trong các biến số. Biến chuỗi không có giá trị missing hệ thống. Dữ liệu có thể chứa các giá trị missing hệ thống vì 4 lý do thường gặp bao gồm:
- Một số người trả lời không được hỏi một số câu hỏi do định tuyến bảng câu hỏi.
- Người cung cấp câu trả lời bỏ qua một số câu hỏi.
- Đã xảy ra sự cố khi chuyển đổi hoặc chỉnh sửa dữ liệu.
- Một số giá trị không được ghi lại do lỗi thiết bị.
1.2. Giá trị missing do người dùng (SPSS User Missing Values)
- Định nghĩa: Giá trị missing do người dùng là các giá trị bị loại trừ khi phân tích hoặc chỉnh sửa dữ liệu.
Giá trị missing do người dùng được phân thành 2 dạng chính bao gồm:
- Giá trị missing do người dùng cho các biến phân loại:
- Dấu hiệu: Một cách nhanh chóng để kiểm tra các biến phân loại là chạy phân phối tần số và biểu đồ thanh tương ứng. Đảm bảo rằng các bảng đầu ra hiển thị cả giá trị và nhãn giá trị.
- Ví dụ:
Khi quan sát bảng kết quả ta thấy rằng rằng q1 là một biến thứ tự: các giá trị cao hơn cho thấy mức độ đồng ý cao hơn. Tuy nhiên, điều này không đúng với dữ liệu 11: No answer (Không trả lời) không chỉ ra được sự đồng ý nhiều hơn dữ liệu 10: Totally agree (Hoàn toàn đồng ý). Do đó, chỉ có các giá trị từ 1 đến 10 tạo nên một biến thứ tự và dữ liệu 11 bị loại trừ.
- Giá trị missing người dùng do thiếu giá trị cho các biến số liệu:
Dấu hiệu: Cách phù hợp nhất để bạn có thể kiểm tra các biến số liệu là chạy biểu đồ trên chúng.
- Ví dụ:
Đọc kết quả:
- Dựa trên biểu đồ, bạn có thể thấy được một số người trả lời báo cáo làm việc hơn 150 giờ mỗi tuần. Tuy nhiên, đây có thể là số giờ hàng tháng của họ thay vì hàng tuần. Do đó, trong mọi trường hợp, những giá trị trên biểu đồ không đáng tin cậy.
- Để giải quyết vấn đề, chúng ta sẽ đặt tất cả các giá trị từ 50 giờ mỗi tuần trở lên là những người dùng thiếu biến dữ liệu.
Với nhiều năm kinh nghiệm trong việc xử lý số liệu SPSS – Luận văn 24 đã chứng minh được mình là một đơn vị uy tín hàng đầu trong lĩnh vực này. Đây sẽ là lựa chọn cho bạn nếu có nhu cầu và mong muốn nhận được hỗ trợ khi gặp khó khăn trong việc xử lý số liệu spss.
2. Cách kiểm tra giá trị missing trong SPSS
2.1. Kiểm tra trên mỗi biến
- Một cách cực nhanh để kiểm tra các giá trị missing trong SPSS trên mỗi biến (hệ thống và người dùng) bạn cần thực hiện việc chạy một bảng DESCRIPTIVES cơ bản. Câu lệnh cần được thực hiện là:
- Sau khi thực hiện câu lệnh, bạn sẽ nhận được bảng kết quả sau:
Đọc kết quả:
- Cột N hiển thị số lượng giá trị không missing cho mỗi biến. Vì chúng có tổng cộng 464 trường hợp, (464 – N) là số giá trị missing trên mỗi biến. Nếu bất kỳ biến nào có tỷ lệ phần trăm bị thiếu cao, bạn có thể muốn loại trừ chúng khỏi các phân tích.
- Valid N (listwise) = 309 . Đây là những trường hợp không có bất kỳ giá trị nào missing trên tất cả các biến trong bảng này. Một số dữ liệu sẽ chỉ sử dụng 309 trường hợp không xác định.
Việc mã hóa dữ liệu gây ra rất nhiều khó khăn cho người thực hiện trong suốt quá trình chạy, tìm hiểu kỹ hơn các thông tin về mã hóa dữ liệu trong spss để có thêm thật nhiều kiến thức hay và xử lý được tình huống khó nhằn này một cách dễ dàng bạn nhé!
2.2. Kiểm tra trên mỗi trường hợp
- Để kiểm tra xem có trường hợp nào có nhiều giá trị missing hay không, bạn cần phải tạo một biến mới. Biến này chứa số lượng giá trị missing trong một tập hợp các biến mà bạn muốn phân tích. Trong ví dụ bên dưới đây, đó sẽ là q1 đến q9.
- Bạn cần sử dụng câu lệnh:
- Tạo biến mới giữ số lượng giá trị bị thiếu trên q1 đến q9
- Lưu ý: mis_1 là tên biến ngắn gọn được đặt.
- Đặt mô tả của mis_1 làm nhãn biến
- Kiểm tra các giá trị thiếu phân phối tần số
- Sau khi thực hiện xong các lệnh trên, bạn sẽ nhận được bảng kết quả sau:
Đọc kết quả:
- Trong bảng này, 0 có nghĩa là không thiếu giá trị nào trên q1 đến q9. Điều này được áp dụng cho 309 trường hợp. Đây là N hợp lệ (theo danh sách) mà chúng ta đã thấy trong bảng mô tả trước đó.
- 1 trường hợp có 8 giá trị bị thiếu trong số 9 biến. Bạn có thể nghi ngờ nếu người trả lời này điền vào bảng câu hỏi một cách nghiêm túc thì bạn nên loại trừ nó khỏi các phân tích từ q1 đến q9.
3. Phân tích xử lý dữ liệu missing trong SPSS
3.1. Loại trừ theo cặp giá trị
- Để xử lý dữ liệu missing trong spss bằng cách loại trừ cặp giá trị, bạn cần kiểm tra về các mối tương quan (Pearsion) của dữ liệu q1 đến q9 với lệnh
- Với lệnh trên, bạn sẽ nhận được bảng kết quả dưới đây:
- Kết quả cho thấy mỗi mối tương quan giữa một cặp biến sử dụng tất cả các trường hợp có giá trị hợp lệ trên 2 biến. Đây được gọi là loại trừ từng cặp các giá trị bị thiếu. Lưu ý rằng hầu hết các mối tương quan có kết quả khoảng 410 đến 440 trường hợp.
Bạn luôn phân vân trong việc xử lý các câu hỏi? Trong SPSS cũng vậy, để thực hiện điều đó một cách dễ dàng hơn, bạn đọc tham khảo bài viết xử lý câu hỏi nhiều lựa chọn trong spss để tìm được lời giải đáp ngay nhé!
3.2. Loại trừ theo danh sách các giá trị bị thiếu
- Để xử lý dữ liệu missing trong spss bằng cách loại trừ theo danh sách các giá trị bị thiếu bạn cần sử dụng cú pháp sau:
- Với lệnh trên bạn sẽ nhận được bảng kết quả được loại bỏ số trường hợp missing trên mỗi tương quan.
- Mỗi mối tương quan dựa trên 309 trường hợp giống nhau trong danh sách N. Đây là các trường hợp missing giá trị bị thiếu trên tất cả các biến trong bảng: q1 đến q9.
- Lưu ý: So với cách loại trừ theo cặp thì loại trừ theo danh sách các giá trị bị thiếu sẽ có ít trường hợp được sử dụng hơn.
3.3. Chỉnh sửa dữ liệu bị thiếu giá trị
Để xử lý dữ liệu missing trong spss bằng cách chỉnh sửa dữ liệu bị thiếu giá trị bạn có thể thực hiện thông qua 3 lệnh bao gồm:
- Tính giá trị trung bình a:
- Tính giá trị trung bình b:
- Tính giá trị trung bình c:
- Kiểm tra kết quả:
Bằng cách thực hiện 4 câu lệnh trên đây, bạn sẽ nhận được một bảng kết quả Descriptive Statistics:
Giá trị missing hường không gây ra nhiều rắc rối khi phân tích hoặc chỉnh sửa dữ liệu nhưng trong một số trường hợp thì sẽ gây ra sự thiếu sót trong kết quả. Do đó, với các thông tin về quá trình xử lý giá trị missing trong SPSS được Luận văn 24 chia sẻ sẽ giúp bạn đạt được kết quả tốt nhất cho bài làm của mình.
Tôi là Thu Trà, hiện tại tôi là Quản lý nội dung của Luận Văn 24 – Chuyên cung cấp dịch vụ làm luận văn uy tín. Chúng tôi đặt lợi ích của khách hàng là ưu tiên hàng đầu. Website: https://luanvan24.com/ – Hotline: 0988552424.