Hướng dẫn cách tạo bộ dữ liệu đẹp trong phân tích định lượng

Bạn đang thực hiện một cuộc khảo sát định lượng cho các ý tưởng kinh doanh mới hoặc để đánh giá sự hài lòng của khách hàng để hiểu nhu cầu của khách hàng? Nhưng làm thế nào để có được bộ dữ liệu đẹp? Hãy cùng tìm câu trả lời trong bài viết dưới đây nhé. Bạn có biết dữ liệu xấu là lý do chính gây ra các kết quả kiểm định không đạt yêu cầu: EFA biến chạy lung tung, Cronbach Alpha bị loại quá nhiều, Tương quan và hồi quy biến quan trọng lại không có ý nghĩa trong mô hình…

Hãy liên hệ với đội ngũ Luận Văn 24 để được hỗ trợ xử lý số liệu spss Với kinh nghiệm và đội ngũ trình độ cao, chúng tôi cam kết sẽ mang đến cho bạn nhiều lợi ích nhất.

Hướng dẫn cách tạo bộ dữ liệu đẹp trong phân tích định lượng

Hướng dẫn cách tạo bộ dữ liệu đẹp trong phân tích định lượng

1. Thiết kế bảng hỏi thật cẩn thận

Hãy tạo ra một bảng các câu hỏi thật ngắn gọn và dễ hiểu. Công đoạn này mất khá nhiều thời gian, công sức và thậm chí là tiền bạc, tuy nhiên rất nhiều bạn lại chỉ làm một cách qua loa và hời hợt. Kết quả là số liệu thu thập được không sử dụng được. Và tất cả những gì bạn bỏ ra đã “bỏ sông bỏ bể”.

  • Các lỗi thường gặp khi xây dựng bảng hỏi là:
  • Câu hỏi lủng củng không rõ ràng
  • Câu hỏi khó hiểu
  • Tự đưa vào các câu hỏi nhưng không có cơ sở lý luận hợp lý

Việc trả lời các câu hỏi không mất quá nhiều thời gian, nhưng nếu ngay 1, 2 câu hỏi mà người trả lời họ không hiểu câu hỏi thì sẽ ảnh hưởng rất lớn đến các kiểm định liên quan đến 1, 2 câu hỏi này. Do vậy, bạn nên tham khảo các nghiên cứu uy tín cùng đề tài và cùng ngôn ngữ Tiếng Việt để có được một bộ câu hỏi chất lượng.

Trường hợp bạn dịch từ bảng câu hỏi của nghiên cứu nước ngoài, thì hãy dịch thật rõ ràng và dùng từ ngữ Tiếng Việt viết lại để câu mạch lạc và dễ hiểu. Thực tế rất nhiều bạn làm bảng khảo sát dịch rất tệ, phần dịch đọc vào rối hơn cả phần Tiếng Anh, ngay cả người làm nghiên cứu với nhau không hiểu thì người trả lời họ không hiểu câu hỏi sẽ chiếm khả năng rất cao.

Nếu bạn đưa thêm các câu hỏi mới, nhân tố mới, hãy xem cơ sở lý luận nào bạn lại đưa ra các câu hỏi, các nhân tố đó. Bạn không được thêm bớt câu hỏi theo cảm tính, tất cả phải dựa vào cơ sở lý luận. Kèm với đó, bạn nên tham khảo ý kiến của chuyên gia, giảng viên, họ là những người có kinh nghiệm hơn bạn, họ sẽ cho bạn những lời khuyên, góp ý về câu hỏi bạn đưa vào có hợp lý không, các câu hỏi như vậy có dễ hiểu không, cơ sở lý luận bạn dùng có tốt không…

Hãy khéo léo lồng vào các câu hỏi “gài” và câu hỏi “đảo đáp án”

Kỹ thuật câu hỏi gài và đảo đáp án là hai kỹ thuật sẽ giúp bạn loại bỏ đi phần lớn những phiếu khảo sát kém chất lượng. Bạn sẽ dễ dàng nhận ra đâu là phiếu khảo sát đánh bao lô, đánh qua loa cho xong.

Thực hiện nghiên cứu sơ bộ

Có rất nhiều bạn mới làm nghiên cứu thường hay bỏ qua phần này mà chỉ hoàn thành bảng khảo sát và đi tới bước khảo sát chính thức.

Theo kinh nghiệm của những người đi trước thì bạn nên thực hiện nghiên cứu sơ bộ tầm 70 người  sẽ tốt hơn mức 40-50 như nhiều tài liệu viết. Dữ liệu mà bạn thu được từ khảo sát sơ bộ, bạn sẽ tiến hành phân tích Cronbach Alpha và EFA để xem độ tin cậy thang đo và tính hội tụ của các thang đo.

Từ những góp ý của người trả lời, vấn đề khó khăn tiếp theo là khi các bạn tiến hành nhập liệu và kết quả kiểm định của dữ liệu sơ bộ, tiến hành điều chỉnh, chỉnh sửa để có được bảng khảo sát hoàn thiện. Hãy trình bày với giảng viên, chuyên gia về bảng khảo sát bạn đã chỉnh sửa những gì, tối ưu những gì để họ góp ý thêm, sau đó đi đến khảo sát chính thức với cỡ mẫu lớn.

2. Làm “sạch” dữ liệu sau khi khảo sát

Loại bỏ các bảng khảo sát kém chất lượng

Dựa vào 2 kỹ thuật câu hỏi gài và đảo ngược đáp án, loại bỏ các phiếu khảo sát kém chất lượng, tiến hành nhập liệu các bảng khảo sát tốt vào Excel (nên nhập dữ liệu vào Excel, sau đó cần xử lý hãy import vào SPSS, không nên nhập trực tiếp vào SPSS).

Sẽ có thể xuất hiện phiếu khảo sát bị thiếu một vài cột mà đáng lẽ nó phải có giá trị, thống kê gọi đó là missing value. Nếu thiếu giá trị thì một số kiểm định sẽ không thực hiện được, do vậy, một trong các cách giải quyết đối với trường hợp này đó là lấy trung bình toàn bộ các giá trị của cột đó rồi làm tròn điền vào giá trị missing.

Làm “sạch” dữ liệu

Dùng kỹ thuật bảng tần số và bảng kết hợp để tìm ra những lỗi phát sinh do quá trình nhập liệu. Ví dụ, biến giới tính bạn chỉ có 2 giá trị là 1-Nam và 2-Nữ, nhưng khi chạy bảng thống kê tần số, dữ liệu lại xuất hiện giá trị 3, 4, 5… nghĩa là bạn đã nhập sai con số.

Ảnh 1 - Làm sạch dữ liệu

Ảnh 1 – Làm sạch dữ liệu

Hoặc bằng kỹ thuật bảng kết hợp, dựa trên nguyên tắc logic trong các đặc điểm nhân khẩu học, đặc điểm thông tin liên quan đến đối tượng khảo sát, chúng ta sẽ xem có sự bất hợp lý khi kết hợp 2 hay nhiều đặc điểm này lại với nhau hay không. Ví dụ, với bảng dưới đây, có sự bất hợp lý khi có 1 phiếu khảo sát có độ tuổi dưới 18 nhưng trình độ học vấn là trên đại học. Bạn cần rà soát và kiểm tra lại phiếu khảo sát này.

Ảnh 2 - Rà soát phiếu khảo sát

Ảnh 2 – Rà soát phiếu khảo sát

3. Tìm kiếm các điểm dị biệt và loại bỏ

Sau khi đã làm tốt bước chuẩn bị bảng khảo sát và làm sạch dữ liệu. Khả năng rất cao chúng ta đã có một bộ số liệu tương đối tốt.

Tuy nhiên, 300 người khảo sát thì sẽ có một vài cá nhân gọi là “dị biệt” khi kết quả của họ đánh giá đi lệch với xu hướng chung của phần lớn dữ liệu. Và các điểm dị biệt này nếu chiếm một số lượng đáng kể hoặc tính dị biệt của nó lớn sẽ ảnh hưởng trực tiếp lên các kiểm định.

Do vậy, khi xử lý các kiểm định, phân tích, kết quả không ra không đúng như kỳ vọng hoặc khác biệt nhiều so với thực tế đánh giá, hãy tìm kiếm các điểm bị diệt này và loại bỏ chúng để xem các kết quả kiểm định có tốt hơn hay không. Ví dụ ở hình bên dưới, dùng đồ thị Normal Q-Q để phát hiện điểm dị biệt đi lệch khỏi phân phối chuẩn của biến. Vùng bôi đỏ là 5 phiếu khảo sát thứ tự: 24, 90, 131, 154, 179 trong bảng dữ liệu. Trong khi xu hướng chung của dữ liệu tập hợp ở gần giá trị 0 ở trục tung thì 5 phiếu khảo sát này có giá trị tách biệt rất nhiều so với phần lớn dữ liệu.

Ảnh 3 - Tìm kiếm điểm dị biệt và loại bỏ

Ảnh 3 – Tìm kiếm điểm dị biệt và loại bỏ

Do kỹ thuật này khá phức tạp và xử lý bằng thủ công khá nhiều nên mình sẽ có một bài viết chi tiết hơn trong thời gian tới. Các bạn có thể tìm kiếm các video hướng dẫn nước ngoài với tiêu đề “Identify Outlier in SPSS” để xem cách thực hiện nhé.

Cuối cùng chỉ muốn nhấn mạnh, hãy làm thật tốt khâu chuẩn bị bảng khảo sát, đừng để khảo sát số lượng lớn mất tiền, thời gian, công sức rồi phải căng sức xử lý số liệu xấu. Các kỹ thuật mà bạn đã biết rồi nhưng làm chưa kỹ, hoặc biết nhưng không làm, hãy làm chúng tốt thật tốt vào.

Nguồn: luanvan24.com

Hướng dẫn cách tạo bộ dữ liệu đẹp trong phân tích định lượng
5 (100%) 7 vote[s]
avatar
1 Chủ đề bình luận
1 Trả lời chủ đề
0 Người theo dõi
 
Phản ứng nhiều nhất
Chủ đề bình luận nóng nhất
2 Tác giả bình luận
Đặng Thu TràLan Lan Tác giả bình luận gần đây
  Theo dõi  
Thông báo về
Lan Lan
Khách
Lan Lan

Cho mình hỏi, mình chạy EFA cho biến phụ thuộc thì kết quả ma trận xoay tạo ra 3 nhóm. Thì mình phải chia ra làm 3 biến phụ thuộc và chạy mô hình hình hồi quy cho cả 3 nhóm hay có cách xử lý nào khác để mình chạy EFA cho biến phụ thuộc mà kết quả ma trận xoay chỉ có 1 nhóm không? Cảm ơn nhiều!