Kiểm đinh đa cộng tuyến trong stata và cách khắc phục hiệu quả!

4/5 - (1 bình chọn)

Kiểm định đa cộng tuyến trong stata là gì và cách nào để khắc phục hiện tượng này một cách tối ưu và hiệu quả nhất? Bài viết này sẽ trả lời cho bạn đọc hiểu tường tận chi tiết và đầy đủ cho câu hỏi đó và giúp bạn đạt được kết quả tốt nhất khi chạy stata. Theo dõi ngay!

1. Đa cộng tuyến trong stata là gì? 

  • Kiểm định đa cộng tuyến trong stata xảy ra khi hai hoặc nhiều biến giải thích có sự tương quan cao với nhau và chúng không cung cấp thông tin duy nhất hoặc độc lập trong mô hình hồi quy. 
  • Lưu ý: Nếu mức độ tương quan đủ cao giữa các biến, nó có thể gây ra các vấn đề khi điều chỉnh và diễn giải mô hình hồi quy. 
  • Đa cộng tuyến không làm giảm khả năng dự đoán hay độ tin cậy của mô hình nói chung mà nó đa phần sẽ chỉ ảnh hưởng đến các tính toán mà liên quan đến yếu tố dự đoán riêng lẻ.
Đa cộng tuyến trong stata là gì Lưu ý và nguyên nhân
Đa cộng tuyến trong stata là gì? 

2 nguyên nhân chính của kiểm định đa cộng tuyến trong stata bao gồm:

  • Dữ liệu được người thực hiện thu thập không sát với thực tế hoặc chất lượng của dữ liệu kém.
  • Các biến trong mô hình có mối tương quan thật với nhau khi xét đến các khía cạnh thực tế.

Bên cạnh các dạng bài chạy kiểm định trong STATA thì SPSS cũng là một dạng phổ biến và thường được sử dụng. Để hiểu hơn về các loại kiểm định trong spss, bạn đọc hãy đọc ngay bài viết từ Luận văn 24 và mọi câu hỏi thắc mắc liên quan đến kiểm định trong SPSS sẽ được giải đáp một cách đầy đủ và chi tiết nhất. Xem ngay!

2. 3 cách kiểm tra đa cộng tuyến 

Vậy làm cách nào để bạn có thể phát hiện ra đa cộng tuyến để bạn có thể khắc phục một cách kịp thời để đạt được kết quả tốt nhất? Có 3 cách để giúp bạn kiểm tra đa cộng tuyến trong stata một cách nhanh chóng và dễ dàng:

Cách kiểm tra đa cộng tuyến
Cách kiểm tra đa cộng tuyến

2.1. Kiểm tra mối tương quan giữa tất cả các biến giải thích 

Cách đầu tiên bạn cần lưu ý khi thực hiện chạy stata là kiểm tra mối tương quan giữa tất cả các biến giải thích. Nghĩa là, nếu có mối tương quan cao giữa các biến độc lập thì sẽ tồn tại đa cộng tuyến. Để kiểm tra mối tương quan giữa tất cả các biến giải thích bạn cần thực hiện theo 3 bước sau:

Bước 1: Chọn “Statistics” → chọn “Summaries, tables and tests” → chọn “Summary and descriptive statistics” → chọn “Correlations and covariances”

Bước 1: Kiểm tra mối tương quan giữa các biến giải thích
Bước 1: Kiểm tra mối tương quan giữa các biến giải thích

Bước 2: Lựa chọn các biến để kiểm tra đa cộng tuyến trong STATA: trong hộp thoại correlate nhập các biến độc lập ‘pfce’ và ‘gfcf’.

Bước 2: Lựa chọn các biến để kiểm định đa cộng tuyến trong STATA
Bước 2: Lựa chọn các biến để kiểm định đa cộng tuyến trong STATA

Bước 3: Nhấp vào “OK” và chờ kết quả xuất hiện.

Bước 3: Xem kết quả
Bước 3: Xem kết quả
  • Lưu ý: Giá trị tương quan pfce càng gần với 1 thì mức độ tương quan giữa các biến càng cao.

2.2. Không nhất quán về giá trị ý nghĩa 

  • Phương pháp thứ 2 mà bạn cần lưu ý để kiểm tra đa cộng tuyến là khi các giá trị thống kê riêng lẻ trong kết quả hồi quy là không đáng kể những giá trị thống kê chung lại là đáng kể thì sẽ có đa cộng tuyến.
  • Điều đó chỉ ra rằng đa cộng tuyến đã làm giảm ý nghĩa cá nhân của biến và các biến có sự tương quan cao với nhau.

2.3. Sử dụng lệnh Vif

  • Phương pháp thứ 3 mà bạn đọc có thể sử dụng để kiểm tra đa cộng tuyến là sử dụng lệnh Vif sau khi đã nhận được kết quả hồi quy.
  • “Vif” là hệ số làm phát phương sai và là thước đo mức độ đa cộng tuyến trong một tập hợp nhiều biến hồi quy.
Kết quả hồi quy bằng lệnh vif trong STATA
Kết quả hồi quy bằng lệnh vif trong STATA

Bạn đọc cần sử dụng lệnh ‘vif’ trong dấu nhắc và kết quả cuối sẽ xuất hiện.

Kết quả của kiểm tra đa cộng tuyến trong STATA bằng lệnh vif
Kết quả của kiểm tra đa cộng tuyến trong STATA bằng lệnh vif
  • Lưu ý: 
  • Theo quy tắc chung, giá trị vif nhỏ hơn 10 cho thấy không có đa cộng tuyến giữa các biến.
  • 1/vif: là dung sai cho biết mức độ thẳng hàng giữa các biến. Các biến có giá trị dung sai nhỏ hơn 0,1 là sự kết hợp tuyến tính của các biến giải thích khác.

Bạn đang trong quá trình thực hiện việc chạy STATA nhưng lại gặp rất nhiều khó khăn và chưa đạt được kết quả như mong muốn? Luận văn 24 – với 17 năm kinh nghiệm trong việc hỗ trợ các bạn đọc thực hiện các dạng bài tập khó nhằn nhất luôn sẵn sàng nhận chạy Stata để giúp bạn một cách nhanh chóng, dễ dàng và đạt được kết quả như mong muốn.

3. Ví dụ về kiểm định đa cộng tuyến 

Ví dụ về kiểm định đa cộng tuyến trong stata
Ví dụ về kiểm định đa cộng tuyến trong stata
  • Trong ví dụ này. các giá trị VIF và dung sai (1 / VIF) cho avg_ed, grad_sch và col_grad là có sự tương quan cao. Tất cả các biến này đo lường trình độ học vấn của cha mẹ và giá trị VIF rất cao cho thấy rằng các biến này có thể dư thừa. Ví dụ, sau khi bạn biết grad_sch và col_grad thì bạn có thể dự đoán avg_ed rất tốt. Trong ví dụ này, đa cộng tuyến nảy sinh bởi vì chúng ta đã đưa vào quá nhiều biến số đo lường cùng một thứ là giáo dục của cha mẹ.
  • Hãy bỏ qua một trong các biến giáo dục của cha mẹ, avg_ed. Lưu ý rằng các giá trị VIF trong phân tích dưới đây xuất hiện tốt hơn nhiều. Ngoài ra, hãy lưu ý cách giảm các lỗi tiêu chuẩn cho các biến giáo dục cha mẹ, grad_sch và col_grad. Điều này là do mức độ thẳng hàng cao khiến sai số tiêu chuẩn bị thổi phồng. Với đa cộng tuyến được loại bỏ, hệ số cho grad_sch, trước đây không có ý nghĩa.
  • Hãy giới thiệu một lệnh khác về tính thẳng hàng. Lệnh collin hiển thị một số phép đo độ thẳng hàng khác nhau. Ví dụ, chúng ta có thể kiểm tra tính cộng đồng giữa các biến mà chúng ta đã sử dụng trong hai ví dụ trên.
  • Lưu ý rằng lệnh collin không cần phải chạy cùng với lệnh hồi quy, không giống như lệnh vif theo sau lệnh hồi quy. Cũng lưu ý rằng chỉ các biến dự đoán (độc lập) mới được sử dụng với lệnh collin. Bạn có thể tải xuống collin từ bên trong Stata bằng cách gõ findit collin.

4. Cách khắc phục đa cộng tuyến trong stata hiệu quả

Để khắc phục đa cộng tuyến trong stata hiệu quả thì hiện không có lệnh cụ thể nào. Tuy nhiên, bạn đọc có thể áp dụng quy trình sau với 4 bước chính để giải quyết một cách nhanh chóng kiểm định đa cộng tuyến trong stata bao gồm:

Cách khắc phục đa cộng tuyến trong stata hiệu quả
Cách khắc phục đa cộng tuyến trong stata hiệu quả
  • Bước 1: Loại bỏ tất cả các biến đang có sự tương quan cao.
  • Bước 2: Kết hợp tuyến tính các biến độc lập chẳng hạn như là cộng chúng lại với nhau.
  • Bước 3: Thực hiện việc phân tích cho các biến có tương quan cao, chẳng hạn như bạn đọc có thể phân tích các thành phần chính hoặc hồi quy bình phương nhỏ nhất từng phần.
  • Bước 4: Chuyển đổi dạng hàm của hồi quy tuyến tính chẳng hạn như chuyển đổi dạng hàm trong log-log, lin-log, log-lin và các dạng khác.

Bài viết chia sẻ cho bạn đọc những khái niệm chung nhất về kiểm định đa cộng tuyến trong stata cùng với cách kiểm tra và khắc phục sao cho hiệu quả nhất. Hy vọng những kiến thức trên đã giúp cho bạn hoàn thiện và đạt được kết quả tốt nhất khi chạy kiểm định SPSS.

4/5 (1 Review)

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết liên quan