THỐNG KÊ MÔ TẢ VÀ THỐNG KÊ SUY LUẬN [SO SÁNH + VÍ DỤ]

4.7/5 - (3 bình chọn)

Thống kê ngày càng đóng vai trò quan trọng trong lĩnh vực nghiên cứu. Tuy nhiên, để phân biệt chính xác thống kê mô tả và thống kê suy luận không phải là điều ai cũng làm được. Nếu bạn đang gặp khó khăn trong vấn đề trên, bài viết này sẽ giải đáp đầy đủ và chính xác nhất những thắc mắc của bạn. Hãy xem ngay để biết so sánh và ví dụ cụ thể của hai lĩnh vực thống kê này một cách nhanh chóng và dễ dàng nhé!

Thống kê là gì?

   Thống kê là một dạng phân tích toán học gồm hệ thống các phương pháp sử dụng mô hình, sự biểu diễn và tóm tắt định lượng cho một tập hợp dữ liệu. Việc này nhằm phục vụ cho quá trình phân tích, dự đoán và quyết định cho các thực nghiệm hoặc nghiên cứu thực tế nhất định. Đây cũng là nghiên cứu của tập hợp nhiều lĩnh vực khác nhau, bao gồm phân tích, giải thích, trình bày và tổ chức dữ liệu. 

   Thống kê có vai trò quan trọng trong quá trình nghiên cứu. Nó có thể đưa ra được những con số có ý nghĩa phân tích. Việc này giúp cho các nhà phân tích thống kê có được kết quả xác thực nhất để cải thiện các vấn đề liên quan đến đời sống xã hội. Nhất là trong thời đại bùng nổ công nghệ – thông tin như hiện nay, thống kê dần trở thành công cụ quan trọng trong công việc của các nhà chuyên môn thuộc nhiều lĩnh vực khác nhau. Hay thậm chí là ở các hoạt động thường ngày trong xã hội như y tế, tâm lý, giáo dục, xã hội học, vật lý, luật học, kinh doanh, công nghiệp…

   Thống kê được chia làm hai lĩnh vực: thống kê mô tả và thống kê suy luận. Đối với mỗi lĩnh vực sẽ có chức năng riêng. Xác định được mục đích thống kê là gì giúp chủ thể lựa chọn được cho mình phương pháp thực hiện, qua đó có thể đưa ra những đánh giá chính xác nhất khi thực hiện thống kê. Sau đây, chúng ta cùng tìm hiểu cụ thể về thống kê mô tả và suy luận, và sự khác biệt của nó nhé!

Định-nghĩa-thống-kê-mô-tả
Định-nghĩa-thống-kê-mô-tả

1. Định nghĩa thống kê mô tả

   Thống kê mô tả (descriptive statistics): được hiểu là các phương pháp liên quan đến việc thu thập số liệu, tóm tắt, trình bày, tính toán và mô tả các đặc trưng riêng biệt khác nhau để phản ánh tổng quát đối tượng nghiên cứu.

   Thống kê mô tả được sử dụng để tóm tắt và vẽ biểu đồ dữ liệu cho một nhóm mẫu đã chọn. Quá trình này giúp hiểu rõ tập hợp các quan sát cụ thể đó. Hiểu đơn giản là bạn chỉ cần lấy một nhóm mẫu mà bạn quan tâm, ghi lại dữ liệu về các thành viên trong nhóm. Sau đó sử dụng thống kê mô tả tóm tắt và dùng đồ thị để trình bày các thuộc tính của nhóm. 

   Thống kê này được đảm bảo độ chính xác chắc chắn, vì chỉ mô tả những mẫu mà bạn thực sự đo lường được mà không cần phải suy luận các thuộc tính về mẫu lớn hơn. Quá trình này bao gồm việc lấy một số lượng lớn các điểm dữ liệu có thể có trong mẫu và tạo nên biểu đồ tóm tắt có ý nghĩa. Qua đó, giúp người đọc hiểu rõ và trực quan hóa dữ liệu hơn.

2. 3 công cụ phổ biến của thống kê mô tả

Thống kê mô tả thường sử dụng các công cụ thống kê phổ biến sau để mô tả các nhóm:

công-cụ-phổ-biến-của-thống-kê-mô-tả
công-cụ-phổ-biến-của-thống-kê-mô-tả

2.1. Xu hướng tập trung

   Sử dụng giá trị trung bình (mean) hoặc giá trị trung vị (median) để định vị tâm của tập dữ liệu. Thước đo này sẽ cho bạn biết hầu hết các giá trị giảm ở đâu.

2.2. Phân tán

   Dữ liệu mở rộng ra cách trung tâm khoảng cách như thế nào? Bạn có thể sử dụng phạm vi hoặc độ lệch chuẩn để đo độ phân tán. Độ phân tán thấp chỉ ra rằng các giá trị tập trung chặt chẽ hơn xung quanh trung tâm. Độ phân tán cao hơn biểu thị rằng các điểm dữ liệu rời ra xa trung tâm hơn. Chúng ta cũng có thể vẽ biểu đồ phân bố tần suất.

2.3. Độ lệch

   Đây là thước đo cho bạn biết liệu sự phân bố các giá trị là đối xứng hay sai lệch

Tóm lại, các bạn có thể trình bày các công cụ này bằng cách sử dụng số và đồ thị. Đây là những công cụ thống kê mô tả tiêu biểu, các bạn cũng có thể thực hiện những phân tích mô tả khác cho hợp lý. Chẳng hạn như đánh giá mối quan hệ của dữ liệu được ghép nối bằng cách sử dụng biểu đồ tương quan và phân tán. 

3. Ví dụ về thống kê mô tả

Giả sử các bạn muốn mô tả điểm kiểm tra trong một lớp cụ thể gồm 30 học sinh. Dưới đây là tất cả các điểm kiểm tra và tính toán số liệu thống kê tóm tắt được ghi lại và tạo ra các biểu đồ. Với tệp dữ liệu CSV như sau: Thống kê mô tả.

 

Biểu đồ ví dụ cho thống kê mô tả
Biểu đồ ví dụ cho thống kê mô tả

Kết quả thống kê mô tả:

Thống kê Giá trị lớp học
Trung bình 79.18
Phạm vi 66.21 – 96.53
Tỷ lệ > = 70 86.7%

 

Những kết quả này chỉ ra rằng điểm trung bình của lớp này là 79.18. Điểm số nằm trong khoảng từ 66.21 đến 96.53 và sự phân bố được tập trung đối xứng xung quanh giá trị trung bình. Điểm ít nhất 70 trong bài kiểm tra là chấp nhận được. Dữ liệu cho thấy 86.7% học sinh có điểm số chấp nhận được.

Nhìn chung, thông tin này cho chúng ta thấy một bức tranh khá tốt về lớp học cụ thể này. Kết quả thống kê được chắc chắn vì bạn đã thu thập điểm số của tất cả mọi người trong lớp. Tuy nhiên, các bạn cũng không thể lấy những kết quả này để suy ra cho một số lượng lớn học sinh hơn.

Bạn lo lắng chưa biết cách chạy thống kê mô tả trong spss? Dù đã đọc các thông tin tại đây xong nhưng bạn vẫn đang gặp khó khăn với các con số. Đừng lo, tại bài viết này, Luận Văn 24 đã hướng dẫn chi tiết cách chạy thống kê mô tả trong spss cho các bạn. Xem ngay!

4. Định nghĩa thống kê suy luận

   Thống kê suy luận (inferential statistics): bao gồm các phương pháp ước lượng các đặc trưng của tổng thể, phân tích mối liên hệ giữa các hiện tượng nghiên cứu, dự đoán hoặc ra quyết định trên cơ sở thu thập thông tin từ kết quả quan sát mẫu. 

   Thống kê suy luận là tất cả về khái quát hóa từ mẫu đến quần thể, tức là lấy dữ liệu từ một mẫu và đưa ra các suy luận về quần thể lớn hơn mà từ đó mẫu được rút ra. Mục tiêu của thống kê suy luận rút ra kết luận từ một mẫu và khái quát hóa chúng thành một quần thể, và mẫu phải phản ánh chính xác quần thể đó. Ở cấp độ rộng, các bạn cần phải làm như sau:

  • Xác định quần thể chúng ta đang nghiên cứu.
  • Vẽ một mẫu đại diện từ quần thể đó.
  • Sử dụng các phân tích kết hợp lấy mẫu lỗi.

   Lấy mẫu ngẫu nhiên giúp chắc chắn rằng mẫu đại diện cho tổng thể. Đây là quá trình quan trọng tạo ra số liệu thống kê, chẳng hạn như giá trị trung bình,… Tuy nhiên, việc thu thập một mẫu thực sự ngẫu nhiên có thể là một quá trình phức tạp. Ngược lại, lấy mẫu có sẵn sẽ dễ thu thập hơn, nhưng sẽ khó lấy mẫu đại diện và kết quả cũng ít chính xác hơn.

5. 3 công cụ phân tích tiêu chuẩn của thống kê suy luận

3 công cụ phân tích tiêu chuẩn của thống kê suy luận
3 công cụ phân tích tiêu chuẩn của thống kê suy luận

Các phương pháp phổ biến nhất trong thống kê suy luận là kiểm định giả thuyết, khoảng tin cậy và phân tích hồi quy. Điều thú vị là các công cụ phân tích của thống kê suy luận này có thể tạo ra các giá trị tóm tắt tương tự như thống kê mô tả, chẳng hạn như giá trị trung bình và độ lệch chuẩn. Tuy nhiên, sẽ có các cách sử dụng khác nhau khi đưa ra các kết luận, cụ thể như sau:

5.1. Kiểm định giả thuyết

Phương pháp kiểm tra giả thuyết sử dụng dữ liệu mẫu trả lời các câu hỏi như sau:

  • Quần thể có ý nghĩa lớn hơn hay nhỏ hơn so với một giá trị cụ thể?
  • phương tiện của hai hoặc nhiều quần thể khác nhau?

Ví dụ: Nếu chúng ta nghiên cứu hiệu quả của một loại thuốc mới bằng cách so sánh kết quả trong nhóm điều trị và kiểm soát. Các thử nghiệm giả thuyết có thể cho biết liệu tác dụng của thuốc mà chúng ta quan sát được trong mẫu có khả năng tồn tại trong toàn quần thể hay không

   Tất nhiên, chúng ta không muốn sử dụng thuốc nếu nó chỉ có hiệu quả trong một mẫu cụ thể. Thay vào đó, chúng ta cần bằng chứng cho thấy nó sẽ hữu ích trong toàn bộ bệnh nhân. Các thử nghiệm giả thuyết cho phép chúng ta rút ra các loại kết luận này về toàn bộ quần thể.

5.2. Khoảng tin cậy (CIs)

   Trong thống kê suy luận, mục tiêu chính là ước tính các tham số của quần thể. Các tham số này là các giá trị chưa biết trong toàn bộ tập hợp, chẳng hạn như giá trị trung bình và độ lệch chuẩn. Các giá trị tham số này hầu như không thể biết được. Thông thường, nó không thể đo lường toàn bộ tham số. Lấy mẫu lỗi tạo ra sự không chắc chắn hoặc sai số xung quanh các ước tính.

   Giả sử xác định quần thể là tất cả các cầu thủ bóng rổ ở trường trung học. Sau đó, lấy một mẫu ngẫu nhiên từ quần thể này và tính chiều cao trung bình là 181 cm. Ước tính mẫu này là 181cm là ước tính tốt nhất về chiều cao trung bình của quần thể. Tuy nhiên, chắc chắn rằng ước tính này về tham số quần thể có thể không chính xác.

   Khoảng tin cậy kết hợp sự không chắc chắn và mẫu lỗi để tạo ra một loạt các giá trị. Các giá trị này là giá trị quần thể thực tế sẽ rơi vào bên trong. Ví dụ: khoảng tin cậy [176 186] chỉ ra rằng chắc chắn trung bình quần thể thực sự nằm trong phạm vi này.

Ngoài mẫu bị lỗi, bên cạnh đó, các bạn thỉnh thoảng cũng sẽ bắt gặp một số lỗi nhập liệu khi nhập dữ liệu SPSS. Chính vì thế, lọc dữ liệu SPSS là việc làm cần thiết để loại bỏ hết các lỗi nhập liệu đó. Nhưng bạn chưa biết cách lọc dữ liệu trong SPSS (Select Case trong SPSS) như thế nào mới đúng? Câu trả lời đã được Luận Văn 24 tổng hợp chi tiết bật mí đến các bạn ngay đây!

5.3. Phân tích hồi quy

Phân tích hồi quy mô tả mối quan hệ giữa một tập hợp các biến độc lập và một biến phụ thuộc. Phân tích này kết hợp các thử nghiệm giả thuyết giúp xác định xem các mối quan hệ quan sát được trong dữ liệu mẫu có thực sự tồn tại trong quần thể hay không.

Ví dụ: Biểu đồ đường thẳng dưới đây hiển thị mối quan hệ trong mô hình hồi quy giữa chiều cao và cân nặng ở các cô gái vị thành niên. Bởi vì mối quan hệ có ý nghĩa thống kê, chúng ta có đủ bằng chứng để kết luận rằng mối quan hệ này tồn tại trong quần thể chứ không chỉ là mẫu ngẫu nhiên.

Biểu đồ phân tích hồi quy trong thống kê suy luận

Biểu đồ phân tích hồi quy trong thống kê suy luận

6. Ví dụ về thống kê suy luận

   Đối với ví dụ này, giả sử các bạn đã tiến hành nghiên cứu về điểm kiểm tra cho một lớp học cụ thể như Luận Văn 24 đã trình bày chi tiết trong ví dụ phần thống kê mô tả. Tương tự, bây giờ các bạn muốn thực hiện một nghiên cứu thống kê suy luận cho cùng một bài kiểm tra đó. Giả thuyết đó là một bài kiểm tra tiêu chuẩn hóa trên toàn tiểu bang. Bằng cách sử dụng cùng một bài kiểm tra, nhưng bây giờ với mục tiêu rút ra các suy luận về quần thể.

    Hãy xác định quần thể của các bạn là học sinh lớp 8 tại các trường công lập ở Bang Pennsylvania, Hoa Kỳ. Các bạn cần đưa ra một kế hoạch lấy mẫu ngẫu nhiên để giúp đảm bảo một mẫu đại diện. Và giả sử rằng các bạn được cung cấp một danh sách các tên cho toàn bộ quần thể. Sau đó, rút ra một mẫu ngẫu nhiên gồm 100 học sinh từ đó và lấy điểm kiểm tra của họ. Lưu ý rằng những học sinh này sẽ không ở trong một lớp, mà đến từ nhiều lớp khác nhau ở các trường khác nhau trên toàn tiểu bang.

Kết quả thống kê suy luận:

    Đối với thống kê suy luận, chúng ta có thể tính toán ước tính điểm cho giá trị trung bình, độ lệch chuẩn và tỷ lệ cho mẫu ngẫu nhiên của chúng ta. Bởi vì chúng tôi không thể đo lường tất cả các đối tượng trong dân số này, nên sẽ có một biên độ sai sót xung quanh các số liệu thống kê này. Do đó, kết quả sẽ cho ra báo cáo khoảng tin cậy cho giá trị trung bình, độ lệch chuẩn và tỷ lệ điểm thỏa đáng (> = 70). Đây là tệp dữ liệu CSV: Thống kê suy luận.

Thống kê Ước tính thông số quần thể (CIs)
Trung bình 77.4 – 80.9
Độ lệch chuẩn 7.7 – 10.1
Tỷ lệ điểm > = 70 77% – 92%

 

 Với độ tin cậy liên quan đến những ước tính này, các bạn có thể tự tin 95% rằng trung bình quần thể là từ 77.4 đến 80.9. Độ lệch chuẩn tổng thể (thước đo độ phân tán) có khả năng nằm trong khoảng từ 7.7 đến 10.1. Và, tỷ lệ quần thể đạt yêu cầu dự kiến sẽ nằm trong khoảng từ 77% đến 92%.

7. 5 điểm khác biệt về thống kê mô tả và thống kê suy luận

Sự khác biệt chính giữa thống kê mô tả và suy luận chủ yếu được thể hiện qua 5 đặc điểm gồm: Ý nghĩa, Vai trò, kết quả, cách sử dụng và chức năng. Luận Văn 24 đã tổng kết 5 điểm khác biệt chính bằng biểu đồ so sánh dưới đây:

Biểu đồ so sánh thống kê mô tả và thống kê suy luận:

Cơ sở để so sánh Thống kê mô tả Thống kê suy luận
Ý nghĩa Là thống kê liên quan đến việc mô tả toàn bộ quần thể đang nghiên cứu. Là thống kê tập trung vào việc rút ra kết luận về quần thể, trên cơ sở phân tích và quan sát mẫu.
Vai trò Thu thập, tổ chức, phân tích và trình bày dữ liệu một cách có ý nghĩa. So sánh, kiểm tra giả thuyết và đưa ra dự đoán về kết quả trong tương lai.
Kết quả Biểu đồ, đồ thị và bảng. Xác suất.
Cách sử dụng Để mô tả tình huống. Để giải thích các cơ hội xảy ra của sự kiện.
Chức năng Giải thích các  dữ liệu đã biết được biết để tóm tắt mẫu. Đi đến kết luận để tìm hiểu về quần thể, mở rộng ra ngoài dữ liệu có sẵn.

Ngoài việc phải lựa chọn thống kê mô tả và thống kê suy luận cho bài nghiên cứu của mình, bạn còn gặp khó khăn khi phân tích spss? Bạn đang cần tư vấn, hỗ trợ spss để hoàn thành tốt luận văn cuối khóa. Bất kể khi nào bạn gặp khó khăn trong việc sử dụng SPSS, Luận Văn 24 tự tin là đơn vị uy tín và chuyên nghiệp với kinh nghiệm chạy SPSS thuê hơn 17 năm. Liên hệ ngay với chúng tôi để nhận được tư vấn và hỗ trợ kịp thời!

KẾT LUẬN

Bài viết chia sẻ với bạn đọc tất cả những kiến thức kèm theo những ví dụ liên quan đến thống kê mô tả và thống kê suy luận để bạn có thể phân biệt hai loại thống kê này một cách dễ dàng. Hy vọng với những thông tin đưa ra đã giúp các bạn hiểu được nội dung một cách chi tiết và hoàn thành tốt bài nghiên cứu của mình.

 

5/5 (1 Review)

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết liên quan