Chuyển đến nội dung

Trắc nghiệm Thống kê học online có đáp án

Trắc Nghiệm Kỹ Thuật & Công Nghệ

Trắc nghiệm Thống kê học online có đáp án

Ngày cập nhật: Tháng 2 1, 2026

Lưu ý và Miễn trừ trách nhiệm:Toàn bộ nội dung câu hỏi, đáp án và thông tin được cung cấp trên website này được xây dựng nhằm mục đích tham khảo, hỗ trợ ôn tập và củng cố kiến thức. Chúng tôi không cam kết về tính chính xác tuyệt đối, tính cập nhật hay độ tin cậy hoàn toàn của các dữ liệu này. Nội dung tại đây KHÔNG PHẢI LÀ ĐỀ THI CHÍNH THỨC của bất kỳ tổ chức giáo dục, trường đại học hay cơ quan cấp chứng chỉ nào. Người sử dụng tự chịu trách nhiệm khi sử dụng các thông tin này vào mục đích học tập, nghiên cứu hoặc áp dụng vào thực tiễn. Chúng tôi không chịu trách nhiệm pháp lý đối với bất kỳ sai sót, thiệt hại hoặc hậu quả nào phát sinh từ việc sử dụng thông tin trên website này.

Chào mừng bạn đến với bộ Trắc nghiệm Thống kê học online có đáp án. Bộ trắc nghiệm này giúp bạn hệ thống lại kiến thức một cách logic và dễ hiểu. Hãy chọn một bộ câu hỏi phía dưới để bắt đầu. Chúc bạn làm bài thuận lợi và thu được nhiều kiến thức mới

★★★★★
★★★★★
4.8/5 (183 đánh giá)

1. Thống kê mô tả có vai trò chính nào trong phân tích dữ liệu?

A. Kiểm định giả thuyết về tổng thể dựa trên mẫu.
B. Xác định mối quan hệ nhân quả phức tạp giữa các biến.
C. Tóm tắt, sắp xếp và trình bày các đặc trưng cơ bản của dữ liệu.
D. Dự đoán giá trị tương lai của dữ liệu.

2. Sự khác biệt cơ bản giữa tổng thể (population) và mẫu (sample) trong thống kê là gì?

A. Tổng thể là toàn bộ đối tượng nghiên cứu, còn mẫu là một phần được chọn ra từ tổng thể.
B. Tổng thể luôn nhỏ hơn mẫu.
C. Mẫu luôn có sai số lớn hơn tổng thể.
D. Tổng thể được thu thập dễ dàng hơn mẫu.

3. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?

A. Trung vị (Median).
B. Miền giá trị (Range).
C. Độ lệch chuẩn (Standard Deviation).
D. Mode.

4. Biến ‘Giới tính’ (Nam/Nữ) là loại biến nào trong thống kê?

A. Biến thứ bậc (Ordinal variable).
B. Biến khoảng (Interval variable).
C. Biến định tính (Nominal variable).
D. Biến tỷ lệ (Ratio variable).

5. Đặc điểm nổi bật của phân phối chuẩn (Normal Distribution) là gì?

A. Luôn có hai đỉnh (bimodal).
B. Đối xứng, hình chuông, trung bình, trung vị và mode trùng nhau.
C. Luôn bị lệch về phía bên phải.
D. Chỉ áp dụng cho dữ liệu định tính.

6. Sai lầm loại I (Type I Error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết null (H₀) trong khi nó thực sự đúng.
B. Chấp nhận giả thuyết null (H₀) trong khi nó thực sự sai.
C. Bác bỏ giả thuyết thay thế (H₁) trong khi nó thực sự đúng.
D. Không thể đưa ra kết luận nào.

7. Giá trị P-value trong kiểm định giả thuyết cho biết điều gì?

A. Xác suất giả thuyết null (H₀) là đúng.
B. Kích thước của hiệu ứng được quan sát.
C. Xác suất quan sát được kết quả dữ liệu hoặc kết quả cực đoan hơn nếu giả thuyết null (H₀) là đúng.
D. Xác suất giả thuyết thay thế (H₁) là đúng.

8. Khoảng tin cậy 95% cho giá trị trung bình tổng thể có ý nghĩa gì?

A. Có 95% khả năng giá trị trung bình tổng thể chính xác bằng giá trị ở giữa khoảng.
B. Nếu lặp lại quá trình lấy mẫu nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa giá trị trung bình thực của tổng thể.
C. Khoảng này chứa 95% dữ liệu trong mẫu.
D. Có 95% khả năng giá trị trung bình mẫu nằm trong khoảng này.

9. Hệ số tương quan Pearson r = -0.8 cho thấy mối quan hệ như thế nào giữa hai biến?

A. Mối quan hệ tuyến tính đồng biến mạnh.
B. Không có mối quan hệ tuyến tính.
C. Mối quan hệ tuyến tính nghịch biến mạnh.
D. Mối quan hệ phi tuyến tính mạnh.

10. Phương pháp lấy mẫu nào đảm bảo mỗi phần tử trong tổng thể có cùng xác suất được chọn vào mẫu?

A. Lấy mẫu thuận tiện (Convenience Sampling).
B. Lấy mẫu phân tầng (Stratified Sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling).
D. Lấy mẫu theo cụm (Cluster Sampling).

11. Khi nào nên sử dụng kiểm định t-test cho hai mẫu độc lập?

A. Khi so sánh giá trị trung bình của hai nhóm độc lập, với dữ liệu có phân phối xấp xỉ chuẩn.
B. Khi so sánh tỷ lệ của hai nhóm.
C. Khi so sánh ba hoặc nhiều hơn ba nhóm.
D. Khi phân tích mối quan hệ giữa hai biến định tính.

12. Mục đích chính của phân tích phương sai (ANOVA) là gì?

A. Kiểm tra sự phân tán của một nhóm dữ liệu.
B. Đánh giá mối quan hệ tuyến tính giữa hai biến định lượng.
C. So sánh giá trị trung bình của ba hoặc nhiều hơn ba nhóm độc lập.
D. So sánh tỷ lệ giữa hai nhóm.

13. Kiểm định Chi-squared (χ²) được sử dụng chủ yếu để làm gì?

A. Dự đoán giá trị của một biến dựa trên biến khác.
B. Kiểm tra mối quan hệ giữa hai biến định tính (phân loại).
C. So sánh giá trị trung bình của hai nhóm.
D. Đánh giá sự phân phối của một biến liên tục.

14. Mô hình hồi quy tuyến tính đơn giản có mục tiêu chính là gì?

A. Phân tích mối quan hệ giữa các biến định tính.
B. Mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc định lượng và một biến độc lập định lượng.
C. So sánh giá trị trung bình của nhiều nhóm.
D. Xác định sự khác biệt giữa hai tỷ lệ.

15. Hệ số xác định R² trong hồi quy tuyến tính biểu thị điều gì?

A. Độ lớn của mối quan hệ nhân quả.
B. Độ dốc của đường hồi quy.
C. Phần trăm phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
D. Mức độ tin cậy của ước tính.

16. Giá trị ngoại lệ (Outlier) ảnh hưởng như thế nào đến các thống kê mô tả như trung bình và trung vị?

A. Không ảnh hưởng đến trung bình nhưng ảnh hưởng mạnh đến trung vị.
B. Ảnh hưởng mạnh mẽ đến giá trị trung bình nhưng ít ảnh hưởng đến trung vị.
C. Không ảnh hưởng đáng kể đến cả trung bình và trung vị.
D. Ảnh hưởng mạnh mẽ đến cả trung bình và trung vị.

17. Yếu tố nào sau đây không ảnh hưởng trực tiếp đến việc xác định cỡ mẫu cần thiết cho một nghiên cứu thống kê?

A. Chi phí thu thập dữ liệu.
B. Độ lớn của hiệu ứng mong muốn (Effect size).
C. Mức ý nghĩa (Alpha level).
D. Độ lệch chuẩn của tổng thể (hoặc ước tính).

18. Trong phương trình hồi quy tuyến tính y = a + bx, hệ số ‘b’ (độ dốc) biểu thị điều gì?

A. Giá trị của biến phụ thuộc (y) khi biến độc lập (x) bằng 0.
B. Mức độ thay đổi trung bình của biến phụ thuộc (y) khi biến độc lập (x) tăng thêm một đơn vị.
C. Mức độ tương quan giữa hai biến.
D. Giá trị trung bình của biến phụ thuộc (y).

19. Khi nào nên sử dụng phân phối t-Student thay vì phân phối Z trong kiểm định giả thuyết về trung bình?

A. Khi dữ liệu không có phân phối chuẩn.
B. Khi cỡ mẫu lớn và độ lệch chuẩn của tổng thể đã biết.
C. Khi so sánh tỷ lệ giữa hai nhóm.
D. Khi cỡ mẫu nhỏ và độ lệch chuẩn của tổng thể chưa biết.

20. Điều gì xảy ra với độ rộng của khoảng tin cậy khi mức độ tin cậy tăng lên (ví dụ từ 90% lên 99%)?

A. Độ rộng của khoảng tin cậy sẽ giảm xuống.
B. Khoảng tin cậy sẽ dịch chuyển về phía trung bình mẫu.
C. Độ rộng của khoảng tin cậy không thay đổi.
D. Độ rộng của khoảng tin cậy sẽ tăng lên.

21. Một nhà nghiên cứu đang thu thập dữ liệu về ‘Thứ hạng học lực’ (Giỏi, Khá, Trung bình, Yếu) của sinh viên. Đây là loại biến nào?

A. Biến định tính (Nominal variable).
B. Biến thứ bậc (Ordinal variable).
C. Biến khoảng (Interval variable).
D. Biến tỷ lệ (Ratio variable).

22. Giả định nào sau đây là quan trọng đối với mô hình hồi quy tuyến tính bội?

A. Các biến độc lập phải có tương quan cao với nhau.
B. Phân phối của biến phụ thuộc phải là phân phối nhị thức.
C. Các phần dư (errors) phải độc lập với nhau.
D. Cỡ mẫu phải nhỏ hơn 30.

23. Sai lầm loại II (Type II Error) trong kiểm định giả thuyết là gì?

A. Bác bỏ giả thuyết null (H₀) trong khi nó thực sự đúng.
B. Chấp nhận giả thuyết null (H₀) trong khi nó thực sự sai.
C. Bác bỏ giả thuyết thay thế (H₁) trong khi nó thực sự sai.
D. Không thể đưa ra bất kỳ kết luận nào về giả thuyết.

24. Sức mạnh của kiểm định (Power of a Test) trong kiểm định giả thuyết là gì?

A. Xác suất chấp nhận giả thuyết null (H₀) khi nó thực sự đúng.
B. Xác suất thực hiện sai lầm loại I.
C. Xác suất bác bỏ đúng giả thuyết null (H₀) khi nó thực sự sai.
D. Xác suất thực hiện sai lầm loại II.

25. Tại sao phương sai (Variance) là một thước đo quan trọng trong thống kê?

A. Chỉ ra điểm giữa của tập dữ liệu.
B. Cung cấp thông tin về mức độ phân tán của dữ liệu so với giá trị trung bình.
C. Xác định giá trị phổ biến nhất trong tập dữ liệu.
D. Đo lường mối quan hệ tuyến tính giữa hai biến.

26. Biến giả (Dummy variable) trong mô hình hồi quy thường được sử dụng cho mục đích nào?

A. Giảm thiểu hiện tượng đa cộng tuyến.
B. Mã hóa các biến định tính (phân loại) thành dạng số để đưa vào mô hình hồi quy.
C. Biến đổi các biến liên tục thành biến có phân phối chuẩn.
D. Chỉ sử dụng khi không có biến định lượng nào khác.

27. Khi nào thì trung vị (Median) được ưu tiên hơn trung bình (Mean) để biểu thị xu hướng trung tâm của dữ liệu?

A. Khi dữ liệu có phân phối chuẩn và đối xứng.
B. Khi dữ liệu chỉ có các giá trị định tính.
C. Khi cần tính toán độ lệch chuẩn.
D. Khi dữ liệu có sự phân phối lệch hoặc có các giá trị ngoại lệ.

28. Mục đích chính của kỹ thuật lấy mẫu phân tầng (Stratified Sampling) là gì?

A. Chọn các phần tử ngẫu nhiên hoàn toàn từ toàn bộ tổng thể.
B. Đảm bảo tất cả các nhóm con (tầng) quan trọng trong tổng thể được đại diện đầy đủ và chính xác trong mẫu.
C. Chỉ chọn những phần tử dễ tiếp cận nhất.
D. Chọn các cụm nhỏ hơn của tổng thể rồi khảo sát tất cả các phần tử trong cụm đó.

29. Khi nào nên xem xét sử dụng kiểm định phi tham số thay vì kiểm định tham số?

A. Khi độ lệch chuẩn của tổng thể đã biết.
B. Khi dữ liệu không đáp ứng các giả định của kiểm định tham số (ví dụ: không phân phối chuẩn, cỡ mẫu nhỏ).
C. Khi biến phụ thuộc là biến định tính.
D. Khi số lượng nhóm cần so sánh lớn hơn ba.

30. Giả định nào sau đây là cần thiết cho phân tích phương sai một chiều (One-way ANOVA)?

A. Các biến độc lập phải có phân phối chuẩn.
B. Biến phụ thuộc phải là biến định tính.
C. Các phương sai của tổng thể giữa các nhóm phải đồng nhất (homoscedasticity).
D. Cỡ mẫu của mỗi nhóm phải khác nhau đáng kể.

31. Thống kê học là gì?

A. Thống kê học là khoa học về thu thập, tổ chức, phân tích, diễn giải và trình bày dữ liệu.
B. Thống kê học là một nhánh của toán học thuần túy không liên quan đến dữ liệu thực tế.
C. Thống kê học chủ yếu nghiên cứu về các quy luật vật lý.
D. Thống kê học chỉ tập trung vào việc tính toán các giá trị trung bình.

32. Trong thống kê, ‘dân số’ (population) được định nghĩa là gì?

A. Các dữ liệu được thu thập từ một cuộc khảo sát.
B. Một nhóm nhỏ các cá thể được chọn để nghiên cứu.
C. Toàn bộ tập hợp các đối tượng nghiên cứu mà từ đó chúng ta muốn suy luận.
D. Tổng số người sống trong một quốc gia.

33. Biến định tính (categorical variable) là loại biến nào?

A. Biến mà các giá trị của nó thể hiện các danh mục hoặc nhóm.
B. Biến chỉ có hai giá trị có thể.
C. Biến mà các giá trị của nó là số và có thể đo lường được.
D. Biến mà các giá trị của nó có thứ tự rõ ràng nhưng không có khoảng cách bằng nhau.

34. Thang đo nào cho phép sắp xếp dữ liệu theo thứ tự và có khoảng cách giữa các giá trị là bằng nhau, nhưng không có điểm 0 tuyệt đối?

A. Thang đo danh nghĩa (Nominal scale).
B. Thang đo tỷ lệ (Ratio scale).
C. Thang đo khoảng (Interval scale).
D. Thang đo thứ bậc (Ordinal scale).

35. Đại lượng nào dưới đây được sử dụng để đo lường xu hướng trung tâm của dữ liệu và ít bị ảnh hưởng bởi các giá trị ngoại lai (outliers)?

A. Trung vị (Median).
B. Độ lệch chuẩn (Standard Deviation).
C. Trung bình cộng (Mean).
D. Phương sai (Variance).

36. Khi nào nên sử dụng mode (yếu vị) làm đại lượng đo lường xu hướng trung tâm?

A. Khi cần tính toán khoảng tin cậy cho giá trị trung bình.
B. Khi dữ liệu là định tính (danh nghĩa) hoặc khi muốn tìm giá trị xuất hiện thường xuyên nhất.
C. Khi dữ liệu là định lượng và có phân phối chuẩn.
D. Khi dữ liệu có phân phối đối xứng và không có giá trị ngoại lai.

37. Độ lệch chuẩn (standard deviation) đo lường điều gì?

A. Mức độ phân tán trung bình của các điểm dữ liệu so với giá trị trung bình.
B. Giá trị trung tâm của tập dữ liệu.
C. Tổng các giá trị trong tập dữ liệu.
D. Sự khác biệt giữa giá trị lớn nhất và nhỏ nhất.

38. Một biểu đồ hộp (box plot) cung cấp thông tin gì về dữ liệu?

A. Phân phối của dữ liệu theo thời gian.
B. Mối quan hệ giữa hai biến định lượng.
C. Tần số của từng giá trị riêng lẻ.
D. Tóm tắt năm số (tối thiểu, Q1, trung vị, Q3, tối đa) và các giá trị ngoại lai.

39. Hiện tượng ‘phân phối lệch phải’ (right-skewed distribution) trong biểu đồ histogram có nghĩa là gì?

A. Dữ liệu được phân phối đối xứng xung quanh giá trị trung tâm.
B. Phần lớn dữ liệu tập trung ở phía bên phải và có một ‘đuôi’ dài kéo dài về phía bên trái.
C. Phần lớn dữ liệu tập trung ở phía bên trái và có một ‘đuôi’ dài kéo dài về phía bên phải.
D. Có hai đỉnh rõ ràng trong phân phối dữ liệu.

40. Trong lý thuyết xác suất, biến cố ‘không gian mẫu’ (sample space) là gì?

A. Số lần thử nghiệm được lặp lại.
B. Tập hợp tất cả các kết quả có thể xảy ra của một thử nghiệm ngẫu nhiên.
C. Một kết quả cụ thể của thử nghiệm.
D. Xác suất xảy ra của một biến cố.

41. Định lý giới hạn trung tâm (Central Limit Theorem – CLT) phát biểu điều gì?

A. Xác suất xảy ra của một biến cố độc lập không thay đổi.
B. Phân phối của dân số luôn là phân phối chuẩn.
C. Phân phối của các trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích thước mẫu đủ lớn, bất kể phân phối dân số gốc.
D. Kích thước mẫu càng lớn thì phương sai của mẫu càng tăng.

42. Phân phối chuẩn (Normal Distribution), còn được gọi là ‘phân phối Gauss’, có những đặc điểm nào?

A. Lệch phải, có hai đỉnh, và mode là giá trị cao nhất.
B. Không đối xứng và các giá trị tập trung ở một phía.
C. Chỉ áp dụng cho dữ liệu định tính rời rạc.
D. Đối xứng, hình chuông, với trung bình, trung vị và mode trùng nhau ở trung tâm.

43. Khoảng tin cậy (Confidence Interval – CI) là gì trong thống kê?

A. Độ lệch chuẩn của mẫu.
B. Xác suất xảy ra của một biến cố.
C. Giá trị chính xác của tham số dân số.
D. Một khoảng giá trị ước lượng cho một tham số dân số chưa biết, cùng với một mức độ tin cậy cụ thể.

44. Khi nào chúng ta sử dụng kiểm định z (z-test) thay vì kiểm định t (t-test) để kiểm định trung bình dân số?

A. Khi kích thước mẫu nhỏ hơn 30.
B. Khi dữ liệu có phân phối không chuẩn.
C. Khi độ lệch chuẩn của dân số đã biết và kích thước mẫu đủ lớn.
D. Khi độ lệch chuẩn của dân số chưa biết.

45. P-value (giá trị P) trong kiểm định giả thuyết được diễn giải như thế nào?

A. Xác suất giả thuyết null là đúng.
B. Xác suất quan sát được kết quả dữ liệu ít nhất cực đoan như đã thấy, giả sử giả thuyết null là đúng.
C. Mức ý nghĩa của kiểm định.
D. Xác suất giả thuyết đối là đúng.

46. Lỗi loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết đối khi nó thực sự đúng.
B. Không bác bỏ giả thuyết null khi nó thực sự sai.
C. Không bác bỏ giả thuyết đối khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự đúng.

47. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?

A. Mối quan hệ nhân quả giữa hai biến.
B. Sự khác biệt về trung bình giữa hai nhóm.
C. Mức độ phù hợp của mô hình hồi quy.
D. Cường độ và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng.

48. Trong phân tích hồi quy tuyến tính đơn, hệ số góc (slope) của đường hồi quy biểu thị điều gì?

A. Giá trị của biến phụ thuộc khi biến độc lập bằng 0.
B. Sự thay đổi trung bình trong biến phụ thuộc (Y) khi biến độc lập (X) thay đổi một đơn vị.
C. Mối quan hệ không tuyến tính giữa hai biến.
D. Độ phân tán của các điểm dữ liệu quanh đường hồi quy.

49. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng cho mục đích nào?

A. Ước lượng khoảng tin cậy cho phương sai dân số.
B. Kiểm tra mối quan hệ giữa hai biến định tính hoặc sự phù hợp của phân phối thực tế với phân phối lý thuyết.
C. Phân tích mối quan hệ tuyến tính giữa các biến định lượng.
D. So sánh trung bình của hai nhóm định lượng.

50. Mức ý nghĩa (significance level), thường ký hiệu là alpha (α), đại diện cho điều gì trong kiểm định giả thuyết?

A. Xác suất mắc lỗi loại II (không bác bỏ H0 khi H0 sai).
B. Độ tin cậy của khoảng tin cậy.
C. Xác suất tối đa chấp nhận được để mắc lỗi loại I (bác bỏ H0 khi H0 đúng).
D. P-value của kiểm định.

51. Phương pháp chọn mẫu ngẫu nhiên đơn giản (Simple Random Sampling) là gì?

A. Chỉ chọn những phần tử dễ tiếp cận nhất.
B. Mỗi phần tử trong dân số có cơ hội được chọn vào mẫu là như nhau và độc lập.
C. Chia dân số thành các nhóm nhỏ rồi chọn ngẫu nhiên từ mỗi nhóm.
D. Chọn các phần tử theo một quy luật hệ thống (ví dụ, cứ 10 phần tử chọn 1).

52. Ý nghĩa của việc kiểm định giả thuyết t-test cho hai mẫu độc lập là gì?

A. Kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng.
B. So sánh phương sai của hai nhóm.
C. So sánh trung bình của hai nhóm độc lập để xác định xem có sự khác biệt đáng kể giữa chúng không.
D. So sánh các tần số quan sát với tần số kỳ vọng.

53. Phân tích phương sai (ANOVA – ANalysis Of VAriance) được sử dụng khi nào?

A. So sánh trung bình của hai nhóm phụ thuộc.
B. So sánh trung bình của ba hoặc nhiều nhóm độc lập.
C. Phân tích mối quan hệ giữa các biến định tính.
D. Dự đoán giá trị của một biến dựa trên các biến khác.

54. Hệ số xác định (R-squared) trong phân tích hồi quy cho biết điều gì?

A. Độ tin cậy của khoảng ước lượng.
B. Hệ số xác định R-squared cho biết phần trăm phương sai của biến phụ thuộc được giải thích bởi biến độc lập (hoặc các biến độc lập) trong mô hình hồi quy, Kết luận Lý giải: Phần trăm phương sai của biến phụ thuộc được giải thích bởi (các) biến độc lập trong mô hình.
C. Hướng của mối quan hệ giữa hai biến.
D. Cường độ mối quan hệ tuyến tính giữa hai biến.

55. Khi một nhà nghiên cứu bác bỏ giả thuyết null (H0) khi H0 là đúng, họ đã mắc phải lỗi gì?

A. Lỗi loại I.
B. Lỗi ngẫu nhiên.
C. Lỗi lấy mẫu.
D. Lỗi loại II.

56. Sức mạnh kiểm định (Power of a test) được định nghĩa là gì?

A. Xác suất bác bỏ giả thuyết null khi nó thực sự sai.
B. Xác suất không bác bỏ giả thuyết null khi nó thực sự sai.
C. Mức ý nghĩa của kiểm định.
D. Xác suất bác bỏ giả thuyết null khi nó thực sự đúng.

57. Khi nào chúng ta nên sử dụng tương quan Spearman thay vì tương quan Pearson?

A. Khi cần dự đoán giá trị của một biến từ biến khác.
B. Khi dữ liệu là thứ bậc, phân phối không chuẩn, hoặc mối quan hệ giữa các biến là phi tuyến tính nhưng đơn điệu.
C. Khi cần so sánh trung bình của hai nhóm định lượng.
D. Khi mối quan hệ giữa hai biến là tuyến tính và dữ liệu phân phối chuẩn.

58. Biến ngẫu nhiên rời rạc (discrete random variable) là gì?

A. Biến mà các giá trị có thể có của nó là một tập hợp các số hữu hạn hoặc đếm được.
B. Biến chỉ có một giá trị duy nhất.
C. Biến mà các giá trị có thể có của nó là bất kỳ số thực nào trong một khoảng.
D. Biến mà các giá trị của nó thể hiện các danh mục.

59. Phân phối Poisson thường được sử dụng để mô hình hóa loại sự kiện nào?

A. Số lần thành công trong một số lần thử cố định.
B. Số lần xảy ra một sự kiện hiếm trong một khoảng thời gian hoặc không gian cố định.
C. Thời gian chờ đợi giữa các sự kiện.
D. Kết quả của một biến ngẫu nhiên liên tục đối xứng.

60. Sai số chuẩn của trung bình mẫu (Standard Error of the Mean – SEM) cho biết điều gì?

A. Độ lệch chuẩn của dân số.
B. Kích thước của mẫu.
C. Độ chính xác của trung bình mẫu trong việc ước lượng trung bình dân số.
D. Độ lệch chuẩn của mẫu.

61. Thống kê mô tả (Descriptive Statistics) chủ yếu tập trung vào mục đích nào trong phân tích dữ liệu?

A. Tóm tắt và trình bày dữ liệu một cách có tổ chức, dễ hiểu
B. Đưa ra kết luận về tổng thể dựa trên mẫu dữ liệu
C. Dự đoán giá trị tương lai của một biến số
D. Kiểm định giả thuyết về mối quan hệ nhân quả

62. Đâu là loại dữ liệu định tính (Categorical Data) có thể được sắp xếp theo một thứ tự tự nhiên hoặc xếp hạng?

A. Dữ liệu tỷ lệ (Ratio data)
B. Dữ liệu định danh (Nominal data)
C. Dữ liệu thứ bậc (Ordinal data)
D. Dữ liệu khoảng (Interval data)

63. Chỉ số nào trong các chỉ số sau đây nhạy cảm nhất với các giá trị ngoại lai (outliers) trong một tập dữ liệu?

A. Trung vị (Median)
B. Mốt (Mode)
C. Trung bình cộng (Mean)
D. Khoảng tứ phân vị (Interquartile Range – IQR)

64. Khi nào thì trung vị (Median) được coi là một thước đo xu hướng trung tâm thích hợp hơn trung bình cộng (Mean)?

A. Khi dữ liệu có phân phối đối xứng hoàn hảo
B. Khi dữ liệu không chứa bất kỳ giá trị ngoại lai nào
C. Khi dữ liệu có nhiều giá trị ngoại lai hoặc phân phối lệch
D. Khi cần tính toán độ lệch chuẩn của dữ liệu

65. Giá trị P (P-value) trong kiểm định giả thuyết được định nghĩa là gì?

A. Xác suất bác bỏ giả thuyết không khi nó đúng
B. Xác suất thu được kết quả bằng hoặc cực đoan hơn kết quả quan sát, với giả định giả thuyết không là đúng
C. Ngưỡng ý nghĩa (Significance level) được xác định trước bởi nhà nghiên cứu
D. Xác suất chấp nhận giả thuyết không khi nó sai

66. Phân phối chuẩn (Normal Distribution) được mô tả bởi hai tham số chính nào?

A. Kích thước mẫu (n) và độ lệch chuẩn (σ)
B. Giá trị trung bình (μ) và độ lệch chuẩn (σ)
C. Giá trị trung bình (μ) và phương sai (σ²)
D. Hệ số tương quan (r) và độ dốc (b)

67. Định lý Giới hạn Trung tâm (Central Limit Theorem) phát biểu rằng điều gì xảy ra với phân phối lấy mẫu của trung bình mẫu khi kích thước mẫu đủ lớn?

A. Phân phối lấy mẫu sẽ trở nên vuông vắn, không có đuôi
B. Phân phối lấy mẫu sẽ luôn theo phân phối Student’s t
C. Phân phối lấy mẫu sẽ xấp xỉ phân phối chuẩn, bất kể hình dạng phân phối của tổng thể ban đầu
D. Độ lệch chuẩn của phân phối lấy mẫu sẽ tăng lên đáng kể

68. Lỗi loại I (Type I Error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết không (H₀) khi nó thực sự đúng
B. Chấp nhận giả thuyết không (H₀) khi nó thực sự sai
C. Bác bỏ giả thuyết thay thế (H₁) khi nó thực sự đúng
D. Chấp nhận giả thuyết thay thế (H₁) khi nó thực sự sai

69. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt về chiều cao trung bình giữa nam và nữ trong một trường đại học. Kiểm định thống kê nào là phù hợp nhất?

A. Kiểm định t một mẫu (One-sample t-test)
B. Kiểm định chi-bình phương (Chi-square test)
C. Kiểm định t hai mẫu độc lập (Independent samples t-test)
D. Phân tích phương sai (ANOVA)

70. Hệ số tương quan Pearson (Pearson’s r) đo lường điều gì giữa hai biến định lượng?

A. Độ dốc của mối quan hệ
B. Sức mạnh và chiều hướng của mối quan hệ tuyến tính
C. Tính phi tuyến tính của mối quan hệ
D. Mức độ biến thiên của một biến khi biến kia thay đổi

71. Khi xây dựng một khoảng tin cậy cho trung bình tổng thể, nếu muốn giảm chiều rộng của khoảng tin cậy mà không thay đổi mức độ tin cậy, chúng ta nên làm gì?

A. Giảm kích thước mẫu
B. Tăng kích thước mẫu
C. Giảm độ lệch chuẩn của tổng thể
D. Tăng mức độ tin cậy

72. Trong hồi quy tuyến tính đơn giản, hệ số xác định R² (Coefficient of Determination) giải thích điều gì?

A. Sự biến thiên của biến độc lập được giải thích bởi biến phụ thuộc
B. Phần trăm sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập
C. Mức độ biến thiên không được giải thích bởi mô hình
D. Độ lớn của mối quan hệ tuyến tính giữa hai biến

73. Điều nào sau đây là một đặc điểm của phân phối Student’s t so với phân phối chuẩn?

A. Phân phối Student’s t chỉ áp dụng cho kích thước mẫu lớn
B. Phân phối Student’s t có các đuôi dày hơn và độ rộng lớn hơn đối với bậc tự do nhỏ
C. Phân phối Student’s t không đối xứng
D. Giá trị trung bình của phân phối Student’s t luôn khác 0

74. Phương sai (Variance) của một tập dữ liệu đo lường điều gì?

A. Giá trị trung tâm của dữ liệu
B. Độ phân tán trung bình của dữ liệu so với giá trị trung bình
C. Mốt của phân phối dữ liệu
D. Giá trị lớn nhất trừ đi giá trị nhỏ nhất

75. Khi thu thập dữ liệu bằng cách chọn ngẫu nhiên 50 sinh viên từ mỗi khoa trong một trường đại học, phương pháp lấy mẫu nào đang được sử dụng?

A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phân tầng (Stratified sampling)
C. Lấy mẫu hệ thống (Systematic sampling)
D. Lấy mẫu cụm (Cluster sampling)

76. Phân tích phương sai (ANOVA) được sử dụng để kiểm định giả thuyết nào?

A. Sự khác biệt giữa hai trung bình tổng thể
B. Sự khác biệt giữa ba hoặc nhiều hơn các trung bình tổng thể
C. Mối quan hệ tuyến tính giữa hai biến định lượng
D. Sự độc lập giữa hai biến định tính

77. Độ lệch chuẩn (Standard Deviation) có đơn vị đo là gì?

A. Bình phương đơn vị của dữ liệu gốc
B. Cùng đơn vị với dữ liệu gốc
C. Không có đơn vị đo
D. Đơn vị logarit của dữ liệu gốc

78. Trong kiểm định giả thuyết, nếu giá trị P nhỏ hơn mức ý nghĩa (α), quyết định thống kê sẽ là gì?

A. Chấp nhận giả thuyết không (H₀)
B. Bác bỏ giả thuyết không (H₀)
C. Chấp nhận giả thuyết thay thế (H₁)
D. Không thể đưa ra kết luận

79. Hệ số biến thiên (Coefficient of Variation – CV) được sử dụng khi nào?

A. Để đo lường xu hướng trung tâm của dữ liệu
B. Để so sánh độ phân tán tương đối giữa các tập dữ liệu có đơn vị đo hoặc giá trị trung bình khác nhau
C. Để xác định hình dạng của phân phối dữ liệu
D. Để tính xác suất của một sự kiện

80. Mối quan hệ nào sau đây thể hiện tương quan âm hoàn hảo (Perfect Negative Correlation)?

A. Hệ số tương quan Pearson là +1
B. Hệ số tương quan Pearson là 0
C. Hệ số tương quan Pearson là -1
D. Hệ số tương quan Pearson là +0.5

81. Kỹ thuật đồ thị nào là phù hợp nhất để hiển thị phân phối của một biến định lượng liên tục?

A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ hộp (Box plot)
D. Biểu đồ tần số (Histogram)

82. Điều kiện tiên quyết chính để sử dụng kiểm định t hai mẫu độc lập là gì?

A. Các biến định tính
B. Dữ liệu phải có phân phối Poisson
C. Các phương sai của hai tổng thể là bằng nhau hoặc tương tự nhau (đã kiểm định) và các quan sát độc lập
D. Kích thước mẫu phải cực kỳ nhỏ

83. Chỉ số nào đo lường độ phân tán của dữ liệu dựa trên sự chênh lệch giữa các tứ phân vị?

A. Độ lệch chuẩn (Standard Deviation)
B. Phương sai (Variance)
C. Khoảng tứ phân vị (Interquartile Range – IQR)
D. Miền giá trị (Range)

84. Khi dữ liệu có phân phối lệch phải (positively skewed), mối quan hệ giữa trung bình, trung vị và mốt thường là gì?

A. Trung bình < Trung vị < Mốt
B. Trung bình ≈ Trung vị ≈ Mốt
C. Mốt < Trung vị < Trung bình
D. Mốt > Trung vị > Trung bình

85. Mục đích chính của việc tính toán độ tin cậy của một khoảng ước lượng (Confidence Interval) là gì?

A. Cung cấp một ước tính điểm chính xác của tham số tổng thể
B. Xác định xác suất giả thuyết không là đúng
C. Đưa ra một khoảng giá trị có khả năng chứa tham số tổng thể thực sự với một mức độ tin cậy nhất định
D. Kiểm tra mức độ tương quan giữa hai biến

86. Sai số chuẩn của trung bình mẫu (Standard Error of the Mean) đo lường điều gì?

A. Độ lệch chuẩn của tổng thể
B. Độ biến thiên của các mẫu dữ liệu khác nhau so với tổng thể
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu
D. Sai số xảy ra do lỗi trong quá trình thu thập dữ liệu

87. Khi nào thì nên sử dụng kiểm định chi-bình phương (Chi-square test)?

A. Để so sánh trung bình của hai nhóm
B. Để kiểm tra mối quan hệ giữa hai biến định tính
C. Để dự đoán giá trị của một biến liên tục
D. Để đánh giá sự khác biệt giữa các phương sai

88. Hệ số tương quan Spearman (Spearman’s Rho) được sử dụng để đo lường mối quan hệ nào?

A. Mối quan hệ tuyến tính giữa hai biến định lượng
B. Mối quan hệ phi tuyến tính giữa hai biến định lượng
C. Mối quan hệ đơn điệu giữa hai biến thứ bậc hoặc định lượng không theo phân phối chuẩn
D. Mối quan hệ nhân quả giữa các biến

89. Một nhà tiếp thị muốn kiểm tra hiệu quả của ba chiến dịch quảng cáo khác nhau (A, B, C) dựa trên doanh số bán hàng trung bình. Kiểm định thống kê nào phù hợp nhất?

A. Kiểm định t ghép cặp (Paired t-test)
B. Kiểm định t hai mẫu độc lập
C. Phân tích phương sai một chiều (One-way ANOVA)
D. Hồi quy tuyến tính

90. Ý nghĩa của mức ý nghĩa (Alpha Level, α) trong kiểm định giả thuyết là gì?

A. Xác suất mắc lỗi loại II
B. Xác suất chấp nhận giả thuyết không
C. Ngưỡng mà tại đó chúng ta bác bỏ giả thuyết không, đại diện cho xác suất tối đa chấp nhận mắc lỗi loại I
D. Xác suất giả thuyết thay thế là đúng

91. Trong thống kê học, sự khác biệt cơ bản giữa thống kê mô tả (descriptive statistics) và thống kê suy luận (inferential statistics) là gì?

A. Thống kê mô tả chỉ dùng cho dữ liệu định tính, trong khi thống kê suy luận dùng cho dữ liệu định lượng.
B. Thống kê mô tả tập trung vào việc tóm tắt và trình bày dữ liệu, còn thống kê suy luận nhằm mục đích đưa ra kết luận về tổng thể dựa trên dữ liệu mẫu.
C. Thống kê mô tả luôn yêu cầu kiểm định giả thuyết, còn thống kê suy luận thì không.
D. Thống kê mô tả chỉ sử dụng biểu đồ, trong khi thống kê suy luận chỉ sử dụng các con số.

92. Đại lượng đo lường nào sau đây không phải là một thước đo xu hướng trung tâm (measures of central tendency)?

A. Trung bình (Mean)
B. Trung vị (Median)
C. Độ lệch chuẩn (Standard Deviation)
D. Mốt (Mode)

93. Khi nào thì trung vị (median) được xem là thước đo xu hướng trung tâm phù hợp hơn trung bình (mean) cho một tập dữ liệu?

A. Khi tập dữ liệu có phân phối đối xứng.
B. Khi tập dữ liệu chứa các giá trị ngoại lai (outliers) hoặc có phân phối lệch (skewed distribution).
C. Khi tập dữ liệu có kích thước mẫu rất lớn.
D. Khi tất cả các giá trị trong tập dữ liệu đều bằng nhau.

94. Hệ số tương quan Pearson ‘r’ đo lường điều gì giữa hai biến định lượng?

A. Mức độ phụ thuộc nhân quả giữa hai biến.
B. Sức mạnh và hướng của mối quan hệ tuyến tính giữa hai biến.
C. Giá trị trung bình của mỗi biến.
D. Sự khác biệt về phương sai giữa hai biến.

95. Giả thuyết không (null hypothesis) trong kiểm định giả thuyết thường phát biểu điều gì?

A. Có một sự khác biệt đáng kể hoặc mối quan hệ tồn tại.
B. Không có sự khác biệt đáng kể hoặc mối quan hệ giữa các biến.
C. Kích thước mẫu là đủ lớn để rút ra kết luận.
D. Dữ liệu tuân theo phân phối chuẩn.

96. Sai lầm loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết không khi nó thực sự đúng.
B. Không bác bỏ giả thuyết không khi nó thực sự sai.
C. Bác bỏ giả thuyết thay thế khi nó thực sự đúng.
D. Không bác bỏ giả thuyết thay thế khi nó thực sự sai.

97. Điều nào sau đây là một đặc điểm của phân phối chuẩn (normal distribution)?

A. Luôn có dạng phân phối lệch trái.
B. Là một phân phối đối xứng, hình chuông, với trung bình, trung vị và mốt trùng nhau.
C. Chỉ áp dụng cho dữ liệu định tính.
D. Các giá trị đều có xác suất xảy ra bằng nhau.

98. Giá trị p (p-value) trong kiểm định giả thuyết được hiểu là gì?

A. Xác suất để giả thuyết không là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất quan sát được dữ liệu cực đoan hoặc cực đoan hơn dữ liệu đã quan sát, giả sử giả thuyết không là đúng.
D. Ngưỡng ý nghĩa (alpha level) của kiểm định.

99. Kỹ thuật lấy mẫu nào liên quan đến việc chia tổng thể thành các nhóm (cụm) không chồng lấn và sau đó chọn ngẫu nhiên một số nhóm để lấy toàn bộ các phần tử trong đó?

A. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling)
B. Lấy mẫu phân tầng (Stratified Sampling)
C. Lấy mẫu cụm (Cluster Sampling)
D. Lấy mẫu hệ thống (Systematic Sampling)

100. Độ tin cậy (confidence level) 95% trong khoảng tin cậy (confidence interval) có ý nghĩa gì?

A. Có 95% khả năng tham số tổng thể rơi vào khoảng đã tính.
B. Nếu lặp lại quá trình lấy mẫu và tính toán khoảng tin cậy nhiều lần, khoảng tin cậy của chúng ta sẽ chứa tham số tổng thể khoảng 95% số lần.
C. Có 95% số liệu mẫu nằm trong khoảng này.
D. Xác suất mắc sai lầm loại I là 5%.

101. Loại dữ liệu nào phù hợp nhất để sử dụng biểu đồ cột (bar chart) để hiển thị tần số?

A. Dữ liệu định lượng liên tục (ví dụ: chiều cao).
B. Dữ liệu định lượng rời rạc có nhiều giá trị khác nhau (ví dụ: tuổi).
C. Dữ liệu định tính hoặc định lượng rời rạc với số lượng danh mục/giá trị hạn chế (ví dụ: giới tính, loại sản phẩm).
D. Dữ liệu chuỗi thời gian (ví dụ: doanh thu qua các quý).

102. Nguyên lý định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì?

A. Tổng thể luôn có phân phối chuẩn, bất kể kích thước mẫu.
B. Đối với một kích thước mẫu đủ lớn, phân phối mẫu của trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể hình dạng của phân phối tổng thể ban đầu.
C. Độ lệch chuẩn của mẫu sẽ luôn bằng độ lệch chuẩn của tổng thể.
D. Trung bình mẫu sẽ luôn bằng trung bình tổng thể.

103. Phương pháp thống kê nào được sử dụng để kiểm tra mối quan hệ giữa một biến phụ thuộc định lượng và một hoặc nhiều biến độc lập định lượng?

A. Kiểm định Chi-bình phương (Chi-square test)
B. Phân tích hồi quy (Regression analysis)
C. Kiểm định t một mẫu (One-sample t-test)
D. Phân tích phương sai (ANOVA)

104. Khi nào thì một nhà nghiên cứu nên sử dụng kiểm định t cho hai mẫu độc lập (independent samples t-test)?

A. Khi so sánh trung bình của một mẫu với một giá trị giả định của tổng thể.
B. Khi so sánh trung bình của hai nhóm không liên quan với nhau.
C. Khi so sánh trung bình của hai phép đo lường trên cùng một nhóm đối tượng.
D. Khi kiểm tra mối quan hệ giữa hai biến định tính.

105. Chỉ số R-squared (R²) trong phân tích hồi quy tuyến tính cho chúng ta biết điều gì?

A. Độ dốc của đường hồi quy.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
C. Giá trị trung bình của biến phụ thuộc.
D. Mức độ tương quan giữa các biến độc lập.

106. Loại dữ liệu nào có thể được sắp xếp theo thứ tự, nhưng sự khác biệt giữa các giá trị không có ý nghĩa nhất quán?

A. Dữ liệu định danh (Nominal data)
B. Dữ liệu thứ bậc (Ordinal data)
C. Dữ liệu khoảng (Interval data)
D. Dữ liệu tỷ lệ (Ratio data)

107. Khi thực hiện kiểm định giả thuyết, nếu giá trị p nhỏ hơn mức ý nghĩa alpha (p < α), quyết định thống kê phổ biến nhất là gì?

A. Không bác bỏ giả thuyết không.
B. Bác bỏ giả thuyết không.
C. Chấp nhận giả thuyết không.
D. Tăng kích thước mẫu.

108. Thước đo nào sau đây nhạy cảm nhất với các giá trị ngoại lai trong một tập dữ liệu?

A. Mốt (Mode)
B. Trung vị (Median)
C. Trung bình (Mean)
D. Khoảng tứ phân vị (Interquartile Range – IQR)

109. Một nhà nghiên cứu muốn so sánh điểm trung bình của ba nhóm sinh viên khác nhau. Kiểm định thống kê nào là phù hợp nhất?

A. Kiểm định t cho một mẫu (One-sample t-test)
B. Kiểm định t cho hai mẫu độc lập (Independent samples t-test)
C. Phân tích phương sai một chiều (One-way ANOVA)
D. Kiểm định tương quan Pearson (Pearson correlation test)

110. Độ lệch chuẩn (standard deviation) của một mẫu được tính như thế nào?

A. Là bình phương của phương sai.
B. Là căn bậc hai của phương sai.
C. Là giá trị lớn nhất trừ đi giá trị nhỏ nhất trong mẫu.
D. Là trung bình của các giá trị tuyệt đối của độ lệch so với trung bình.

111. Loại biểu đồ nào hiệu quả nhất để hiển thị phân phối của một biến định lượng liên tục?

A. Biểu đồ tròn (Pie chart)
B. Biểu đồ cột (Bar chart)
C. Biểu đồ tần số (Histogram)
D. Biểu đồ đường (Line chart)

112. Mối quan hệ nhân quả (causation) có thể được suy luận trực tiếp từ một hệ số tương quan mạnh không?

A. Luôn luôn, một tương quan mạnh luôn chỉ ra mối quan hệ nhân quả.
B. Có, nhưng chỉ khi hệ số tương quan là 1 hoặc -1.
C. Không, tương quan chỉ cho thấy mối quan hệ, không nhất thiết là nhân quả.
D. Có, nếu p-value của hệ số tương quan nhỏ hơn 0.05.

113. Một tập dữ liệu có phân phối lệch phải (right-skewed) sẽ có đặc điểm nào về các thước đo xu hướng trung tâm?

A. Trung bình < Trung vị < Mốt.
B. Trung bình > Trung vị > Mốt.
C. Trung bình = Trung vị = Mốt.
D. Trung vị < Trung bình < Mốt.

114. Loại sai số nào phát sinh do quá trình chọn mẫu không hoàn hảo, dẫn đến mẫu không đại diện cho tổng thể?

A. Sai số đo lường (Measurement error)
B. Sai số lấy mẫu (Sampling error)
C. Sai số không lấy mẫu (Non-sampling error)
D. Sai số tính toán (Calculation error)

115. Phân phối Poisson thường được sử dụng để mô hình hóa loại sự kiện nào?

A. Số lần thành công trong một số lượng thử nghiệm cố định.
B. Thời gian chờ đợi giữa các sự kiện.
C. Số lần một sự kiện xảy ra trong một khoảng thời gian hoặc không gian cố định.
D. Sự xuất hiện của một kết quả nhị phân (có/không).

116. Biến nào sau đây được coi là biến định tính (categorical variable)?

A. Chiều cao của học sinh.
B. Nhiệt độ đo bằng độ C.
C. Màu sắc yêu thích (ví dụ: Đỏ, Xanh, Vàng).
D. Số lượng sách đã đọc trong một năm.

117. Khi kiểm định giả thuyết, nếu giá trị p lớn hơn mức ý nghĩa alpha (p > α), thì kết luận hợp lý nhất là gì?

A. Có bằng chứng mạnh mẽ để ủng hộ giả thuyết thay thế.
B. Không đủ bằng chứng để bác bỏ giả thuyết không.
C. Giả thuyết không là đúng.
D. Cần giảm mức ý nghĩa alpha.

118. Chức năng chính của biểu đồ hộp (box plot) là gì?

A. Hiển thị mối quan hệ giữa hai biến định lượng.
B. Trình bày phân phối tần số của dữ liệu định tính.
C. Trực quan hóa phân phối của một tập dữ liệu định lượng thông qua tứ phân vị và các giá trị ngoại lai.
D. Theo dõi sự thay đổi của một biến theo thời gian.

119. Trong hồi quy tuyến tính đơn, biến độc lập được gọi là gì?

A. Biến phản hồi (Response variable)
B. Biến giải thích (Explanatory variable)
C. Biến phụ thuộc (Dependent variable)
D. Biến ngoại lai (Extraneous variable)

120. Phép thử Chi-bình phương (Chi-square test) được sử dụng chủ yếu để làm gì?

A. So sánh trung bình của hai nhóm.
B. Đánh giá mối quan hệ tuyến tính giữa hai biến định lượng.
C. Kiểm tra mối quan hệ giữa hai biến định tính (phân loại).
D. Ước lượng tham số tổng thể.

121. Trong thống kê học, sự khác biệt giữa ‘quần thể’ và ‘mẫu’ là gì?

A. Quần thể là một tập hợp con của mẫu, được chọn ngẫu nhiên để nghiên cứu.
B. Mẫu là toàn bộ đối tượng quan tâm trong khi quần thể là một phần nhỏ được chọn ra.
C. Quần thể bao gồm tất cả các đơn vị được quan tâm trong một nghiên cứu, trong khi mẫu là một tập hợp con của quần thể được chọn để đại diện cho quần thể đó.
D. Mẫu và quần thể là hai thuật ngữ có thể thay thế cho nhau, không có sự khác biệt đáng kể.

122. Đại lượng đo lường nào sau đây thể hiện độ phân tán của dữ liệu xung quanh giá trị trung bình?

A. Trung vị.
B. Độ lệch chuẩn.
C. Yếu vị.
D. Khoảng biến thiên.

123. Một nhà nghiên cứu muốn khảo sát chiều cao trung bình của sinh viên đại học trên toàn quốc; việc thu thập dữ liệu từ một nhóm 500 sinh viên tại một trường đại học cụ thể được gọi là gì?

A. Tổng thể.
B. Quần thể mục tiêu.
C. Mẫu nghiên cứu.
D. Biến nghiên cứu.

124. Phân phối chuẩn (Normal distribution) có đặc điểm hình dạng như thế nào?

A. Đối xứng và có dạng hình chuông.
B. Lệch về bên trái với đuôi dài về bên phải.
C. Phân bố đều trên một khoảng xác định.
D. Lệch về bên phải với đuôi dài về bên trái.

125. Trong kiểm định giả thuyết thống kê, ‘mức ý nghĩa’ (significance level, α) đại diện cho điều gì?

A. Xác suất bác bỏ giả thuyết không khi nó đúng (lỗi loại I).
B. Xác suất chấp nhận giả thuyết không khi nó sai (lỗi loại II).
C. Độ lớn của hiệu ứng giữa các nhóm.
D. Kích thước mẫu cần thiết để đạt được kết quả có ý nghĩa.

126. Để xác định mối quan hệ tuyến tính giữa hai biến định lượng, phương pháp thống kê nào thường được sử dụng?

A. Kiểm định t-test.
B. Phân tích phương sai (ANOVA).
C. Phân tích tương quan và hồi quy.
D. Kiểm định chi-bình phương (Chi-square test).

127. Khi nào thì ‘trung vị’ (median) là một chỉ số tốt hơn ‘trung bình cộng’ (mean) để mô tả xu hướng trung tâm của dữ liệu?

A. Khi dữ liệu có phân phối đối xứng.
B. Khi dữ liệu có các giá trị ngoại lai (outliers) hoặc bị lệch.
C. Khi kích thước mẫu rất lớn.
D. Khi tất cả các giá trị dữ liệu đều giống nhau.

128. Một nhà sản xuất kem đánh răng muốn biết liệu loại kem mới có làm trắng răng hiệu quả hơn loại cũ hay không. Họ tiến hành thử nghiệm trên hai nhóm người dùng và so sánh mức độ trắng răng. Đây là loại kiểm định giả thuyết nào phù hợp nhất?

A. Kiểm định Chi-bình phương.
B. Kiểm định Tương quan Pearson.
C. Kiểm định t-test cho hai mẫu độc lập.
D. Phân tích hồi quy đơn.

129. Chỉ số nào sau đây không phải là một đại lượng đo lường xu hướng trung tâm của dữ liệu?

A. Trung bình cộng (Mean).
B. Trung vị (Median).
C. Yếu vị (Mode).
D. Khoảng tứ phân vị (Interquartile Range – IQR).

130. Khái niệm ‘sai số chuẩn của trung bình’ (standard error of the mean) cho chúng ta biết điều gì?

A. Độ phân tán của các giá trị riêng lẻ trong mẫu.
B. Độ chính xác của trung bình mẫu khi ước lượng trung bình quần thể.
C. Kích thước của sai số lấy mẫu ngẫu nhiên.
D. Phần trăm sai số tối đa trong quá trình đo lường.

131. Trong một nghiên cứu, biến số được phân loại là ‘số lượng học sinh trong một lớp học’ là loại biến nào?

A. Biến định tính (Categorical variable).
B. Biến định lượng liên tục (Continuous quantitative variable).
C. Biến định lượng rời rạc (Discrete quantitative variable).
D. Biến thứ tự (Ordinal variable).

132. Lỗi loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết không khi nó đúng.
B. Chấp nhận giả thuyết không khi nó sai.
C. Không đủ bằng chứng để bác bỏ giả thuyết không.
D. Phát hiện một hiệu ứng không tồn tại.

133. Hệ số tương quan Pearson (Pearson’s r) có giá trị nằm trong khoảng nào?

A. Từ 0 đến 1.
B. Từ -1 đến 1.
C. Từ -∞ đến +∞.
D. Chỉ có thể là 0 hoặc 1.

134. Khoảng tin cậy 95% cho trung bình của quần thể có ý nghĩa gì?

A. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
B. Nếu lấy nhiều mẫu và xây dựng các khoảng tin cậy tương ứng, khoảng 95% trong số đó sẽ chứa trung bình thực của quần thể.
C. Giá trị trung bình của quần thể chắc chắn nằm trong khoảng này.
D. Khoảng này chứa 95% tổng số các giá trị dữ liệu.

135. Phương pháp lấy mẫu nào sau đây yêu cầu chia quần thể thành các nhóm nhỏ (strata) không chồng chéo, sau đó lấy mẫu ngẫu nhiên đơn giản từ mỗi nhóm?

A. Lấy mẫu ngẫu nhiên đơn giản (Simple Random Sampling).
B. Lấy mẫu hệ thống (Systematic Sampling).
C. Lấy mẫu phân tầng (Stratified Sampling).
D. Lấy mẫu cụm (Cluster Sampling).

136. Giá trị p (p-value) trong kiểm định giả thuyết được diễn giải như thế nào?

A. Xác suất giả thuyết không đúng.
B. Xác suất quan sát được kết quả dữ liệu hoặc kết quả cực đoan hơn, giả sử giả thuyết không là đúng.
C. Xác suất giả thuyết thay thế đúng.
D. Giá trị tối thiểu mà một kiểm định thống kê phải đạt được để có ý nghĩa.

137. Mô hình hồi quy tuyến tính đơn có dạng Y = a + bX, trong đó ‘b’ đại diện cho điều gì?

A. Giá trị dự đoán của Y khi X bằng 0.
B. Độ dốc của đường hồi quy, cho biết mức độ thay đổi của Y khi X thay đổi một đơn vị.
C. Sai số ngẫu nhiên trong mô hình.
D. Hệ số tương quan giữa X và Y.

138. Trong thống kê mô tả, ‘tần số tương đối’ (relative frequency) là gì?

A. Số lần xuất hiện của một giá trị trong tập dữ liệu.
B. Tỷ lệ phần trăm của một giá trị hoặc khoảng giá trị trong tổng số các quan sát.
C. Tổng của tất cả các giá trị chia cho số lượng quan sát.
D. Điểm giữa của một khoảng giá trị.

139. Giả định cơ bản nào cần được thỏa mãn khi sử dụng kiểm định t-test cho hai mẫu độc lập?

A. Dữ liệu phải có phân phối Bernoulli.
B. Phương sai của hai quần thể phải bằng nhau (hoặc gần bằng nhau).
C. Các biến phải là định tính.
D. Kích thước mẫu phải cực kỳ nhỏ.

140. Biến nào sau đây được coi là biến định tính thứ tự (Ordinal categorical variable)?

A. Giới tính (Nam/Nữ).
B. Mức độ hài lòng (Rất không hài lòng, Không hài lòng, Bình thường, Hài lòng, Rất hài lòng).
C. Màu sắc yêu thích (Đỏ, Xanh, Vàng).
D. Nhiệt độ (Độ C).

141. Trong phân tích phương sai (ANOVA), giả thuyết không (H0) thường phát biểu điều gì?

A. Tất cả các trung bình quần thể đều khác nhau.
B. Ít nhất một trung bình quần thể khác với các trung bình khác.
C. Tất cả các trung bình quần thể đều bằng nhau.
D. Phương sai của các quần thể là khác nhau.

142. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?

A. Khi kích thước mẫu rất lớn.
B. Khi dữ liệu thỏa mãn các giả định về phân phối chuẩn và phương sai đồng nhất.
C. Khi các giả định về phân phối chuẩn không được thỏa mãn hoặc dữ liệu có tính chất thứ tự.
D. Khi muốn ước lượng các tham số quần thể.

143. Đồ thị nào sau đây là công cụ hiệu quả để trực quan hóa mối quan hệ giữa hai biến định lượng?

A. Biểu đồ cột (Bar chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ phân tán (Scatter plot).
D. Biểu đồ hộp (Box plot).

144. Hiện tượng ‘đa cộng tuyến’ (multicollinearity) trong hồi quy tuyến tính xảy ra khi nào?

A. Biến độc lập có mối tương quan mạnh với biến phụ thuộc.
B. Các biến độc lập trong mô hình có mối tương quan mạnh với nhau.
C. Phần dư (residuals) không có phân phối chuẩn.
D. Kích thước mẫu quá nhỏ so với số lượng biến.

145. Khái niệm ‘sai số lấy mẫu’ (sampling error) là gì?

A. Sai số do lỗi trong quá trình đo lường dữ liệu.
B. Sự khác biệt giữa thống kê mẫu và tham số quần thể tương ứng.
C. Sai số do không bao phủ toàn bộ quần thể trong mẫu.
D. Sai số do lựa chọn sai phương pháp thống kê.

146. Độ nhọn (Kurtosis) trong phân phối dữ liệu mô tả đặc điểm nào?

A. Mức độ đối xứng của phân phối.
B. Chiều cao và độ nhọn của đỉnh phân phối, cũng như độ dày của các đuôi.
C. Độ trải rộng của dữ liệu.
D. Giá trị trung tâm của phân phối.

147. Trong thống kê, ‘ước lượng điểm’ (point estimate) là gì?

A. Một khoảng giá trị mà tham số quần thể có thể nằm trong đó.
B. Một giá trị đơn lẻ được tính từ mẫu để ước lượng một tham số quần thể.
C. Mức độ tin cậy của một ước lượng.
D. Giá trị trung bình của nhiều ước lượng khác nhau.

148. Kiểm định Chi-bình phương (Chi-square test) được sử dụng chủ yếu để làm gì?

A. So sánh trung bình của hai nhóm.
B. Phân tích mối quan hệ giữa hai biến định lượng.
C. Kiểm tra mối quan hệ giữa hai biến định tính (phân loại).
D. Ước lượng khoảng tin cậy cho phương sai.

149. Đâu là ưu điểm chính của việc sử dụng mẫu lớn trong nghiên cứu thống kê?

A. Giảm thiểu chi phí và thời gian thu thập dữ liệu.
B. Tăng cường độ tin cậy và độ chính xác của ước lượng tham số quần thể.
C. Đảm bảo dữ liệu luôn có phân phối chuẩn.
D. Loại bỏ hoàn toàn sai số lấy mẫu.

150. Hệ số xác định (R-squared) trong hồi quy tuyến tính cho chúng ta biết điều gì?

A. Mức độ biến thiên của biến độc lập được giải thích bởi biến phụ thuộc.
B. Mức độ biến thiên của biến phụ thuộc được giải thích bởi biến độc lập (hoặc các biến độc lập) trong mô hình.
C. Tổng sai số của mô hình hồi quy.
D. Giá trị trung bình của biến phụ thuộc.

Số câu đã làm: 0/0
Thời gian còn lại: 00:00:00
  • Đã làm
  • Chưa làm
  • Cần kiểm tra lại
© 2026 Trending New 24h • Tạo ra với GeneratePress

Bạn ơi!!! Để xem được kết quả, bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

HƯỚNG DẪN TÌM MẬT KHẨU

Đang tải nhiệm vụ...

Bước 1: Mở tab mới và truy cập Google.com. Sau đó tìm kiếm chính xác từ khóa sau:

Bước 2: Tìm và click vào kết quả có trang web giống như hình ảnh dưới đây:

Hướng dẫn tìm kiếm

Bước 3: Kéo xuống cuối trang đó để tìm mật khẩu như hình ảnh hướng dẫn:

Hướng dẫn lấy mật khẩu

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác nhé.