1. Độ lệch (skewness) của một phân phối cho biết điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình
B. Mức độ phân tán của dữ liệu
C. Mức độ bất đối xứng của phân phối
D. Số lượng giá trị ngoại lệ
2. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến nào?
A. Biến định lượng liên tục
B. Biến định tính có hai giá trị (binary)
C. Biến định tính có nhiều hơn hai giá trị
D. Biến thứ bậc (ordinal)
3. Khi nào nên sử dụng kiểm định Chi-square?
A. Để so sánh trung bình của hai nhóm độc lập
B. Để kiểm tra mối quan hệ giữa hai biến định tính
C. Để dự đoán giá trị của một biến định lượng dựa trên một biến định tính
D. Để đo lường mức độ tương quan giữa hai biến định lượng
4. Mục đích của việc chuẩn hóa dữ liệu (data standardization) là gì?
A. Để thay đổi đơn vị đo của dữ liệu
B. Để đưa dữ liệu về cùng một thang đo, giúp so sánh và phân tích dễ dàng hơn
C. Để loại bỏ các giá trị ngoại lệ
D. Để làm cho dữ liệu tuân theo phân phối chuẩn
5. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến
B. Mức độ phù hợp của mô hình hồi quy
C. Mức độ tuyến tính của mối quan hệ giữa hai biến định lượng
D. Sự khác biệt giữa hai nhóm
6. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Giá trị lớn nhất (Maximum value)
C. Độ lệch chuẩn (Standard deviation)
D. Tần số (Frequency)
7. Sai số loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết H0 khi nó đúng
B. Chấp nhận giả thuyết H0 khi nó đúng
C. Không bác bỏ giả thuyết H0 khi nó sai
D. Bác bỏ giả thuyết H1 khi nó đúng
8. Trong phân tích phương sai (ANOVA), giả thuyết H0 thường là gì?
A. Tất cả các trung bình của các nhóm đều khác nhau
B. Ít nhất một trung bình của các nhóm khác với các trung bình còn lại
C. Tất cả các trung bình của các nhóm đều bằng nhau
D. Phương sai của các nhóm khác nhau
9. Loại biểu đồ nào phù hợp nhất để thể hiện sự thay đổi của một biến theo thời gian?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ đường (Line chart)
C. Biểu đồ tròn (Pie chart)
D. Biểu đồ phân tán (Scatter plot)
10. Khi nào nên sử dụng kiểm định t (t-test) cho hai mẫu độc lập?
A. Khi so sánh trung bình của hai mẫu có liên quan
B. Khi so sánh phương sai của hai mẫu
C. Khi so sánh trung bình của hai mẫu độc lập và kích thước mẫu nhỏ
D. Khi kiểm tra mối quan hệ giữa hai biến định tính
11. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc không tuân theo phân phối chuẩn
B. Khi có mối tương quan cao giữa các biến độc lập
C. Khi số lượng biến độc lập quá ít
D. Khi sai số có phương sai thay đổi
12. Sai số loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai
B. Bác bỏ giả thuyết H0 khi nó đúng
C. Không bác bỏ giả thuyết H0 khi nó sai
D. Bác bỏ giả thuyết H0 khi nó đúng
13. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Sự thay đổi của biến phụ thuộc khi biến độc lập tăng một đơn vị
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0
C. Mức độ phù hợp của mô hình hồi quy
D. Sai số chuẩn của các hệ số hồi quy
14. Trong phân tích hồi quy, hệ số R bình phương (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình
C. Sai số chuẩn của các hệ số hồi quy
D. Mức ý nghĩa của mô hình
15. Giá trị p (p-value) trong kiểm định giả thuyết thể hiện điều gì?
A. Xác suất giả thuyết H0 là đúng
B. Xác suất mắc lỗi loại II
C. Xác suất thu được kết quả như quan sát (hoặc cực đoan hơn) nếu giả thuyết H0 là đúng
D. Xác suất bác bỏ giả thuyết H0 khi nó sai
16. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn
C. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn
D. Để đo lường mối quan hệ giữa hai biến định lượng
17. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy
B. Phân tích phương sai (ANOVA)
C. Phân tích thành phần chính (Principal Component Analysis – PCA)
D. Kiểm định Chi-square
18. Loại biểu đồ nào sau đây thích hợp nhất để so sánh tỷ lệ giữa các nhóm khác nhau?
A. Biểu đồ đường (Line chart)
B. Biểu đồ hộp (Box plot)
C. Biểu đồ tròn (Pie chart)
D. Biểu đồ phân tán (Scatter plot)
19. Trong thống kê suy diễn, mục tiêu chính là gì?
A. Mô tả các đặc điểm của mẫu
B. Thu thập dữ liệu từ tổng thể
C. Suy luận về tổng thể dựa trên thông tin từ mẫu
D. Tính toán các thống kê mô tả
20. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. So sánh phương sai của hai mẫu
B. So sánh trung bình của ba nhóm trở lên
C. Đo lường mối quan hệ giữa hai biến định lượng
D. Kiểm tra tính độc lập của hai biến định tính
21. Trong phân tích sống còn (survival analysis), hàm sống còn (survival function) biểu thị điều gì?
A. Thời gian trung bình sống sót
B. Xác suất một cá nhân sống sót ít nhất một khoảng thời gian nhất định
C. Tỷ lệ tử vong tại một thời điểm cụ thể
D. Nguy cơ tử vong tại một thời điểm cụ thể
22. Độ tin cậy (Confidence interval) cho biết điều gì?
A. Khoảng giá trị mà chúng ta tin rằng chứa giá trị trung bình của mẫu
B. Khoảng giá trị mà chúng ta tin rằng chứa giá trị trung bình của tổng thể với một mức độ tin cậy nhất định
C. Xác suất mà giả thuyết H0 là đúng
D. Sai số chuẩn của ước lượng
23. Trong kiểm định giả thuyết, ‘mức ý nghĩa (alpha)’ đại diện cho điều gì?
A. Xác suất mắc lỗi loại II
B. Xác suất chấp nhận giả thuyết H0 khi nó đúng
C. Xác suất bác bỏ giả thuyết H0 khi nó đúng
D. Xác suất chấp nhận giả thuyết H0 khi nó sai
24. Ưu điểm chính của việc sử dụng phương pháp lấy mẫu ngẫu nhiên là gì?
A. Đảm bảo mẫu đại diện chính xác cho tổng thể
B. Giảm thiểu sai số hệ thống
C. Tiết kiệm chi phí và thời gian
D. Tất cả các đáp án trên
25. Phương pháp nào sau đây được sử dụng để giảm ảnh hưởng của các giá trị ngoại lệ (outliers) trong phân tích dữ liệu?
A. Sử dụng giá trị trung bình (mean)
B. Sử dụng độ lệch chuẩn (standard deviation)
C. Sử dụng trung vị (median)
D. Sử dụng phương sai (variance)
26. Kurtosis của một phân phối cho biết điều gì?
A. Mức độ tập trung của dữ liệu xung quanh giá trị trung bình
B. Mức độ nhọn của đỉnh phân phối so với phân phối chuẩn
C. Mức độ bất đối xứng của phân phối
D. Số lượng giá trị ngoại lệ
27. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi các giả định của kiểm định tham số không được đáp ứng
D. Khi cần tính toán khoảng tin cậy
28. Điều gì xảy ra với độ rộng của khoảng tin cậy khi kích thước mẫu tăng lên?
A. Độ rộng tăng lên
B. Độ rộng giảm xuống
C. Độ rộng không đổi
D. Không thể xác định
29. Thang đo nào sau đây là thang đo định danh (nominal scale)?
A. Nhiệt độ (độ C)
B. Thu nhập (VNĐ)
C. Mức độ hài lòng (1-5)
D. Giới tính (Nam/Nữ)
30. Trong phân tích bảng chéo (cross-tabulation), thống kê nào thường được sử dụng để kiểm tra mối quan hệ giữa hai biến định tính?
A. Hệ số tương quan Pearson
B. Kiểm định t
C. Kiểm định Chi-square
D. Phân tích phương sai (ANOVA)
31. Khi thực hiện kiểm định giả thuyết một đuôi (one-tailed test), điều gì khác biệt so với kiểm định hai đuôi (two-tailed test)?
A. Kiểm định một đuôi chỉ kiểm tra sự khác biệt theo một hướng cụ thể
B. Kiểm định một đuôi luôn có giá trị p nhỏ hơn kiểm định hai đuôi
C. Kiểm định một đuôi chỉ sử dụng khi kích thước mẫu lớn
D. Kiểm định một đuôi không sử dụng giá trị p
32. Khi nào nên sử dụng kiểm định t Student thay vì kiểm định z?
A. Khi kích thước mẫu lớn (n > 30)
B. Khi phương sai của quần thể đã biết
C. Khi so sánh hai quần thể độc lập
D. Khi kích thước mẫu nhỏ (n < 30) và phương sai của quần thể chưa biết
33. Khi nào thì việc sử dụng kiểm định Kruskal-Wallis phù hợp?
A. Khi so sánh giá trị trung bình của hai mẫu độc lập có phân phối chuẩn
B. Khi so sánh giá trị trung bình của ba hoặc nhiều mẫu độc lập có phân phối chuẩn
C. Khi so sánh ba hoặc nhiều mẫu độc lập không có phân phối chuẩn
D. Khi so sánh hai mẫu phụ thuộc không có phân phối chuẩn
34. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Có 95% khả năng giá trị trung bình của mẫu nằm trong khoảng này
B. Có 95% khả năng giá trị trung bình của quần thể nằm trong khoảng này
C. Có 5% khả năng giá trị trung bình của quần thể nằm ngoài khoảng này
D. Cả B và C
35. Khi nào thì việc sử dụng kiểm định Mann-Whitney U phù hợp?
A. Khi so sánh giá trị trung bình của hai mẫu độc lập có phân phối chuẩn
B. Khi so sánh giá trị trung bình của hai mẫu phụ thuộc có phân phối chuẩn
C. Khi so sánh hai mẫu độc lập không có phân phối chuẩn
D. Khi so sánh hai mẫu phụ thuộc không có phân phối chuẩn
36. Khi nào thì việc sử dụng kiểm định Wilcoxon signed-rank test phù hợp?
A. Khi so sánh giá trị trung bình của hai mẫu độc lập có phân phối chuẩn
B. Khi so sánh giá trị trung bình của hai mẫu phụ thuộc có phân phối chuẩn
C. Khi so sánh hai mẫu độc lập không có phân phối chuẩn
D. Khi so sánh hai mẫu phụ thuộc không có phân phối chuẩn
37. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa hai biến định tính?
A. Phân tích phương sai (ANOVA)
B. Kiểm định Chi-bình phương
C. Hồi quy tuyến tính
D. Kiểm định t Student
38. Sai số loại II (Type II error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không đúng khi nó thực sự đúng
B. Chấp nhận giả thuyết không đúng khi nó thực sự sai
C. Bác bỏ giả thuyết không đúng khi nó thực sự sai
D. Không bác bỏ giả thuyết không đúng khi nó thực sự sai
39. Trong phân tích đường dẫn (path analysis), mục tiêu chính là gì?
A. Xác định mối quan hệ nhân quả giữa các biến
B. Tìm ra các nhóm (cụm) có đặc điểm tương đồng trong một tập dữ liệu
C. Dự đoán giá trị của một biến dựa trên các biến khác
D. Kiểm tra giả thuyết về sự khác biệt giữa các nhóm
40. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc tương quan cao với nhau
B. Khi các biến độc lập tương quan cao với nhau
C. Khi có nhiều giá trị ngoại lệ trong dữ liệu
D. Khi mô hình hồi quy không phù hợp với dữ liệu
41. Điều gì xảy ra với độ rộng của khoảng tin cậy khi tăng kích thước mẫu?
A. Độ rộng của khoảng tin cậy tăng lên
B. Độ rộng của khoảng tin cậy giảm xuống
C. Độ rộng của khoảng tin cậy không thay đổi
D. Không thể xác định
42. Trong phân tích trung gian (mediation analysis), biến trung gian có vai trò gì?
A. Giải thích mối quan hệ giữa biến độc lập và biến phụ thuộc
B. Làm mạnh thêm mối quan hệ giữa biến độc lập và biến phụ thuộc
C. Làm yếu đi mối quan hệ giữa biến độc lập và biến phụ thuộc
D. Không ảnh hưởng đến mối quan hệ giữa biến độc lập và biến phụ thuộc
43. Ý nghĩa của hệ số tương quan Pearson là gì?
A. Đo lường độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
B. Đo lường độ mạnh của mối quan hệ phi tuyến tính giữa hai biến định lượng
C. Đo lường sự khác biệt giữa giá trị trung bình của hai nhóm
D. Đo lường tần suất xuất hiện của một biến cố
44. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Giá trị trung bình
45. Trong lý thuyết xác suất, quy tắc cộng (addition rule) được sử dụng để tính xác suất của sự kiện nào?
A. Xác suất của cả hai sự kiện A và B xảy ra
B. Xác suất của sự kiện A hoặc sự kiện B xảy ra (hoặc cả hai)
C. Xác suất của sự kiện A xảy ra khi biết sự kiện B đã xảy ra
D. Xác suất của sự kiện A không xảy ra
46. Trong phân tích phương sai lặp lại (repeated measures ANOVA), điều gì được đo lường lặp đi lặp lại?
A. Các biến khác nhau trên cùng một đối tượng
B. Cùng một biến trên các đối tượng khác nhau
C. Cùng một biến trên cùng một đối tượng tại các thời điểm khác nhau
D. Các biến khác nhau trên các đối tượng khác nhau
47. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa một biến phụ thuộc định lượng và một hoặc nhiều biến độc lập định tính?
A. Phân tích hồi quy tuyến tính
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương
D. Phân tích tương quan
48. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Mức ý nghĩa thống kê của mô hình
D. Độ chính xác của các hệ số hồi quy
49. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu lớn trong khi vẫn giữ lại phần lớn thông tin?
A. Phân tích hồi quy
B. Phân tích thành phần chính (Principal Component Analysis – PCA)
C. Kiểm định t Student
D. Phân tích phương sai (ANOVA)
50. Sai số loại I (Type I error) trong kiểm định giả thuyết là gì?
A. Bác bỏ giả thuyết không đúng khi nó thực sự đúng
B. Chấp nhận giả thuyết không đúng khi nó thực sự sai
C. Bác bỏ giả thuyết không đúng khi nó thực sự sai
D. Chấp nhận giả thuyết không đúng khi nó thực sự đúng
51. Trong phân tích hồi quy logistic, biến phụ thuộc có đặc điểm gì?
A. Là biến định lượng liên tục
B. Là biến định tính có hai giá trị (binary)
C. Là biến định tính có nhiều hơn hai giá trị
D. Là biến thứ bậc
52. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết không đúng là đúng
B. Xác suất bác bỏ giả thuyết không đúng
C. Xác suất thu được kết quả quan sát được (hoặc kết quả cực đoan hơn) nếu giả thuyết không đúng là đúng
D. Xác suất giả thuyết không đúng là sai
53. Mục đích của việc chuẩn hóa dữ liệu (ví dụ: z-score) là gì?
A. Để loại bỏ các giá trị ngoại lệ
B. Để chuyển đổi dữ liệu về cùng một đơn vị đo lường và có giá trị trung bình là 0 và độ lệch chuẩn là 1
C. Để làm cho dữ liệu tuân theo phân phối chuẩn
D. Để tăng độ chính xác của các phép tính thống kê
54. Phương pháp nào sau đây được sử dụng để xác định xem một tập dữ liệu có tuân theo phân phối chuẩn hay không?
A. Biểu đồ tần số
B. Biểu đồ phân tán
C. Kiểm định Shapiro-Wilk
D. Kiểm định t Student
55. Phương pháp lấy mẫu nào đảm bảo mọi thành viên của quần thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện
B. Lấy mẫu phân tầng
C. Lấy mẫu ngẫu nhiên đơn giản
D. Lấy mẫu cụm
56. Trong phân tích phương sai (ANOVA), yếu tố nào sau đây được so sánh để xác định xem có sự khác biệt đáng kể giữa các nhóm hay không?
A. Phương sai giữa các nhóm và phương sai trong từng nhóm
B. Giá trị trung bình của các nhóm và độ lệch chuẩn của các nhóm
C. Trung vị của các nhóm và khoảng tứ phân vị của các nhóm
D. Tổng của các nhóm và kích thước của các nhóm
57. Khi nào thì việc sử dụng thống kê phi tham số là phù hợp hơn thống kê tham số?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc có thang đo thứ bậc
D. Khi cần tính toán nhanh chóng
58. Trong phân tích cụm (cluster analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến dựa trên các biến khác
B. Tìm ra các nhóm (cụm) có đặc điểm tương đồng trong một tập dữ liệu
C. Xác định mối quan hệ nhân quả giữa các biến
D. Kiểm tra giả thuyết về sự khác biệt giữa các nhóm
59. Loại biểu đồ nào thích hợp nhất để so sánh tỷ lệ phần trăm của các danh mục khác nhau trong một tập dữ liệu?
A. Biểu đồ đường
B. Biểu đồ hộp
C. Biểu đồ tròn
D. Biểu đồ tần số
60. Trong phân tích dữ liệu bảng (panel data), điều gì làm cho nó khác biệt so với dữ liệu chuỗi thời gian (time series) hoặc dữ liệu cắt ngang (cross-sectional)?
A. Dữ liệu bảng chỉ sử dụng các biến định tính
B. Dữ liệu bảng kết hợp cả chiều thời gian và chiều không gian (các đơn vị quan sát khác nhau)
C. Dữ liệu bảng không bị ảnh hưởng bởi các yếu tố ngoại sinh
D. Dữ liệu bảng luôn có kích thước lớn hơn
61. Khi nào nên sử dụng kiểm định Friedman?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của ba mẫu trở lên phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
62. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt giữa trung bình của hai nhóm.
D. Mức độ phù hợp của mô hình hồi quy.
63. Phương pháp lấy mẫu nào đảm bảo mỗi thành viên của tổng thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (convenience sampling)
B. Lấy mẫu phân tầng (stratified sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (simple random sampling)
D. Lấy mẫu định mức (quota sampling)
64. Trong phân tích yếu tố (factor analysis), mục tiêu chính là gì?
A. Dự đoán giá trị của một biến dựa trên giá trị của các biến khác.
B. Giảm số lượng biến bằng cách tìm ra các yếu tố tiềm ẩn giải thích sự tương quan giữa các biến.
C. So sánh trung bình của nhiều nhóm.
D. Kiểm tra mối quan hệ giữa hai biến định tính.
65. Khi nào nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
66. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Mối quan hệ tuyến tính hoàn hảo giữa biến độc lập và biến phụ thuộc.
B. Mối quan hệ tuyến tính mạnh mẽ giữa các biến độc lập.
C. Sự thay đổi phương sai của sai số.
D. Sự thiếu dữ liệu trong tập dữ liệu.
67. Sai số loại II (Type II error) xảy ra khi nào?
A. Bác bỏ giả thuyết null khi nó đúng.
B. Không bác bỏ giả thuyết null khi nó sai.
C. Chọn một mức ý nghĩa (alpha) quá cao.
D. Mẫu nghiên cứu quá nhỏ.
68. Ý nghĩa của khoảng tin cậy (confidence interval) là gì?
A. Xác suất một tham số tổng thể nằm trong khoảng đó.
B. Một khoảng giá trị mà chúng ta tin rằng tham số tổng thể nằm trong đó với một mức độ tin cậy nhất định.
C. Mức ý nghĩa thống kê của một kiểm định.
D. Sai số chuẩn của trung bình mẫu.
69. Trong phân tích đường dẫn (path analysis), mục tiêu chính là gì?
A. Xác định mối quan hệ nhân quả giữa các biến.
B. Giảm số lượng biến bằng cách tìm ra các yếu tố tiềm ẩn.
C. So sánh trung bình của nhiều nhóm.
D. Kiểm tra mối quan hệ giữa hai biến định tính.
70. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính tin cậy (reliability) của một thang đo?
A. Kiểm định t
B. Hệ số Cronbach’s Alpha
C. Phân tích phương sai (ANOVA)
D. Hồi quy tuyến tính
71. Khi nào nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi kích thước mẫu lớn (n > 30).
B. Khi biết độ lệch chuẩn của tổng thể.
C. Khi kích thước mẫu nhỏ (n < 30) và độ lệch chuẩn của tổng thể không được biết.
D. Khi so sánh trung bình của hai tổng thể độc lập.
72. Trong thống kê mô tả, tứ phân vị (quartiles) được sử dụng để làm gì?
A. Tính giá trị trung bình.
B. Đo độ lệch chuẩn.
C. Chia dữ liệu thành bốn phần bằng nhau.
D. Xác định giá trị lớn nhất và nhỏ nhất.
73. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Kiểm tra mối quan hệ giữa hai biến định tính.
B. So sánh trung bình của hai nhóm.
C. So sánh trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của một biến dựa trên giá trị của biến khác.
74. Ý nghĩa của độ lệch chuẩn (standard deviation) là gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Số trung vị của một tập dữ liệu.
C. Mức độ phân tán của dữ liệu so với giá trị trung bình.
D. Phần trăm số lượng mẫu trong tập dữ liệu.
75. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Mức ý nghĩa thống kê được chọn trước.
C. Xác suất quan sát được kết quả cực đoan như kết quả đã quan sát, hoặc cực đoan hơn, nếu giả thuyết null là đúng.
D. Sai số loại I.
76. Trong phân tích dữ liệu định tính, mã hóa (coding) là quá trình như thế nào?
A. Chuyển đổi dữ liệu định tính thành dữ liệu định lượng.
B. Gán nhãn hoặc tên cho các đoạn văn bản để xác định các chủ đề và mẫu.
C. Sử dụng phần mềm thống kê để phân tích dữ liệu.
D. Xóa bỏ các thông tin không liên quan khỏi dữ liệu.
77. Phương pháp thống kê nào phù hợp nhất để kiểm tra mối quan hệ giữa hai biến định tính?
A. Hệ số tương quan Pearson
B. Kiểm định t
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
78. Ý nghĩa của hệ số xác định (R-squared) trong hồi quy tuyến tính là gì?
A. Độ dốc của đường hồi quy.
B. Mức độ phù hợp của mô hình hồi quy, tức là tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Sai số chuẩn của các hệ số hồi quy.
D. Mức ý nghĩa thống kê của mô hình hồi quy.
79. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi tất cả các biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình hồi quy.
D. Sai số chuẩn của các hệ số hồi quy.
80. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
81. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi kích thước mẫu lớn.
C. Khi các giả định của kiểm định tham số không được đáp ứng.
D. Khi muốn so sánh trung bình của hai nhóm.
82. Phương pháp nào sau đây thường được sử dụng để kiểm tra tính hợp lệ (validity) của một thang đo?
A. Kiểm định t
B. Hệ số Cronbach’s Alpha
C. Phân tích yếu tố khẳng định (confirmatory factor analysis)
D. Hồi quy tuyến tính
83. Trong phân tích phương sai đa biến (MANOVA), mục tiêu chính là gì?
A. So sánh trung bình của hai nhóm.
B. So sánh trung bình của ba nhóm trở lên trên một biến phụ thuộc.
C. So sánh trung bình của ba nhóm trở lên trên nhiều biến phụ thuộc cùng một lúc.
D. Kiểm tra mối quan hệ giữa hai biến định tính.
84. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai nhóm phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
C. Để so sánh trung bình của ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn.
D. Để kiểm tra mối quan hệ giữa hai biến định tính.
85. Thang đo nào sau đây được sử dụng để phân loại các biến thành các danh mục không có thứ tự?
A. Thang đo tỷ lệ
B. Thang đo thứ bậc
C. Thang đo danh nghĩa
D. Thang đo khoảng
86. Phương pháp nào sau đây được sử dụng để giảm nguy cơ sai số loại I trong các kiểm định đa so sánh?
A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Hiệu chỉnh Bonferroni
D. Hồi quy tuyến tính
87. Ý nghĩa của hệ số V của Cramer là gì?
A. Đo lường mức độ phù hợp của mô hình hồi quy.
B. Đo lường mức độ mạnh của mối quan hệ giữa hai biến định lượng.
C. Đo lường mức độ mạnh của mối quan hệ giữa hai biến định tính.
D. Đo lường sự khác biệt giữa trung bình của hai nhóm.
88. Mục đích của việc chuẩn hóa dữ liệu (data normalization) là gì?
A. Loại bỏ các giá trị ngoại lệ.
B. Chuyển đổi dữ liệu về một thang đo chung để so sánh và phân tích dễ dàng hơn.
C. Tăng kích thước mẫu.
D. Đảm bảo dữ liệu tuân theo phân phối chuẩn.
89. Phương pháp nào sau đây được sử dụng để khám phá cấu trúc ẩn trong một tập dữ liệu lớn bằng cách nhóm các đối tượng tương tự lại với nhau?
A. Phân tích hồi quy
B. Phân tích cụm (cluster analysis)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
90. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến định lượng liên tục.
B. Biến định tính nhị phân (binary).
C. Biến định tính đa danh mục (categorical).
D. Biến thứ bậc (ordinal).
91. Trong phân tích hồi quy, ‘sai số chuẩn’ (standard error) của hệ số hồi quy đo lường điều gì?
A. Độ lớn của hệ số hồi quy.
B. Mức độ phù hợp của mô hình hồi quy.
C. Độ chính xác của ước lượng hệ số hồi quy.
D. Mức độ quan trọng của biến độc lập.
92. Phương pháp nào sau đây được sử dụng để kiểm tra sự khác biệt giữa tỷ lệ của hai nhóm?
A. Kiểm định t (t-test).
B. Kiểm định z (z-test) cho tỷ lệ.
C. Phân tích phương sai (ANOVA).
D. Phân tích hồi quy (Regression analysis).
93. Trong thống kê, thuật ngữ ‘phân phối lấy mẫu’ (sampling distribution) đề cập đến điều gì?
A. Phân phối của dữ liệu trong mẫu.
B. Phân phối của các thống kê mẫu (ví dụ: trung bình mẫu) từ tất cả các mẫu có thể có cùng kích thước được lấy từ một tổng thể.
C. Phân phối của dữ liệu trong tổng thể.
D. Phân phối của sai số.
94. Ý nghĩa của ‘khoảng tin cậy 95%’ (95% confidence interval) là gì?
A. Xác suất tham số tổng thể nằm trong khoảng đó là 95%.
B. 95% các mẫu sẽ cho ra khoảng tin cậy chứa tham số tổng thể.
C. 5% các mẫu sẽ cho ra khoảng tin cậy không chứa tham số tổng thể.
D. Cả B và C đều đúng.
95. Trong thống kê, ‘phương sai’ (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
C. Xu hướng trung tâm của dữ liệu.
D. Mối quan hệ giữa hai biến.
96. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để kiểm tra điều gì?
A. Sự khác biệt giữa giá trị trung bình của hai mẫu.
B. Mối quan hệ giữa hai biến định lượng.
C. Sự độc lập giữa hai biến định tính.
D. Sự phù hợp của dữ liệu với phân phối chuẩn.
97. Trong thống kê, ‘độ lệch chuẩn’ (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu.
B. Mức độ phân tán trung bình của dữ liệu xung quanh giá trị trung bình.
C. Xu hướng trung tâm của dữ liệu.
D. Mối quan hệ giữa hai biến.
98. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến định lượng liên tục.
B. Biến định tính nhị phân (binary).
C. Biến định tính đa danh mục (categorical).
D. Biến thứ bậc (ordinal).
99. Ý nghĩa của thuật ngữ ‘bậc tự do’ (degrees of freedom) trong thống kê là gì?
A. Số lượng biến trong một tập dữ liệu.
B. Số lượng quan sát trong một mẫu.
C. Số lượng giá trị trong tính toán cuối cùng của một thống kê có thể tự do thay đổi.
D. Mức ý nghĩa được sử dụng trong kiểm định giả thuyết.
100. Trong phân tích dữ liệu, ‘phân phối chuẩn’ (normal distribution) còn được gọi là gì?
A. Phân phối Poisson.
B. Phân phối Bernoulli.
C. Phân phối Gaussian.
D. Phân phối nhị thức.
101. Trong phân tích hồi quy, hệ số R-bình phương (R-squared) đo lường điều gì?
A. Mối quan hệ nhân quả giữa các biến.
B. Tầm quan trọng của các biến độc lập.
C. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
D. Sai số chuẩn của ước lượng.
102. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh giá trị trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh giá trị trung bình của hai mẫu phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh giá trị trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh giá trị trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
103. Phương pháp lấy mẫu nào đảm bảo mỗi thành viên của tổng thể đều có cơ hội được chọn như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu phân tầng (Stratified sampling).
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
D. Lấy mẫu theo cụm (Cluster sampling).
104. Trong hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy.
B. Giá trị dự đoán của biến phụ thuộc khi biến độc lập bằng 0.
C. Mức độ phù hợp của mô hình.
D. Sai số chuẩn của ước lượng.
105. Khi nào thì nên sử dụng kiểm định Mann-Whitney U (Mann-Whitney U test)?
A. Để so sánh giá trị trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh giá trị trung bình của hai mẫu phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh giá trị trung bình của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh giá trị trung bình của hai mẫu phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
106. Hệ số Cronbach’s alpha được sử dụng để đánh giá điều gì?
A. Độ tin cậy của một bài kiểm tra hoặc thang đo.
B. Tính hợp lệ của một bài kiểm tra hoặc thang đo.
C. Mối quan hệ giữa hai biến.
D. Sự khác biệt giữa giá trị trung bình của hai nhóm.
107. Trong thống kê mô tả, đại lượng nào sau đây được sử dụng để đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Phương sai (Variance)
C. Mốt (Mode)
D. Giá trị trung bình (Mean)
108. Khi nào thì việc sử dụng trung vị (median) thích hợp hơn so với giá trị trung bình (mean) để đo lường xu hướng trung tâm?
A. Khi dữ liệu phân phối chuẩn.
B. Khi dữ liệu có giá trị ngoại lệ (outliers).
C. Khi cỡ mẫu lớn.
D. Khi cần tính toán nhanh chóng.
109. Sự khác biệt chính giữa thống kê mô tả (descriptive statistics) và thống kê suy luận (inferential statistics) là gì?
A. Thống kê mô tả sử dụng đồ thị, thống kê suy luận sử dụng số.
B. Thống kê mô tả mô tả dữ liệu, thống kê suy luận suy luận về tổng thể dựa trên mẫu.
C. Thống kê mô tả dễ hơn thống kê suy luận.
D. Thống kê mô tả chính xác hơn thống kê suy luận.
110. Phân tích phương sai (ANOVA) được sử dụng để làm gì?
A. Đo lường mối quan hệ giữa hai biến định lượng.
B. So sánh giá trị trung bình của hai nhóm.
C. So sánh giá trị trung bình của ba nhóm trở lên.
D. Dự đoán giá trị của một biến dựa trên biến khác.
111. Trong phân tích phương sai (ANOVA), giả thuyết không (null hypothesis) thường là gì?
A. Tất cả các giá trị trung bình của các nhóm đều khác nhau.
B. Ít nhất một giá trị trung bình của các nhóm khác nhau.
C. Tất cả các giá trị trung bình của các nhóm đều bằng nhau.
D. Phương sai của các nhóm khác nhau.
112. Điều gì xảy ra với khoảng tin cậy (confidence interval) khi tăng cỡ mẫu?
A. Khoảng tin cậy trở nên rộng hơn.
B. Khoảng tin cậy không thay đổi.
C. Khoảng tin cậy trở nên hẹp hơn.
D. Khoảng tin cậy biến mất.
113. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn.
B. Khi cỡ mẫu lớn.
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ.
D. Khi cần tính toán nhanh chóng.
114. Ý nghĩa của ‘giá trị tới hạn’ (critical value) trong kiểm định giả thuyết là gì?
A. Xác suất mắc sai lầm loại I.
B. Giá trị mà tại đó chúng ta bác bỏ giả thuyết không.
C. Giá trị trung bình của mẫu.
D. Độ lệch chuẩn của mẫu.
115. Trong kiểm định giả thuyết, sai lầm loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không (null hypothesis) khi nó thực sự đúng.
B. Chấp nhận giả thuyết không khi nó thực sự sai.
C. Không bác bỏ giả thuyết không khi nó thực sự đúng.
D. Bác bỏ giả thuyết không khi nó thực sự sai.
116. Khi nào thì nên sử dụng kiểm định t (t-test) thay vì kiểm định z (z-test)?
A. Khi cỡ mẫu lớn (n > 30).
B. Khi biết độ lệch chuẩn của tổng thể.
C. Khi không biết độ lệch chuẩn của tổng thể và cỡ mẫu nhỏ (n < 30).
D. Khi cần tính toán nhanh chóng.
117. Phương pháp nào sau đây được sử dụng để giảm số lượng biến trong một tập dữ liệu mà vẫn giữ lại thông tin quan trọng nhất?
A. Phân tích phương sai (ANOVA).
B. Phân tích tương quan (Correlation analysis).
C. Phân tích thành phần chính (Principal component analysis – PCA).
D. Phân tích hồi quy (Regression analysis).
118. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh giá trị trung bình của hai mẫu.
B. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
C. Đo lường mối quan hệ giữa hai biến.
D. So sánh phương sai của hai mẫu.
119. Hệ số tương quan Pearson đo lường điều gì?
A. Mối quan hệ nhân quả giữa hai biến.
B. Mức độ phù hợp của một mô hình hồi quy.
C. Mức độ tuyến tính và hướng của mối quan hệ giữa hai biến định lượng.
D. Sự khác biệt giữa giá trị trung bình của hai nhóm.
120. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết không là đúng.
B. Xác suất mắc sai lầm loại I.
C. Xác suất thu được kết quả cực đoan như kết quả quan sát được (hoặc cực đoan hơn) nếu giả thuyết không là đúng.
D. Xác suất mắc sai lầm loại II.
121. Giả thuyết không (null hypothesis) trong kiểm định giả thuyết thường phát biểu điều gì?
A. Có sự khác biệt đáng kể giữa các nhóm
B. Không có mối quan hệ giữa các biến
C. Có một mối quan hệ nhân quả giữa các biến
D. Không có sự khác biệt hoặc không có tác động
122. Khi nào nên sử dụng kiểm định t ghép cặp (paired t-test)?
A. Khi so sánh giá trị trung bình của hai nhóm độc lập
B. Khi so sánh giá trị trung bình của hai nhóm có liên quan (ví dụ: trước và sau can thiệp)
C. Khi so sánh phương sai của hai nhóm
D. Khi so sánh tỷ lệ của hai nhóm
123. Trong phân tích dữ liệu định tính, ‘mã hóa’ (coding) là gì?
A. Quá trình chuyển đổi dữ liệu định tính thành dữ liệu định lượng
B. Quá trình gán nhãn hoặc danh mục cho các đoạn văn bản để xác định các chủ đề và mẫu
C. Quá trình kiểm tra tính hợp lệ của dữ liệu
D. Quá trình trình bày dữ liệu một cách trực quan
124. Trong nghiên cứu khoa học xã hội, ‘tính hợp lệ’ (validity) đề cập đến điều gì?
A. Mức độ nhất quán của kết quả nghiên cứu
B. Mức độ mà một công cụ đo lường đo lường chính xác những gì nó được thiết kế để đo lường
C. Mức độ mà kết quả nghiên cứu có thể được khái quát hóa cho các quần thể khác
D. Mức độ mà nghiên cứu tuân thủ các nguyên tắc đạo đức
125. Trong nghiên cứu khoa học xã hội, cỡ mẫu (sample size) có vai trò gì?
A. Ảnh hưởng đến tính hợp lệ của nghiên cứu
B. Ảnh hưởng đến độ tin cậy và khả năng khái quát hóa kết quả
C. Ảnh hưởng đến tính khách quan của nghiên cứu
D. Không ảnh hưởng đến kết quả nghiên cứu
126. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để làm gì?
A. So sánh giá trị trung bình của hai nhóm
B. Kiểm tra sự độc lập giữa hai biến định tính
C. Ước lượng mối quan hệ tuyến tính giữa hai biến
D. Đo lường mức độ phân tán của dữ liệu
127. Giả sử bạn muốn so sánh thu nhập trung bình của người dân ở hai thành phố khác nhau, bạn nên sử dụng kiểm định nào?
A. Kiểm định Chi-bình phương (Chi-square test)
B. Kiểm định t (t-test)
C. Phân tích phương sai (ANOVA)
D. Phân tích hồi quy (Regression analysis)
128. Trong phân tích phương sai (ANOVA), thống kê F được sử dụng để kiểm tra điều gì?
A. Sự khác biệt giữa các phương sai của hai quần thể
B. Sự khác biệt giữa các giá trị trung bình của hai quần thể
C. Sự khác biệt giữa các giá trị trung bình của ba hoặc nhiều quần thể
D. Mối quan hệ giữa hai biến định lượng
129. Phân tích hồi quy tuyến tính được sử dụng để làm gì?
A. Đo lường sự khác biệt giữa các nhóm
B. Ước lượng mối quan hệ giữa các biến
C. Mô tả đặc điểm của một biến duy nhất
D. Phân loại dữ liệu thành các nhóm
130. Trong phân tích hồi quy, hệ số R bình phương (R-squared) đo lường điều gì?
A. Độ mạnh của mối quan hệ nhân quả
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập
C. Mức độ ý nghĩa thống kê của mô hình
D. Độ chính xác của các ước lượng hệ số
131. Phương pháp nào sau đây được sử dụng để giảm thiểu ảnh hưởng của các biến nhiễu (confounding variables) trong nghiên cứu quan sát?
A. Phân tích hồi quy đa biến (Multiple regression analysis)
B. Kiểm định t (t-test)
C. Phân tích phương sai (ANOVA)
D. Thống kê mô tả (Descriptive statistics)
132. Thang đo nào sau đây là thang đo định danh (nominal scale)?
A. Nhiệt độ (Temperature)
B. Xếp hạng (Ranking)
C. Số đo chiều cao (Height in centimeters)
D. Giới tính (Gender)
133. Độ lệch chuẩn (standard deviation) đo lường điều gì?
A. Giá trị trung bình của dữ liệu
B. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
C. Giá trị lớn nhất trong tập dữ liệu
D. Giá trị nhỏ nhất trong tập dữ liệu
134. Nếu giá trị p (p-value) nhỏ hơn mức ý nghĩa (alpha), bạn nên làm gì?
A. Chấp nhận giả thuyết không
B. Bác bỏ giả thuyết không
C. Không đưa ra kết luận
D. Tăng kích thước mẫu
135. Mức ý nghĩa (significance level) trong kiểm định giả thuyết, thường ký hiệu là alpha (α), biểu thị điều gì?
A. Xác suất mắc lỗi loại II
B. Xác suất bác bỏ giả thuyết không khi nó đúng
C. Xác suất chấp nhận giả thuyết không khi nó sai
D. Xác suất chấp nhận giả thuyết không khi nó đúng
136. Phương pháp lấy mẫu nào đảm bảo mỗi thành viên của quần thể có cơ hội được chọn vào mẫu như nhau?
A. Lấy mẫu thuận tiện (Convenience sampling)
B. Lấy mẫu phán đoán (Judgment sampling)
C. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling)
D. Lấy mẫu theo mục tiêu (Purposive sampling)
137. Khi nào nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi các giả định của kiểm định tham số không được đáp ứng
D. Khi muốn tăng độ mạnh của kiểm định
138. Sai số loại I (Type I error) xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó sai
B. Chấp nhận giả thuyết không khi nó đúng
C. Bác bỏ giả thuyết không khi nó đúng
D. Chấp nhận giả thuyết không khi nó sai
139. Phương pháp nào sau đây được sử dụng để xác định các nhóm (clusters) trong dữ liệu dựa trên sự tương đồng giữa các quan sát?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích cụm (Cluster analysis)
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương (Chi-square test)
140. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ khác biệt giữa các nhóm
B. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến định lượng
C. Mức độ phân tán của dữ liệu
D. Mối quan hệ nhân quả giữa hai biến
141. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị (Median)
B. Phương sai (Variance)
C. Mode (Mode)
D. Giá trị trung bình (Mean)
142. Loại biểu đồ nào sau đây thích hợp nhất để so sánh tỷ lệ phần trăm của các danh mục khác nhau?
A. Biểu đồ đường (Line chart)
B. Biểu đồ cột (Bar chart)
C. Biểu đồ tròn (Pie chart)
D. Biểu đồ phân tán (Scatter plot)
143. Khi phân tích dữ liệu khảo sát, phương pháp nào sau đây thường được sử dụng để tóm tắt các câu trả lời cho câu hỏi mở?
A. Phân tích hồi quy (Regression analysis)
B. Phân tích nội dung (Content analysis)
C. Phân tích phương sai (ANOVA)
D. Kiểm định t (t-test)
144. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) xảy ra khi nào?
A. Khi biến phụ thuộc không tuân theo phân phối chuẩn
B. Khi các biến độc lập có mối tương quan cao với nhau
C. Khi kích thước mẫu quá nhỏ
D. Khi có các giá trị ngoại lệ (outliers) trong dữ liệu
145. Trong thống kê, thuật ngữ ‘outlier’ dùng để chỉ điều gì?
A. Giá trị trung bình của dữ liệu
B. Giá trị xuất hiện nhiều nhất trong dữ liệu
C. Giá trị cực đoan, khác biệt đáng kể so với các giá trị khác trong tập dữ liệu
D. Giá trị nằm ở giữa tập dữ liệu
146. Biểu đồ nào sau đây thích hợp nhất để hiển thị mối quan hệ giữa hai biến định lượng?
A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ hộp (Box plot)
D. Biểu đồ phân tán (Scatter plot)
147. Giá trị p (p-value) trong kiểm định giả thuyết biểu thị điều gì?
A. Xác suất giả thuyết không là đúng
B. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết không là đúng
C. Xác suất giả thuyết thay thế là đúng
D. Xác suất mắc lỗi loại II
148. Trong thống kê, biến số nào sau đây là biến định tính (categorical variable)?
A. Chiều cao (Height)
B. Cân nặng (Weight)
C. Màu mắt (Eye color)
D. Thu nhập (Income)
149. Trong nghiên cứu khoa học xã hội, ‘độ tin cậy’ (reliability) đề cập đến điều gì?
A. Mức độ mà một công cụ đo lường đo lường chính xác những gì nó được thiết kế để đo lường
B. Mức độ nhất quán của kết quả khi đo lường được lặp lại
C. Mức độ mà kết quả nghiên cứu có thể được khái quát hóa cho các quần thể khác
D. Mức độ mà nghiên cứu tuân thủ các nguyên tắc đạo đức
150. Khái niệm nào sau đây mô tả việc một mẫu (sample) đại diện cho quần thể (population) mà nó được rút ra?
A. Tính hợp lệ (Validity)
B. Độ tin cậy (Reliability)
C. Tính đại diện (Representativeness)
D. Tính khách quan (Objectivity)