1. Giá trị p (p-value) trong kiểm định giả thuyết thống kê y học biểu thị điều gì?
A. Xác suất giả thuyết H0 là đúng
B. Mức ý nghĩa thống kê được chọn trước
C. Xác suất bác bỏ giả thuyết H0 khi nó thực sự đúng
D. Xác suất thu được kết quả quan sát, hoặc kết quả còn cực đoan hơn, nếu giả thuyết H0 là đúng
2. Thế nào là một nghiên cứu thuần tập (cohort study)?
A. Một nghiên cứu so sánh nhóm người có bệnh với nhóm người không có bệnh
B. Một nghiên cứu theo dõi một nhóm người theo thời gian để xem ai phát triển bệnh
C. Một nghiên cứu can thiệp để đánh giá hiệu quả của một phương pháp điều trị
D. Một nghiên cứu mô tả đặc điểm của một nhóm người tại một thời điểm
3. Điều gì xảy ra với khoảng tin cậy khi cỡ mẫu tăng lên?
A. Khoảng tin cậy trở nên rộng hơn
B. Khoảng tin cậy trở nên hẹp hơn
C. Khoảng tin cậy không thay đổi
D. Không thể dự đoán
4. Khi nào nên sử dụng kiểm định t Student ghép cặp (paired t-test)?
A. Khi so sánh hai mẫu độc lập
B. Khi so sánh hai mẫu có liên quan (ví dụ: trước và sau điều trị)
C. Khi so sánh nhiều hơn hai mẫu
D. Khi dữ liệu không tuân theo phân phối chuẩn
5. Loại biểu đồ nào thích hợp nhất để thể hiện mối quan hệ giữa hai biến số liên tục?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ hộp
D. Biểu đồ phân tán
6. Độ nhạy (Sensitivity) của một xét nghiệm y tế thể hiện điều gì?
A. Khả năng xét nghiệm xác định chính xác người không mắc bệnh
B. Tỷ lệ người bệnh được xét nghiệm xác định là bệnh
C. Khả năng xét nghiệm xác định chính xác người mắc bệnh
D. Tỷ lệ người khỏe mạnh được xét nghiệm xác định là khỏe mạnh
7. Ý nghĩa của khoảng tin cậy 95% cho tỷ số chênh (Odds Ratio) là (0.5, 1.5) là gì?
A. Không có mối liên hệ có ý nghĩa thống kê giữa yếu tố nguy cơ và bệnh
B. Yếu tố nguy cơ làm tăng nguy cơ mắc bệnh
C. Yếu tố nguy cơ làm giảm nguy cơ mắc bệnh
D. Cần thêm dữ liệu để xác định mối liên hệ
8. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến gì?
A. Biến liên tục
B. Biến thứ bậc
C. Biến định tính (categorical)
D. Biến thời gian
9. Phương pháp nào sau đây được sử dụng để kiểm tra tính chuẩn của dữ liệu?
A. Kiểm định t Student
B. Kiểm định Chi bình phương
C. Kiểm định Shapiro-Wilk
D. Phân tích hồi quy
10. Trong phân tích sống còn (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?
A. Ước tính tỷ lệ sống sót theo thời gian
B. So sánh tỷ lệ sống sót giữa hai nhóm
C. Xác định các yếu tố tiên lượng
D. Tất cả các đáp án trên
11. Biến số nào sau đây là biến số định lượng liên tục?
A. Nhóm máu (A, B, AB, O)
B. Số lượng bệnh nhân trong một bệnh viện
C. Chiều cao của một người (cm)
D. Mức độ hài lòng (Rất hài lòng, Hài lòng, Không hài lòng)
12. Giá trị tiên đoán dương (Positive Predictive Value – PPV) của một xét nghiệm y tế phụ thuộc vào yếu tố nào sau đây?
A. Độ nhạy của xét nghiệm
B. Độ đặc hiệu của xét nghiệm
C. Tỷ lệ hiện mắc của bệnh trong quần thể
D. Tất cả các yếu tố trên
13. Khoảng tin cậy (Confidence Interval) 95% có ý nghĩa gì?
A. Xác suất tham số thực nằm trong khoảng này là 95%
B. Nếu lặp lại nghiên cứu 100 lần, 95 lần khoảng tin cậy sẽ chứa tham số thực
C. Giá trị p nhỏ hơn 0.05
D. Sai số loại I là 5%
14. Trong thống kê y học, thuật ngữ ‘power’ (độ mạnh) của một kiểm định có nghĩa là gì?
A. Xác suất mắc sai số loại I
B. Xác suất mắc sai số loại II
C. Khả năng bác bỏ giả thuyết H0 khi nó thực sự sai
D. Khả năng chấp nhận giả thuyết H0 khi nó thực sự đúng
15. Trong thiết kế nghiên cứu thử nghiệm lâm sàng ngẫu nhiên có đối chứng (RCT), việc ‘làm mù’ (blinding) có vai trò gì?
A. Giảm thiểu sai số do người tham gia và nhà nghiên cứu biết ai đang nhận điều trị thật và ai đang nhận giả dược
B. Tăng cường tính đại diện của mẫu nghiên cứu
C. Đảm bảo tính tuân thủ điều trị của người tham gia
D. Đơn giản hóa quá trình thu thập dữ liệu
16. Loại biểu đồ nào phù hợp nhất để so sánh phân bố của một biến số giữa nhiều nhóm?
A. Biểu đồ tròn
B. Biểu đồ đường
C. Biểu đồ hộp (boxplot)
D. Biểu đồ phân tán
17. Độ đặc hiệu (Specificity) của một xét nghiệm y tế thể hiện điều gì?
A. Khả năng xét nghiệm xác định chính xác người mắc bệnh
B. Tỷ lệ người bệnh được xét nghiệm xác định là bệnh
C. Khả năng xét nghiệm xác định chính xác người không mắc bệnh
D. Tỷ lệ người khỏe mạnh được xét nghiệm xác định là bệnh
18. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ liên kết tuyến tính giữa hai biến số
B. Mức độ khác biệt giữa hai biến số
C. Mức độ phân tán của dữ liệu
D. Mức độ ảnh hưởng của một biến số lên biến số khác
19. Giá trị nào sau đây không bị ảnh hưởng bởi các giá trị ngoại lai (outliers)?
A. Giá trị trung bình (mean)
B. Độ lệch chuẩn (standard deviation)
C. Trung vị (median)
D. Phạm vi (range)
20. Trong nghiên cứu bệnh chứng (case-control study), thước đo nào được sử dụng để ước tính mối liên hệ giữa yếu tố nguy cơ và bệnh?
A. Tỷ số rủi ro (Risk Ratio)
B. Tỷ số chênh (Odds Ratio)
C. Tỷ lệ hiện mắc (Prevalence)
D. Tỷ lệ mới mắc (Incidence)
21. Giá trị tiên đoán âm (Negative Predictive Value – NPV) của một xét nghiệm y tế phụ thuộc vào yếu tố nào sau đây?
A. Độ nhạy của xét nghiệm
B. Độ đặc hiệu của xét nghiệm
C. Tỷ lệ hiện mắc của bệnh trong quần thể
D. Tất cả các yếu tố trên
22. Trong một nghiên cứu cắt ngang (cross-sectional study), điều gì được đo lường tại một thời điểm duy nhất?
A. Tỷ lệ mắc bệnh mới
B. Mối quan hệ nhân quả giữa yếu tố nguy cơ và bệnh
C. Tỷ lệ hiện mắc bệnh và yếu tố nguy cơ
D. Sự thay đổi của bệnh theo thời gian
23. Trong thống kê y học, loại sai số nào xảy ra khi bác sĩ kết luận một người khỏe mạnh là bệnh nhân?
A. Sai số loại II (false negative)
B. Sai số hệ thống
C. Sai số loại I (false positive)
D. Sai số ngẫu nhiên
24. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ
D. Khi cần so sánh nhiều nhóm
25. Trung vị (median) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
C. Giá trị nằm ở giữa tập dữ liệu đã được sắp xếp
D. Giá trị lớn nhất trừ giá trị nhỏ nhất của tập dữ liệu
26. Trong phân tích hồi quy tuyến tính, R-squared (R bình phương) biểu thị điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu
B. Mức độ tin cậy của các hệ số hồi quy
C. Sai số chuẩn của mô hình
D. Giá trị p của mô hình
27. Phân phối chuẩn (Normal distribution) có đặc điểm gì?
A. Đối xứng, đơn đỉnh và có hình chuông
B. Bất đối xứng và có nhiều đỉnh
C. Luôn có giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1
D. Chỉ áp dụng cho dữ liệu rời rạc
28. Phương pháp thống kê nào thích hợp nhất để so sánh tỷ lệ khỏi bệnh giữa hai nhóm bệnh nhân được điều trị bằng hai loại thuốc khác nhau?
A. Kiểm định t Student
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi bình phương (Chi-square)
D. Hệ số tương quan Pearson
29. Trong thống kê mô tả, phương sai (variance) đo lường điều gì?
A. Giá trị trung bình của dữ liệu
B. Độ lệch chuẩn của dữ liệu
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình
D. Giá trị lớn nhất trừ giá trị nhỏ nhất của dữ liệu
30. Trong kiểm định giả thuyết, mức ý nghĩa (alpha) thường được đặt là 0.05. Điều này có nghĩa là gì?
A. Xác suất mắc sai số loại II là 5%
B. Xác suất mắc sai số loại I là 5%
C. Độ mạnh của kiểm định là 95%
D. Khoảng tin cậy là 95%
31. Trong phân tích sống còn, đường cong Kaplan-Meier được sử dụng để ước tính điều gì?
A. Nguy cơ tức thời (hazard rate)
B. Thời gian sống trung bình
C. Hàm sống còn (survival function)
D. Tỷ lệ tử vong
32. Trong phân tích sống còn (survival analysis), hàm sống còn (survival function) S(t) biểu diễn điều gì?
A. Thời gian trung bình sống sót
B. Xác suất một cá nhân sống sót ít nhất đến thời điểm t
C. Tỷ lệ tử vong tại thời điểm t
D. Nguy cơ tử vong tại thời điểm t
33. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết không đúng là đúng
B. Xác suất mắc lỗi loại II
C. Xác suất quan sát được kết quả hiện tại (hoặc kết quả cực đoan hơn) nếu giả thuyết không đúng là đúng
D. Mức ý nghĩa thống kê được chọn trước
34. Phương pháp nào sau đây được sử dụng để điều chỉnh sai số do so sánh nhiều cặp trong phân tích hậu kiểm (post-hoc analysis) sau ANOVA?
A. Kiểm định t
B. Kiểm định Chi-bình phương
C. Hiệu chỉnh Bonferroni
D. Hồi quy tuyến tính
35. Khi nào nên sử dụng kiểm định ANOVA lặp lại (repeated measures ANOVA)?
A. Khi so sánh trung bình của hai nhóm độc lập
B. Khi so sánh trung bình của ba nhóm độc lập trở lên
C. Khi so sánh trung bình của một nhóm tại nhiều thời điểm khác nhau
D. Khi dữ liệu không tuân theo phân phối chuẩn
36. Trong thống kê mô tả, đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Phương sai
C. Mốt
D. Phân vị
37. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của hai nhóm liên quan khi dữ liệu tuân theo phân phối chuẩn
C. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn
D. Để so sánh trung bình của hai nhóm liên quan khi dữ liệu không tuân theo phân phối chuẩn
38. Trong thống kê y học, thuật ngữ ‘số người cần điều trị’ (Number Needed to Treat – NNT) có nghĩa là gì?
A. Số lượng bệnh nhân cần điều trị để gây ra một tác dụng phụ
B. Số lượng bệnh nhân cần điều trị để ngăn chặn một kết quả xấu
C. Số lượng bệnh nhân cần sàng lọc để phát hiện một trường hợp bệnh
D. Số lượng bệnh nhân cần theo dõi để quan sát một biến cố
39. Trong một nghiên cứu cắt ngang (cross-sectional study), thước đo nào sau đây thường được sử dụng để mô tả tỷ lệ hiện mắc của một bệnh tại một thời điểm nhất định?
A. Nguy cơ tương đối (Relative Risk)
B. Tỷ số chênh (Odds Ratio)
C. Tỷ lệ hiện mắc (Prevalence)
D. Tỷ lệ mới mắc (Incidence)
40. Trong thống kê y học, ‘phương pháp mù’ (blinding) được sử dụng để làm gì?
A. Giảm thiểu sai số do người tham gia hoặc nhà nghiên cứu biết về phương pháp điều trị
B. Tăng cường tính bảo mật của dữ liệu
C. Đảm bảo rằng tất cả người tham gia đều nhận được cùng một phương pháp điều trị
D. Đơn giản hóa quá trình phân tích dữ liệu
41. Độ đặc hiệu (specificity) của một xét nghiệm chẩn đoán được định nghĩa là gì?
A. Khả năng xét nghiệm xác định chính xác những người mắc bệnh
B. Khả năng xét nghiệm xác định chính xác những người không mắc bệnh
C. Tỷ lệ người có kết quả xét nghiệm dương tính trong tổng số người được xét nghiệm
D. Tỷ lệ người có kết quả xét nghiệm âm tính trong tổng số người được xét nghiệm
42. Một nghiên cứu bệnh chứng (case-control study) thường được sử dụng để điều tra về điều gì?
A. Tỷ lệ mắc bệnh trong một quần thể
B. Nguyên nhân của một bệnh hiếm gặp
C. Hiệu quả của một phương pháp điều trị mới
D. Sự tiến triển tự nhiên của một bệnh
43. Sai số loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không đúng khi nó thực sự đúng
B. Không bác bỏ giả thuyết không đúng khi nó thực sự sai
C. Bác bỏ giả thuyết không khi nó thực sự đúng
D. Không bác bỏ giả thuyết không khi nó thực sự đúng
44. Trong một nghiên cứu bệnh chứng, thước đo nào sau đây thường được sử dụng để ước tính mối liên hệ giữa một yếu tố phơi nhiễm và một bệnh?
A. Nguy cơ tương đối (Relative Risk)
B. Tỷ số chênh (Odds Ratio)
C. Tỷ lệ hiện mắc (Prevalence)
D. Tỷ lệ mới mắc (Incidence)
45. Sai số loại II (Type II error) trong kiểm định giả thuyết xảy ra khi nào?
A. Bác bỏ giả thuyết không khi nó thực sự đúng
B. Không bác bỏ giả thuyết không khi nó thực sự sai
C. Bác bỏ giả thuyết không khi nó thực sự sai
D. Không bác bỏ giả thuyết không khi nó thực sự đúng
46. Giá trị p nào sau đây cho thấy kết quả có ý nghĩa thống kê ở mức ý nghĩa 0.05?
A. p = 0.10
B. p = 0.06
C. p = 0.05
D. p = 0.04
47. Trong thống kê y học, thuật ngữ ‘số cần thiết để gây hại’ (Number Needed to Harm – NNH) có nghĩa là gì?
A. Số lượng bệnh nhân cần điều trị để có một người cải thiện
B. Số lượng bệnh nhân cần điều trị để một người bị tác dụng phụ
C. Số lượng bệnh nhân cần điều trị để một người tử vong
D. Số lượng bệnh nhân cần điều trị để một người không có tác dụng
48. Trong thống kê y học, loại biến số nào sau đây biểu diễn các thuộc tính không định lượng và có thể được chia thành các nhóm không có thứ tự?
A. Biến số định lượng liên tục
B. Biến số định lượng rời rạc
C. Biến số định tính thứ bậc
D. Biến số định tính danh nghĩa
49. Độ nhạy (sensitivity) của một xét nghiệm chẩn đoán được định nghĩa là gì?
A. Khả năng xét nghiệm xác định chính xác những người không mắc bệnh
B. Khả năng xét nghiệm xác định chính xác những người mắc bệnh
C. Tỷ lệ người có kết quả xét nghiệm dương tính trong tổng số người được xét nghiệm
D. Tỷ lệ người có kết quả xét nghiệm âm tính trong tổng số người được xét nghiệm
50. Thước đo nào sau đây thường được sử dụng để đánh giá độ tin cậy giữa các người quan sát (inter-rater reliability) đối với dữ liệu định tính?
A. Hệ số tương quan Pearson
B. Hệ số Kappa (Cohen’s Kappa)
C. Hệ số Cronbach’s alpha
D. Hệ số hồi quy
51. Giá trị nào sau đây thể hiện một mối tương quan dương tính yếu?
A. -0.9
B. -0.2
C. 0.1
D. 0.8
52. Trong một nghiên cứu когорт (cohort study), thước đo nào sau đây thường được sử dụng để ước tính nguy cơ tương đối của một yếu tố phơi nhiễm đối với một bệnh?
A. Tỷ số chênh (Odds ratio)
B. Nguy cơ tuyệt đối (Absolute risk)
C. Nguy cơ tương đối (Relative risk)
D. Số người cần điều trị (Number needed to treat)
53. Trong một phân phối chuẩn, khoảng tin cậy 95% cho trung bình mẫu được tính như thế nào?
A. Trung bình mẫu ± 1.645 * (Sai số chuẩn)
B. Trung bình mẫu ± 1.96 * (Sai số chuẩn)
C. Trung bình mẫu ± 2.576 * (Sai số chuẩn)
D. Trung bình mẫu ± 3 * (Sai số chuẩn)
54. Giá trị nào sau đây cho biết mối tương quan tuyến tính nghịch biến mạnh giữa hai biến số?
A. r = 0.9
B. r = 0.1
C. r = -0.8
D. r = 0
55. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của ba nhóm độc lập trở lên khi dữ liệu tuân theo phân phối chuẩn
C. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn
D. Để so sánh trung bình của ba nhóm độc lập trở lên khi dữ liệu không tuân theo phân phối chuẩn
56. Phương pháp thống kê nào thường được sử dụng để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn và phương sai của hai nhóm gần bằng nhau?
A. Kiểm định Chi-bình phương
B. Kiểm định t độc lập
C. Kiểm định Mann-Whitney U
D. Phân tích phương sai (ANOVA)
57. Khi nào nên sử dụng kiểm định Mann-Whitney U thay vì kiểm định t độc lập?
A. Khi so sánh trung bình của hai nhóm liên quan
B. Khi dữ liệu không tuân theo phân phối chuẩn
C. Khi phương sai của hai nhóm bằng nhau
D. Khi kích thước mẫu lớn
58. Trong phân tích hồi quy logistic, biến phụ thuộc (dependent variable) phải thuộc loại nào?
A. Biến số định lượng liên tục
B. Biến số định lượng rời rạc
C. Biến số định tính nhị phân
D. Biến số định tính đa phân
59. Phương pháp nào sau đây được sử dụng để kiểm tra xem có sự khác biệt đáng kể giữa tỷ lệ của một biến số định tính trong nhiều nhóm?
A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi-bình phương
D. Hồi quy tuyến tính
60. Trong phân tích hồi quy tuyến tính, hệ số tương quan (r) đo lường điều gì?
A. Độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến số
B. Độ dốc của đường hồi quy
C. Mức độ phù hợp của mô hình hồi quy với dữ liệu
D. Sai số chuẩn của ước lượng
61. Trong phân tích hồi quy đa biến, hiện tượng đa cộng tuyến (multicollinearity) đề cập đến vấn đề gì?
A. Sự tương quan cao giữa các biến độc lập.
B. Sự tương quan cao giữa biến độc lập và biến phụ thuộc.
C. Sự không tuyến tính trong mối quan hệ giữa các biến.
D. Sự không đồng nhất phương sai của các sai số.
62. Trong phân tích hồi quy tuyến tính, hệ số xác định (R-squared) cho biết điều gì?
A. Độ mạnh của mối quan hệ giữa các biến độc lập.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập.
C. Ý nghĩa thống kê của các biến độc lập.
D. Sai số chuẩn của các hệ số hồi quy.
63. Giá trị nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Giá trị lớn nhất
C. Độ lệch chuẩn
D. Tần số
64. Trong một nghiên cứu về hiệu quả của một loại thuốc mới, sai số loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết null khi nó thực sự sai.
B. Bác bỏ giả thuyết null khi nó thực sự đúng.
C. Không bác bỏ giả thuyết null khi nó thực sự sai.
D. Bác bỏ giả thuyết null khi nó thực sự sai.
65. Kiểm định Kolmogorov-Smirnov được sử dụng để làm gì?
A. So sánh trung bình của hai mẫu.
B. So sánh phương sai của hai mẫu.
C. Kiểm tra xem một mẫu có tuân theo một phân phối cụ thể hay không.
D. Đo lường mối tương quan giữa hai biến.
66. Trong thống kê y học, thuật ngữ ‘phương sai’ (variance) đề cập đến điều gì?
A. Giá trị trung bình của một tập dữ liệu.
B. Độ lệch chuẩn của một tập dữ liệu.
C. Mức độ phân tán của dữ liệu xung quanh giá trị trung bình.
D. Số lượng quan sát trong một tập dữ liệu.
67. Trong một nghiên cứu bệnh chứng (case-control study), thước đo nào thường được sử dụng để ước tính mức độ liên quan giữa yếu tố phơi nhiễm và bệnh tật?
A. Nguy cơ tương đối (Relative risk)
B. Tỷ số chênh (Odds ratio)
C. Tỷ lệ hiện mắc
D. Tỷ lệ mới mắc
68. Trong nghiên cứu когорт (cohort study), thước đo nào thường được sử dụng để ước tính mức độ liên quan giữa yếu tố phơi nhiễm và bệnh tật?
A. Tỷ số chênh (Odds ratio)
B. Nguy cơ tương đối (Relative risk)
C. Tỷ lệ hiện mắc
D. Tỷ lệ mới mắc
69. Công thức nào sau đây được sử dụng để tính khoảng tin cậy cho tỷ lệ?
A. p ± z * √(p(1-p)/n)
B. p ± t * √(p(1-p)/n)
C. p ± z * (s/√n)
D. p ± t * (s/√n)
70. Trong một phân phối chuẩn, khoảng tin cậy 95% cho trung bình mẫu được tính như thế nào?
A. Trung bình mẫu ± 1.645 * (Độ lệch chuẩn / √n)
B. Trung bình mẫu ± 1.96 * (Độ lệch chuẩn / √n)
C. Trung bình mẫu ± 2.576 * (Độ lệch chuẩn / √n)
D. Trung bình mẫu ± 3 * (Độ lệch chuẩn / √n)
71. Trong thống kê y học, loại biến nào sau đây thể hiện các đặc điểm định tính, không có thứ tự cụ thể?
A. Biến định lượng liên tục
B. Biến định lượng rời rạc
C. Biến định danh
D. Biến thứ bậc
72. Trong phân tích sống còn (survival analysis), hàm sống còn (survival function) biểu thị điều gì?
A. Xác suất một cá nhân sống sót ít nhất đến một thời điểm nhất định.
B. Thời gian trung bình sống sót của một nhóm bệnh nhân.
C. Tỷ lệ tử vong trong một khoảng thời gian nhất định.
D. Nguy cơ tử vong tại một thời điểm cụ thể.
73. Giá trị trung vị (median) của một tập dữ liệu là gì?
A. Giá trị trung bình của tập dữ liệu.
B. Giá trị xuất hiện nhiều nhất trong tập dữ liệu.
C. Giá trị nằm giữa của tập dữ liệu khi được sắp xếp theo thứ tự.
D. Tổng của tất cả các giá trị trong tập dữ liệu chia cho số lượng giá trị.
74. Trong phân tích phương sai (ANOVA), giả thuyết null thường phát biểu điều gì?
A. Tất cả các nhóm đều có phương sai bằng nhau.
B. Ít nhất một nhóm có trung bình khác với các nhóm khác.
C. Tất cả các nhóm đều có trung bình bằng nhau.
D. Không có mối quan hệ giữa các biến.
75. Ý nghĩa của độ lệch chuẩn (standard error) của trung bình mẫu là gì?
A. Độ lệch chuẩn của toàn bộ quần thể.
B. Ước tính độ lệch chuẩn của phân phối lấy mẫu của trung bình mẫu.
C. Độ lệch chuẩn của mẫu.
D. Khoảng tin cậy 95% cho trung bình mẫu.
76. Trong một nghiên cứu thử nghiệm lâm sàng (clinical trial), mù đôi (double-blinding) có nghĩa là gì?
A. Bệnh nhân không biết họ đang dùng thuốc thật hay giả dược.
B. Nhà nghiên cứu không biết bệnh nhân nào đang dùng thuốc thật hay giả dược.
C. Cả bệnh nhân và nhà nghiên cứu đều không biết ai đang dùng thuốc thật hay giả dược.
D. Chỉ có bệnh nhân biết họ đang dùng thuốc thật hay giả dược.
77. Độ nhạy (sensitivity) của một xét nghiệm chẩn đoán bệnh được định nghĩa là gì?
A. Tỷ lệ người không mắc bệnh có kết quả xét nghiệm âm tính.
B. Tỷ lệ người mắc bệnh có kết quả xét nghiệm dương tính.
C. Tỷ lệ người có kết quả xét nghiệm dương tính thực sự mắc bệnh.
D. Tỷ lệ người có kết quả xét nghiệm âm tính thực sự không mắc bệnh.
78. Trong phân tích hồi quy logistic, biến phụ thuộc là loại biến nào?
A. Biến định lượng liên tục
B. Biến định lượng rời rạc
C. Biến định tính nhị phân
D. Biến định tính đa phân
79. Loại biểu đồ nào sau đây thích hợp nhất để hiển thị phân phối tần số của một biến liên tục?
A. Biểu đồ tròn (pie chart)
B. Biểu đồ thanh (bar chart)
C. Biểu đồ hộp (box plot)
D. Biểu đồ tần suất (histogram)
80. Khi so sánh hiệu quả của ba phương pháp điều trị khác nhau, phương pháp thống kê nào phù hợp nhất để sử dụng?
A. Kiểm định t-Student
B. Kiểm định Chi bình phương
C. Phân tích phương sai (ANOVA)
D. Hồi quy tuyến tính
81. Phương pháp nào sau đây thường được sử dụng để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn và phương sai bằng nhau?
A. Kiểm định Chi bình phương
B. Kiểm định t-Student
C. Phân tích phương sai (ANOVA)
D. Kiểm định Mann-Whitney U
82. Phương pháp nào sau đây được sử dụng để kiểm tra sự độc lập giữa hai biến định tính?
A. Kiểm định t-Student
B. Phân tích phương sai (ANOVA)
C. Kiểm định Chi bình phương
D. Hệ số tương quan Pearson
83. Hệ số tương quan Pearson (Pearson correlation coefficient) đo lường điều gì?
A. Mức độ liên kết phi tuyến tính giữa hai biến.
B. Mức độ liên kết tuyến tính giữa hai biến.
C. Sự khác biệt giữa trung bình của hai biến.
D. Sự khác biệt giữa phương sai của hai biến.
84. Khi nào thì nên sử dụng kiểm định Mann-Whitney U?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai nhóm phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh phương sai của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
85. Khi nào thì nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của ba nhóm trở lên khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh trung vị của ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn.
86. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết null là đúng.
B. Xác suất mắc lỗi loại II.
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết null là đúng.
D. Mức ý nghĩa thống kê được chọn trước.
87. Giá trị p (p-value) là 0.04. Mức ý nghĩa thống kê (alpha) được đặt là 0.05. Kết luận nào sau đây là chính xác?
A. Bác bỏ giả thuyết null.
B. Chấp nhận giả thuyết null.
C. Không đủ bằng chứng để bác bỏ giả thuyết null.
D. Giả thuyết null có thể đúng hoặc sai.
88. Khi nào thì nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh trung bình của hai nhóm độc lập khi dữ liệu tuân theo phân phối chuẩn.
B. Để so sánh trung bình của hai nhóm phụ thuộc khi dữ liệu tuân theo phân phối chuẩn.
C. Để so sánh trung vị của hai nhóm độc lập khi dữ liệu không tuân theo phân phối chuẩn.
D. Để so sánh trung vị của hai nhóm phụ thuộc khi dữ liệu không tuân theo phân phối chuẩn.
89. Đặc hiệu (specificity) của một xét nghiệm chẩn đoán bệnh được định nghĩa là gì?
A. Tỷ lệ người mắc bệnh có kết quả xét nghiệm dương tính.
B. Tỷ lệ người không mắc bệnh có kết quả xét nghiệm âm tính.
C. Tỷ lệ người có kết quả xét nghiệm dương tính thực sự mắc bệnh.
D. Tỷ lệ người có kết quả xét nghiệm âm tính thực sự không mắc bệnh.
90. Khi nào thì nên sử dụng kiểm định phi tham số thay vì kiểm định tham số?
A. Khi kích thước mẫu lớn.
B. Khi dữ liệu tuân theo phân phối chuẩn.
C. Khi phương sai của các nhóm bằng nhau.
D. Khi dữ liệu không tuân theo phân phối chuẩn hoặc kích thước mẫu nhỏ.
91. Trong thống kê y học, loại sai số nào xảy ra khi bác sĩ kết luận một bệnh nhân không mắc bệnh, trong khi thực tế họ có bệnh?
A. Sai số loại II (False Negative)
B. Sai số hệ thống
C. Sai số loại I (False Positive)
D. Sai số ngẫu nhiên
92. Trong phân tích sống còn, hàm Cox proportional hazards được sử dụng để làm gì?
A. Ước tính tỷ lệ sống sót theo thời gian
B. So sánh tỷ lệ sống sót giữa các nhóm
C. Xác định các yếu tố tiên lượng ảnh hưởng đến thời gian sống sót
D. Ước tính thời gian sống sót trung bình
93. Giá trị nào sau đây biểu thị mối tương quan nghịch biến mạnh nhất?
A. 0. 9
B. -0. 9
C. 0. 1
D. -0. 1
94. Trong phân tích hồi quy tuyến tính, hệ số hồi quy (regression coefficient) biểu thị điều gì?
A. Mức độ phù hợp của mô hình với dữ liệu
B. Mức độ biến thiên của biến phụ thuộc
C. Sự thay đổi trung bình của biến phụ thuộc khi biến độc lập thay đổi một đơn vị
D. Mức độ tương quan giữa các biến độc lập
95. Khi nào nên sử dụng kiểm định Kruskal-Wallis?
A. Để so sánh hai nhóm độc lập
B. Để so sánh hai nhóm liên quan
C. Để so sánh ba nhóm trở lên khi dữ liệu không tuân theo phân phối chuẩn
D. Để kiểm tra tính độc lập giữa hai biến phân loại
96. Độ đặc hiệu (Specificity) của một xét nghiệm y tế được định nghĩa là gì?
A. Tỷ lệ những người mắc bệnh có kết quả xét nghiệm dương tính
B. Tỷ lệ những người không mắc bệnh có kết quả xét nghiệm âm tính
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh
97. Giá trị nào sau đây biểu thị mối tương quan tuyến tính mạnh nhất?
A. 0. 2
B. -0. 8
C. 0
D. 0. 5
98. Khoảng tin cậy (Confidence Interval) 95% cho trung bình của một mẫu được hiểu như thế nào?
A. Có 95% khả năng trung bình mẫu nằm trong khoảng này
B. Có 95% khả năng trung bình quần thể nằm trong khoảng này
C. Khoảng này chứa 95% dữ liệu trong mẫu
D. Có 5% khả năng trung bình quần thể nằm ngoài khoảng này
99. Giá trị tiên đoán âm (Negative Predictive Value – NPV) của một xét nghiệm y tế được định nghĩa là gì?
A. Tỷ lệ những người mắc bệnh có kết quả xét nghiệm dương tính
B. Tỷ lệ những người không mắc bệnh có kết quả xét nghiệm âm tính
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh
100. Sai số loại II (Type II error) trong kiểm định giả thuyết thống kê còn được gọi là gì?
A. False positive
B. False negative
C. Độ nhạy
D. Độ đặc hiệu
101. Khi nào nên sử dụng kiểm định Mann-Whitney U thay vì kiểm định t độc lập?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi kích thước mẫu lớn
C. Khi so sánh hai biến định tính
D. Khi dữ liệu không tuân theo phân phối chuẩn
102. Trong phân tích sống còn (survival analysis), hàm Kaplan-Meier được sử dụng để làm gì?
A. Ước tính tỷ lệ sống sót theo thời gian
B. So sánh tỷ lệ sống sót giữa các nhóm
C. Xác định các yếu tố tiên lượng
D. Ước tính thời gian sống sót trung bình
103. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa hai biến định lượng khi có một biến gây nhiễu?
A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Hồi quy đa biến
D. Kiểm định Chi-bình phương
104. Phương pháp thống kê nào phù hợp nhất để so sánh trung bình của ba nhóm độc lập trở lên?
A. Kiểm định t
B. Hồi quy tuyến tính
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
105. Khi nào nên sử dụng kiểm định Wilcoxon signed-rank test?
A. Để so sánh hai nhóm độc lập
B. Để so sánh hai nhóm liên quan khi dữ liệu không tuân theo phân phối chuẩn
C. Để so sánh ba nhóm trở lên
D. Để kiểm tra tính độc lập giữa hai biến phân loại
106. Trong một nghiên cứu когорт (cohort study), thước đo nào thường được sử dụng để đánh giá mối liên hệ giữa yếu tố phơi nhiễm và bệnh tật?
A. Odds ratio
B. Hazard ratio
C. Tỷ số hiện mắc
D. Tỷ lệ rủi ro (Risk ratio)
107. Trong một nghiên cứu bệnh chứng (case-control study), thước đo nào thường được sử dụng để đánh giá mối liên hệ giữa yếu tố phơi nhiễm và bệnh tật?
A. Tỷ lệ rủi ro (Risk ratio)
B. Odds ratio
C. Hazard ratio
D. Tỷ lệ hiện mắc
108. Phương pháp nào sau đây được sử dụng để điều chỉnh cho nhiều so sánh trong kiểm định giả thuyết?
A. Kiểm định t
B. Bonferroni correction
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
109. Hàm ý nghĩa của hệ số tương quan Pearson là gì?
A. Đo lường mối quan hệ nhân quả giữa hai biến
B. Đo lường sự khác biệt giữa trung bình của hai nhóm
C. Đo lường độ mạnh và hướng của mối quan hệ tuyến tính giữa hai biến liên tục
D. Dự đoán giá trị của một biến dựa trên giá trị của biến khác
110. Giá trị tiên đoán dương (Positive Predictive Value – PPV) của một xét nghiệm y tế được định nghĩa là gì?
A. Tỷ lệ những người mắc bệnh có kết quả xét nghiệm dương tính
B. Tỷ lệ những người không mắc bệnh có kết quả xét nghiệm âm tính
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh
111. Độ nhạy (Sensitivity) của một xét nghiệm y tế được định nghĩa là gì?
A. Tỷ lệ những người không mắc bệnh có kết quả xét nghiệm âm tính
B. Tỷ lệ những người mắc bệnh có kết quả xét nghiệm dương tính
C. Xác suất một người có kết quả xét nghiệm dương tính thực sự mắc bệnh
D. Xác suất một người có kết quả xét nghiệm âm tính thực sự không mắc bệnh
112. Trong phân tích sống còn, đường cong Kaplan-Meier được sử dụng để làm gì?
A. Ước tính tỷ lệ sống sót trung bình
B. So sánh tỷ lệ sống sót giữa các nhóm
C. Hiển thị tỷ lệ sống sót theo thời gian
D. Xác định các yếu tố tiên lượng
113. Phương pháp nào sau đây được sử dụng để kiểm tra xem dữ liệu có tuân theo phân phối chuẩn hay không?
A. Kiểm định t
B. Kiểm định Shapiro-Wilk
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
114. Phương pháp nào sau đây được sử dụng để kiểm tra tính độc lập giữa hai biến phân loại?
A. Kiểm định t
B. Hồi quy tuyến tính
C. Phân tích phương sai (ANOVA)
D. Kiểm định Chi-bình phương
115. Loại biểu đồ nào phù hợp nhất để hiển thị phân phối của một biến liên tục?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ hộp
D. Biểu đồ散点
116. Phương pháp nào sau đây được sử dụng để phân tích mối quan hệ giữa hai biến phân loại khi có nhiều hơn hai nhóm?
A. Kiểm định t
B. Hồi quy tuyến tính
C. Kiểm định Chi-bình phương
D. Phân tích phương sai (ANOVA)
117. Giá trị p (p-value) trong kiểm định giả thuyết thống kê biểu thị điều gì?
A. Xác suất mắc sai lầm loại II
B. Xác suất để giả thuyết không là đúng
C. Ngưỡng ý nghĩa thống kê
D. Xác suất để có được kết quả quan sát hoặc kết quả cực đoan hơn nếu giả thuyết không là đúng
118. Trong một nghiên cứu can thiệp (intervention study), thước đo nào thường được sử dụng để đánh giá hiệu quả của can thiệp?
A. Tỷ lệ hiện mắc
B. Tỷ lệ rủi ro (Risk ratio)
C. Odds ratio
D. Số người cần điều trị (Number Needed to Treat – NNT)
119. Sai số loại I (Type I error) trong kiểm định giả thuyết thống kê còn được gọi là gì?
A. False negative
B. False positive
C. Độ nhạy
D. Độ đặc hiệu
120. Trong thống kê y học, phương pháp nào được sử dụng để ước tính kích thước mẫu cần thiết cho một nghiên cứu?
A. Phân tích phương sai (ANOVA)
B. Phân tích công suất (Power analysis)
C. Hồi quy tuyến tính
D. Kiểm định Chi-bình phương
121. Giá trị tiên đoán dương tính (Positive Predictive Value – PPV) của một xét nghiệm bị ảnh hưởng nhiều nhất bởi yếu tố nào?
A. Độ nhạy của xét nghiệm
B. Độ đặc hiệu của xét nghiệm
C. Tỷ lệ hiện mắc của bệnh trong quần thể
D. Cỡ mẫu nghiên cứu
122. Khi nào thì nên sử dụng kiểm định phi tham số (non-parametric test) thay vì kiểm định tham số (parametric test)?
A. Khi dữ liệu tuân theo phân phối chuẩn
B. Khi cỡ mẫu lớn
C. Khi dữ liệu không tuân theo phân phối chuẩn hoặc cỡ mẫu nhỏ
D. Khi muốn so sánh trung bình của hai nhóm
123. Chọn phát biểu đúng về độ nhạy (sensitivity) của một xét nghiệm chẩn đoán:
A. Tỷ lệ người không mắc bệnh có kết quả xét nghiệm âm tính
B. Tỷ lệ người mắc bệnh có kết quả xét nghiệm dương tính
C. Tỷ lệ người có kết quả xét nghiệm dương tính thực sự mắc bệnh
D. Tỷ lệ người có kết quả xét nghiệm âm tính thực sự không mắc bệnh
124. Phương pháp thống kê nào phù hợp nhất để so sánh tỷ lệ mắc bệnh giữa hai nhóm đối tượng độc lập?
A. Kiểm định t-Student
B. Kiểm định Chi-square
C. Phân tích phương sai ANOVA
D. Hồi quy tuyến tính
125. Trong một phân phối chuẩn, khoảng nào chứa khoảng 95% dữ liệu?
A. Trung bình ± 1 độ lệch chuẩn
B. Trung bình ± 2 độ lệch chuẩn
C. Trung bình ± 3 độ lệch chuẩn
D. Trung bình ± 1.645 độ lệch chuẩn
126. Hệ số tương quan Pearson đo lường điều gì?
A. Mức độ khác biệt giữa hai biến số
B. Mức độ liên hệ tuyến tính giữa hai biến số định lượng
C. Mức độ ảnh hưởng của một biến số lên biến số khác
D. Mức độ phù hợp của mô hình hồi quy
127. Trong thống kê y học, loại biến số nào thể hiện đặc điểm định tính và không thể đo lường bằng số?
A. Biến số định lượng liên tục
B. Biến số định lượng rời rạc
C. Biến số định tính thứ bậc
D. Biến số định lượng
128. Thế nào là phương sai (variance) trong thống kê?
A. Giá trị trung bình của một tập dữ liệu
B. Độ lệch chuẩn của một tập dữ liệu
C. Bình phương độ lệch chuẩn của một tập dữ liệu
D. Khoảng cách giữa giá trị lớn nhất và nhỏ nhất của một tập dữ liệu
129. Trong kiểm định giả thuyết thống kê, sai lầm loại I (Type I error) xảy ra khi nào?
A. Chấp nhận giả thuyết H0 khi nó sai
B. Bác bỏ giả thuyết H0 khi nó đúng
C. Chấp nhận giả thuyết H1 khi nó đúng
D. Bác bỏ giả thuyết H1 khi nó sai
130. Ý nghĩa của khoảng tin cậy 95% là gì?
A. Có 95% khả năng giá trị thực của tham số nằm ngoài khoảng tin cậy
B. Có 95% khả năng giá trị thực của tham số nằm trong khoảng tin cậy
C. Khoảng tin cậy chứa 95% dữ liệu quan sát được
D. Giá trị p nhỏ hơn 0.05
131. Trong phân tích phương sai (ANOVA), giá trị F thể hiện điều gì?
A. Phương sai giữa các nhóm
B. Phương sai trong các nhóm
C. Tỷ lệ giữa phương sai giữa các nhóm và phương sai trong các nhóm
D. Tổng phương sai của tất cả các nhóm
132. Mục đích của việc sử dụng các phương pháp thống kê trong nghiên cứu y học là gì?
A. Để chứng minh rằng một phương pháp điều trị luôn hiệu quả
B. Để loại bỏ hoàn toàn sai số trong nghiên cứu
C. Để đưa ra kết luận khách quan và dựa trên bằng chứng về các vấn đề y học
D. Để làm cho kết quả nghiên cứu trông có vẻ khoa học hơn
133. Trong nghiên cứu cắt ngang (cross-sectional study), thước đo nào thường được sử dụng để mô tả tần suất của bệnh tại một thời điểm nhất định?
A. Tỷ lệ mắc mới (incidence rate)
B. Tỷ lệ hiện mắc (prevalence)
C. Nguy cơ tương đối (relative risk)
D. Tỷ số chênh (odds ratio)
134. Phương pháp nào sau đây được sử dụng để kiểm tra tính chuẩn của dữ liệu?
A. Kiểm định t-Student
B. Kiểm định Chi-square
C. Kiểm định Shapiro-Wilk
D. Phân tích hồi quy tuyến tính
135. Giá trị p (p-value) trong kiểm định giả thuyết thống kê thể hiện điều gì?
A. Xác suất giả thuyết H0 đúng
B. Xác suất giả thuyết H1 đúng
C. Xác suất quan sát được kết quả (hoặc kết quả cực đoan hơn) nếu giả thuyết H0 đúng
D. Xác suất mắc sai lầm loại I
136. Phân tích độ tin cậy (reliability analysis) được sử dụng để đánh giá điều gì trong một nghiên cứu?
A. Mức độ chính xác của các phép đo
B. Mức độ ổn định và nhất quán của các phép đo
C. Mức độ mà kết quả nghiên cứu có thể áp dụng cho các quần thể khác
D. Mức độ mà các biến số trong nghiên cứu có liên quan đến nhau
137. Ý nghĩa của việc chuẩn hóa dữ liệu (data normalization) trong thống kê là gì?
A. Loại bỏ các giá trị ngoại lai
B. Chuyển đổi dữ liệu về cùng một thang đo
C. Sắp xếp dữ liệu theo thứ tự tăng dần
D. Tính toán các giá trị thống kê mô tả
138. Khi nào nên sử dụng kiểm định Mann-Whitney U test?
A. Để so sánh trung bình của hai mẫu độc lập khi dữ liệu tuân theo phân phối chuẩn
B. Để so sánh trung bình của hai mẫu phụ thuộc khi dữ liệu tuân theo phân phối chuẩn
C. Để so sánh trung vị của hai mẫu độc lập khi dữ liệu không tuân theo phân phối chuẩn
D. Để so sánh tỷ lệ của hai mẫu độc lập
139. Trong nghiên cứu bệnh chứng (case-control study), thước đo nào thường được sử dụng để ước tính mối liên hệ giữa yếu tố nguy cơ và bệnh?
A. Tỷ số hiện mắc (Prevalence ratio)
B. Nguy cơ tương đối (Relative risk)
C. Tỷ số chênh (Odds ratio)
D. Hiệu số nguy cơ (Risk difference)
140. Trong phân tích sống còn (survival analysis), hàm sống còn (survival function) S(t) thể hiện điều gì?
A. Thời gian trung bình sống sót
B. Xác suất một cá thể sống sót ít nhất đến thời điểm t
C. Tỷ lệ tử vong tại thời điểm t
D. Thời gian sống sót dài nhất quan sát được
141. Chọn phát biểu đúng nhất về ý nghĩa của cỡ mẫu (sample size) trong nghiên cứu y học:
A. Cỡ mẫu càng nhỏ thì kết quả nghiên cứu càng chính xác
B. Cỡ mẫu không ảnh hưởng đến kết quả nghiên cứu
C. Cỡ mẫu lớn giúp tăng khả năng phát hiện sự khác biệt có ý nghĩa thống kê
D. Cỡ mẫu chỉ quan trọng trong nghiên cứu định tính
142. Giá trị nào sau đây đo lường mức độ phân tán của dữ liệu xung quanh giá trị trung bình?
A. Trung vị
B. Độ lệch chuẩn
C. Mốt
D. Giá trị lớn nhất
143. Trong thống kê mô tả, trung vị (median) là gì?
A. Giá trị xuất hiện nhiều nhất trong tập dữ liệu
B. Giá trị trung bình của tập dữ liệu
C. Giá trị nằm chính giữa tập dữ liệu đã được sắp xếp
D. Tổng của tất cả các giá trị trong tập dữ liệu chia cho số lượng giá trị
144. Khi nào nên sử dụng kiểm định ANOVA thay vì kiểm định t-Student?
A. Khi so sánh trung bình của hai nhóm
B. Khi so sánh trung bình của ba nhóm trở lên
C. Khi so sánh phương sai của hai nhóm
D. Khi so sánh tỷ lệ của hai nhóm
145. Trong một nghiên cứu когорт (cohort study), thước đo nào được sử dụng để đánh giá mối liên hệ giữa yếu tố nguy cơ và bệnh?
A. Tỷ số chênh (Odds ratio)
B. Nguy cơ tương đối (Relative risk)
C. Tỷ số hiện mắc (Prevalence ratio)
D. Giá trị tiên đoán dương tính (Positive predictive value)
146. Khi nào nên sử dụng phân tích hồi quy logistic?
A. Khi biến phụ thuộc là biến định lượng liên tục
B. Khi biến phụ thuộc là biến định lượng rời rạc
C. Khi biến phụ thuộc là biến định tính nhị phân
D. Khi biến phụ thuộc là biến định tính đa phân
147. Trong phân tích hồi quy tuyến tính, hệ số chặn (intercept) biểu thị điều gì?
A. Độ dốc của đường hồi quy
B. Giá trị của biến phụ thuộc khi biến độc lập bằng 0
C. Mức độ phù hợp của mô hình
D. Sai số chuẩn của ước lượng
148. Độ đặc hiệu (specificity) của một xét nghiệm chẩn đoán là gì?
A. Khả năng xét nghiệm phát hiện đúng bệnh
B. Khả năng xét nghiệm loại trừ đúng người không bệnh
C. Tỷ lệ người bệnh có kết quả dương tính
D. Tỷ lệ người không bệnh có kết quả dương tính
149. Sai số chuẩn của trung bình (standard error of the mean) đo lường điều gì?
A. Độ lệch chuẩn của mẫu
B. Độ lệch chuẩn của quần thể
C. Độ lệch chuẩn của phân phối lấy mẫu của trung bình
D. Sai số do đo lường
150. Loại biểu đồ nào thích hợp nhất để thể hiện mối quan hệ giữa hai biến số định lượng?
A. Biểu đồ cột
B. Biểu đồ tròn
C. Biểu đồ đường
D. Biểu đồ phân tán (Scatter plot)