Chuyển đến nội dung

Trắc nghiệm Thống kê ứng dụng online có đáp án

Trắc Nghiệm Kỹ Thuật & Công Nghệ

Trắc nghiệm Thống kê ứng dụng online có đáp án

Ngày cập nhật: Tháng 2 8, 2026

Lưu ý và Miễn trừ trách nhiệm:Toàn bộ nội dung câu hỏi, đáp án và thông tin được cung cấp trên website này được xây dựng nhằm mục đích tham khảo, hỗ trợ ôn tập và củng cố kiến thức. Chúng tôi không cam kết về tính chính xác tuyệt đối, tính cập nhật hay độ tin cậy hoàn toàn của các dữ liệu này. Nội dung tại đây KHÔNG PHẢI LÀ ĐỀ THI CHÍNH THỨC của bất kỳ tổ chức giáo dục, trường đại học hay cơ quan cấp chứng chỉ nào. Người sử dụng tự chịu trách nhiệm khi sử dụng các thông tin này vào mục đích học tập, nghiên cứu hoặc áp dụng vào thực tiễn. Chúng tôi không chịu trách nhiệm pháp lý đối với bất kỳ sai sót, thiệt hại hoặc hậu quả nào phát sinh từ việc sử dụng thông tin trên website này.

Bạn đã sẵn sàng thử sức với bộ Trắc nghiệm Thống kê ứng dụng online có đáp án. Bộ câu hỏi sẽ giúp bạn củng cố kiến thức thông qua trải nghiệm học tập chủ động. Bắt đầu bằng cách chọn một bộ câu hỏi trong danh sách bên dưới. Mong rằng bộ câu hỏi này sẽ giúp bạn học tập tốt hơn

★★★★★
★★★★★
4.7/5 (155 đánh giá)

1. Trong thống kê ứng dụng, khi nào thì việc sử dụng trung vị (median) thích hợp hơn trung bình cộng (mean) để mô tả xu hướng trung tâm của dữ liệu?

A. Khi dữ liệu có phân phối đối xứng và không có giá trị ngoại lai đáng kể.
B. Khi cần tính toán các đại lượng thống kê phức tạp khác như độ lệch chuẩn.
C. Khi dữ liệu có các giá trị ngoại lai (outliers) hoặc phân phối lệch (skewed distribution).
D. Khi kích thước mẫu rất lớn và dữ liệu được thu thập từ nhiều nguồn khác nhau.

2. Giá trị p-value trong kiểm định giả thuyết thống kê cho biết điều gì?

A. Xác suất để giả thuyết không (H0) là đúng.
B. Xác suất mắc lỗi loại I (Type I error) nếu bác bỏ giả thuyết không (H0).
C. Mức ý nghĩa alpha mà tại đó chúng ta bác bỏ giả thuyết không (H0).
D. Xác suất quan sát được một kết quả dữ liệu ít nhất cực đoan như kết quả đã quan sát, giả sử giả thuyết không (H0) là đúng.

3. Lỗi loại I (Type I error) trong kiểm định giả thuyết thống kê xảy ra khi nào?

A. Bác bỏ giả thuyết không (H0) khi nó thực sự sai.
B. Không bác bỏ giả thuyết không (H0) khi nó thực sự sai.
C. Không bác bỏ giả thuyết không (H0) khi nó thực sự đúng.
D. Bác bỏ giả thuyết không (H0) khi nó thực sự đúng.

4. Mục đích chính của phân tích hồi quy tuyến tính đơn là gì?

A. Đo lường mức độ liên kết giữa hai biến định tính.
B. Dự đoán giá trị của một biến phụ thuộc định lượng dựa trên giá trị của một biến độc lập định lượng duy nhất.
C. So sánh trung bình của ba hoặc nhiều nhóm độc lập.
D. Kiểm tra xem hai biến có độc lập với nhau hay không.

5. Khi phân tích hồi quy, chỉ số R-squared (R^2) được sử dụng để làm gì?

A. Đo lường sức mạnh của mối quan hệ tuyến tính giữa các biến.
B. Xác định mức ý nghĩa thống kê của các hệ số hồi quy riêng lẻ.
C. Cho biết tỷ lệ phương sai của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
D. Đánh giá xem các phần dư có tuân theo phân phối chuẩn hay không.

6. Khái niệm ‘mức ý nghĩa’ (significance level), thường ký hiệu là α (alpha), trong kiểm định giả thuyết thống kê có ý nghĩa gì?

A. Xác suất để giả thuyết thay thế (H1) là đúng.
B. Xác suất không bác bỏ giả thuyết không (H0) khi nó thực sự sai.
C. Xác suất tối đa mà nhà nghiên cứu chấp nhận mắc lỗi loại I.
D. Xác suất tối thiểu để một kết quả được coi là có ý nghĩa thống kê.

7. Lý thuyết giới hạn trung tâm (Central Limit Theorem) phát biểu rằng điều gì sẽ xảy ra với phân phối của trung bình mẫu khi kích thước mẫu tăng lên?

A. Phân phối của trung bình mẫu sẽ trở nên lệch hơn.
B. Phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể phân phối của quần thể gốc là gì.
C. Phương sai của trung bình mẫu sẽ tăng lên.
D. Trung bình của các mẫu sẽ khác xa trung bình của quần thể.

8. Khoảng tin cậy (Confidence Interval) 95% cho trung bình quần thể có ý nghĩa gì?

A. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
B. Có 95% khả năng trung bình quần thể nằm trong khoảng đã tính toán.
C. Nếu lặp lại quá trình lấy mẫu và xây dựng khoảng tin cậy nhiều lần, khoảng tin cậy sẽ chứa trung bình quần thể thật trong 95% các trường hợp.
D. Trung bình quần thể chắc chắn nằm trong khoảng này với xác suất 95%.

9. Loại dữ liệu nào sau đây được gọi là dữ liệu định tính (categorical data) có thứ tự rõ ràng nhưng khoảng cách giữa các giá trị không có ý nghĩa nhất quán?

A. Dữ liệu tỷ lệ (Ratio data).
B. Dữ liệu khoảng (Interval data).
C. Dữ liệu danh nghĩa (Nominal data).
D. Dữ liệu thứ tự (Ordinal data).

10. Khi nào thì nên sử dụng kiểm định Chi-squared (Kiểm định Chi bình phương) để phân tích dữ liệu?

A. Để so sánh trung bình của hai nhóm độc lập định lượng.
B. Để đánh giá mối quan hệ tuyến tính giữa hai biến định lượng.
C. Để kiểm tra sự độc lập giữa hai biến định tính hoặc so sánh phân phối tần suất quan sát với phân phối tần suất mong đợi.
D. Để ước tính giá trị của một biến phụ thuộc dựa trên nhiều biến độc lập.

11. Độ lệch chuẩn (Standard Deviation) đo lường điều gì trong một tập dữ liệu?

A. Giá trị trung bình của dữ liệu.
B. Điểm giữa của dữ liệu sau khi sắp xếp.
C. Mức độ phân tán hay biến động của dữ liệu xung quanh giá trị trung bình.
D. Giá trị xuất hiện thường xuyên nhất trong dữ liệu.

12. Phương pháp lấy mẫu nào sau đây có xu hướng tạo ra một mẫu đại diện cho quần thể tốt nhất nếu được thực hiện đúng cách?

A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
C. Lấy mẫu phán đoán (Judgment sampling).
D. Lấy mẫu có mục đích (Purposive sampling).

13. Khi phân tích phương sai (ANOVA), giả thuyết không (H0) thường phát biểu điều gì?

A. Ít nhất một trong các trung bình nhóm là khác biệt đáng kể.
B. Không có sự khác biệt đáng kể giữa các trung bình nhóm.
C. Các phương sai của các nhóm là khác nhau.
D. Có mối quan hệ tuyến tính giữa biến độc lập và biến phụ thuộc.

14. Một nhà nghiên cứu muốn kiểm tra xem liệu một phương pháp giảng dạy mới có cải thiện điểm thi trung bình của sinh viên hay không. Ông nên sử dụng kiểm định giả thuyết nào nếu giả định điểm thi được phân phối chuẩn và có hai nhóm độc lập (cũ và mới)?

A. Kiểm định Chi-squared.
B. Phân tích hồi quy tuyến tính.
C. Kiểm định t độc lập (Independent samples t-test).
D. Phân tích phương sai (ANOVA).

15. Hệ số tương quan Pearson (Pearson’s correlation coefficient, r) đo lường điều gì?

A. Mức độ tác động nhân quả giữa hai biến.
B. Độ mạnh và chiều hướng của mối quan hệ tuyến tính giữa hai biến định lượng.
C. Sự khác biệt trung bình giữa hai nhóm.
D. Tỷ lệ phương sai được giải thích trong một mô hình hồi quy.

16. Một trong những giả định quan trọng nhất của hồi quy tuyến tính cổ điển là gì?

A. Các biến độc lập phải có tương quan cao với nhau.
B. Phần dư (residuals) phải có phương sai không đổi (homoscedasticity) và phân phối chuẩn.
C. Biến phụ thuộc phải là biến định tính.
D. Số lượng biến độc lập phải bằng số lượng quan sát.

17. Hiện tượng đa cộng tuyến (multicollinearity) trong hồi quy tuyến tính xảy ra khi nào?

A. Phần dư có mối tương quan với các biến độc lập.
B. Biến phụ thuộc có nhiều giá trị ngoại lai.
C. Các biến độc lập trong mô hình có mối tương quan mạnh mẽ với nhau.
D. Phương sai của phần dư không đồng nhất.

18. Trong nghiên cứu ứng dụng, ‘quần thể’ (population) được hiểu là gì?

A. Tập hợp con của các đối tượng được chọn để nghiên cứu.
B. Toàn bộ tập hợp các cá thể, đối tượng hoặc sự kiện mà chúng ta muốn suy luận về chúng.
C. Các kết quả thống kê thu được từ mẫu.
D. Tổng số người sống trong một khu vực địa lý cụ thể.

19. Loại biểu đồ nào là tốt nhất để hiển thị phân phối của một biến định lượng liên tục?

A. Biểu đồ cột (Bar chart).
B. Biểu đồ tròn (Pie chart).
C. Biểu đồ phân tán (Scatter plot).
D. Biểu đồ tần suất (Histogram).

20. Để so sánh trung bình của ba hoặc nhiều nhóm độc lập khi dữ liệu phân phối chuẩn, phương pháp thống kê nào là phù hợp nhất?

A. Kiểm định t cặp (Paired t-test).
B. Phân tích hồi quy đa biến.
C. Phân tích phương sai một yếu tố (One-way ANOVA).
D. Kiểm định Wilcoxon rank-sum.

21. Khi p-value nhỏ hơn mức ý nghĩa alpha (α), chúng ta nên đưa ra kết luận gì?

A. Không có đủ bằng chứng thống kê để bác bỏ giả thuyết không (H0).
B. Giả thuyết không (H0) là đúng.
C. Bác bỏ giả thuyết không (H0).
D. Chấp nhận giả thuyết thay thế (H1) mà không cần kiểm chứng thêm.

22. Một nhà tiếp thị muốn kiểm tra xem liệu có mối liên hệ giữa giới tính (Nam/Nữ) và sự ưa thích một loại sản phẩm mới (Thích/Không thích) hay không. Anh ta nên sử dụng kiểm định nào?

A. Kiểm định t độc lập.
B. Hồi quy tuyến tính.
C. Kiểm định Chi-squared về sự độc lập.
D. Phân tích phương sai (ANOVA).

23. Điểm Z-score của một quan sát trong phân phối chuẩn cho chúng ta biết điều gì?

A. Giá trị tuyệt đối của quan sát.
B. Khoảng cách của quan sát đó từ trung bình tính theo độ lệch chuẩn.
C. Vị trí của quan sát trong phân phối chuẩn sau khi đã chuyển đổi thành percentile.
D. Mức độ lệch của phân phối so với phân phối chuẩn.

24. Phân tích hồi quy logistic được sử dụng khi nào?

A. Biến phụ thuộc là định lượng và biến độc lập là định tính.
B. Biến phụ thuộc là định tính (nhị phân hoặc đa thể) và biến độc lập có thể là định lượng hoặc định tính.
C. Cả biến phụ thuộc và biến độc lập đều là định lượng.
D. Mối quan hệ giữa các biến là phi tuyến tính và phức tạp.

25. Trong phân tích thống kê, ‘giá trị ngoại lai’ (outlier) là gì?

A. Giá trị trung bình của tập dữ liệu.
B. Một điểm dữ liệu nằm cách xa đáng kể so với các điểm dữ liệu khác trong tập hợp.
C. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
D. Giá trị nhỏ nhất hoặc lớn nhất của tập dữ liệu.

26. Mục đích của việc kiểm tra giả định về phân phối chuẩn của dữ liệu là gì?

A. Để đảm bảo rằng tất cả các giá trị trong mẫu là duy nhất.
B. Để xác định xem có nên sử dụng các phương pháp thống kê phi tham số hay không.
C. Để xác định liệu dữ liệu có thể được mô tả bằng trung bình và độ lệch chuẩn hay không.
D. Để đảm bảo rằng các phương pháp thống kê tham số (như kiểm định t, ANOVA) có thể được áp dụng một cách hợp lệ.

27. Khi nào thì kiểm định t cặp (Paired samples t-test) được sử dụng?

A. Để so sánh trung bình của một biến định lượng giữa hai nhóm độc lập.
B. Để so sánh trung bình của một biến định lượng từ cùng một nhóm hoặc cá thể được đo lường hai lần (trước và sau).
C. Để kiểm tra mối quan hệ giữa hai biến định tính.
D. Để dự đoán giá trị của một biến dựa trên các biến khác.

28. Độ chính xác của một ước tính khoảng tin cậy (ví dụ: độ rộng của khoảng) phụ thuộc chủ yếu vào yếu tố nào?

A. Số lượng biến độc lập trong mô hình.
B. Mức ý nghĩa alpha (α) được chọn.
C. Kích thước mẫu và độ lệch chuẩn của quần thể (hoặc mẫu).
D. Số lượng giá trị ngoại lai trong dữ liệu.

29. Mối tương quan giả (spurious correlation) là gì trong phân tích thống kê?

A. Mối tương quan mạnh giữa hai biến thực sự có liên hệ nhân quả.
B. Mối tương quan không đáng kể giữa hai biến.
C. Mối tương quan thống kê giữa hai biến không có mối liên hệ nhân quả trực tiếp, mà được gây ra bởi một biến thứ ba không được quan sát hoặc một sự trùng hợp ngẫu nhiên.
D. Mối tương quan được tìm thấy trong mẫu nhưng không tồn tại trong quần thể.

30. Phương pháp nào sau đây giúp giảm thiểu rủi ro lấy mẫu thiên vị (sampling bias)?

A. Chỉ chọn những cá thể dễ tiếp cận nhất.
B. Sử dụng các phương pháp lấy mẫu xác suất như lấy mẫu ngẫu nhiên hoặc lấy mẫu phân tầng.
C. Tăng số lượng câu hỏi trong bảng khảo sát.
D. Phân tích dữ liệu bằng nhiều phần mềm thống kê khác nhau.

31. Trong thống kê ứng dụng, mục đích chính của thống kê mô tả là gì?

A. Dùng để kiểm định các giả thuyết về mối quan hệ nhân quả.
B. Để đưa ra các dự đoán và kết luận về tổng thể dựa trên mẫu dữ liệu.
C. Để tổng hợp, trình bày và mô tả các đặc điểm chính của một tập dữ liệu.
D. Nhằm phát hiện ra các mối tương quan phức tạp giữa nhiều biến số.

32. Khi phân tích dữ liệu về thu nhập của một nhóm người có nhiều giá trị ngoại lai (outliers) cực cao, thước đo xu hướng trung tâm nào sau đây thường được xem là phù hợp nhất để thể hiện thu nhập ‘điển hình’?

A. Độ lệch chuẩn.
B. Giá trị trung bình (Mean).
C. Khoảng biến thiên.
D. Trung vị (Median).

33. Giá trị p (p-value) trong kiểm định giả thuyết thống kê cho biết điều gì?

A. Mức độ quan trọng thực tế của hiệu ứng được quan sát.
B. Khả năng giả thuyết không (H0) là đúng.
C. Xác suất quan sát thấy dữ liệu như hiện tại (hoặc cực đoan hơn) nếu giả thuyết không (H0) là đúng.
D. Độ lớn của sự khác biệt giữa các nhóm.

34. Sai lầm loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?

A. Không bác bỏ giả thuyết không (H0) khi nó thực sự là sai.
B. Bác bỏ giả thuyết không (H0) khi nó thực sự là đúng.
C. Bác bỏ giả thuyết thay thế (H1) khi nó thực sự là đúng.
D. Không bác bỏ giả thuyết thay thế (H1) khi nó thực sự là sai.

35. Định lý Giới hạn Trung tâm (Central Limit Theorem) có ý nghĩa quan trọng nhất trong thống kê ứng dụng là gì?

A. Nó đảm bảo rằng phân phối của một mẫu luôn là phân phối chuẩn, bất kể phân phối của tổng thể.
B. Nó cho phép sử dụng thống kê suy luận trên các tổng thể có phân phối không chuẩn khi kích thước mẫu đủ lớn.
C. Nó chỉ áp dụng cho dữ liệu được thu thập từ các thí nghiệm ngẫu nhiên có kiểm soát.
D. Nó khẳng định rằng giá trị trung bình của mẫu luôn bằng giá trị trung bình của tổng thể.

36. Một nhà nghiên cứu muốn so sánh điểm trung bình của hai nhóm sinh viên độc lập đã học theo hai phương pháp giảng dạy khác nhau; kiểm định thống kê nào là phù hợp nhất để sử dụng?

A. Kiểm định Chi-bình phương (Chi-square test).
B. Phân tích phương sai (ANOVA).
C. Kiểm định t độc lập (Independent samples t-test).
D. Phân tích hồi quy tuyến tính.

37. Trong phân tích hồi quy tuyến tính đơn giản, giá trị R-squared (R bình phương) bằng 0.75 có ý nghĩa gì?

A. Có 75% khả năng biến độc lập gây ra biến phụ thuộc.
B. Biến phụ thuộc được giải thích 75% bởi biến độc lập trong mô hình.
C. Mối quan hệ tuyến tính giữa hai biến là 75% mạnh.
D. Khoảng tin cậy cho hệ số hồi quy là 75%.

38. Sự khác biệt cơ bản giữa tương quan (correlation) và nhân quả (causation) trong thống kê là gì?

A. Tương quan ngụ ý có một biến ảnh hưởng trực tiếp đến biến kia, còn nhân quả thì không.
B. Nhân quả chỉ mối liên hệ tuyến tính, trong khi tương quan có thể là phi tuyến.
C. Tương quan chỉ ra hai biến có xu hướng thay đổi cùng nhau, còn nhân quả khẳng định một biến là nguyên nhân trực tiếp của biến kia.
D. Không có sự khác biệt đáng kể, chúng thường được sử dụng thay thế cho nhau.

39. Khoảng tin cậy 95% cho giá trị trung bình của tổng thể có ý nghĩa gì?

A. Có 95% khả năng giá trị trung bình mẫu nằm trong khoảng này.
B. Nếu lấy mẫu lặp lại nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa giá trị trung bình thực của tổng thể.
C. Khoảng này chứa 95% số liệu của tổng thể.
D. Xác suất giá trị trung bình tổng thể nằm trong khoảng này là 0.95.

40. Dữ liệu về xếp hạng mức độ hài lòng của khách hàng (ví dụ: ‘Rất không hài lòng’, ‘Không hài lòng’, ‘Trung lập’, ‘Hài lòng’, ‘Rất hài lòng’) thuộc loại thang đo nào?

A. Thang đo định danh (Nominal scale).
B. Thang đo tỷ lệ (Ratio scale).
C. Thang đo khoảng (Interval scale).
D. Thang đo thứ bậc (Ordinal scale).

41. Khi nào thì phân tích phương sai (ANOVA) là một phương pháp kiểm định thống kê thích hợp để sử dụng?

A. Khi so sánh hai giá trị trung bình của hai nhóm độc lập.
B. Khi kiểm tra mối quan hệ giữa hai biến định tính.
C. Khi so sánh giá trị trung bình của ba hoặc nhiều nhóm độc lập trở lên.
D. Khi dự đoán một biến liên tục dựa trên một biến liên tục khác.

42. Một nhà nghiên cứu muốn kiểm tra xem có mối liên hệ nào giữa giới tính (Nam/Nữ) và sở thích xem phim (Hành động/Hài/Kinh dị) hay không; kiểm định thống kê nào phù hợp nhất?

A. Kiểm định t độc lập.
B. Phân tích hồi quy bội.
C. Kiểm định Chi-bình phương (Chi-square test).
D. Phân tích phương sai (ANOVA).

43. Sự khác biệt giữa tổng thể (population) và mẫu (sample) trong thống kê là gì?

A. Tổng thể là một tập hợp con của mẫu, được chọn ngẫu nhiên để phân tích.
B. Mẫu là toàn bộ tập hợp các cá thể hoặc đối tượng quan tâm, trong khi tổng thể là một phần nhỏ được chọn từ đó.
C. Tổng thể là toàn bộ tập hợp các cá thể hoặc đối tượng mà chúng ta muốn suy luận, còn mẫu là một tập hợp con được chọn từ tổng thể đó.
D. Tổng thể và mẫu là hai thuật ngữ có thể thay thế cho nhau trong hầu hết các nghiên cứu thống kê.

44. Giá trị nào trong các lựa chọn sau đây là thước đo độ phân tán (variability) của dữ liệu?

A. Trung vị (Median).
B. Giá trị trung bình (Mean).
C. Độ lệch chuẩn (Standard deviation).
D. Mốt (Mode).

45. Khi nào phân phối dữ liệu được coi là ‘lệch trái’ (negatively skewed)?

A. Khi phần lớn dữ liệu tập trung ở phía bên phải của biểu đồ, và có một ‘đuôi’ kéo dài về phía bên trái.
B. Khi dữ liệu phân bố đối xứng hoàn hảo quanh giá trị trung bình.
C. Khi phần lớn dữ liệu tập trung ở phía bên trái của biểu đồ, và có một ‘đuôi’ kéo dài về phía bên phải.
D. Khi giá trị trung bình, trung vị và mốt đều bằng nhau.

46. Phương pháp lấy mẫu nào sau đây có khả năng giảm thiểu thiên vị (bias) và tăng tính đại diện của mẫu nhất?

A. Lấy mẫu thuận tiện (Convenience sampling).
B. Lấy mẫu ngẫu nhiên đơn giản (Simple random sampling).
C. Lấy mẫu theo định mức (Quota sampling).
D. Lấy mẫu có chủ đích (Purposive sampling).

47. Một nhà thống kê cần phân tích dữ liệu không tuân theo phân phối chuẩn và kích thước mẫu nhỏ; loại kiểm định nào thường được ưu tiên sử dụng trong trường hợp này?

A. Kiểm định tham số (Parametric test).
B. Kiểm định hồi quy tuyến tính.
C. Kiểm định phi tham số (Non-parametric test).
D. Kiểm định t.

48. Trong phân tích hồi quy bội, nếu hệ số của một biến độc lập có giá trị p lớn hơn mức ý nghĩa alpha (ví dụ 0.05), điều này có ý nghĩa gì?

A. Biến độc lập đó có tác động ý nghĩa thống kê lên biến phụ thuộc.
B. Biến độc lập đó không có tác động đáng kể về mặt kinh tế lên biến phụ thuộc.
C. Không có đủ bằng chứng thống kê để kết luận rằng biến độc lập đó có mối quan hệ tuyến tính ý nghĩa với biến phụ thuộc.
D. Mô hình hồi quy có chất lượng dự đoán cao.

49. Khi trình bày kết quả thống kê, việc làm tròn số liệu hoặc bỏ qua các giá trị ngoại lai mà không có lý do chính đáng có thể dẫn đến vấn đề gì?

A. Tăng độ chính xác của mô hình thống kê.
B. Giảm bớt sự phức tạp trong báo cáo, giúp người đọc dễ hiểu hơn.
C. Thiên vị dữ liệu và làm sai lệch kết quả nghiên cứu, gây ra các kết luận không chính xác.
D. Luôn được chấp nhận trong các nghiên cứu khoa học để làm đẹp số liệu.

50. Giá trị ngoại lai (outlier) trong tập dữ liệu có thể ảnh hưởng như thế nào đến phân tích thống kê?

A. Luôn làm tăng độ chính xác của các ước lượng tham số.
B. Có thể làm sai lệch các thước đo xu hướng trung tâm như trung bình và ảnh hưởng đến kết quả hồi quy.
C. Chỉ ảnh hưởng đến các biến định tính, không ảnh hưởng đến biến định lượng.
D. Không có tác động đáng kể nào nếu kích thước mẫu đủ lớn.

51. Chỉ số Z-score của một điểm dữ liệu là 2.0 có ý nghĩa gì?

A. Điểm dữ liệu đó nằm cách giá trị trung bình 2 đơn vị.
B. Điểm dữ liệu đó nằm cách giá trị trung bình 2 độ lệch chuẩn.
C. Điểm dữ liệu đó là một giá trị ngoại lai cực đoan.
D. Xác suất để có điểm dữ liệu cao hơn là 2%.

52. Khi phân phối dữ liệu là đối xứng và không có giá trị ngoại lai, thước đo xu hướng trung tâm nào thường cho kết quả tương tự và có thể được sử dụng thay thế cho nhau?

A. Khoảng tứ phân vị và độ lệch chuẩn.
B. Trung bình, trung vị và mốt.
C. Giá trị lớn nhất và giá trị nhỏ nhất.
D. Độ lệch chuẩn và phương sai.

53. Trong phân tích hồi quy, việc kiểm tra biểu đồ phần dư (residual plot) giúp chúng ta đánh giá điều gì về mô hình?

A. Tính đối xứng của phân phối biến phụ thuộc.
B. Mối quan hệ nhân quả giữa các biến độc lập và biến phụ thuộc.
C. Các giả định của hồi quy tuyến tính như tính tuyến tính, phương sai phần dư không đổi và tính độc lập của phần dư.
D. Độ lớn của hệ số tương quan giữa các biến.

54. Kỹ thuật ‘nghiên cứu mù đôi’ (double-blind study) trong thiết kế thí nghiệm được sử dụng để làm gì?

A. Để đảm bảo rằng tất cả người tham gia đều nhận được cùng một loại điều trị.
B. Để ngăn chặn cả người tham gia và nhà nghiên cứu biết ai thuộc nhóm điều trị và ai thuộc nhóm đối chứng, giảm thiểu thiên vị.
C. Để tăng cường khả năng tổng quát hóa kết quả cho một tổng thể lớn hơn.
D. Chỉ áp dụng cho các nghiên cứu về thuốc và không liên quan đến thống kê.

55. Sự khác biệt giữa ý nghĩa thống kê (statistical significance) và ý nghĩa thực tiễn (practical significance) là gì?

A. Ý nghĩa thống kê luôn ngụ ý ý nghĩa thực tiễn, và ngược lại.
B. Ý nghĩa thống kê chỉ ra rằng một hiệu ứng có thể không phải do ngẫu nhiên, trong khi ý nghĩa thực tiễn đề cập đến tầm quan trọng hoặc tác động thực sự của hiệu ứng đó trong thế giới thực.
C. Ý nghĩa thực tiễn dựa trên giá trị p, còn ý nghĩa thống kê dựa trên độ lớn của hiệu ứng.
D. Không có sự khác biệt rõ ràng giữa hai khái niệm này trong thực hành thống kê.

56. Trong thống kê Bayes, khái niệm ‘prior probability’ (xác suất tiên nghiệm) đóng vai trò gì?

A. Là xác suất của dữ liệu được quan sát.
B. Là xác suất của giả thuyết được cập nhật sau khi có dữ liệu mới.
C. Là niềm tin ban đầu về một giả thuyết trước khi xem xét bất kỳ dữ liệu mới nào.
D. Là xác suất của giả thuyết không.

57. Phân tích chuỗi thời gian (time series analysis) thường được áp dụng cho loại dữ liệu nào?

A. Dữ liệu được thu thập từ các thí nghiệm ngẫu nhiên, không có thứ tự thời gian.
B. Dữ liệu được thu thập từ các cuộc khảo sát một lần với nhiều biến số.
C. Dữ liệu được thu thập liên tục qua các khoảng thời gian đều đặn, có thứ tự phụ thuộc vào thời gian.
D. Dữ liệu về các mối quan hệ giữa các biến định tính.

58. Thách thức chính khi áp dụng các phương pháp thống kê truyền thống cho ‘Big Data’ là gì?

A. Kích thước mẫu lớn luôn làm cho mọi kiểm định thống kê đều có ý nghĩa.
B. Các phương pháp này thường được thiết kế cho dữ liệu có cấu trúc, sạch sẽ và kích thước nhỏ hơn, không hiệu quả với khối lượng, tốc độ và sự đa dạng của Big Data.
C. Big Data không bao giờ yêu cầu phân tích thống kê, chỉ cần học máy.
D. Big Data có quá ít biến để thực hiện phân tích đa biến.

59. Điểm tương đồng chính giữa học máy (Machine Learning) và thống kê ứng dụng là gì?

A. Học máy chỉ tập trung vào dự đoán, trong khi thống kê chỉ tập trung vào suy luận.
B. Cả hai đều sử dụng dữ liệu để khám phá các mô hình, đưa ra dự đoán và hiểu về thế giới, mặc dù có thể khác nhau về mục tiêu và thuật toán cụ thể.
C. Học máy hoàn toàn không dựa trên các nguyên tắc thống kê.
D. Thống kê luôn yêu cầu các giả định nghiêm ngặt về phân phối dữ liệu, còn học máy thì không.

60. Mô phỏng Monte Carlo được sử dụng trong thống kê ứng dụng cho mục đích nào?

A. Để tìm kiếm mối quan hệ nhân quả trong dữ liệu quan sát.
B. Để ước lượng các tham số phức tạp hoặc mô hình hóa các hệ thống có yếu tố ngẫu nhiên khi phương pháp phân tích truyền thống khó áp dụng.
C. Để giảm kích thước mẫu cần thiết cho một nghiên cứu.
D. Để chứng minh một giả thuyết là đúng mà không cần thu thập dữ liệu thực tế.

61. Thống kê ứng dụng’ chủ yếu tập trung vào khía cạnh nào trong phân tích dữ liệu?

A. Phát triển các lý thuyết toán học phức tạp cho thống kê.
B. Việc áp dụng các phương pháp thống kê để giải quyết các vấn đề thực tế và diễn giải kết quả.
C. Chỉ thu thập dữ liệu mà không phân tích.
D. Tập trung duy nhất vào việc thiết kế phần mềm thống kê.

62. Trong thống kê ứng dụng, kiểm định t-test độc lập thường được sử dụng trong trường hợp nào?

A. Dự đoán giá trị của một biến dựa trên biến khác.
B. So sánh ba hay nhiều hơn các nhóm mẫu.
C. So sánh giá trị trung bình của hai nhóm mẫu độc lập.
D. Kiểm tra mối quan hệ giữa hai biến định tính.

63. Hệ số tương quan Pearson (r) có giá trị là 0,85 cho thấy điều gì giữa hai biến định lượng?

A. Có mối tương quan tuyến tính âm mạnh giữa hai biến.
B. Không có mối tương quan giữa hai biến.
C. Một biến gây ra sự thay đổi ở biến kia.
D. Có mối tương quan tuyến tính dương mạnh giữa hai biến.

64. Trong kiểm định giả thuyết, nếu p-value nhỏ hơn mức ý nghĩa alpha (ví dụ 0,05), kết luận thống kê phổ biến nhất là gì?

A. Chấp nhận giả thuyết không (H0).
B. Bác bỏ giả thuyết không (H0).
C. Kích thước mẫu quá nhỏ để đưa ra kết luận.
D. Giả thuyết thay thế (Ha) là sai.

65. Sai lầm loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?

A. Chấp nhận giả thuyết không (H0) trong khi H0 thực sự sai.
B. Bác bỏ giả thuyết không (H0) trong khi H0 thực sự đúng.
C. Bác bỏ giả thuyết thay thế (Ha) trong khi Ha thực sự đúng.
D. Chấp nhận giả thuyết thay thế (Ha) trong khi Ha thực sự sai.

66. Mục đích chính của việc sử dụng phân tích hồi quy trong thống kê ứng dụng là gì?

A. Mô hình hóa và dự đoán mối quan hệ giữa biến phụ thuộc và các biến độc lập.
B. Chỉ để kiểm tra sự khác biệt giữa các nhóm.
C. Xác định độ tin cậy của một cuộc khảo sát.
D. Thu thập dữ liệu từ một tập hợp lớn.

67. Biến định danh (nominal variable) có đặc điểm nào sau đây?

A. Có thứ tự nhưng không có khoảng cách bằng nhau giữa các giá trị.
B. Phân loại dữ liệu thành các danh mục không có thứ bậc rõ ràng.
C. Có thứ tự, khoảng cách bằng nhau và điểm 0 tuyệt đối.
D. Có thứ tự và khoảng cách bằng nhau nhưng không có điểm 0 tuyệt đối.

68. Phương pháp lấy mẫu nào đảm bảo rằng mỗi phần tử trong tổng thể có cơ hội được chọn như nhau vào mẫu?

A. Lấy mẫu thuận tiện.
B. Lấy mẫu ngẫu nhiên đơn giản.
C. Lấy mẫu tuyết lăn.
D. Lấy mẫu định mức.

69. Phương sai trong thống kê đo lường điều gì của một tập dữ liệu?

A. Tần suất xuất hiện của một giá trị.
B. Giá trị trung tâm của dữ liệu.
C. Mức độ phân tán của các điểm dữ liệu so với giá trị trung bình.
D. Mối quan hệ tuyến tính giữa hai biến.

70. Một khoảng tin cậy 95% cho giá trị trung bình của tổng thể có nghĩa là gì?

A. Có 95% khả năng giá trị trung bình mẫu nằm trong khoảng này.
B. Có 95% khả năng giá trị trung bình tổng thể nằm trong khoảng này.
C. Nếu lặp lại việc lấy mẫu nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa giá trị trung bình thực của tổng thể.
D. Giá trị trung bình của tổng thể sẽ nằm trong khoảng này với xác suất 0,95.

71. Đặc điểm nào sau đây KHÔNG ĐÚNG với phân phối chuẩn (normal distribution)?

A. Các đuôi của phân phối tiệm cận trục hoành nhưng không bao giờ chạm tới.
B. Dạng hình chuông và đối xứng.
C. Giá trị mode luôn nhỏ hơn giá trị trung bình và trung vị.
D. Giá trị trung bình, trung vị và mode trùng nhau.

72. Phân tích phương sai một chiều (One-Way ANOVA) được sử dụng để làm gì?

A. So sánh giá trị trung bình của hai nhóm phụ thuộc.
B. Kiểm tra sự phù hợp của mô hình với dữ liệu.
C. So sánh giá trị trung bình của ba hoặc nhiều nhóm độc lập.
D. Phân tích mối quan hệ giữa hai biến định lượng.

73. Trong một mô hình hồi quy tuyến tính đơn giản Y = a + bX, hệ số ‘a’ (hệ số chặn) đại diện cho điều gì?

A. Độ dốc của đường hồi quy.
B. Mối tương quan giữa Y và X.
C. Giá trị dự đoán của biến phụ thuộc Y khi biến độc lập X bằng 0.
D. Sai số chuẩn của ước lượng.

74. Khi một tập dữ liệu có các giá trị ngoại lai (outliers) đáng kể, thước đo xu hướng trung tâm nào thường được khuyến nghị sử dụng nhất?

A. Độ lệch chuẩn.
B. Trung bình.
C. Trung vị.
D. Mode.

75. Kiểm định Chi-bình phương (Chi-square test) thường được sử dụng để phân tích loại dữ liệu nào?

A. Dữ liệu liên tục và có phân phối chuẩn.
B. Dữ liệu thời gian thực được thu thập liên tục.
C. Dữ liệu định tính (danh mục) hoặc tần số.
D. Dữ liệu có thứ bậc với khoảng cách không đều.

76. ‘Ý nghĩa thống kê’ trong một nghiên cứu có nghĩa là gì?

A. Kết quả có ý nghĩa thực tế cao.
B. Khả năng kết quả quan sát không xảy ra do ngẫu nhiên.
C. Kích thước mẫu đủ lớn để đại diện cho tổng thể.
D. Giả thuyết không đã được chứng minh là đúng.

77. Chỉ số R-squared (R²) trong phân tích hồi quy cho biết điều gì?

A. Độ mạnh của mối tương quan giữa hai biến.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi mô hình hồi quy.
C. Độ dốc của đường hồi quy.
D. Xác suất lỗi loại I.

78. Thiên lệch lấy mẫu (sampling bias) xảy ra khi nào trong quá trình thu thập dữ liệu?

A. Người trả lời cung cấp thông tin không chính xác.
B. Dữ liệu được phân tích bằng phương pháp không phù hợp.
C. Kích thước mẫu quá lớn.
D. Một số thành viên của tổng thể ít có khả năng được chọn vào mẫu hơn những người khác.

79. Định lý giới hạn trung tâm (Central Limit Theorem) phát biểu điều gì về phân phối của trung bình mẫu?

A. Phân phối của tổng thể luôn là phân phối chuẩn.
B. Khi kích thước mẫu đủ lớn, phân phối của trung bình mẫu sẽ xấp xỉ phân phối chuẩn, bất kể phân phối của tổng thể.
C. Các giá trị ngoại lai không ảnh hưởng đến trung bình mẫu.
D. Kích thước mẫu càng lớn thì độ lệch chuẩn của tổng thể càng nhỏ.

80. Bước đầu tiên và quan trọng nhất trong quy trình kiểm định giả thuyết thống kê là gì?

A. Tính toán p-value.
B. Xác định rõ ràng giả thuyết không (H0) và giả thuyết thay thế (Ha).
C. Thu thập dữ liệu.
D. Quyết định bác bỏ hay không bác bỏ H0.

81. Biểu đồ hộp (box plot) được sử dụng hiệu quả nhất để hiển thị điều gì về một phân phối dữ liệu?

A. Tần suất của các danh mục dữ liệu.
B. Sự thay đổi của một biến theo thời gian.
C. Mối quan hệ giữa hai biến định lượng.
D. Tứ phân vị, trung vị, sự phân tán và các giá trị ngoại lai của dữ liệu.

82. Trong trường hợp nào, việc sử dụng các kiểm định phi tham số (non-parametric tests) thường được ưu tiên hơn các kiểm định tham số (parametric tests)?

A. Khi cần kiểm tra mối quan hệ tuyến tính giữa hai biến.
B. Dữ liệu không tuân theo phân phối chuẩn hoặc có kích thước mẫu nhỏ.
C. Khi dữ liệu là biến tỷ lệ và có phân phối chuẩn.
D. Khi độ lệch chuẩn của tổng thể đã biết.

83. Sức mạnh của một kiểm định thống kê (statistical power) được định nghĩa là gì?

A. Xác suất mắc lỗi loại I.
B. Xác suất chấp nhận giả thuyết không khi nó đúng.
C. Xác suất bác bỏ giả thuyết không (H0) khi H0 thực sự sai (tức là H1 đúng).
D. Xác suất mắc lỗi loại II.

84. Thành phần nào của chuỗi thời gian mô tả sự biến động lặp đi lặp lại trong một khoảng thời gian nhất định (ví dụ: hàng ngày, hàng tuần, hàng tháng)?

A. Thành phần ngẫu nhiên (Random/Irregular).
B. Thành phần mùa vụ (Seasonality).
C. Thành phần chu kỳ (Cyclical).
D. Thành phần xu hướng (Trend).

85. Bước ‘làm sạch dữ liệu’ (data cleaning) trong quy trình phân tích thống kê ứng dụng có mục đích chính là gì?

A. Chỉ để trực quan hóa dữ liệu.
B. Đảm bảo tính chính xác và nhất quán của dữ liệu để phân tích hiệu quả.
C. Áp dụng các thuật toán máy học phức tạp.
D. Giảm kích thước tập dữ liệu.

86. Trong phân tích hồi quy đa biến, đa cộng tuyến (multicollinearity) xảy ra khi nào?

A. Có quá ít biến độc lập trong mô hình.
B. Các phần dư của mô hình không phân phối chuẩn.
C. Các biến độc lập trong mô hình hồi quy có mối tương quan mạnh với nhau.
D. Biến phụ thuộc có mối tương quan mạnh với các biến độc lập.

87. Khái niệm ‘phân phối lấy mẫu’ của một thống kê (ví dụ: trung bình mẫu) là gì?

A. Phân phối của dữ liệu trong một mẫu duy nhất.
B. Phân phối của dữ liệu trong toàn bộ tổng thể.
C. Một loại biểu đồ được sử dụng để trực quan hóa dữ liệu.
D. Phân phối xác suất của một thống kê được tính từ tất cả các mẫu có thể có được rút ra từ một tổng thể.

88. Kích thước hiệu ứng (effect size) trong thống kê ứng dụng cung cấp thông tin gì bổ sung cho p-value?

A. Xác suất bác bỏ giả thuyết không.
B. Độ tin cậy của mô hình thống kê.
C. Độ lớn và ý nghĩa thực tế của mối quan hệ hoặc sự khác biệt giữa các biến.
D. Xác suất mắc lỗi loại I.

89. Một kiểm định giả thuyết một phía (one-tailed test) được sử dụng khi nào?

A. Không có dự đoán về hướng của sự khác biệt.
B. Có một dự đoán cụ thể về hướng của sự khác biệt hoặc mối quan hệ.
C. Cần so sánh nhiều hơn hai nhóm.
D. Dữ liệu không phân phối chuẩn.

90. Trong phân tích hồi quy, ‘phần dư’ (residuals) là gì?

A. Sai số chuẩn của ước lượng.
B. Hệ số xác định R-squared.
C. Sự khác biệt giữa giá trị quan sát thực tế và giá trị dự đoán bởi mô hình.
D. Các biến độc lập không được đưa vào mô hình.

91. Trong thống kê ứng dụng, việc thu thập dữ liệu về tuổi, giới tính, thu nhập của khách hàng truy cập một trang web thương mại điện tử nhằm mục đích phân tích hành vi mua sắm thuộc loại thống kê nào?

A. Thống kê suy diễn
B. Thống kê mô tả
C. Thống kê đa biến
D. Thống kê phi tham số

92. Khi một nhà nghiên cứu sử dụng cỡ mẫu N=30 cho một thử nghiệm lâm sàng, quy tắc ngón tay cái này thường ngụ ý việc sử dụng phân phối xác suất nào cho các suy luận về trung bình tổng thể, giả sử độ lệch chuẩn tổng thể không biết?

A. Phân phối chuẩn (Z-distribution)
B. Phân phối t của Student (t-distribution)
C. Phân phối Chi-bình phương (Chi-square distribution)
D. Phân phối F (F-distribution)

93. Một công ty muốn kiểm tra xem liệu một chiến dịch quảng cáo mới có làm tăng doanh số bán hàng trung bình hàng ngày hay không; họ đã ghi nhận doanh số trước và sau chiến dịch cho cùng một nhóm cửa hàng, phương pháp kiểm định giả thuyết nào là phù hợp nhất để sử dụng?

A. Kiểm định t độc lập (Independent samples t-test)
B. Kiểm định Chi-bình phương (Chi-square test)
C. Kiểm định t cặp (Paired samples t-test)
D. Phân tích phương sai (ANOVA)

94. Trong phân tích hồi quy tuyến tính đơn giản, hệ số xác định R-squared bằng 0.85 có ý nghĩa gì?

A. 85% các điểm dữ liệu nằm trên đường hồi quy
B. 85% biến thiên của biến phụ thuộc được giải thích bởi biến độc lập
C. Có 85% khả năng mối quan hệ là tuyến tính
D. Hệ số tương quan Pearson là 0.85

95. Khi thực hiện kiểm định giả thuyết, nếu giá trị p-value nhỏ hơn mức ý nghĩa alpha (ví dụ p < 0.05), kết luận nào sau đây là đúng?

A. Chấp nhận giả thuyết không (H0)
B. Bác bỏ giả thuyết không (H0)
C. Không thể đưa ra kết luận
D. Kết quả không có ý nghĩa thống kê

96. Đại lượng nào sau đây đo lường mức độ phân tán của dữ liệu quanh giá trị trung bình và được biểu thị bằng cùng đơn vị với dữ liệu gốc?

A. Phương sai
B. Độ lệch chuẩn
C. Khoảng biến thiên
D. Khoảng tứ phân vị

97. Trong một cuộc khảo sát trực tuyến về sự hài lòng của khách hàng, loại dữ liệu thu được từ câu hỏi ‘Bạn có hài lòng với dịch vụ của chúng tôi không? (Rất hài lòng / Hài lòng / Bình thường / Không hài lòng / Rất không hài lòng)’ là gì?

A. Dữ liệu định danh (Nominal data)
B. Dữ liệu thứ bậc (Ordinal data)
C. Dữ liệu khoảng (Interval data)
D. Dữ liệu tỷ lệ (Ratio data)

98. Biểu đồ nào sau đây thường được sử dụng để hiển thị mối quan hệ giữa hai biến định lượng và xác định xem có tồn tại mối tương quan tuyến tính hay không?

A. Biểu đồ cột (Bar chart)
B. Biểu đồ tròn (Pie chart)
C. Biểu đồ phân tán (Scatter plot)
D. Biểu đồ hộp (Box plot)

99. Lỗi loại I (Type I error) trong kiểm định giả thuyết xảy ra khi nào?

A. Bác bỏ giả thuyết không (H0) khi H0 thực sự đúng
B. Chấp nhận giả thuyết không (H0) khi H0 thực sự sai
C. Bác bỏ giả thuyết thay thế (H1) khi H1 thực sự đúng
D. Chấp nhận giả thuyết thay thế (H1) khi H1 thực sự sai

100. Phân tích phương sai (ANOVA) một yếu tố được sử dụng để kiểm định điều gì?

A. Mối quan hệ giữa hai biến định lượng
B. Sự khác biệt về trung bình giữa hai nhóm độc lập
C. Sự khác biệt về trung bình giữa ba hoặc nhiều nhóm độc lập
D. Sự khác biệt về trung bình cho cùng một nhóm trước và sau can thiệp

101. Để đảm bảo tính đại diện của mẫu trong một cuộc khảo sát trực tuyến trên quy mô lớn, phương pháp chọn mẫu nào sau đây thường được ưu tiên để giảm thiểu sai lệch?

A. Chọn mẫu tiện lợi (Convenience sampling)
B. Chọn mẫu ngẫu nhiên đơn giản (Simple random sampling)
C. Chọn mẫu phán đoán (Judgmental sampling)
D. Chọn mẫu quả bóng tuyết (Snowball sampling)

102. Độ nhọn (Kurtosis) của một phân phối đo lường điều gì?

A. Mức độ đối xứng của phân phối
B. Mức độ tập trung của dữ liệu quanh giá trị trung bình
C. Mức độ nặng của các đuôi phân phối và sự xuất hiện của các giá trị ngoại lai
D. Điểm giữa của phân phối dữ liệu

103. Trong phân tích chuỗi thời gian, yếu tố nào mô tả sự biến động lặp đi lặp lại trong một khoảng thời gian nhất định (ví dụ: theo mùa, theo tuần)?

A. Xu hướng (Trend)
B. Tính chu kỳ (Cyclical component)
C. Tính mùa vụ (Seasonal component)
D. Sai số ngẫu nhiên (Irregular component)

104. Khi nào thì nên sử dụng kiểm định Chi-bình phương (Chi-square test) cho tính độc lập?

A. Khi so sánh trung bình của hai nhóm định lượng
B. Khi kiểm tra mối quan hệ giữa hai biến định danh (categorical)
C. Khi dự đoán một biến định lượng dựa trên một biến định lượng khác
D. Khi kiểm tra sự khác biệt giữa các điểm số cặp của cùng một đối tượng

105. Giá trị trung vị (Median) là gì?

A. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu
B. Tổng của tất cả các giá trị chia cho số lượng giá trị
C. Giá trị nằm ở chính giữa của tập dữ liệu đã được sắp xếp
D. Hiệu số giữa giá trị lớn nhất và nhỏ nhất

106. Trong một nghiên cứu về hiệu quả của một loại thuốc mới, nhóm đối tượng nào nhận được giả dược hoặc phương pháp điều trị tiêu chuẩn được gọi là gì?

A. Nhóm thử nghiệm
B. Nhóm đối chứng
C. Nhóm ngẫu nhiên
D. Nhóm mục tiêu

107. Mức ý nghĩa (Significance level), ký hiệu là alpha (α), đại diện cho điều gì trong kiểm định giả thuyết?

A. Xác suất mắc lỗi loại II
B. Xác suất bác bỏ giả thuyết không khi nó thực sự đúng (Lỗi loại I)
C. Độ tin cậy của khoảng ước lượng
D. Giá trị trung bình của dữ liệu mẫu

108. Khi phân tích dữ liệu bán hàng trực tuyến, nếu một số lượng lớn các giao dịch có giá trị rất cao (outliers) xuất hiện, đại lượng nào sau đây bị ảnh hưởng nhiều nhất?

A. Trung vị
B. Mốt
C. Trung bình
D. Khoảng tứ phân vị

109. Phương pháp thống kê nào được sử dụng để dự đoán giá trị của một biến liên tục (biến phụ thuộc) dựa trên giá trị của một hoặc nhiều biến độc lập khác?

A. Kiểm định t
B. Phân tích phương sai (ANOVA)
C. Phân tích hồi quy
D. Kiểm định Chi-bình phương

110. Một nhà tiếp thị muốn biết liệu có sự khác biệt về tỷ lệ nhấp chuột (CTR) giữa ba phiên bản quảng cáo khác nhau trên mạng xã hội; kiểm định giả thuyết nào là phù hợp nhất?

A. Kiểm định Z một mẫu
B. Kiểm định t độc lập
C. Kiểm định Chi-bình phương cho tính đồng nhất
D. Phân tích tương quan Pearson

111. Để đánh giá mối quan hệ định hướng và mức độ mạnh yếu giữa hai biến thứ bậc, hệ số tương quan nào thường được sử dụng?

A. Hệ số tương quan Pearson
B. Hệ số tương quan Spearman
C. Hệ số tương quan Cramer’s V
D. Hệ số tương quan Phi

112. Sai số chuẩn (Standard Error) của trung bình mẫu đo lường điều gì?

A. Mức độ phân tán của dữ liệu trong một mẫu
B. Mức độ chính xác mà trung bình mẫu ước lượng trung bình tổng thể
C. Độ lệch chuẩn của tổng thể
D. Khoảng cách giữa trung bình mẫu và trung vị mẫu

113. Trong ngữ cảnh của kiểm định giả thuyết, ‘quyền lực của kiểm định’ (power of a test) là gì?

A. Xác suất bác bỏ H0 khi H0 là đúng (Lỗi loại I)
B. Xác suất chấp nhận H0 khi H0 là sai (Lỗi loại II)
C. Xác suất bác bỏ H0 khi H0 là sai
D. Xác suất không mắc lỗi loại I hoặc loại II

114. Hệ số tương quan Pearson (r) có giá trị nằm trong khoảng nào?

A. Từ 0 đến 1
B. Từ -1 đến 1
C. Từ -∞ đến +∞
D. Từ 0 đến ∞

115. Khi phân tích dữ liệu về số lượt truy cập hàng ngày của một trang web, loại biểu đồ nào phù hợp nhất để hiển thị xu hướng theo thời gian?

A. Biểu đồ cột chồng (Stacked bar chart)
B. Biểu đồ đường (Line chart)
C. Biểu đồ tần số (Histogram)
D. Biểu đồ vùng (Area chart)

116. Phương pháp nào được sử dụng để tạo một khoảng giá trị, trong đó chúng ta tin rằng tham số tổng thể thực sự nằm trong đó với một mức độ tin cậy nhất định?

A. Ước lượng điểm (Point estimation)
B. Kiểm định giả thuyết (Hypothesis testing)
C. Ước lượng khoảng (Interval estimation)
D. Lấy mẫu ngẫu nhiên (Random sampling)

117. Giả định cơ bản nào cần được thỏa mãn khi áp dụng phân tích phương sai (ANOVA)?

A. Các nhóm phải có trung bình khác nhau
B. Dữ liệu phải có phân phối nhị thức
C. Phương sai của các nhóm phải bằng nhau (đồng nhất phương sai)
D. Các nhóm phải có cỡ mẫu nhỏ hơn 30

118. Loại biến nào sau đây chỉ có hai giá trị có thể (ví dụ: ‘có’/’không’, ‘thành công’/’thất bại’)?

A. Biến liên tục
B. Biến rời rạc
C. Biến nhị phân (Binary variable)
D. Biến thứ bậc

119. Khi phân tích hồi quy, nếu biểu đồ phần dư (residuals plot) cho thấy một mẫu hình rõ ràng (ví dụ: hình phễu hoặc đường cong), điều này thường chỉ ra vấn đề gì?

A. Biến độc lập không có mối quan hệ với biến phụ thuộc
B. Mô hình hồi quy tuyến tính là phù hợp
C. Giả định về phương sai không đồng nhất (heteroscedasticity) hoặc mối quan hệ không tuyến tính đã bị vi phạm
D. Kích thước mẫu quá lớn

120. Phân phối chuẩn là một phân phối xác suất quan trọng với hình dạng đặc trưng nào?

A. Hình chữ U
B. Hình chuông và đối xứng
C. Lệch trái
D. Lệch phải

121. Trong thống kê ứng dụng, sự khác biệt cơ bản giữa dữ liệu định tính và định lượng là gì?

A. Dữ liệu định tính luôn được thu thập qua phỏng vấn trực tiếp trong khi dữ liệu định lượng chỉ qua khảo sát trực tuyến.
B. Dữ liệu định tính mô tả các đặc điểm không đo lường được bằng số, còn dữ liệu định lượng biểu thị số lượng hoặc giá trị đo lường.
C. Dữ liệu định tính được biểu diễn bằng biểu đồ tròn, còn dữ liệu định lượng luôn được biểu diễn bằng biểu đồ cột.
D. Dữ liệu định tính chỉ áp dụng cho nghiên cứu khoa học xã hội, dữ liệu định lượng chỉ cho khoa học tự nhiên.

122. Độ lệch chuẩn là một thước đo quan trọng trong thống kê để làm gì?

A. Đo lường mức độ tập trung của dữ liệu quanh giá trị trung bình.
B. Xác định giá trị trung vị của một tập dữ liệu.
C. Đo lường mức độ biến động hoặc phân tán của dữ liệu so với giá trị trung bình.
D. Xác định tần suất xuất hiện của giá trị phổ biến nhất.

123. Khi phân tích dữ liệu, giá trị ‘p-value’ (giá trị p) được sử dụng để làm gì trong kiểm định giả thuyết?

A. Là xác suất để giả thuyết null là đúng.
B. Là xác suất để sai lầm loại I xảy ra nếu giả thuyết null bị từ chối.
C. Là xác suất quan sát được kết quả cực đoan hoặc cực đoan hơn giả định nếu giả thuyết null là đúng.
D. Là xác suất để chấp nhận giả thuyết thay thế.

124. Khái niệm ‘sai lầm loại I’ (Type I error) trong kiểm định giả thuyết đề cập đến tình huống nào?

A. Chấp nhận giả thuyết null khi nó thực sự sai.
B. Từ chối giả thuyết null khi nó thực sự đúng.
C. Từ chối giả thuyết thay thế khi nó thực sự đúng.
D. Chấp nhận giả thuyết thay thế khi nó thực sự sai.

125. Mục đích chính của phân tích hồi quy tuyến tính đơn là gì?

A. So sánh giá trị trung bình của hai nhóm độc lập.
B. Đánh giá mối quan hệ định tính giữa hai biến.
C. Mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc định lượng và một biến độc lập định lượng.
D. Kiểm tra sự phù hợp của dữ liệu với phân phối chuẩn.

126. Hệ số tương quan Pearson (r) đo lường điều gì giữa hai biến định lượng?

A. Mức độ biến động của một biến.
B. Mức độ tập trung của dữ liệu.
C. Độ mạnh và chiều hướng của mối quan hệ tuyến tính.
D. Sự khác biệt về giá trị trung bình giữa hai biến.

127. Định lý Giới hạn Trung tâm (Central Limit Theorem) có ý nghĩa quan trọng như thế nào trong thống kê?

A. Nó nói rằng tất cả các tập dữ liệu đều tuân theo phân phối chuẩn.
B. Nó đảm bảo rằng kích thước mẫu lớn sẽ loại bỏ sai số lấy mẫu.
C. Nó cho phép chúng ta suy luận về dân số từ mẫu ngay cả khi dân số không phân phối chuẩn, vì phân phối mẫu của trung bình sẽ xấp xỉ chuẩn khi mẫu đủ lớn.
D. Nó xác định rằng giá trị trung bình và trung vị của một phân phối luôn bằng nhau.

128. Khi nào thì nên sử dụng kiểm định Chi-squared (Kiểm định Chi bình phương) về tính độc lập?

A. Khi muốn so sánh giá trị trung bình của ba nhóm trở lên.
B. Để kiểm tra mối quan hệ tuyến tính giữa hai biến định lượng.
C. Khi muốn xác định xem có mối quan hệ đáng kể giữa hai biến định tính (biến phân loại) hay không.
D. Để ước tính khoảng tin cậy cho tỷ lệ dân số.

129. Ước lượng khoảng là gì trong thống kê suy luận?

A. Một giá trị đơn lẻ được sử dụng để ước tính một tham số dân số.
B. Một khoảng giá trị mà trong đó tham số dân số có khả năng nằm với một mức độ tin cậy nhất định.
C. Luôn là giá trị trung bình của mẫu.
D. Sai số tiêu chuẩn của trung bình mẫu.

130. ANOVA (Analysis of Variance) được sử dụng chủ yếu cho mục đích nào?

A. Để kiểm tra mối tương quan giữa hai biến định tính.
B. Để so sánh giá trị trung bình của hai nhóm liên quan.
C. Để so sánh giá trị trung bình của ba hay nhiều nhóm độc lập.
D. Để dự đoán giá trị của một biến từ một biến khác.

131. Trong phân tích hồi quy, ‘hệ số xác định’ (R-squared) giải thích điều gì?

A. Độ dốc của đường hồi quy.
B. Tỷ lệ phương sai của biến phụ thuộc được giải thích bởi biến độc lập(s) trong mô hình.
C. Sai số trung bình của các ước lượng.
D. Giá trị trung bình của biến độc lập.

132. Khi thực hiện kiểm định giả thuyết, nếu giá trị p-value nhỏ hơn mức ý nghĩa alpha (α) đã chọn, quyết định thống kê thường là gì?

A. Chấp nhận giả thuyết null.
B. Từ chối giả thuyết null.
C. Tăng mức ý nghĩa alpha.
D. Giảm kích thước mẫu.

133. Một nhà nghiên cứu muốn kiểm tra xem có sự khác biệt đáng kể về hiệu suất học tập trung bình giữa sinh viên sử dụng phương pháp A và sinh viên sử dụng phương pháp B. Loại kiểm định giả thuyết nào là phù hợp nhất?

A. Kiểm định Chi-squared.
B. Hồi quy tuyến tính.
C. Kiểm định t độc lập (Independent Samples t-test).
D. ANOVA một chiều.

134. Trong một nghiên cứu về mối liên hệ giữa thời gian học (giờ/tuần) và điểm thi, một nhà thống kê nhận thấy hệ số tương quan Pearson là 0.85. Điều này có ý nghĩa gì?

A. Không có mối liên hệ giữa thời gian học và điểm thi.
B. Có mối liên hệ tuyến tính mạnh mẽ, thuận chiều giữa thời gian học và điểm thi.
C. Thời gian học tăng lên dẫn đến điểm thi giảm xuống.
D. Chỉ 85% điểm thi được giải thích bởi thời gian học.

135. Khái niệm ‘sai số tiêu chuẩn’ của trung bình mẫu (Standard Error of the Mean – SEM) biểu thị điều gì?

A. Độ lệch chuẩn của dân số.
B. Độ lệch chuẩn của một mẫu cụ thể.
C. Độ lệch chuẩn của phân phối mẫu của trung bình (tức là mức độ biến động của các trung bình mẫu quanh trung bình dân số).
D. Khoảng tin cậy cho giá trị trung bình.

136. Để xác định tỷ lệ phần trăm người dân trong một thành phố ủng hộ một chính sách mới, loại mẫu nào sau đây là phù hợp nhất để đảm bảo tính đại diện?

A. Mẫu thuận tiện (Convenience sample).
B. Mẫu quả cầu tuyết (Snowball sample).
C. Mẫu ngẫu nhiên đơn giản (Simple random sample).
D. Mẫu tự chọn (Voluntary response sample).

137. Phân phối chuẩn (Normal Distribution), còn được gọi là ‘đường cong hình chuông’, có đặc điểm nổi bật nào?

A. Nó luôn có hai đỉnh (bimodal).
B. Nó đối xứng quanh giá trị trung bình, trung vị và mode đều nằm ở tâm.
C. Nó chỉ áp dụng cho dữ liệu định tính.
D. Nó có độ lệch chuẩn bằng 0.

138. Khi một nhà thống kê nói ‘mức ý nghĩa alpha (α) = 0.05’, điều đó có nghĩa là gì?

A. Xác suất mắc sai lầm loại II là 5%.
B. Xác suất chấp nhận giả thuyết null đúng là 5%.
C. Xác suất tối đa mà nhà nghiên cứu sẵn sàng chấp nhận mắc sai lầm loại I (từ chối giả thuyết null đúng) là 5%.
D. Xác suất giả thuyết thay thế là đúng là 95%.

139. Một công ty muốn biết liệu có sự khác biệt đáng kể về doanh số trung bình hàng tháng giữa ba kênh bán hàng khác nhau (Online, Cửa hàng, Đại lý). Phương pháp thống kê nào là phù hợp nhất?

A. Kiểm định Z một mẫu.
B. Kiểm định t độc lập.
C. Phân tích hồi quy đa biến.
D. Phân tích phương sai một yếu tố (One-way ANOVA).

140. Phần tử nào sau đây KHÔNG phải là một giả định quan trọng của hồi quy tuyến tính OLS (Ordinary Least Squares) kinh điển?

A. Mối quan hệ tuyến tính giữa các biến.
B. Sai số (phần dư) phải có phân phối chuẩn.
C. Tính đa cộng tuyến cao giữa biến phụ thuộc và các biến độc lập.
D. Phương sai của các phần dư phải không đổi (tính đồng nhất phương sai – homoscedasticity).

141. Một nhà nghiên cứu đang phân tích dữ liệu về giới tính (Nam/Nữ) và sự ưa thích sản phẩm A (Thích/Không thích). Loại biểu đồ nào phù hợp nhất để trực quan hóa mối quan hệ giữa hai biến này?

A. Biểu đồ phân tán (Scatter plot).
B. Biểu đồ hộp (Box plot).
C. Biểu đồ thanh nhóm (Grouped Bar Chart) hoặc biểu đồ cột chồng (Stacked Bar Chart).
D. Biểu đồ đường (Line plot).

142. Trong thống kê ứng dụng, ‘lấy mẫu ngẫu nhiên phân tầng’ (Stratified Random Sampling) được thực hiện như thế nào?

A. Chỉ chọn những cá thể dễ tiếp cận nhất.
B. Chia dân số thành các nhóm con (tầng) không chồng chéo, sau đó lấy mẫu ngẫu nhiên đơn giản từ mỗi tầng.
C. Chọn một điểm khởi đầu ngẫu nhiên và sau đó chọn mọi cá thể thứ k.
D. Sử dụng các đối tượng nghiên cứu để giới thiệu các đối tượng nghiên cứu khác.

143. Giá trị ‘mode’ trong thống kê mô tả là gì?

A. Giá trị trung bình của tập dữ liệu.
B. Giá trị giữa của tập dữ liệu khi đã sắp xếp.
C. Giá trị xuất hiện thường xuyên nhất trong tập dữ liệu.
D. Hiệu số giữa giá trị lớn nhất và nhỏ nhất.

144. Một công ty dược phẩm đang thử nghiệm một loại thuốc mới và muốn xác định xem loại thuốc này có làm giảm huyết áp trung bình của bệnh nhân hay không. Giả thuyết null (H0) phù hợp cho kiểm định này là gì?

A. Thuốc mới làm giảm huyết áp đáng kể.
B. Thuốc mới làm tăng huyết áp đáng kể.
C. Không có sự thay đổi đáng kể về huyết áp trung bình sau khi dùng thuốc.
D. Huyết áp trung bình sau khi dùng thuốc là 120 mmHg.

145. Điều kiện nào sau đây phải được đáp ứng để sử dụng kiểm định t cho hai mẫu độc lập khi phương sai dân số không biết nhưng được giả định là bằng nhau?

A. Kích thước mẫu phải nhỏ hơn 30.
B. Dữ liệu phải có phân phối nhị thức.
C. Các dân số phải có phân phối chuẩn (hoặc kích thước mẫu đủ lớn) và phương sai của chúng bằng nhau.
D. Biến phụ thuộc phải là định tính.

146. Khái niệm ‘sai lầm loại II’ (Type II error) trong kiểm định giả thuyết xảy ra khi nào?

A. Từ chối giả thuyết null khi nó thực sự đúng.
B. Chấp nhận giả thuyết null khi nó thực sự sai.
C. Từ chối giả thuyết thay thế khi nó thực sự sai.
D. Không đưa ra quyết định thống kê nào.

147. Ưu điểm chính của hồi quy bội so với hồi quy đơn là gì?

A. Nó loại bỏ hoàn toàn vấn đề đa cộng tuyến.
B. Nó cho phép mô hình hóa mối quan hệ giữa một biến phụ thuộc với nhiều biến độc lập cùng một lúc.
C. Nó chỉ sử dụng dữ liệu định tính.
D. Nó luôn có hệ số xác định (R-squared) là 1.

148. Một nhà nghiên cứu muốn kiểm tra xem có sự liên hệ giữa giới tính (Nam/Nữ) và việc có tham gia hoạt động tình nguyện (Có/Không) trong một cộng đồng hay không. Kiểm định thống kê nào phù hợp nhất?

A. Kiểm định t độc lập.
B. Hồi quy tuyến tính đơn.
C. Kiểm định Chi-squared về tính độc lập.
D. ANOVA hai yếu tố.

149. Khi phân tích một bộ dữ liệu có ‘ngoại lệ’ (outliers) đáng kể, chỉ số thống kê nào sau đây ít bị ảnh hưởng nhất?

A. Giá trị trung bình.
B. Độ lệch chuẩn.
C. Giá trị trung vị.
D. Khoảng biến thiên.

150. Khoảng tin cậy 95% cho giá trị trung bình dân số có ý nghĩa gì?

A. Có 95% khả năng trung bình mẫu nằm trong khoảng này.
B. Nếu lấy mẫu nhiều lần, 95% các khoảng tin cậy được xây dựng sẽ chứa giá trị trung bình thực của dân số.
C. Giá trị trung bình dân số chính xác là giá trị giữa của khoảng này.
D. Khoảng này chứa 95% dữ liệu của dân số.

Số câu đã làm: 0/0
Thời gian còn lại: 00:00:00
  • Đã làm
  • Chưa làm
  • Cần kiểm tra lại
© 2026 Trending New 24h • Tạo ra với GeneratePress

Bạn ơi!!! Để xem được kết quả, bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

HƯỚNG DẪN TÌM MẬT KHẨU

Đang tải nhiệm vụ...

Bước 1: Mở tab mới và truy cập Google.com. Sau đó tìm kiếm chính xác từ khóa sau:

Bước 2: Tìm và click vào kết quả có trang web giống như hình ảnh dưới đây:

Hướng dẫn tìm kiếm

Bước 3: Kéo xuống cuối trang đó để tìm mật khẩu như hình ảnh hướng dẫn:

Hướng dẫn lấy mật khẩu

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác nhé.