Chuyển đến nội dung

Trắc nghiệm Học máy online có đáp án

Trắc Nghiệm Kỹ Thuật & Công Nghệ

Trắc nghiệm Học máy online có đáp án

Ngày cập nhật: Tháng 2 6, 2026

Lưu ý và Miễn trừ trách nhiệm:Toàn bộ nội dung câu hỏi, đáp án và thông tin được cung cấp trên website này được xây dựng nhằm mục đích tham khảo, hỗ trợ ôn tập và củng cố kiến thức. Chúng tôi không cam kết về tính chính xác tuyệt đối, tính cập nhật hay độ tin cậy hoàn toàn của các dữ liệu này. Nội dung tại đây KHÔNG PHẢI LÀ ĐỀ THI CHÍNH THỨC của bất kỳ tổ chức giáo dục, trường đại học hay cơ quan cấp chứng chỉ nào. Người sử dụng tự chịu trách nhiệm khi sử dụng các thông tin này vào mục đích học tập, nghiên cứu hoặc áp dụng vào thực tiễn. Chúng tôi không chịu trách nhiệm pháp lý đối với bất kỳ sai sót, thiệt hại hoặc hậu quả nào phát sinh từ việc sử dụng thông tin trên website này.

Hãy cùng khám phá bộ Trắc nghiệm Học máy online có đáp án. Nội dung câu hỏi được xây dựng nhằm hỗ trợ bạn ôn tập và ghi nhớ hiệu quả. Chỉ cần bấm vào phần trắc nghiệm bạn quan tâm để làm bài ngay. Hy vọng bạn có trải nghiệm học tập hiệu quả và thú vị

★★★★★
★★★★★
4.5/5 (133 đánh giá)

1. Đâu là một thuật toán học máy thuộc nhóm học có giám sát (supervised learning)?

A. K-means clustering
B. Principal Component Analysis (PCA)
C. Support Vector Machine (SVM)
D. Apriori algorithm

2. Hiện tượng ‘overfitting’ xảy ra khi nào?

A. Mô hình hoạt động kém trên cả tập huấn luyện và tập kiểm tra
B. Mô hình học quá tốt trên tập huấn luyện nhưng hoạt động kém trên tập kiểm tra
C. Mô hình học quá kém trên tập huấn luyện
D. Mô hình hoạt động tốt trên cả tập huấn luyện và tập kiểm tra

3. Trong học máy, ‘bias’ và ‘variance’ là gì và chúng ảnh hưởng đến hiệu suất của mô hình như thế nào?

A. Bias là sai số ngẫu nhiên, variance là sai số hệ thống
B. Bias là sai số hệ thống, variance là độ nhạy của mô hình với sự thay đổi trong dữ liệu huấn luyện
C. Bias là độ nhạy của mô hình với sự thay đổi trong dữ liệu huấn luyện, variance là sai số hệ thống
D. Bias và variance đều là sai số ngẫu nhiên

4. Thuật toán nào sau đây thuộc nhóm thuật toán giảm chiều dữ liệu tuyến tính?

A. t-distributed Stochastic Neighbor Embedding (t-SNE)
B. Principal Component Analysis (PCA)
C. IsoMap
D. Local Linear Embedding (LLE)

5. Trong ngữ cảnh của mạng nơ-ron tích chập (Convolutional Neural Networks – CNNs), ‘pooling’ (gộp) là gì?

A. Một lớp để tăng cường dữ liệu
B. Một lớp để giảm chiều không gian của dữ liệu
C. Một hàm kích hoạt
D. Một thuật toán tối ưu hóa

6. Trong học máy, ‘label encoding’ và ‘one-hot encoding’ được sử dụng để làm gì?

A. Chuẩn hóa dữ liệu số
B. Chuyển đổi dữ liệu categorical thành dạng số để có thể sử dụng trong các mô hình học máy
C. Giảm chiều dữ liệu
D. Tăng cường dữ liệu

7. Transformer networks được sử dụng chủ yếu trong lĩnh vực nào?

A. Xử lý ảnh
B. Xử lý ngôn ngữ tự nhiên (NLP)
C. Học tăng cường
D. Phân tích chuỗi thời gian

8. Trong học máy, ‘feature engineering’ là gì?

A. Quá trình lựa chọn thuật toán học máy phù hợp nhất
B. Quá trình tối ưu hóa siêu tham số của mô hình
C. Quá trình tạo và biến đổi các đặc trưng (features) từ dữ liệu thô để cải thiện hiệu suất mô hình
D. Quá trình đánh giá hiệu suất của mô hình

9. Giải thích sự khác biệt giữa online learning và batch learning?

A. Online learning chỉ sử dụng dữ liệu số, batch learning chỉ sử dụng dữ liệu văn bản.
B. Online learning huấn luyện mô hình trên từng mẫu dữ liệu đơn lẻ hoặc một nhóm nhỏ dữ liệu, trong khi batch learning huấn luyện trên toàn bộ tập dữ liệu.
C. Online learning nhanh hơn batch learning.
D. Online learning chỉ phù hợp với dữ liệu tĩnh, batch learning phù hợp với dữ liệu động.

10. Phương pháp nào sau đây giúp giải quyết vấn đề ‘underfitting’?

A. Giảm số lượng đặc trưng (features)
B. Tăng cường dữ liệu (data augmentation)
C. Tăng độ phức tạp của mô hình
D. Sử dụng kỹ thuật regularization

11. Trong thuật toán K-means, tham số ‘K’ đại diện cho điều gì?

A. Số lượng đặc trưng (features)
B. Số lượng cụm (clusters) cần tìm
C. Số lượng mẫu dữ liệu
D. Số lần lặp tối đa

12. Khi nào nên sử dụng thuật toán Random Forest thay vì Decision Tree?

A. Khi dữ liệu có ít đặc trưng
B. Khi cần một mô hình dễ giải thích
C. Khi muốn giảm overfitting và cải thiện độ chính xác
D. Khi thời gian huấn luyện là yếu tố quan trọng nhất

13. Trong bài toán phân loại, độ đo nào thường được sử dụng để đánh giá hiệu quả của mô hình?

A. Mean Squared Error (MSE)
B. R-squared
C. Accuracy
D. Root Mean Squared Error (RMSE)

14. Phương pháp đánh giá mô hình học máy nào chia dữ liệu thành k phần, huấn luyện và kiểm tra mô hình k lần, mỗi lần sử dụng một phần khác nhau làm tập kiểm tra?

A. Đánh giá bằng tập huấn luyện
B. Kiểm tra chéo k-fold
C. Đánh giá trên tập kiểm tra
D. Bootstrap sampling

15. Độ đo F1-score là gì và nó được tính như thế nào?

A. Trung bình cộng của precision và recall
B. Trung bình nhân của precision và recall
C. Trung bình điều hòa của precision và recall
D. Tỷ lệ giữa precision và recall

16. Trong reinforcement learning, Q-learning là gì?

A. Một thuật toán học có giám sát
B. Một thuật toán học không giám sát
C. Một thuật toán học tăng cường off-policy
D. Một thuật toán giảm chiều dữ liệu

17. Giải thích sự khác biệt giữa generative và discriminative models trong học máy.

A. Generative model chỉ tạo ra dữ liệu mới, discriminative model chỉ phân loại dữ liệu.
B. Generative model học phân phối của dữ liệu, discriminative model học ranh giới quyết định giữa các lớp.
C. Generative model nhanh hơn discriminative model.
D. Generative model chỉ sử dụng dữ liệu có nhãn, discriminative model chỉ sử dụng dữ liệu không nhãn.

18. Trong ngữ cảnh của học sâu (deep learning), hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán sai số của mô hình
B. Giới thiệu tính phi tuyến vào mạng nơ-ron
C. Chuẩn hóa dữ liệu đầu vào
D. Tối ưu hóa tốc độ học

19. Trong học máy, ‘regularization’ là gì?

A. Một kỹ thuật để tăng cường dữ liệu
B. Một kỹ thuật để giảm overfitting bằng cách thêm một khoản phạt vào hàm mất mát
C. Một phương pháp để chọn các đặc trưng quan trọng nhất
D. Một phương pháp để chuẩn hóa dữ liệu

20. Trong bài toán phát hiện gian lận (fraud detection), độ đo nào quan trọng hơn: precision hay recall?

A. Precision quan trọng hơn
B. Recall quan trọng hơn
C. Precision và recall quan trọng như nhau
D. Không có độ đo nào quan trọng

21. Đâu là một ví dụ về thuật toán học tăng cường (ensemble learning)?

A. Linear Regression
B. Decision Tree
C. Random Forest
D. Logistic Regression

22. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

A. Chuẩn hóa dữ liệu
B. Điền giá trị trung bình/mode
C. Giảm chiều dữ liệu
D. Tăng cường dữ liệu

23. ROC (Receiver Operating Characteristic) curve được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình hồi quy
B. Đánh giá hiệu suất của mô hình phân loại ở các ngưỡng khác nhau
C. Chọn các đặc trưng quan trọng nhất
D. Chuẩn hóa dữ liệu đầu vào

24. Mục tiêu của việc sử dụng word embeddings (ví dụ: Word2Vec, GloVe) trong xử lý ngôn ngữ tự nhiên (NLP) là gì?

A. Giảm số lượng từ vựng
B. Biểu diễn từ dưới dạng các vector số để máy tính có thể hiểu được ngữ nghĩa của từ
C. Tăng tốc độ xử lý văn bản
D. Loại bỏ các từ dừng (stop words)

25. Khi nào nên sử dụng L1 regularization (Lasso) thay vì L2 regularization (Ridge)?

A. Khi muốn giảm ảnh hưởng của các đặc trưng lớn
B. Khi muốn chọn một tập con các đặc trưng quan trọng nhất
C. Khi muốn giảm overfitting một cách nhẹ nhàng
D. Khi muốn tăng độ phức tạp của mô hình

26. Trong học sâu, ‘backpropagation’ là gì?

A. Một phương pháp để chuẩn hóa dữ liệu đầu vào
B. Một thuật toán để tính toán gradient của hàm mất mát theo các trọng số của mạng nơ-ron
C. Một kỹ thuật để giảm chiều dữ liệu
D. Một phương pháp để tăng cường dữ liệu

27. Trong học máy, phương pháp nào được sử dụng để giảm số lượng chiều của dữ liệu trong khi vẫn giữ lại thông tin quan trọng nhất?

A. Chuẩn hóa dữ liệu
B. Giảm chiều dữ liệu
C. Phân cụm dữ liệu
D. Tăng cường dữ liệu

28. Hàm mất mát (loss function) được sử dụng để làm gì trong quá trình huấn luyện mô hình học máy?

A. Đánh giá hiệu suất của mô hình trên tập kiểm tra
B. Đo lường sự khác biệt giữa dự đoán của mô hình và giá trị thực tế
C. Chuẩn hóa dữ liệu đầu vào
D. Chọn các đặc trưng quan trọng nhất

29. Bootstrap là gì và nó được sử dụng để làm gì trong học máy?

A. Một phương pháp để tăng cường dữ liệu
B. Một phương pháp lấy mẫu lại có thay thế để ước lượng thống kê
C. Một phương pháp để chuẩn hóa dữ liệu
D. Một phương pháp để chọn các đặc trưng quan trọng nhất

30. Trong thuật toán Gradient Descent, ‘learning rate’ (tốc độ học) là gì?

A. Số lượng lần lặp tối đa
B. Kích thước của tập huấn luyện
C. Bước nhảy trong quá trình tối ưu hóa
D. Độ chính xác mong muốn

31. Trong học máy, ‘learning rate’ là gì và nó ảnh hưởng như thế nào đến quá trình huấn luyện?

A. Tốc độ mà dữ liệu được tải vào mô hình
B. Kích thước của batch size
C. Bước nhảy trong quá trình tối ưu hóa để tìm giá trị nhỏ nhất của hàm mất mát
D. Số lượng nơ-ron trong một lớp của mạng nơ-ron

32. Phương pháp nào sau đây giúp giải quyết vấn đề vanishing gradients trong mạng nơ-ron sâu?

A. Sử dụng learning rate cao
B. Sử dụng hàm kích hoạt ReLU
C. Tăng kích thước batch size
D. Sử dụng regularization L1

33. Trong học máy, mục tiêu của việc sử dụng ‘dropout’ là gì?

A. Tăng tốc độ huấn luyện
B. Giảm overfitting
C. Tăng độ chính xác trên tập huấn luyện
D. Giảm dung lượng bộ nhớ cần thiết

34. Trong học máy, ‘precision’ và ‘recall’ được sử dụng để đánh giá hiệu suất của mô hình trong bài toán nào?

A. Hồi quy
B. Phân loại
C. Phân cụm
D. Giảm chiều dữ liệu

35. Phương pháp nào sau đây thường được sử dụng để đánh giá mức độ tương đồng giữa hai văn bản?

A. PCA
B. Cosine similarity
C. One-hot encoding
D. Gradient descent

36. Mục tiêu chính của việc sử dụng cross-validation trong học máy là gì?

A. Tăng tốc độ huấn luyện mô hình
B. Đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu mới
C. Giảm dung lượng bộ nhớ cần thiết để lưu trữ mô hình
D. Cải thiện khả năng diễn giải của mô hình

37. Trong học máy, phương pháp nào thường được sử dụng để giảm số lượng chiều dữ liệu trong khi vẫn giữ được thông tin quan trọng?

A. Chuẩn hóa dữ liệu
B. PCA (Principal Component Analysis)
C. Tăng cường dữ liệu
D. One-hot encoding

38. Khi nào nên sử dụng thuật toán K-Nearest Neighbors (KNN)?

A. Khi dữ liệu có nhiều chiều và cần giảm chiều
B. Khi cần một mô hình dễ diễn giải và không yêu cầu huấn luyện
C. Khi dữ liệu có mối quan hệ tuyến tính
D. Khi cần dự đoán chuỗi thời gian

39. Kỹ thuật nào sau đây thường được sử dụng để tìm kiếm các siêu tham số (hyperparameters) tốt nhất cho một mô hình học máy?

A. Gradient descent
B. PCA
C. Grid search hoặc Random search
D. Regularization

40. Khi nào nên sử dụng thuật toán DBSCAN?

A. Khi biết trước số lượng cụm
B. Khi dữ liệu có hình dạng cụm phức tạp và không tuyến tính
C. Khi dữ liệu có ít chiều
D. Khi cần một mô hình dễ diễn giải

41. Phương pháp nào sau đây giúp ngăn chặn hiện tượng overfitting trong quá trình huấn luyện mô hình học máy?

A. Tăng kích thước batch size
B. Sử dụng learning rate cao
C. Regularization (L1, L2)
D. Giảm số lượng features

42. Trong học máy, ‘early stopping’ là gì và nó được sử dụng để làm gì?

A. Một phương pháp tăng tốc độ huấn luyện
B. Một kỹ thuật ngăn chặn overfitting bằng cách dừng huấn luyện khi hiệu suất trên tập validation không cải thiện
C. Một phương pháp giảm chiều dữ liệu
D. Một kỹ thuật tiền xử lý dữ liệu

43. Khi nào nên sử dụng thuật toán Naive Bayes?

A. Khi cần một mô hình phức tạp để nắm bắt các mối quan hệ phi tuyến tính
B. Khi các features có mối tương quan cao
C. Khi cần một mô hình đơn giản, nhanh chóng và dễ triển khai
D. Khi dữ liệu có kích thước lớn và cần giảm chiều

44. Đâu là một thách thức chính khi làm việc với dữ liệu văn bản trong học máy?

A. Dữ liệu văn bản luôn có cấu trúc rõ ràng
B. Dữ liệu văn bản thường có kích thước nhỏ
C. Dữ liệu văn bản thường không có cấu trúc và cần được tiền xử lý
D. Dữ liệu văn bản không chứa thông tin hữu ích

45. Trong học máy, thuật ngữ ‘transfer learning’ đề cập đến điều gì?

A. Việc chuyển đổi dữ liệu từ định dạng này sang định dạng khác
B. Việc sử dụng kiến thức học được từ một bài toán để giải quyết một bài toán khác
C. Việc chuyển dữ liệu giữa các thiết bị khác nhau
D. Việc sử dụng một thuật toán học máy duy nhất cho nhiều bài toán khác nhau

46. Khi nào nên sử dụng mô hình tuyến tính (linear model) thay vì một mô hình phức tạp hơn như mạng nơ-ron?

A. Khi dữ liệu có mối quan hệ phi tuyến tính mạnh
B. Khi cần độ chính xác cao nhất có thể
C. Khi dữ liệu có nhiều features
D. Khi mối quan hệ giữa các features và target là tuyến tính hoặc gần tuyến tính

47. Trong học máy, thuật ngữ ‘ensemble learning’ đề cập đến điều gì?

A. Việc sử dụng một tập dữ liệu lớn để huấn luyện mô hình
B. Việc kết hợp nhiều mô hình học máy để cải thiện hiệu suất tổng thể
C. Việc sử dụng một thuật toán học máy duy nhất với nhiều tham số
D. Việc tiền xử lý dữ liệu để chuẩn bị cho quá trình huấn luyện

48. Khi nào nên sử dụng thuật toán Random Forest thay vì một cây quyết định (Decision Tree) đơn lẻ?

A. Khi cần một mô hình dễ diễn giải hơn
B. Khi dữ liệu có ít features
C. Khi muốn giảm overfitting và cải thiện độ chính xác
D. Khi cần huấn luyện mô hình nhanh hơn

49. Trong học máy, ‘one-hot encoding’ được sử dụng để làm gì?

A. Chuẩn hóa dữ liệu số
B. Chuyển đổi dữ liệu categorical thành dạng số
C. Giảm chiều dữ liệu
D. Tăng cường dữ liệu

50. Đâu là một ứng dụng phổ biến của Recurrent Neural Network (RNN)?

A. Phân loại ảnh tĩnh
B. Xử lý ngôn ngữ tự nhiên (NLP)
C. Phân cụm dữ liệu
D. Giảm chiều dữ liệu

51. Trong học máy, ‘F1-score’ là gì và nó được tính như thế nào?

A. Một độ đo đánh giá hiệu suất mô hình dựa trên trung bình cộng của precision và recall
B. Một độ đo đánh giá hiệu suất mô hình dựa trên trung bình điều hòa của precision và recall
C. Một độ đo đánh giá hiệu suất mô hình dựa trên phương sai của precision và recall
D. Một độ đo đánh giá hiệu suất mô hình dựa trên độ lệch chuẩn của precision và recall

52. Đâu là một thách thức chính trong việc huấn luyện mô hình học máy với dữ liệu không cân bằng (imbalanced data)?

A. Tốc độ huấn luyện chậm
B. Mô hình bị bias về phía lớp chiếm đa số
C. Khó khăn trong việc thu thập dữ liệu
D. Yêu cầu phần cứng mạnh mẽ hơn

53. Trong học máy, ‘backpropagation’ là gì và nó được sử dụng để làm gì?

A. Một phương pháp giảm chiều dữ liệu
B. Một thuật toán để tính toán gradient của hàm mất mát trong mạng nơ-ron
C. Một kỹ thuật tiền xử lý dữ liệu
D. Một phương pháp đánh giá mô hình

54. Trong học máy, thuật ngữ ‘gradient descent’ dùng để chỉ điều gì?

A. Một phương pháp giảm chiều dữ liệu
B. Một thuật toán tối ưu hóa để tìm giá trị nhỏ nhất của hàm mất mát
C. Một kỹ thuật tiền xử lý dữ liệu
D. Một phương pháp đánh giá mô hình

55. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

A. PCA
B. One-hot encoding
C. Imputation (điền giá trị)
D. Regularization

56. Trong ngữ cảnh của học sâu (deep learning), hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ mất mát (loss)
B. Giới thiệu tính phi tuyến vào mạng nơ-ron
C. Chuẩn hóa dữ liệu đầu vào
D. Tối ưu hóa các tham số của mô hình

57. Trong học máy, ‘ROC curve’ và ‘AUC’ được sử dụng để đánh giá điều gì?

A. Hiệu suất của mô hình hồi quy
B. Hiệu suất của mô hình phân loại
C. Hiệu suất của mô hình phân cụm
D. Hiệu suất của mô hình giảm chiều dữ liệu

58. Đâu là một ứng dụng phổ biến của thuật toán Support Vector Machine (SVM)?

A. Phân cụm dữ liệu
B. Giảm chiều dữ liệu
C. Phân loại ảnh
D. Dự đoán chuỗi thời gian

59. Trong học máy, thuật ngữ ‘bias-variance tradeoff’ đề cập đến điều gì?

A. Sự đánh đổi giữa tốc độ huấn luyện và độ chính xác của mô hình
B. Sự đánh đổi giữa khả năng diễn giải và độ phức tạp của mô hình
C. Sự đánh đổi giữa underfitting và overfitting
D. Sự đánh đổi giữa precision và recall

60. Trong thuật toán K-means, yếu tố nào sau đây ảnh hưởng trực tiếp đến kết quả phân cụm?

A. Số lượng dữ liệu đầu vào
B. Thứ tự của dữ liệu đầu vào
C. Vị trí khởi tạo của các centroid
D. Phương pháp chuẩn hóa dữ liệu

61. Khi nào nên sử dụng Support Vector Machine (SVM)?

A. Khi dữ liệu có số lượng thuộc tính (features) rất lớn.
B. Khi cần một mô hình dễ diễn giải.
C. Khi dữ liệu có số lượng mẫu (samples) lớn hơn nhiều so với số lượng thuộc tính.
D. Khi cần một thuật toán đơn giản và nhanh chóng.

62. Precision và Recall là gì trong đánh giá mô hình phân loại?

A. Precision là tỷ lệ dự đoán đúng trên tổng số dự đoán, Recall là tỷ lệ dự đoán đúng trên tổng số thực tế.
B. Precision là tỷ lệ dự đoán đúng trên tổng số thực tế, Recall là tỷ lệ dự đoán đúng trên tổng số dự đoán.
C. Precision là tỷ lệ dự đoán sai trên tổng số dự đoán, Recall là tỷ lệ dự đoán sai trên tổng số thực tế.
D. Precision và Recall đều là tỷ lệ dự đoán đúng trên tổng số dự đoán.

63. Khi nào nên sử dụng F1-score thay vì chỉ sử dụng accuracy để đánh giá mô hình phân loại?

A. Khi tập dữ liệu bị mất cân bằng (imbalanced dataset).
B. Khi mô hình có tốc độ dự đoán chậm.
C. Khi cần giải thích rõ ràng kết quả cho người không chuyên.
D. Khi tập dữ liệu có nhiều thuộc tính (features).

64. Trong học máy, phương pháp nào thường được sử dụng để giảm số chiều dữ liệu trong khi vẫn giữ lại phần lớn thông tin quan trọng?

A. One-hot encoding
B. Principal Component Analysis (PCA)
C. Gradient Descent
D. K-means clustering

65. ROC curve (Receiver Operating Characteristic curve) được sử dụng để đánh giá điều gì?

A. Hiệu suất của thuật toán hồi quy.
B. Hiệu suất của thuật toán phân cụm.
C. Hiệu suất của thuật toán phân loại nhị phân ở các ngưỡng khác nhau.
D. Hiệu suất của thuật toán giảm chiều.

66. Mục đích của việc sử dụng hàm softmax trong lớp đầu ra của mạng nơ-ron là gì?

A. Để chuẩn hóa dữ liệu đầu vào.
B. Để biến đổi đầu ra thành một phân phối xác suất trên các lớp.
C. Để tăng tốc độ huấn luyện mô hình.
D. Để giảm overfitting.

67. Regularization trong học máy nhằm mục đích gì?

A. Tăng độ phức tạp của mô hình.
B. Giảm overfitting bằng cách thêm một hình phạt vào hàm mất mát.
C. Tăng tốc độ huấn luyện mô hình.
D. Chuẩn hóa dữ liệu đầu vào.

68. Hàm mất mát (loss function) trong học máy có vai trò gì?

A. Đo lường sự khác biệt giữa dự đoán của mô hình và giá trị thực tế.
B. Xác định cấu trúc của mô hình.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tăng tốc độ huấn luyện mô hình.

69. Recursive Neural Networks (RNNs) được thiết kế đặc biệt để xử lý loại dữ liệu nào?

A. Dữ liệu hình ảnh.
B. Dữ liệu văn bản và chuỗi thời gian.
C. Dữ liệu bảng.
D. Dữ liệu âm thanh.

70. Phương pháp nào sau đây KHÔNG thuộc nhóm thuật toán học không giám sát (unsupervised learning)?

A. K-means clustering
B. Principal Component Analysis (PCA)
C. Linear Regression
D. Association rule learning

71. Gradient Descent là gì?

A. Một thuật toán để tìm giá trị nhỏ nhất của một hàm.
B. Một phương pháp để chuẩn hóa dữ liệu.
C. Một thuật toán để giảm số chiều của dữ liệu.
D. Một phương pháp để chọn các thuộc tính quan trọng nhất.

72. Trong quá trình huấn luyện mô hình, epoch là gì?

A. Số lượng dữ liệu được sử dụng trong mỗi lần cập nhật tham số.
B. Một lần duyệt qua toàn bộ tập dữ liệu huấn luyện.
C. Tốc độ học (learning rate) của mô hình.
D. Kích thước của mạng nơ-ron.

73. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán độ lỗi của mô hình.
B. Giới thiệu tính phi tuyến vào mô hình.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tối ưu hóa các tham số của mô hình.

74. Dropout là gì trong ngữ cảnh của mạng nơ-ron?

A. Một phương pháp để chuẩn hóa dữ liệu đầu vào.
B. Một kỹ thuật regularization bằng cách ngẫu nhiên bỏ qua một số nơ-ron trong quá trình huấn luyện.
C. Một phương pháp để tăng tốc độ huấn luyện mô hình.
D. Một thuật toán để tìm các tham số tối ưu cho mô hình.

75. Backpropagation là gì trong ngữ cảnh của mạng nơ-ron?

A. Một phương pháp để chuẩn hóa dữ liệu đầu vào.
B. Một thuật toán để tính toán gradient của hàm mất mát và cập nhật các trọng số của mạng.
C. Một phương pháp để giảm số chiều của dữ liệu.
D. Một thuật toán để tìm các tham số tối ưu cho mô hình.

76. Trong học máy, ensemble learning là gì?

A. Một phương pháp để giảm số chiều của dữ liệu.
B. Một kỹ thuật kết hợp nhiều mô hình học máy để cải thiện hiệu suất tổng thể.
C. Một phương pháp để chuẩn hóa dữ liệu đầu vào.
D. Một thuật toán để tìm các tham số tối ưu cho mô hình.

77. Bias-variance tradeoff đề cập đến điều gì trong học máy?

A. Sự đánh đổi giữa độ chính xác và tốc độ của mô hình.
B. Sự đánh đổi giữa việc mô hình quá khớp (overfitting) và quá đơn giản (underfitting).
C. Sự đánh đổi giữa việc sử dụng nhiều dữ liệu huấn luyện và sử dụng ít dữ liệu huấn luyện.
D. Sự đánh đổi giữa việc sử dụng các thuật toán khác nhau.

78. Lợi ích chính của việc sử dụng mini-batch gradient descent so với batch gradient descent là gì?

A. Đảm bảo tìm được giá trị tối ưu toàn cục.
B. Tốc độ huấn luyện nhanh hơn và yêu cầu ít bộ nhớ hơn.
C. Độ chính xác cao hơn.
D. Dễ dàng song song hóa hơn.

79. Mục tiêu của việc sử dụng validation set là gì?

A. Huấn luyện mô hình.
B. Đánh giá hiệu suất cuối cùng của mô hình sau khi đã được huấn luyện.
C. Điều chỉnh các siêu tham số (hyperparameters) của mô hình.
D. Chuẩn hóa dữ liệu đầu vào.

80. Trong học máy, cross-validation được sử dụng để làm gì?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Ước tính hiệu suất của mô hình trên dữ liệu mới.
C. Giảm số chiều của dữ liệu.
D. Tìm các tham số tối ưu cho mô hình.

81. Overfitting xảy ra khi nào?

A. Khi mô hình quá đơn giản và không thể học được các mối quan hệ trong dữ liệu.
B. Khi mô hình học quá kỹ dữ liệu huấn luyện và không tổng quát hóa tốt cho dữ liệu mới.
C. Khi dữ liệu huấn luyện bị thiếu dữ liệu.
D. Khi tốc độ học (learning rate) quá cao.

82. Bagging và Boosting khác nhau như thế nào trong ensemble learning?

A. Bagging huấn luyện các mô hình song song, Boosting huấn luyện các mô hình tuần tự.
B. Bagging sử dụng toàn bộ dữ liệu huấn luyện cho mỗi mô hình, Boosting sử dụng một phần dữ liệu huấn luyện cho mỗi mô hình.
C. Bagging tập trung vào việc giảm bias, Boosting tập trung vào việc giảm variance.
D. Bagging chỉ sử dụng cho bài toán phân loại, Boosting chỉ sử dụng cho bài toán hồi quy.

83. Underfitting xảy ra khi nào?

A. Khi mô hình học quá kỹ dữ liệu huấn luyện.
B. Khi mô hình không thể học được các mối quan hệ trong dữ liệu.
C. Khi dữ liệu huấn luyện có quá nhiều nhiễu.
D. Khi mô hình có độ phức tạp quá cao.

84. Trong học tăng cường (reinforcement learning), Q-learning là gì?

A. Một thuật toán học chính sách trực tiếp.
B. Một thuật toán học giá trị, ước tính giá trị Q (Q-value) cho mỗi cặp trạng thái-hành động.
C. Một thuật toán học mô hình, xây dựng mô hình của môi trường.
D. Một thuật toán tìm kiếm heuristic.

85. Làm thế nào để xử lý dữ liệu bị thiếu (missing data) trong học máy?

A. Luôn loại bỏ các hàng hoặc cột chứa dữ liệu bị thiếu.
B. Thay thế bằng giá trị trung bình, trung vị, hoặc một giá trị hằng số.
C. Chỉ sử dụng các thuật toán không yêu cầu dữ liệu đầy đủ.
D. Không cần xử lý, các thuật toán học máy tự xử lý được.

86. Điều gì KHÔNG phải là một ưu điểm của thuật toán Random Forest?

A. Giảm overfitting so với một cây quyết định đơn lẻ.
B. Dễ dàng song song hóa.
C. Khó diễn giải và hiểu được logic bên trong.
D. Yêu cầu ít điều chỉnh tham số hơn so với các thuật toán khác.

87. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu văn bản trong học máy?

A. Principal Component Analysis (PCA)
B. K-means clustering
C. Support Vector Machines (SVM)
D. Term Frequency-Inverse Document Frequency (TF-IDF)

88. Trong học máy, feature engineering là gì?

A. Quá trình chọn các thuật toán tốt nhất cho một bài toán cụ thể.
B. Quá trình tạo ra các thuộc tính (features) mới từ dữ liệu hiện có để cải thiện hiệu suất mô hình.
C. Quá trình giảm số chiều của dữ liệu.
D. Quá trình chuẩn hóa dữ liệu đầu vào.

89. Khi nào nên sử dụng thuật toán K-Nearest Neighbors (KNN)?

A. Khi dữ liệu có nhiều chiều và cần giảm chiều.
B. Khi cần một mô hình tuyến tính dễ diễn giải.
C. Khi cần một thuật toán đơn giản và dữ liệu có cấu trúc rõ ràng.
D. Khi cần xử lý dữ liệu bị thiếu.

90. Batch normalization được sử dụng để làm gì trong mạng nơ-ron?

A. Chuẩn hóa dữ liệu đầu vào.
B. Chuẩn hóa đầu ra của mỗi lớp để tăng tốc độ huấn luyện và cải thiện độ ổn định.
C. Giảm số chiều của dữ liệu.
D. Tìm các tham số tối ưu cho mô hình.

91. Thuật toán nào sau đây thường được sử dụng để phát hiện các điểm bất thường (outliers) trong dữ liệu?

A. Isolation Forest
B. Hồi quy tuyến tính (Linear Regression)
C. Máy vector hỗ trợ (Support Vector Machine)
D. K-means clustering

92. Trong bài toán phân loại, độ đo nào sau đây thể hiện tỷ lệ số mẫu được dự đoán đúng trên tổng số mẫu?

A. Độ chính xác (Accuracy)
B. Độ thu hồi (Recall)
C. Độ đo F1 (F1-score)
D. Độ đo AUC (AUC score)

93. Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu văn bản trong học máy?

A. TF-IDF (Term Frequency-Inverse Document Frequency)
B. Chuẩn hóa dữ liệu (Data Normalization)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Điều chỉnh siêu tham số (Hyperparameter Tuning)

94. Thuật toán nào sau đây là một ví dụ của học tăng cường (Reinforcement Learning)?

A. Q-learning
B. K-means clustering
C. Hồi quy tuyến tính (Linear Regression)
D. Máy vector hỗ trợ (Support Vector Machine)

95. Phương pháp nào sau đây thường được sử dụng để chia dữ liệu thành tập huấn luyện, tập kiểm tra và tập xác thực?

A. Hold-out method
B. Chuẩn hóa dữ liệu (Data Normalization)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Điều chỉnh siêu tham số (Hyperparameter Tuning)

96. Thuật toán nào sau đây là một ví dụ của học không giám sát (Unsupervised Learning)?

A. Phân tích thành phần chính (PCA)
B. Hồi quy logistic (Logistic Regression)
C. Máy vector hỗ trợ (Support Vector Machine)
D. Rừng ngẫu nhiên (Random Forest)

97. Trong học máy, mục tiêu của việc sử dụng hàm mất mát (loss function) là gì?

A. Đo lường sai số giữa dự đoán của mô hình và giá trị thực tế.
B. Chuẩn hóa dữ liệu đầu vào.
C. Tăng tốc độ huấn luyện.
D. Điều chỉnh siêu tham số của mô hình.

98. Trong học máy, mục tiêu của việc chuẩn hóa dữ liệu (data normalization) là gì?

A. Đưa các đặc trưng về cùng một thang đo.
B. Giảm chiều dữ liệu.
C. Loại bỏ các giá trị ngoại lệ.
D. Tăng độ chính xác của mô hình.

99. Phương pháp nào sau đây thường được sử dụng để giảm số lượng chiều dữ liệu trong học máy, đồng thời giữ lại thông tin quan trọng nhất?

A. Phân tích thành phần chính (PCA)
B. Chuẩn hóa dữ liệu (Data Normalization)
C. Mã hóa one-hot (One-hot Encoding)
D. Đánh giá chéo (Cross-validation)

100. Thuật toán nào sau đây thường được sử dụng để giảm phương sai (variance) của mô hình bằng cách kết hợp kết quả của nhiều cây quyết định?

A. Rừng ngẫu nhiên (Random Forest)
B. Gradient Boosting
C. AdaBoost
D. Cây quyết định (Decision Tree)

101. Thuật toán nào sau đây thường được sử dụng để xây dựng hệ thống gợi ý (recommendation system)?

A. Collaborative filtering
B. Hồi quy tuyến tính (Linear Regression)
C. Máy vector hỗ trợ (Support Vector Machine)
D. K-means clustering

102. Trong học máy, thuật ngữ nào mô tả quá trình điều chỉnh các tham số của mô hình để đạt được hiệu suất tốt nhất trên dữ liệu kiểm tra?

A. Điều chỉnh siêu tham số (Hyperparameter Tuning)
B. Lựa chọn đặc trưng (Feature Selection)
C. Trích xuất đặc trưng (Feature Extraction)
D. Chuẩn hóa dữ liệu (Data Normalization)

103. Trong học máy, kỹ thuật ‘dropout’ thường được sử dụng trong mạng nơ-ron để làm gì?

A. Ngăn chặn overfitting.
B. Tăng tốc độ huấn luyện.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tối ưu hóa các tham số của mô hình.

104. Trong ngữ cảnh của mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

A. Giới thiệu tính phi tuyến vào mạng.
B. Tính toán độ chính xác của mô hình.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tối ưu hóa các tham số của mô hình.

105. Phương pháp nào sau đây thường được sử dụng để đánh giá mức độ phù hợp của mô hình với dữ liệu (goodness of fit)?

A. Hệ số xác định (R-squared)
B. Độ chính xác (Accuracy)
C. Độ thu hồi (Recall)
D. Độ đo F1 (F1-score)

106. Thuật toán nào sau đây thường được sử dụng để tìm các quy luật kết hợp (association rules) trong dữ liệu, ví dụ như ‘những khách hàng mua sản phẩm A cũng thường mua sản phẩm B’?

A. Apriori algorithm
B. K-means clustering
C. Hồi quy tuyến tính (Linear Regression)
D. Máy vector hỗ trợ (Support Vector Machine)

107. Thuật toán học máy nào sau đây thường được sử dụng cho các bài toán hồi quy?

A. Hồi quy tuyến tính (Linear Regression)
B. Cây quyết định (Decision Tree)
C. Máy vector hỗ trợ (Support Vector Machine)
D. K-means clustering

108. Loại thuật toán học máy nào sau đây hoạt động bằng cách tìm các cụm (cluster) trong dữ liệu dựa trên sự tương đồng giữa các điểm dữ liệu?

A. K-means clustering
B. Hồi quy logistic (Logistic Regression)
C. Mạng nơ-ron (Neural Network)
D. Rừng ngẫu nhiên (Random Forest)

109. Trong học máy, ‘overfitting’ xảy ra khi nào?

A. Mô hình học quá tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
B. Mô hình không học được các đặc trưng quan trọng từ dữ liệu huấn luyện.
C. Dữ liệu huấn luyện chứa quá nhiều nhiễu.
D. Quá trình huấn luyện mô hình diễn ra quá nhanh.

110. Trong học máy, đường cong ROC (Receiver Operating Characteristic) được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình phân loại nhị phân.
B. Trực quan hóa dữ liệu.
C. Chuẩn hóa dữ liệu.
D. Giảm chiều dữ liệu.

111. Trong học máy, mục tiêu của việc sử dụng kỹ thuật ‘early stopping’ là gì?

A. Ngăn chặn overfitting.
B. Tăng tốc độ huấn luyện.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tối ưu hóa các tham số của mô hình.

112. Phương pháp nào sau đây giúp đánh giá hiệu suất của mô hình học máy trên dữ liệu chưa từng thấy bằng cách chia dữ liệu thành nhiều phần và huấn luyện/kiểm tra trên các phần khác nhau?

A. Kiểm định chéo (Cross-validation)
B. Chuẩn hóa dữ liệu (Data Normalization)
C. Lựa chọn đặc trưng (Feature Selection)
D. Điều chỉnh siêu tham số (Hyperparameter Tuning)

113. Phương pháp nào sau đây thường được sử dụng để xử lý các giá trị thiếu (missing values) trong dữ liệu?

A. Điền giá trị trung bình/trung vị hoặc loại bỏ các hàng/cột chứa giá trị thiếu.
B. Chuẩn hóa dữ liệu (Data Normalization)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Điều chỉnh siêu tham số (Hyperparameter Tuning)

114. Trong học máy, thuật ngữ nào mô tả quá trình lựa chọn các biến đầu vào quan trọng nhất để huấn luyện mô hình?

A. Lựa chọn đặc trưng (Feature Selection)
B. Trích xuất đặc trưng (Feature Extraction)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Chuẩn hóa dữ liệu (Data Normalization)

115. Phương pháp nào sau đây thường được sử dụng để giải quyết vấn đề ‘imbalanced dataset’ (dữ liệu không cân bằng) trong bài toán phân loại?

A. Oversampling và Undersampling
B. Chuẩn hóa dữ liệu (Data Normalization)
C. Giảm chiều dữ liệu (Dimensionality Reduction)
D. Điều chỉnh siêu tham số (Hyperparameter Tuning)

116. Trong học máy, ‘bias’ là gì?

A. Sai lệch hệ thống trong dự đoán của mô hình.
B. Mức độ biến động của dự đoán khi huấn luyện trên các tập dữ liệu khác nhau.
C. Lượng dữ liệu bị thiếu trong tập huấn luyện.
D. Tốc độ học của mô hình.

117. Trong học máy, thuật ngữ nào mô tả việc mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra?

A. Underfitting
B. Overfitting
C. Bias
D. Variance

118. Trong học máy, thuật ngữ nào mô tả việc đánh đổi giữa bias và variance để đạt được hiệu suất tốt nhất?

A. Bias-variance tradeoff
B. Overfitting
C. Underfitting
D. Regularization

119. Trong học máy, mục tiêu của việc sử dụng kỹ thuật ‘regularization’ là gì?

A. Ngăn chặn overfitting.
B. Tăng tốc độ huấn luyện.
C. Chuẩn hóa dữ liệu đầu vào.
D. Tối ưu hóa các tham số của mô hình.

120. Trong học máy, ma trận nhầm lẫn (confusion matrix) được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình phân loại.
B. Trực quan hóa dữ liệu.
C. Chuẩn hóa dữ liệu.
D. Giảm chiều dữ liệu.

121. Trong học máy, ‘feature scaling’ thường được áp dụng để làm gì?

A. Tăng số lượng thuộc tính trong tập dữ liệu.
B. Đảm bảo rằng tất cả các thuộc tính có cùng một phạm vi giá trị, giúp cải thiện hiệu suất của một số thuật toán.
C. Giảm số lượng mẫu trong tập dữ liệu.
D. Chuyển đổi các biến phân loại thành biến số.

122. Khi nào thì việc sử dụng Support Vector Machine (SVM) phù hợp?

A. Khi dữ liệu có số lượng thuộc tính ít hơn nhiều so với số lượng mẫu.
B. Khi dữ liệu có số lượng thuộc tính lớn và có thể tìm được một siêu phẳng (hyperplane) để phân tách các lớp.
C. Khi dữ liệu có nhiều nhiễu và cần một mô hình đơn giản.
D. Khi cần một mô hình dễ diễn giải.

123. Trong học sâu, ‘transfer learning’ là gì?

A. Huấn luyện một mô hình từ đầu trên một tập dữ liệu lớn.
B. Sử dụng một mô hình đã được huấn luyện trên một tập dữ liệu lớn để giải quyết một bài toán tương tự với một tập dữ liệu nhỏ hơn.
C. Chuyển dữ liệu từ định dạng này sang định dạng khác.
D. Tăng tốc độ huấn luyện bằng cách sử dụng nhiều GPU.

124. Trong xử lý ngôn ngữ tự nhiên (NLP), TF-IDF được sử dụng để làm gì?

A. Phân tích cú pháp của câu.
B. Biểu diễn mức độ quan trọng của một từ trong một tài liệu so với toàn bộ tập tài liệu.
C. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
D. Tạo ra các câu ngẫu nhiên.

125. Trong học sâu, ‘batch normalization’ được sử dụng để làm gì?

A. Tăng số lượng lớp trong mạng nơ-ron.
B. Chuẩn hóa đầu ra của mỗi lớp trong quá trình huấn luyện, giúp tăng tốc độ huấn luyện và cải thiện hiệu suất.
C. Giảm số lượng tham số trong mạng nơ-ron.
D. Thay đổi kiến trúc mạng nơ-ron.

126. Thuật toán nào sau đây thuộc loại học có giám sát (supervised learning)?

A. K-means clustering.
B. Principal Component Analysis (PCA).
C. Linear Regression.
D. Association Rule Mining.

127. Kỹ thuật nào sau đây thường được sử dụng để xử lý dữ liệu bị thiếu (missing data)?

A. One-hot encoding.
B. Imputation (điền giá trị thiếu).
C. Feature scaling.
D. Principal Component Analysis (PCA).

128. Đâu là một ưu điểm của việc sử dụng mô hình Ensemble?

A. Dễ dàng diễn giải hơn so với các mô hình đơn lẻ.
B. Ít tốn kém tài nguyên tính toán hơn.
C. Thường cho độ chính xác dự đoán cao hơn so với các mô hình đơn lẻ.
D. Không yêu cầu quá trình tiền xử lý dữ liệu.

129. Đánh giá nào sau đây mô tả đúng nhất về ‘precision’ trong đánh giá mô hình phân loại?

A. Tỷ lệ các trường hợp thực tế là dương tính được dự đoán chính xác là dương tính.
B. Tỷ lệ các trường hợp được dự đoán là dương tính thực sự là dương tính.
C. Tỷ lệ các trường hợp thực tế là âm tính được dự đoán chính xác là âm tính.
D. Tỷ lệ các trường hợp được dự đoán là âm tính thực sự là âm tính.

130. Phương pháp nào sau đây là một kỹ thuật giảm chiều dữ liệu (dimensionality reduction)?

A. One-hot encoding.
B. Principal Component Analysis (PCA).
C. Cross-validation.
D. Regularization.

131. Trong học máy, ‘cross-validation’ được sử dụng để làm gì?

A. Tăng kích thước tập dữ liệu huấn luyện.
B. Đánh giá hiệu suất của mô hình và ước tính khả năng khái quát hóa của nó trên dữ liệu mới.
C. Giảm số lượng thuộc tính trong tập dữ liệu.
D. Chuẩn hóa dữ liệu đầu vào.

132. Trong thuật toán K-Nearest Neighbors (KNN), giá trị của K ảnh hưởng đến điều gì?

A. Độ phức tạp của mô hình và khả năng khái quát hóa.
B. Tốc độ huấn luyện của mô hình.
C. Số lượng thuộc tính được sử dụng.
D. Kích thước của tập dữ liệu huấn luyện.

133. Trong học máy, ‘regularization’ được sử dụng để làm gì?

A. Tăng độ phức tạp của mô hình.
B. Giảm overfitting bằng cách thêm một hình phạt vào hàm mất mát, khuyến khích mô hình đơn giản hơn.
C. Tăng kích thước tập dữ liệu huấn luyện.
D. Chuẩn hóa dữ liệu đầu vào.

134. Khi nào nên sử dụng thuật toán Random Forest thay vì một cây quyết định đơn lẻ?

A. Khi cần một mô hình đơn giản và dễ diễn giải.
B. Khi dữ liệu có nhiều thuộc tính tương quan.
C. Khi muốn giảm overfitting và cải thiện độ chính xác dự đoán.
D. Khi cần thời gian huấn luyện nhanh chóng.

135. Trong thuật toán K-means clustering, mục tiêu chính là gì?

A. Phân loại dữ liệu vào các lớp đã biết trước.
B. Dự đoán giá trị của một biến mục tiêu liên tục.
C. Tìm các cụm (cluster) trong dữ liệu sao cho các điểm trong cùng một cụm tương tự nhau hơn các điểm ở các cụm khác.
D. Giảm số lượng chiều của dữ liệu.

136. Trong Computer Vision, Convolutional Neural Networks (CNNs) đặc biệt hiệu quả cho loại tác vụ nào?

A. Dự đoán giá cổ phiếu.
B. Phân loại văn bản.
C. Nhận dạng và phân tích hình ảnh.
D. Dịch máy.

137. Khi nào nên sử dụng thuật toán Naive Bayes?

A. Khi dữ liệu có nhiều thuộc tính tương quan mạnh.
B. Khi cần một mô hình phức tạp để nắm bắt các mối quan hệ phi tuyến.
C. Khi các thuộc tính độc lập với nhau và cần một mô hình đơn giản, nhanh chóng.
D. Khi muốn giảm chiều dữ liệu.

138. Trong thuật toán Gradient Descent, ‘learning rate’ có vai trò gì?

A. Xác định hướng di chuyển trong không gian tham số.
B. Kiểm soát kích thước của bước di chuyển trong không gian tham số để tìm cực tiểu của hàm mất mát.
C. Tính toán gradient của hàm mất mát.
D. Khởi tạo các tham số của mô hình.

139. Trong học tăng cường (reinforcement learning), ‘reward function’ có vai trò gì?

A. Xác định cách môi trường thay đổi trạng thái.
B. Đánh giá hành động của agent trong một trạng thái nhất định, khuyến khích các hành động mong muốn.
C. Dự đoán trạng thái tiếp theo của môi trường.
D. Xác định chính sách (policy) tối ưu.

140. Trong học máy, ‘F1-score’ là gì?

A. Trung bình cộng của precision và recall.
B. Trung bình nhân của precision và recall.
C. Trung bình điều hòa của precision và recall.
D. Tỷ lệ giữa precision và recall.

141. Trong học máy, ‘data augmentation’ được sử dụng để làm gì?

A. Giảm kích thước tập dữ liệu.
B. Tăng kích thước tập dữ liệu bằng cách tạo ra các biến thể mới từ dữ liệu hiện có.
C. Chuẩn hóa dữ liệu đầu vào.
D. Giảm số lượng thuộc tính trong tập dữ liệu.

142. Mục đích của việc sử dụng ‘dropout’ trong mạng nơ-ron là gì?

A. Tăng tốc độ huấn luyện.
B. Giảm overfitting bằng cách ngăn chặn các nơ-ron phụ thuộc quá nhiều vào các nơ-ron khác.
C. Tăng số lượng nơ-ron trong mạng.
D. Chuẩn hóa dữ liệu đầu vào.

143. Trong học máy, ‘bias’ và ‘variance’ đại diện cho điều gì?

A. Bias là sai số ngẫu nhiên, variance là sai số hệ thống.
B. Bias là sai số hệ thống, variance là độ nhạy của mô hình đối với sự thay đổi trong dữ liệu huấn luyện.
C. Bias là độ phức tạp của mô hình, variance là khả năng khái quát hóa của mô hình.
D. Bias là kích thước tập dữ liệu huấn luyện, variance là kích thước tập dữ liệu kiểm tra.

144. Kỹ thuật nào sau đây được sử dụng để đánh giá hiệu suất của mô hình học máy trên dữ liệu chưa thấy?

A. Huấn luyện mô hình trên toàn bộ tập dữ liệu.
B. Sử dụng tập dữ liệu huấn luyện để đánh giá.
C. Sử dụng tập dữ liệu kiểm tra (test set) hoặc cross-validation.
D. Áp dụng regularization.

145. Khi nào nên sử dụng L1 regularization (Lasso) thay vì L2 regularization (Ridge)?

A. Khi muốn giảm overfitting một cách nhẹ nhàng.
B. Khi muốn tự động lựa chọn thuộc tính bằng cách đưa các hệ số của một số thuộc tính về 0.
C. Khi tất cả các thuộc tính đều quan trọng.
D. Khi dữ liệu có ít nhiễu.

146. Trong ngữ cảnh của học máy, ‘overfitting’ xảy ra khi nào?

A. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
B. Mô hình hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu kiểm tra.
C. Mô hình hoạt động tốt trên dữ liệu kiểm tra nhưng kém trên dữ liệu huấn luyện.
D. Mô hình hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.

147. Trong học máy, ‘recall’ đo lường điều gì?

A. Tỷ lệ các trường hợp được dự đoán là dương tính thực sự là dương tính.
B. Tỷ lệ các trường hợp thực tế là dương tính được dự đoán chính xác là dương tính.
C. Tỷ lệ các trường hợp được dự đoán là âm tính thực sự là âm tính.
D. Tỷ lệ các trường hợp thực tế là âm tính được dự đoán chính xác là âm tính.

148. Trong mạng nơ-ron, hàm kích hoạt (activation function) có vai trò gì?

A. Tính toán sai số giữa giá trị dự đoán và giá trị thực tế.
B. Giới thiệu tính phi tuyến vào mạng nơ-ron, cho phép nó học các mối quan hệ phức tạp.
C. Cập nhật trọng số của các kết nối giữa các nơ-ron.
D. Chuẩn hóa dữ liệu đầu vào.

149. Trong bài toán phân loại, ROC curve được sử dụng để làm gì?

A. Đánh giá hiệu suất của mô hình trên tập dữ liệu huấn luyện.
B. Đánh giá hiệu suất của mô hình ở các ngưỡng phân loại khác nhau.
C. Tìm các cụm (cluster) trong dữ liệu.
D. Giảm chiều dữ liệu.

150. Phương pháp nào sau đây thường được sử dụng để giảm overfitting trong mô hình cây quyết định?

A. Tăng số lượng thuộc tính đầu vào.
B. Giảm độ sâu tối đa của cây.
C. Sử dụng one-hot encoding cho các biến liên tục.
D. Tăng kích thước tập dữ liệu huấn luyện.

Số câu đã làm: 0/0
Thời gian còn lại: 00:00:00
  • Đã làm
  • Chưa làm
  • Cần kiểm tra lại
© 2026 Trending New 24h • Tạo ra với GeneratePress

Bạn ơi!!! Để xem được kết quả, bạn vui lòng làm nhiệm vụ nhỏ xíu này nha

HƯỚNG DẪN TÌM MẬT KHẨU

Đang tải nhiệm vụ...

Bước 1: Mở tab mới và truy cập Google.com. Sau đó tìm kiếm chính xác từ khóa sau:

Bước 2: Tìm và click vào kết quả có trang web giống như hình ảnh dưới đây:

Hướng dẫn tìm kiếm

Bước 3: Kéo xuống cuối trang đó để tìm mật khẩu như hình ảnh hướng dẫn:

Hướng dẫn lấy mật khẩu

Nếu tìm không thấy mã bạn có thể Đổi nhiệm vụ để lấy mã khác nhé.