200+ Trắc nghiệm Học máy cơ bản (có đáp án)
Tổng hợp trên 200 câu hỏi trắc nghiệm Học máy cơ bản có đáp án với các câu hỏi đa dạng, phong phú từ nhiều nguồn giúp sinh viên ôn trắc nghiệm Học máy cơ bản đạt kết quả cao.
200+ Trắc nghiệm Học máy cơ bản (có đáp án)
Câu 1. Thuật toán nào sau đây là ví dụ điển hình của phương pháp học sâu (deep learning)?
A. Hồi quy Logistic (Logistic Regression)
B. Mạng nơ-ron tích chập (Convolutional Neural Network – CNN)
C. Cây quyết định (Decision Tree)
D. Máy vector hỗ trợ (Support Vector Machine – SVM)
Câu 2. Trong học máy, ‘pipeline’ (đường ống) là một khái niệm dùng để:
A. Huấn luyện mô hình trên nhiều máy tính cùng lúc
B. Kết hợp nhiều bước xử lý dữ liệu và huấn luyện mô hình thành một chuỗi tuần tự, dễ quản lý và tái sử dụng
C. Tự động tìm kiếm siêu tham số (hyperparameter tuning)
D. Đánh giá hiệu suất của mô hình trên tập kiểm tra
Câu 3. Thuật toán nào sau đây thường được sử dụng cho bài toán phân loại đa lớp (multi-class classification)?
A. Hồi quy tuyến tính (Linear Regression)
B. Hồi quy Logistic (Logistic Regression) với chiến lược One-vs-Rest hoặc Softmax
C. Hồi quy tuyến tính với bình phương sai số (Linear Regression with squared error)
D. Phân tích thành phần chính (Principal Component Analysis – PCA)
Câu 4. Thuật toán ‘Logistic Regression’ thực chất là một dạng của mô hình gì?
A. Mô hình phân cụm
B. Mô hình hồi quy tuyến tính được áp dụng với hàm sigmoid để phân loại
C. Mô hình cây quyết định
D. Mô hình mạng nơ-ron đơn giản
Câu 5. Trong học máy, ‘cross-validation’ (kiểm định chéo) được sử dụng để làm gì?
A. Tăng cường tốc độ xử lý dữ liệu
B. Giảm thiểu số lượng đặc trưng cần thiết
C. Ước lượng hiệu suất của mô hình một cách đáng tin cậy hơn trên dữ liệu mới
D. Xử lý các giá trị bị thiếu trong dữ liệu
Câu 6. Kỹ thuật ‘data augmentation’ (tăng cường dữ liệu) thường được sử dụng trong lĩnh vực nào để cải thiện hiệu suất mô hình?
A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP)
B. Nhận dạng hình ảnh (Image Recognition)
C. Dự báo chuỗi thời gian (Time Series Forecasting)
D. Phân cụm dữ liệu (Clustering)
Câu 7. Trong các thuật toán học máy, ‘feature engineering’ đề cập đến quá trình nào?
A. Chọn thuật toán học máy phù hợp
B. Tạo ra các đặc trưng mới từ dữ liệu thô để cải thiện hiệu suất mô hình
C. Huấn luyện mô hình trên tập dữ liệu lớn
D. Đánh giá mô hình bằng các độ đo hiệu suất
Câu 8. Trong học máy, ‘ensemble learning’ (học tập hợp) là một phương pháp kết hợp nhiều mô hình để:
A. Làm cho mô hình đơn giản hơn
B. Cải thiện hiệu suất tổng thể và độ ổn định của dự đoán
C. Giảm thiểu thời gian huấn luyện
D. Tăng cường tính giải thích của mô hình
Câu 9. Kỹ thuật ‘weight initialization’ (khởi tạo trọng số) trong mạng nơ-ron là quan trọng vì:
A. Nó đảm bảo mô hình luôn hội tụ nhanh chóng
B. Khởi tạo sai có thể dẫn đến vấn đề ‘vanishing gradient’ hoặc ‘exploding gradient’
C. Nó loại bỏ nhu cầu về ‘regularization’
D. Nó tự động chọn kiến trúc mạng nơ-ron phù hợp
Câu 10. Kỹ thuật ‘Grid Search’ trong học máy thường được sử dụng để:
A. Trực quan hóa dữ liệu
B. Tự động tìm kiếm bộ siêu tham số (hyperparameters) tối ưu cho mô hình
C. Giảm thiểu số lượng đặc trưng
D. Đánh giá hiệu suất của mô hình trên tập huấn luyện
Câu 11. Thuật toán ‘XGBoost’ (Extreme Gradient Boosting) là một biến thể tiên tiến của phương pháp nào?
A. K-Means Clustering
B. Gradient Boosting
C. Support Vector Machine (SVM)
D. Naive Bayes
Câu 12. Khi đối mặt với hiện tượng ‘underfitting’ (mô hình quá đơn giản), các chiến lược cải thiện nào sau đây là phù hợp?
A. Giảm độ phức tạp của mô hình (ví dụ: giảm số lượng tham số)
B. Tăng cường feature engineering hoặc thêm các đặc trưng mới
C. Giảm kích thước tập huấn luyện
D. Tăng cường regularization (ví dụ: L1, L2)
Câu 13. Trong các loại lỗi của mô hình học máy, ‘bias’ cao thường biểu thị điều gì?
A. Mô hình quá nhạy cảm với dữ liệu huấn luyện
B. Mô hình có xu hướng đưa ra dự đoán sai lệch hệ thống khỏi giá trị thực
C. Mô hình có phương sai cao
D. Mô hình có thể khái quát hóa rất tốt trên dữ liệu mới
Câu 14. Trong học máy, ‘feature importance’ (tầm quan trọng của đặc trưng) là một khái niệm thường được trích xuất từ loại mô hình nào?
A. Hồi quy tuyến tính (Linear Regression)
B. Các mô hình dựa trên cây (Tree-based models) như Random Forest, Gradient Boosting
C. K-Means Clustering
D. SVM với kernel tuyến tính
Câu 15. Trong Học máy giám sát, mục đích chính của việc chia tập dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) là gì?
A. Để tăng tốc độ huấn luyện mô hình
B. Để đánh giá khả năng khái quát hóa của mô hình trên dữ liệu chưa thấy
C. Để giảm thiểu số chiều của dữ liệu đầu vào
D. Để lựa chọn thuật toán học máy phù hợp nhất
Câu 16. Trong học máy, ‘bias-variance tradeoff’ có ý nghĩa gì đối với mô hình phức tạp và đơn giản?
A. Mô hình phức tạp có bias cao và variance thấp; mô hình đơn giản có bias thấp và variance cao
B. Mô hình phức tạp có bias thấp và variance cao; mô hình đơn giản có bias cao và variance thấp
C. Cả mô hình phức tạp và đơn giản đều có bias và variance thấp
D. Cả mô hình phức tạp và đơn giản đều có bias và variance cao
Câu 17. Thuật toán ‘K-Nearest Neighbors’ (KNN) phân loại một điểm dữ liệu mới dựa trên:
A. Giá trị trung bình của các điểm dữ liệu gần nhất
B. Nhãn của đa số các điểm dữ liệu lân cận gần nhất
C. Khoảng cách từ điểm dữ liệu đến tâm của các cụm
D. Độ dốc của hàm mất mát tại điểm đó
Câu 18. Trong học máy, ‘feature selection’ (lựa chọn đặc trưng) khác với ‘dimensionality reduction’ (giảm chiều dữ liệu) ở điểm nào?
A. Feature selection tạo ra đặc trưng mới, còn dimensionality reduction loại bỏ đặc trưng
B. Feature selection chọn ra một tập con các đặc trưng gốc, còn dimensionality reduction tạo ra các đặc trưng mới là tổ hợp tuyến tính của các đặc trưng gốc
C. Feature selection chỉ áp dụng cho học có giám sát, còn dimensionality reduction cho học không giám sát
D. Không có sự khác biệt đáng kể giữa hai khái niệm này
Câu 19. Thuật toán ‘Apriori’ được sử dụng chủ yếu cho bài toán nào?
A. Phân loại văn bản
B. Phát hiện luật kết hợp (Association Rule Mining)
C. Dự báo chuỗi thời gian
D. Giảm chiều dữ liệu
Câu 20. Khi sử dụng ‘cross-validation’, số lượng ‘folds’ (phần) thường được chọn là bao nhiêu?
A. Luôn luôn là 2
B. Thường là 5 hoặc 10
C. Chỉ phụ thuộc vào số lượng đặc trưng
D. Luôn luôn bằng số lượng mẫu trong tập dữ liệu
Câu 21. Thuật toán ‘Support Vector Machine’ (SVM) tìm kiếm gì để phân chia các lớp dữ liệu?
A. Đường thẳng đi qua tâm của các điểm dữ liệu
B. Siêu phẳng (hyperplane) với biên (margin) lớn nhất giữa các lớp
C. Các cụm dữ liệu
D. Các đường cong tối thiểu hóa sai số bình phương
Câu 22. Kỹ thuật ‘Bagging’ (Bootstrap Aggregating) trong học máy thường được áp dụng để:
A. Tăng cường độ phức tạp của mô hình
B. Giảm phương sai (variance) của mô hình, giúp chống overfitting
C. Tìm kiếm các cụm dữ liệu
D. Giảm thiểu sai số hệ thống (bias)
Câu 23. Kỹ thuật ‘dimensionality reduction’ (giảm chiều dữ liệu) thường được áp dụng để làm gì?
A. Tăng số lượng đặc trưng để cải thiện hiệu suất
B. Giảm thiểu đa cộng tuyến (multicollinearity) giữa các đặc trưng và giảm chi phí tính toán
C. Chỉ sử dụng cho các mô hình học không giám sát
D. Phát hiện các giá trị ngoại lai
Câu 24. Thuật toán nào thuộc nhóm Học máy tăng cường (Reinforcement Learning)?
A. K-Means Clustering
B. Linear Regression
C. Q-Learning
D. Support Vector Machine (SVM)
Câu 25. Thuật toán ‘Random Forest’ là một ví dụ của phương phápensemble nào?
A. Boosting
B. Bagging
C. Stacking
D. Ensembling đơn giản (Simple Averaging)
................................
................................
................................
Xem thêm câu hỏi trắc nghiệm các môn học Đại học có đáp án hay khác:
Sách VietJack thi THPT quốc gia 2025 cho học sinh 2k7:
- Soạn văn 12 (hay nhất) - KNTT
- Soạn văn 12 (ngắn nhất) - KNTT
- Giải sgk Toán 12 - KNTT
- Giải Tiếng Anh 12 Global Success
- Giải sgk Tiếng Anh 12 Smart World
- Giải sgk Tiếng Anh 12 Friends Global
- Giải sgk Vật Lí 12 - KNTT
- Giải sgk Hóa học 12 - KNTT
- Giải sgk Sinh học 12 - KNTT
- Giải sgk Lịch Sử 12 - KNTT
- Giải sgk Địa Lí 12 - KNTT
- Giải sgk Giáo dục KTPL 12 - KNTT
- Giải sgk Tin học 12 - KNTT
- Giải sgk Công nghệ 12 - KNTT
- Giải sgk Hoạt động trải nghiệm 12 - KNTT
- Giải sgk Giáo dục quốc phòng 12 - KNTT
- Giải sgk Âm nhạc 12 - KNTT
- Giải sgk Mĩ thuật 12 - KNTT
Giải bài tập SGK & SBT
Tài liệu giáo viên
Sách
Khóa học
Thi online
Hỏi đáp



