200+ Trắc nghiệm Học máy cơ bản (có đáp án)

HOT Ra mắt Sách tổng ôn 12 (2k8) toán, văn, anh.... (từ 80k/1 cuốn)

Tổng hợp trên 200 câu hỏi trắc nghiệm Học máy cơ bản có đáp án với các câu hỏi đa dạng, phong phú từ nhiều nguồn giúp sinh viên ôn trắc nghiệm Học máy cơ bản đạt kết quả cao.

200+ Trắc nghiệm Học máy cơ bản (có đáp án)

Quảng cáo

TRẮC NGHIỆM ONLINE

Câu 1. Thuật toán nào sau đây là ví dụ điển hình của phương pháp học sâu (deep learning)?

A. Hồi quy Logistic (Logistic Regression)

B. Mạng nơ-ron tích chập (Convolutional Neural Network – CNN)

C. Cây quyết định (Decision Tree)

D. Máy vector hỗ trợ (Support Vector Machine – SVM)

Hiển thị đáp án

Câu 2. Trong học máy, ‘pipeline’ (đường ống) là một khái niệm dùng để:

A. Huấn luyện mô hình trên nhiều máy tính cùng lúc

B. Kết hợp nhiều bước xử lý dữ liệu và huấn luyện mô hình thành một chuỗi tuần tự, dễ quản lý và tái sử dụng

C. Tự động tìm kiếm siêu tham số (hyperparameter tuning)

D. Đánh giá hiệu suất của mô hình trên tập kiểm tra

Hiển thị đáp án

Quảng cáo

Câu 3. Thuật toán nào sau đây thường được sử dụng cho bài toán phân loại đa lớp (multi-class classification)?

A. Hồi quy tuyến tính (Linear Regression)

B. Hồi quy Logistic (Logistic Regression) với chiến lược One-vs-Rest hoặc Softmax

C. Hồi quy tuyến tính với bình phương sai số (Linear Regression with squared error)

D. Phân tích thành phần chính (Principal Component Analysis – PCA)

Hiển thị đáp án

Câu 4. Thuật toán ‘Logistic Regression’ thực chất là một dạng của mô hình gì?

A. Mô hình phân cụm

B. Mô hình hồi quy tuyến tính được áp dụng với hàm sigmoid để phân loại

C. Mô hình cây quyết định

D. Mô hình mạng nơ-ron đơn giản

Hiển thị đáp án

Câu 5. Trong học máy, ‘cross-validation’ (kiểm định chéo) được sử dụng để làm gì?

Quảng cáo

A. Tăng cường tốc độ xử lý dữ liệu

B. Giảm thiểu số lượng đặc trưng cần thiết

C. Ước lượng hiệu suất của mô hình một cách đáng tin cậy hơn trên dữ liệu mới

D. Xử lý các giá trị bị thiếu trong dữ liệu

Hiển thị đáp án

Câu 6. Kỹ thuật ‘data augmentation’ (tăng cường dữ liệu) thường được sử dụng trong lĩnh vực nào để cải thiện hiệu suất mô hình?

A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing – NLP)

B. Nhận dạng hình ảnh (Image Recognition)

C. Dự báo chuỗi thời gian (Time Series Forecasting)

D. Phân cụm dữ liệu (Clustering)

Hiển thị đáp án

Câu 7. Trong các thuật toán học máy, ‘feature engineering’ đề cập đến quá trình nào?

A. Chọn thuật toán học máy phù hợp

B. Tạo ra các đặc trưng mới từ dữ liệu thô để cải thiện hiệu suất mô hình

C. Huấn luyện mô hình trên tập dữ liệu lớn

D. Đánh giá mô hình bằng các độ đo hiệu suất

Hiển thị đáp án

Quảng cáo

Câu 8. Trong học máy, ‘ensemble learning’ (học tập hợp) là một phương pháp kết hợp nhiều mô hình để:

A. Làm cho mô hình đơn giản hơn

B. Cải thiện hiệu suất tổng thể và độ ổn định của dự đoán

C. Giảm thiểu thời gian huấn luyện

D. Tăng cường tính giải thích của mô hình

Hiển thị đáp án

Câu 9. Kỹ thuật ‘weight initialization’ (khởi tạo trọng số) trong mạng nơ-ron là quan trọng vì:

A. Nó đảm bảo mô hình luôn hội tụ nhanh chóng

B. Khởi tạo sai có thể dẫn đến vấn đề ‘vanishing gradient’ hoặc ‘exploding gradient’

C. Nó loại bỏ nhu cầu về ‘regularization’

D. Nó tự động chọn kiến trúc mạng nơ-ron phù hợp

Hiển thị đáp án

Câu 10. Kỹ thuật ‘Grid Search’ trong học máy thường được sử dụng để:

A. Trực quan hóa dữ liệu

B. Tự động tìm kiếm bộ siêu tham số (hyperparameters) tối ưu cho mô hình

C. Giảm thiểu số lượng đặc trưng

D. Đánh giá hiệu suất của mô hình trên tập huấn luyện

Hiển thị đáp án

Câu 11. Thuật toán ‘XGBoost’ (Extreme Gradient Boosting) là một biến thể tiên tiến của phương pháp nào?

A. K-Means Clustering

B. Gradient Boosting

C. Support Vector Machine (SVM)

D. Naive Bayes

Hiển thị đáp án

Câu 12. Khi đối mặt với hiện tượng ‘underfitting’ (mô hình quá đơn giản), các chiến lược cải thiện nào sau đây là phù hợp?

A. Giảm độ phức tạp của mô hình (ví dụ: giảm số lượng tham số)

B. Tăng cường feature engineering hoặc thêm các đặc trưng mới

C. Giảm kích thước tập huấn luyện

D. Tăng cường regularization (ví dụ: L1, L2)

Hiển thị đáp án

Câu 13. Trong các loại lỗi của mô hình học máy, ‘bias’ cao thường biểu thị điều gì?

A. Mô hình quá nhạy cảm với dữ liệu huấn luyện

B. Mô hình có xu hướng đưa ra dự đoán sai lệch hệ thống khỏi giá trị thực

C. Mô hình có phương sai cao

D. Mô hình có thể khái quát hóa rất tốt trên dữ liệu mới

Hiển thị đáp án

Câu 14. Trong học máy, ‘feature importance’ (tầm quan trọng của đặc trưng) là một khái niệm thường được trích xuất từ loại mô hình nào?

A. Hồi quy tuyến tính (Linear Regression)

B. Các mô hình dựa trên cây (Tree-based models) như Random Forest, Gradient Boosting

C. K-Means Clustering

D. SVM với kernel tuyến tính

Hiển thị đáp án

Câu 15. Trong Học máy giám sát, mục đích chính của việc chia tập dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) là gì?

A. Để tăng tốc độ huấn luyện mô hình

B. Để đánh giá khả năng khái quát hóa của mô hình trên dữ liệu chưa thấy

C. Để giảm thiểu số chiều của dữ liệu đầu vào

D. Để lựa chọn thuật toán học máy phù hợp nhất

Hiển thị đáp án

Câu 16. Trong học máy, ‘bias-variance tradeoff’ có ý nghĩa gì đối với mô hình phức tạp và đơn giản?

A. Mô hình phức tạp có bias cao và variance thấp; mô hình đơn giản có bias thấp và variance cao

B. Mô hình phức tạp có bias thấp và variance cao; mô hình đơn giản có bias cao và variance thấp

C. Cả mô hình phức tạp và đơn giản đều có bias và variance thấp

D. Cả mô hình phức tạp và đơn giản đều có bias và variance cao

Hiển thị đáp án

Câu 17. Thuật toán ‘K-Nearest Neighbors’ (KNN) phân loại một điểm dữ liệu mới dựa trên:

A. Giá trị trung bình của các điểm dữ liệu gần nhất

B. Nhãn của đa số các điểm dữ liệu lân cận gần nhất

C. Khoảng cách từ điểm dữ liệu đến tâm của các cụm

D. Độ dốc của hàm mất mát tại điểm đó

Hiển thị đáp án

Câu 18. Trong học máy, ‘feature selection’ (lựa chọn đặc trưng) khác với ‘dimensionality reduction’ (giảm chiều dữ liệu) ở điểm nào?

A. Feature selection tạo ra đặc trưng mới, còn dimensionality reduction loại bỏ đặc trưng

B. Feature selection chọn ra một tập con các đặc trưng gốc, còn dimensionality reduction tạo ra các đặc trưng mới là tổ hợp tuyến tính của các đặc trưng gốc

C. Feature selection chỉ áp dụng cho học có giám sát, còn dimensionality reduction cho học không giám sát

D. Không có sự khác biệt đáng kể giữa hai khái niệm này

Hiển thị đáp án

Câu 19. Thuật toán ‘Apriori’ được sử dụng chủ yếu cho bài toán nào?

A. Phân loại văn bản

B. Phát hiện luật kết hợp (Association Rule Mining)

C. Dự báo chuỗi thời gian

D. Giảm chiều dữ liệu

Hiển thị đáp án

Câu 20. Khi sử dụng ‘cross-validation’, số lượng ‘folds’ (phần) thường được chọn là bao nhiêu?

A. Luôn luôn là 2

B. Thường là 5 hoặc 10

C. Chỉ phụ thuộc vào số lượng đặc trưng

D. Luôn luôn bằng số lượng mẫu trong tập dữ liệu

Hiển thị đáp án

Câu 21. Thuật toán ‘Support Vector Machine’ (SVM) tìm kiếm gì để phân chia các lớp dữ liệu?

A. Đường thẳng đi qua tâm của các điểm dữ liệu

B. Siêu phẳng (hyperplane) với biên (margin) lớn nhất giữa các lớp

C. Các cụm dữ liệu

D. Các đường cong tối thiểu hóa sai số bình phương

Hiển thị đáp án

Câu 22. Kỹ thuật ‘Bagging’ (Bootstrap Aggregating) trong học máy thường được áp dụng để:

A. Tăng cường độ phức tạp của mô hình

B. Giảm phương sai (variance) của mô hình, giúp chống overfitting

C. Tìm kiếm các cụm dữ liệu

D. Giảm thiểu sai số hệ thống (bias)

Hiển thị đáp án

Câu 23. Kỹ thuật ‘dimensionality reduction’ (giảm chiều dữ liệu) thường được áp dụng để làm gì?

A. Tăng số lượng đặc trưng để cải thiện hiệu suất

B. Giảm thiểu đa cộng tuyến (multicollinearity) giữa các đặc trưng và giảm chi phí tính toán

C. Chỉ sử dụng cho các mô hình học không giám sát

D. Phát hiện các giá trị ngoại lai

Hiển thị đáp án

Câu 24. Thuật toán nào thuộc nhóm Học máy tăng cường (Reinforcement Learning)?

A. K-Means Clustering

B. Linear Regression

C. Q-Learning

D. Support Vector Machine (SVM)

Hiển thị đáp án

Câu 25. Thuật toán ‘Random Forest’ là một ví dụ của phương phápensemble nào?

A. Boosting

B. Bagging

C. Stacking

D. Ensembling đơn giản (Simple Averaging)

Hiển thị đáp án

................................

TRẮC NGHIỆM ONLINE

Xem thêm câu hỏi trắc nghiệm các môn học Đại học có đáp án hay khác:

Tài liệu cho giáo viên: Giáo án, powerpoint, đề thi giữa kì cuối kì, đánh giá năng lực, thi thử THPT, HSG, chuyên đề, bài tập cuối tuần..... độc quyền VietJack, giá hợp lí

Sách VietJack thi THPT quốc gia 2025 cho học sinh 2k7:

ĐỀ THI, GIÁO ÁN, GÓI THI ONLINE DÀNH CHO GIÁO VIÊN VÀ PHỤ HUYNH LỚP 12

Bộ giáo án, đề thi, bài giảng powerpoint, khóa học dành cho các thầy cô và học sinh lớp 12, đẩy đủ các bộ sách cánh diều, kết nối tri thức, chân trời sáng tạo tại https://tailieugiaovien.com.vn/ . Hỗ trợ zalo VietJack Official