50 Soal Machine Learning Beserta Jawaban

Kumpulan Soal Pilihan Ganda Materi Machine Learning

1. Algoritma Machine Learning yang paling umum digunakan untuk klasifikasi adalah:
A. Linear Regression
B. Naive Bayes
C. K-Means
D. Decision Tree

Jawaban: 
D. Decision Tree


2. Supervised learning adalah:
A. Menggunakan dataset yang tidak memiliki label
B. Memperoleh informasi dari pengalaman
C. Memiliki variabel dependen yang diketahui
D. Menggunakan aturan tertentu untuk memecahkan masalah

Jawaban: 
C. Memiliki variabel dependen yang diketahui


3. Algoritma Machine Learning yang cocok digunakan untuk memprediksi nilai kontinu adalah:
A. Logistic Regression
B. Decision Tree
C. K-Means
D. Linear Regression

Jawaban: 
D. Linear Regression


4. Salah satu keuntungan dari menggunakan ensemble learning adalah:
A. Kemampuan untuk mengklasifikasikan data yang tidak terstruktur
B. Kemampuan untuk menangani dataset dengan dimensi tinggi
C. Kemampuan untuk mempercepat waktu komputasi
D. Kemampuan untuk meningkatkan akurasi prediksi

Jawaban: 
D. Kemampuan untuk meningkatkan akurasi prediksi


5. Proses pembagian dataset menjadi dua bagian, yaitu training set dan testing set, disebut:
A. Cross-validation
B. Feature extraction
C. Data augmentation
D. Data splitting

Jawaban: 
D. Data splitting


6. Algoritma Machine Learning yang digunakan untuk mengurutkan data adalah:
A. Naive Bayes
B. K-Means
C. Linear Regression
D. Support Vector Machine

Jawaban: 
B. K-Means


7. Algoritma Machine Learning yang cocok untuk analisis klastering adalah:
A. Decision Tree
B. K-Means
C. Logistic Regression
D. Random Forest

Jawaban: 
B. K-Means


8. Fungsi aktivasi yang sering digunakan dalam jaringan saraf tiruan (neural networks) adalah:
A. Sigmoid
B. Relu
C. Tanh
D. Semua jawaban benar

Jawaban: 
D. Semua jawaban benar


9. Overfitting terjadi ketika:
A. Model Machine Learning gagal menghasilkan prediksi yang akurat
B. Model Machine Learning terlalu rumit dan terlalu cocok dengan data pelatihan
C. Model Machine Learning terlalu sederhana sehingga tidak dapat menangani masalah yang rumit
D. Model Machine Learning menghasilkan hasil yang konsisten tetapi tidak akurat

Jawaban: 
B. Model Machine Learning terlalu rumit dan terlalu cocok dengan data pelatihan


10. Salah satu teknik untuk mengurangi overfitting pada model Machine Learning adalah:
A. Data augmentation
B. Cross-validation
C. Regularisasi
D. Semua jawaban benar

Jawaban: 
D. Semua jawaban benar


11. Metode evaluasi yang digunakan untuk mengukur kinerja model klasifikasi adalah:
A. Confusion matrix
B. SSE (Sum of Squared Errors)
C. R-squared
D. Silhouette score

Jawaban: 
A. Confusion matrix


12. Support Vector Machine (SVM) digunakan untuk:
A. Klasifikasi dan regresi
B. Clustering
C. Prediksi nilai kontinu
D. Feature selection

Jawaban: 
A. Klasifikasi dan regresi


13. K-fold cross-validation mengacu pada:
A. Metode pembagian dataset menjadi dua bagian: training set dan testing set
B. Metode pembagian dataset menjadi tiga bagian: training set, validation set, dan testing set
C. Metode evaluasi model dengan membagi dataset menjadi k subset yang sama ukurannya
D. Metode evaluasi model dengan menggunakan matriks konfusi

Jawaban: 
C. Metode evaluasi model dengan membagi dataset menjadi k subset yang sama ukurannya


14. Salah satu algoritma Machine Learning yang populer untuk pengelompokan teks adalah:
A. K-Means
B. Naive Bayes
C. Decision Tree
D. Random Forest

Jawaban: 
B. Naive Bayes


15. Algoritma Random Forest digunakan untuk:
A. Klasifikasi dan regresi
B. Clustering
C. Prediksi nilai kontinu
D. Feature selection

Jawaban: 
A. Klasifikasi dan regresi


16. Algoritma Machine Learning yang digunakan untuk deteksi anomali adalah:
A. Naive Bayes
B. K-Means
C. Random Forest
D. One-Class SVM

Jawaban: 
D. One-Class SVM


17. Algoritma Machine Learning yang digunakan untuk pengenalan pola dalam data adalah:
A. Decision Tree
B. K-Nearest Neighbors (KNN)
C. Linear Regression
D. Logistic Regression

Jawaban: 
B. K-Nearest Neighbors (KNN)