50 Soal Praktikum Klasifikasi Dasar Beserta Jawaban
Kumpulan Soal Pilihan Ganda Materi Praktikum Klasifikasi Dasar
Soal 1:
Apa tujuan utama dari praktikum klasifikasi?
a) Menganalisis data statistik
b) Membuat visualisasi data
c) Mengelompokkan data menjadi kategori tertentu
d) Mengurutkan data dalam urutan tertentu
Jawaban: c) Mengelompokkan data menjadi kategori tertentu
Soal 2:
Manakah metode klasifikasi yang sering digunakan dalam pembelajaran mesin?
a) Menghitung rata-rata data
b) K-Means clustering
c) Penjumlahan data
d) Membagi data menjadi beberapa file
Jawaban: b) K-Means clustering
Soal 3:
Apa yang dimaksud dengan fitur dalam konteks klasifikasi data?
a) Label yang mengidentifikasi data
b) Nilai target dari data
c) Variabel yang digunakan untuk menggambarkan data
d) Angka acak yang diberikan pada data
Jawaban: c) Variabel yang digunakan untuk menggambarkan data
Soal 4:
Algoritma Decision Tree digunakan dalam klasifikasi untuk:
a) Menghitung rata-rata data
b) Mengelompokkan data berdasarkan korelasi
c) Mengurutkan data dalam urutan tertentu
d) Mengubah data menjadi data tekstual
Jawaban: b) Mengelompokkan data berdasarkan korelasi
Soal 5:
Manakah dari berikut ini bukan merupakan contoh masalah klasifikasi?
a) Prediksi apakah email adalah spam atau bukan
b) Klasifikasi gambar hewan berdasarkan spesies
c) Menghitung total pendapatan dari dataset penjualan
d) Mengklasifikasikan jenis bunga berdasarkan fitur morfologi
Jawaban: c) Menghitung total pendapatan dari dataset penjualan
Soal 6:
Apa yang dimaksud dengan "label" dalam konteks klasifikasi?
a) Variabel yang digunakan untuk menggambarkan data
b) Nilai target atau kategori yang ingin diprediksi
c) Angka acak yang diberikan pada data
d) Metode untuk mengurutkan data
Jawaban: b) Nilai target atau kategori yang ingin diprediksi
Soal 7:
Manakah algoritma klasifikasi berikut yang tidak menghasilkan model berbasis aturan?
a) Naive Bayes
b) Decision Tree
c) Random Forest
d) K-Nearest Neighbors
Jawaban: d) K-Nearest Neighbors
Soal 8:
Apakah tujuan dari tahap "pelatihan" dalam klasifikasi?
a) Mencari nilai tengah dari data
b) Mengelompokkan data menjadi beberapa bagian
c) Membuat model prediksi berdasarkan data yang diberikan
d) Menyusun data dalam urutan tertentu
Jawaban: c) Membuat model prediksi berdasarkan data yang diberikan
Soal 9:
Manakah metode yang digunakan untuk mengukur performa model klasifikasi?
a) Menghitung jumlah total data
b) Menghitung rata-rata data
c) Menggunakan matriks kebingungan (confusion matrix)
d) Mengubah data menjadi data teks
Jawaban: c) Menggunakan matriks kebingungan (confusion matrix)
Soal 10:
Apa yang dimaksud dengan "overfitting" dalam konteks klasifikasi?
a) Model terlalu sederhana untuk data
b) Model cocok dengan data pelatihan tetapi tidak dapat umumkan untuk data baru
c) Model tidak cukup rumit untuk data
d) Model hanya dapat bekerja dengan data numerik
Jawaban: b) Model cocok dengan data pelatihan tetapi tidak dapat umumkan untuk data baru
Soal 11:
Metode klasifikasi Logistic Regression umumnya digunakan untuk:
a) Mengelompokkan data menjadi kategori
b) Mengurutkan data berdasarkan nilai numerik
c) Menghitung rata-rata data
d) Mengelompokkan data berdasarkan waktu
Jawaban: a) Mengelompokkan data menjadi kategori
Soal 12:
Manakah dari berikut ini bukan merupakan contoh fitur dalam klasifikasi gambar manusia?
a) Warna mata
b) Ukuran baju yang dikenakan
c) Jumlah jari tangan
d) Ketinggian rambut
Jawaban: b) Ukuran baju yang dikenakan
Soal 13:
Apa yang dilakukan oleh algoritma K-Means dalam klasifikasi?
a) Membuat model aturan berdasarkan data pelatihan
b) Menghitung rata-rata data
c) Mengelompokkan data menjadi kategori berdasarkan jarak terdekat
d) Mengurutkan data dalam urutan tertentu
Jawaban: c) Mengelompokkan data menjadi kategori berdasarkan jarak terdekat
Soal 14:
Manakah algoritma klasifikasi yang digunakan untuk memecah data menjadi beberapa subset?
a) Decision Tree
b) Naive Bayes
c) Support Vector Machine (SVM)
d) Random Forest
Jawaban: d) Random Forest
Soal 15:
Apa yang dimaksud dengan "underfitting" dalam konteks klasifikasi?
a) Model cocok dengan data pelatihan tetapi tidak dapat umumkan untuk data baru
b) Model terlalu rumit untuk data
c) Model hanya dapat bekerja dengan data numerik
d) Model tidak cukup kompleks untuk data
Jawaban: d) Model tidak cukup kompleks untuk data
Soal 16:
Manakah algoritma klasifikasi yang menggunakan konsep probabilitas untuk membuat prediksi?
a) Decision Tree
b) K-Nearest Neighbors
c) Naive Bayes
d) Support Vector Machine (SVM)
Jawaban: c) Naive Bayes
Soal 17:
Manakah metode klasifikasi yang dapat digunakan untuk data berlabel dan tidak berlabel?
a) K-Means clustering
b) Decision Tree
c) Random Forest
d) Support Vector Machine (SVM)
Jawaban: d) Support Vector Machine (SVM)
Soal 18:
Apa yang dimaksud dengan "ensemble learning" dalam konteks klasifikasi?
a) Penggunaan hanya satu algoritma klasifikasi
b) Klasifikasi data berdasarkan warna
c) Mengelompokkan data menjadi beberapa subset
d) Kombinasi beberapa model untuk meningkatkan kinerja
Jawaban: d) Kombinasi beberapa model untuk meningkatkan kinerja
Soal 19:
Manakah teknik yang dapat digunakan untuk mengatasi overfitting dalam model klasifikasi?
a) Menambahkan lebih banyak fitur pada model
b) Mengurangi jumlah data pelatihan
c) Menggunakan data validasi dan regulasi
d) Meningkatkan kompleksitas model
Jawaban: c) Menggunakan data validasi dan regulasi
Soal 20:
Metode apa yang digunakan untuk mengukur seberapa baik model klasifikasi dalam memprediksi kelas yang benar?
a) Akurasi
b) K-Means clustering
c) Rata-rata data
d) Regresi linear
Jawaban: a) Akurasi
Soal 21:
Apa yang dimaksud dengan "cross-validation" dalam konteks klasifikasi?
a) Memvalidasi data numerik
b) Menggabungkan data dari dua sumber yang berbeda
c) Teknik untuk mengukur akurasi model dengan membagi data menjadi beberapa subset
d) Mengubah data menjadi data teks
Jawaban: c) Teknik untuk mengukur akurasi model dengan membagi data menjadi beberapa subset
Soal 22:
Manakah algoritma berikut yang tidak sesuai untuk klasifikasi gambar?
a) Naive Bayes
b) Convolutional Neural Network (CNN)
c) Decision Tree
d) Random Forest
Jawaban: a) Naive Bayes
Soal 23:
Apa yang dimaksud dengan "precision" dalam konteks evaluasi model klasifikasi?
a) Kemampuan model untuk memprediksi kelas yang benar secara keseluruhan
b) Kemampuan model untuk menghindari prediksi kelas yang salah positif
c) Kemampuan model untuk menghindari prediksi kelas yang salah negatif
d) Kemampuan model untuk memprediksi kelas dengan waktu yang cepat
Jawaban: b) Kemampuan model untuk menghindari prediksi kelas yang salah positif
Soal 24:
Apa yang diukur oleh area di bawah kurva Receiver Operating Characteristic (ROC)?
a) Akurasi model
b) Presisi model
c) Kemampuan memprediksi kelas positif secara benar
d) Performa model dalam mengklasifikasikan dengan berbagai threshold
Jawaban: d) Performa model dalam mengklasifikasikan dengan berbagai threshold
Soal 25:
Metode apa yang digunakan untuk mengatasi kelas minoritas yang kurang mewakili dalam dataset?
a) Random Forest
b) Undersampling
c) Naive Bayes
d) Decision Tree
Jawaban: b) Undersampling
Soal 26:
Apa yang dimaksud dengan "recall" dalam konteks evaluasi model klasifikasi?
a) Kemampuan model untuk memprediksi kelas yang benar secara keseluruhan
b) Kemampuan model untuk menghindari prediksi kelas yang salah positif
c) Kemampuan model untuk menghindari prediksi kelas yang salah negatif
d) Kemampuan model untuk memprediksi kelas dengan waktu yang cepat
Jawaban: c) Kemampuan model untuk menghindari prediksi kelas yang salah negatif
Soal 27:
Algoritma apa yang membagi data menjadi dua kelas dengan garis pemisah linier?
a) K-Nearest Neighbors
b) Naive Bayes
c) Decision Tree
d) Support Vector Machine (SVM)
Jawaban: d) Support Vector Machine (SVM)
Soal 28:
Apa yang dimaksud dengan "F1-score" dalam evaluasi model klasifikasi?
a) Rata-rata akurasi dan presisi
b) Rata-rata presisi dan recall
c) Rata-rata akurasi dan recall
d) Rata-rata presisi, recall, dan akurasi
Jawaban: b) Rata-rata presisi dan recall
Soal 29:
Manakah metode yang digunakan untuk mengatasi ketidakseimbangan kelas dalam dataset?
a) Decision Tree
b) K-Means clustering
c) Oversampling
d) Regresi linear
Jawaban: c) Oversampling
Soal 30:
Apa yang diukur oleh area di bawah kurva Precision-Recall (PR)?
a) Akurasi model
b) Presisi model
c) Recall model
d) Performa model dalam mengklasifikasikan dengan berbagai threshold
Jawaban: d) Performa model dalam mengklasifikasikan dengan berbagai threshold
Soal 31:
Metode apa yang digunakan untuk mengurutkan fitur-fitur berdasarkan kontribusinya terhadap model klasifikasi?
a) Principal Component Analysis (PCA)
b) Feature Selection
c) Overfitting
d) Regularization
Jawaban: b) Feature Selection
Soal 32:
Manakah algoritma yang lebih cenderung sensitif terhadap outlier dalam data?
a) Naive Bayes
b) K-Nearest Neighbors
c) Decision Tree
d) Random Forest
Jawaban: b) K-Nearest Neighbors
Soal 33:
Apa yang dimaksud dengan "grid search" dalam konteks pemilihan parameter model?
a) Proses mencari angka acak dalam data
b) Proses memilih subset data yang sesuai
c) Teknik pencarian parameter yang optimal melalui kombinasi yang telah ditentukan sebelumnya
d) Teknik memilih model yang paling kompleks
Jawaban: c) Teknik pencarian parameter yang optimal melalui kombinasi yang telah ditentukan sebelumnya
Soal 34:
Manakah dari berikut ini adalah metrik evaluasi yang paling cocok untuk klasifikasi kelas minoritas dalam dataset yang tidak seimbang?
a) Akurasi
b) Precision
c) Recall
d) F1-score
Jawaban: c) Recall
Soal 35:
Apa yang dimaksud dengan "hyperparameter" dalam konteks model klasifikasi?
a) Parameter yang dihasilkan dari model
b) Parameter yang ditemukan secara otomatis selama pelatihan
c) Parameter yang didefinisikan oleh pengguna sebelum pelatihan
d) Parameter yang mengukur kompleksitas model
Jawaban: c) Parameter yang didefinisikan oleh pengguna sebelum pelatihan
Soal 36:
Algoritma apa yang membagi data menjadi beberapa kluster berdasarkan jarak terdekat?
a) Decision Tree
b) K-Means clustering
c) Naive Bayes
d) Support Vector Machine (SVM)
Jawaban: b) K-Means clustering
Soal 37:
Manakah dari berikut ini adalah metrik yang berguna ketika kelas positif dalam dataset adalah fokus utama?
a) Akurasi
b) Precision
c) Recall
d) F1-score
Jawaban: b) Precision
Soal 38:
Apa yang dimaksud dengan "bagging" dalam konteks ensemble learning?
a) Teknik penggabungan beberapa dataset
b) Teknik membagi dataset menjadi beberapa subset
c) Teknik menggabungkan beberapa model dengan memberikan bobot
d) Teknik menggabungkan beberapa model dengan bootstrapped samples
Jawaban: d) Teknik menggabungkan beberapa model dengan bootstrapped samples
Soal 39:
Manakah dari berikut ini adalah metrik yang berguna untuk mengukur seberapa baik model dalam memprediksi kelas negatif dalam dataset yang tidak seimbang?
a) Akurasi
b) Precision
c) Recall
d) F1-score
Jawaban: b) Precision
Soal 40:
Algoritma apa yang dapat mengatasi masalah klasifikasi pada data yang tidak linear terpisah?
a) Naive Bayes
b) Decision Tree
c) Logistic Regression
d) Support Vector Machine (SVM)
Jawaban: d) Support Vector Machine (SVM)
Soal 41:
Apa yang dimaksud dengan "dropout" dalam konteks jaringan saraf tiruan (neural networks)?
a) Teknik mengurangi jumlah lapisan dalam jaringan saraf
b) Teknik menghapus beberapa data dalam dataset
c) Teknik menghentikan pelatihan model secara tiba-tiba
d) Teknik mengatur agar beberapa unit dalam lapisan tertentu dinonaktifkan secara acak selama pelatihan
Jawaban: d) Teknik mengatur agar beberapa unit dalam lapisan tertentu dinonaktifkan secara acak selama pelatihan
Soal 42:
Manakah metode yang dapat digunakan untuk mengurangi dimensi data yang memiliki banyak fitur?
a) Decision Tree
b) Principal Component Analysis (PCA)
c) K-Means clustering
d) Naive Bayes
Jawaban: b) Principal Component Analysis (PCA)
Soal 43:
Apa yang dimaksud dengan "regularization" dalam konteks model klasifikasi?
a) Teknik mengurutkan data secara teratur
b) Teknik menambahkan fitur tambahan pada dataset
c) Teknik menambahkan noise pada data
d) Teknik mengurangi kompleksitas model untuk menghindari overfitting
Jawaban: d) Teknik mengurangi kompleksitas model untuk menghindari overfitting
Soal 44:
Manakah algoritma klasifikasi yang memanfaatkan konsep probabilitas dan teorema Bayes?
a) K-Means clustering
b) Decision Tree
c) Random Forest
d) Naive Bayes
Jawaban: d) Naive Bayes
Soal 45:
Apa yang diukur oleh metrik "AUC-ROC" dalam evaluasi model klasifikasi?
a) Kemampuan model untuk memprediksi kelas positif dengan benar
b) Kemampuan model untuk memprediksi kelas negatif dengan benar
c) Performa model dalam mengklasifikasikan dengan berbagai threshold
d) Performa model dalam mengklasifikasikan data yang sangat seimbang
Jawaban: c) Performa model dalam mengklasifikasikan dengan berbagai threshold
Soal 46:
Manakah algoritma yang cocok untuk klasifikasi data berbasis teks, seperti analisis sentimen pada ulasan pelanggan?
a) Decision Tree
b) Naive Bayes
c) K-Means clustering
d) Support Vector Machine (SVM)
Jawaban: b) Naive Bayes
Soal 47:
Apa yang dimaksud dengan "one-hot encoding" dalam konteks fitur kategorikal?
a) Teknik pengkodean data menjadi angka acak
b) Teknik pengkodean data menjadi nilai numerik berurutan
c) Teknik pengkodean data menjadi vektor biner untuk setiap kategori
d) Teknik pengkodean data menjadi data teks
Jawaban: c) Teknik pengkodean data menjadi vektor biner untuk setiap kategori
Soal 48:
Algoritma apa yang menghasilkan serangkaian aturan keputusan dalam bentuk "jika... maka..."?
a) Decision Tree
b) K-Means clustering
c) Naive Bayes
d) Logistic Regression
Jawaban: a) Decision Tree
Soal 49:
Apa yang dimaksud dengan "bag of words" dalam konteks analisis teks?
a) Teknik mengelompokkan kata-kata dalam urutan tertentu
b) Teknik menghitung jumlah kata dalam teks
c) Teknik menggabungkan beberapa teks menjadi satu
d) Teknik mengurutkan kata-kata dalam abjad
Jawaban: b) Teknik menghitung jumlah kata dalam teks
Soal 50:
Manakah dari berikut ini adalah metrik yang cocok untuk klasifikasi kelas yang tidak seimbang dan fokus pada kelas minoritas?
a) Akurasi
b) Precision
c) Recall
d) F1-score
Jawaban: c) Recall