50 Soal Praktikum Klasifikasi Lanjutan Beserta Jawaban
Kumpulan Soal Pilihan Ganda Materi Praktikum Klasifikasi Lanjutan
Apa tujuan utama dari praktikum klasifikasi lanjutan?
a) Memprediksi masa depan
b) Menemukan pola tersembunyi dalam data
c) Menemukan outlier dalam data
d) Membuat laporan visual data
Jawaban: b) Menemukan pola tersembunyi dalam data
Teknik klasifikasi apa yang cenderung digunakan ketika data memiliki banyak fitur dan jumlah sampel yang relatif kecil?
a) Regresi Linear
b) K-Means Clustering
c) Decision Tree
d) Naive Bayes
Jawaban: c) Decision Tree
Apa yang dimaksud dengan "overfitting" dalam konteks klasifikasi?
a) Model terlalu sederhana untuk data
b) Model terlalu kompleks untuk data
c) Model menghasilkan prediksi yang tepat
d) Model tidak bisa mengatasi data yang hilang
Jawaban: b) Model terlalu kompleks untuk data
Metrik evaluasi mana yang sesuai ketika klasifikasi memiliki kelas minoritas yang penting dan tidak ingin terjadi kesalahan pada kelas tersebut?
a) Akurasi
b) Presisi
c) Recall
d) F1-Score
Jawaban: b) Presisi
Algoritma apa yang umumnya digunakan untuk klasifikasi teks, seperti analisis sentimen?
a) K-Nearest Neighbors
b) Support Vector Machine
c) Naive Bayes
d) K-Means Clustering
Jawaban: c) Naive Bayes
Pada praktikum klasifikasi, apa yang dimaksud dengan "feature extraction"?
a) Mengklasifikasikan fitur-fitur baru
b) Mengurangi dimensi data
c) Mengubah data mentah menjadi fitur yang lebih bermakna
d) Menggabungkan beberapa dataset menjadi satu
Jawaban: c) Mengubah data mentah menjadi fitur yang lebih bermakna
Manakah dari berikut yang bukan termasuk dalam algoritma klasifikasi berbasis ensemble?
a) Random Forest
b) Decision Tree
c) AdaBoost
d) Gradient Boosting
Jawaban: b) Decision Tree
Mengapa penting untuk membagi dataset menjadi data pelatihan dan data pengujian dalam klasifikasi?
a) Agar kita bisa memiliki lebih banyak data
b) Agar kita bisa menghindari overfitting
c) Agar kita bisa menggunakan lebih banyak fitur
d) Agar kita bisa mempercepat pelatihan model
Jawaban: b) Agar kita bisa menghindari overfitting
Pada algoritma Support Vector Machine (SVM), apa yang disebut dengan "kernel"?
a) Sebuah lapisan pelindung pada model
b) Fungsi matematis untuk memetakan data ke dimensi yang lebih tinggi
c) Metode evaluasi model
d) Ukuran tingkat akurasi model
Jawaban: b) Fungsi matematis untuk memetakan data ke dimensi yang lebih tinggi
Manakah di bawah ini adalah contoh metode klasifikasi semi-terawasi?
a) K-Means Clustering
b) Naive Bayes
c) Support Vector Machine
d) Self-Training
Jawaban: d) Self-Training
Algoritma apa yang menghasilkan garis linear yang memisahkan dua kelas pada ruang fitur?
a) Decision Tree
b) K-Nearest Neighbors
c) Naive Bayes
d) Support Vector Machine
Jawaban: d) Support Vector Machine
Apa yang dimaksud dengan "cross-validation" dalam konteks klasifikasi?
a) Menggabungkan beberapa dataset menjadi satu
b) Mengevaluasi model pada data yang sama dengan pelatihannya
c) Memisahkan dataset menjadi dua bagian
d) Memisahkan dataset menjadi beberapa subset untuk evaluasi
Jawaban: d) Memisahkan dataset menjadi beberapa subset untuk evaluasi
Manakah dari berikut ini bukan metode reduksi dimensi dalam klasifikasi?
a) Principal Component Analysis (PCA)
b) Linear Regression
c) t-Distributed Stochastic Neighbor Embedding (t-SNE)
d) Lasso Regression
Jawaban: b) Linear Regression
Pada klasifikasi multikelas, apa yang dimaksud dengan "one-vs-all"?
a) Setiap kelas memiliki model terpisah
b) Setiap kelas hanya memiliki satu sampel
c) Setiap kelas memiliki fitur terpisah
d) Setiap kelas memiliki subset data terpisah
Jawaban: a) Setiap kelas memiliki model terpisah
Manakah dari berikut ini adalah metode regresi yang dapat digunakan untuk masalah klasifikasi?
a) Ridge Regression
b) Lasso Regression
c) Support Vector Machine
d) Polynomial Regression
Jawaban: c) Support Vector Machine
Bagaimana cara mengatasi masalah kelas yang tidak seimbang dalam dataset klasifikasi?
a) Menghapus data kelas minoritas
b) Menambahkan data ke kelas mayoritas
c) Menimbang ulang bobot kelas
d) Menggabungkan kelas minoritas
Jawaban: c) Menimbang ulang bobot kelas
Algoritma klasifikasi apa yang memiliki nama yang terinspirasi dari cara manusia mengklasifikasikan objek dalam kehidupan sehari-hari?
a) K-Means Clustering
b) Naive Bayes
c) Decision Tree
d) Support Vector Machine
Jawaban: c) Decision Tree
Dalam konteks klasifikasi, apa itu "confusion matrix"?
a) Matriks yang membingungkan
b) Matriks untuk mengukur tingkat akurasi model
c) Matriks yang membandingkan dua dataset
d) Matriks yang menunjukkan performa klasifikasi pada berbagai kelas
Jawaban: d) Matriks yang menunjukkan performa klasifikasi pada berbagai kelas
Apa yang dimaksud dengan "hyperparameter" dalam konteks klasifikasi?
a) Parameter yang dihasilkan oleh model
b) Parameter yang mempengaruhi perilaku model tetapi tidak dipelajari oleh model itu sendiri
c) Parameter yang disesuaikan secara otomatis oleh model
d) Parameter yang hanya relevan dalam klasifikasi multi-label
Jawaban: b) Parameter yang mempengaruhi perilaku model tetapi tidak dipelajari oleh model itu sendiri
Pada klasifikasi, apa itu "recall"?
a) Kemampuan model untuk memprediksi dengan benar
b) Kemampuan model untuk memisahkan antara dua kelas
c) Kemampuan model untuk mengenali kelas minoritas
d) Kemampuan model untuk mengurangi dimensi fitur
Jawaban: c) Kemampuan model untuk mengenali kelas minoritas
Manakah dari berikut ini adalah algoritma yang bisa digunakan untuk klasifikasi berbasis teks?
a) K-Means Clustering
b) Random Forest
c) Naive Bayes
d) K-Nearest Neighbors
Jawaban: c) Naive Bayes
Apa tujuan dari "grid search" dalam praktikum klasifikasi?
a) Mencari data baru untuk melengkapi dataset
b) Mencari fitur-fitur terbaik dalam data
c) Mencari nilai hyperparameter terbaik untuk model
d) Mencari data outlier dalam dataset
Jawaban: c) Mencari nilai hyperparameter terbaik untuk model
Pada klasifikasi, apa yang dimaksud dengan "precision"?
a) Kemampuan model untuk memprediksi dengan benar
b) Kemampuan model untuk memisahkan antara dua kelas
c) Proporsi positif sejati dari hasil positif yang diprediksi
d) Proporsi negatif sejati dari hasil negatif yang diprediksi
Jawaban: c) Proporsi positif sejati dari hasil positif yang diprediksi
Manakah dari berikut ini adalah algoritma klasifikasi yang menggabungkan beberapa model menjadi satu?
a) Decision Tree
b) Naive Bayes
c) Support Vector Machine
d) Random Forest
Jawaban: d) Random Forest
Dalam konteks klasifikasi, apa yang dimaksud dengan "bagging"?
a) Mengurangi dimensi data
b) Menggabungkan beberapa dataset menjadi satu
c) Menggabungkan beberapa model menjadi satu
d) Menggabungkan beberapa fitur menjadi satu
Jawaban: c) Menggabungkan beberapa model menjadi satu
Manakah dari berikut ini adalah metode klasifikasi berbasis jarak?
a) Decision Tree
b) K-Nearest Neighbors
c) Naive Bayes
d) Random Forest
Jawaban: b) K-Nearest Neighbors
Apa yang dimaksud dengan "ROC curve" dalam evaluasi klasifikasi?
a) Grafik yang menunjukkan performa model pada berbagai threshold
b) Grafik yang menunjukkan distribusi data
c) Grafik yang menunjukkan pola korelasi antara fitur-fitur
d) Grafik yang menunjukkan distribusi kelas pada dataset
Jawaban: a) Grafik yang menunjukkan performa model pada berbagai threshold
Algoritma klasifikasi mana yang berusaha membangun sejumlah kecil model yang lemah untuk menghasilkan model yang kuat?
a) Random Forest
b) Support Vector Machine
c) AdaBoost
d) K-Means Clustering
Jawaban: c) AdaBoost
Pada klasifikasi, apa yang dimaksud dengan "false positive"?
a) Prediksi yang salah pada kelas positif
b) Prediksi yang benar pada kelas positif
c) Prediksi yang salah pada kelas negatif
d) Prediksi yang benar pada kelas negatif
Jawaban: a) Prediksi yang salah pada kelas positif
Apa yang dimaksud dengan "feature selection" dalam konteks klasifikasi?
a) Mengklasifikasikan fitur-fitur baru
b) Memilih subset fitur yang paling relevan dari dataset
c) Mengurangi dimensi data
d) Mencari outlier dalam data
Jawaban: b) Memilih subset fitur yang paling relevan dari dataset
Algoritma apa yang mencoba untuk memisahkan kelas dalam bentuk garis linear di antara mereka dalam ruang fitur?
a) Decision Tree
b) Naive Bayes
c) Support Vector Machine
d) K-Means Clustering
Jawaban: c) Support Vector Machine
Apa yang dimaksud dengan "k-fold cross-validation"?
a) Membagi dataset menjadi dua bagian
b) Membagi dataset menjadi beberapa subset untuk evaluasi
c) Mengevaluasi model pada data yang sama dengan pelatihannya
d) Menggabungkan beberapa dataset menjadi satu
Jawaban: b) Membagi dataset menjadi beberapa subset untuk evaluasi
Manakah dari berikut ini adalah contoh metode ensemble?
a) Linear Regression
b) Decision Tree
c) Support Vector Machine
d) Random Forest
Jawaban: d) Random Forest
Algoritma apa yang cocok digunakan ketika ada asumsi bahwa atribut-atribut independen dalam klasifikasi?
a) Decision Tree
b) K-Means Clustering
c) Naive Bayes
d) Support Vector Machine
Jawaban: c) Naive Bayes
Bagaimana Anda dapat menghindari overfitting dalam model klasifikasi?
a) Mengurangi jumlah data pelatihan
b) Menambahkan lebih banyak fitur
c) Menggunakan model yang sangat kompleks
d) Menggunakan validasi silang dan mengurangi kompleksitas model
Jawaban: d) Menggunakan validasi silang dan mengurangi kompleksitas model
Apa yang dimaksud dengan "kappa statistic" dalam evaluasi klasifikasi?
a) Metrik yang mengukur sejauh mana model mendekati prediksi yang benar
b) Metrik yang mengukur sejauh mana model memprediksi dengan benar
c) Metrik yang mengukur tingkat kesepakatan antara prediksi dan data aktual
d) Metrik yang mengukur seberapa baik model memisahkan antara kelas
Jawaban: c) Metrik yang mengukur tingkat kesepakatan antara prediksi dan data aktual
Pada algoritma klasifikasi Decision Tree, apa yang digunakan untuk memilih atribut yang akan menjadi akar pohon?
a) Entropi
b) Gini Impurity
c) Euclidean Distance
d) Variance
Jawaban: b) Gini Impurity
Apa yang dimaksud dengan "false negative" dalam klasifikasi?
a) Prediksi yang salah pada kelas positif
b) Prediksi yang benar pada kelas positif
c) Prediksi yang salah pada kelas negatif
d) Prediksi yang benar pada kelas negatif
Jawaban: c) Prediksi yang salah pada kelas negatif
Dalam evaluasi klasifikasi, metrik apa yang mengukur akurasi model terhadap semua kelas?
a) Akurasi
b) Presisi
c) Recall
d) F1-Score
Jawaban: a) Akurasi
Algoritma klasifikasi mana yang bekerja dengan membagi dataset menjadi beberapa bagian lalu mengklasifikasikan data yang tidak ada dalam bagian pelatihan?
a) K-Means Clustering
b) Decision Tree
c) K-Nearest Neighbors
d) Support Vector Machine
Jawaban: c) K-Nearest Neighbors
Dalam klasifikasi, apa yang dimaksud dengan "false discovery rate"?
a) Proporsi positif sejati dari hasil positif yang diprediksi
b) Proporsi negatif sejati dari hasil negatif yang diprediksi
c) Proporsi prediksi positif yang salah dari hasil positif yang diprediksi
d) Proporsi prediksi negatif yang salah dari hasil negatif yang diprediksi
Jawaban: c) Proporsi prediksi positif yang salah dari hasil positif yang diprediksi
Manakah dari berikut ini adalah algoritma yang cocok untuk klasifikasi data yang memiliki banyak fitur namun jumlah sampel yang terbatas?
a) Support Vector Machine
b) K-Means Clustering
c) Decision Tree
d) K-Nearest Neighbors
Jawaban: a) Support Vector Machine
Pada klasifikasi, apa itu "receiver operating characteristic (ROC)"?
a) Metode untuk memilih fitur terbaik
b) Grafik yang menggambarkan performa model pada berbagai threshold
c) Metode untuk menghitung akurasi model
d) Grafik yang menggambarkan distribusi kelas pada dataset
Jawaban: b) Grafik yang menggambarkan performa model pada berbagai threshold
Metrik evaluasi mana yang memberikan keseimbangan antara presisi dan recall?
a) Akurasi
b) F1-Score
c) Gini Impurity
d) Variance
Jawaban: b) F1-Score
Algoritma apa yang mengelompokkan data menjadi kelompok-kelompok yang memiliki atribut-atribut serupa?
a) K-Nearest Neighbors
b) Decision Tree
c) K-Means Clustering
d) Naive Bayes
Jawaban: c) K-Means Clustering
Pada klasifikasi, apa itu "entropy"?
a) Ukuran jarak antara dua titik dalam ruang fitur
b) Ukuran ketidakmurnian atau keacakan dalam kelas
c) Ukuran akurasi model
d) Ukuran jumlah fitur dalam dataset
Jawaban: b) Ukuran ketidakmurnian atau keacakan dalam kelas
Apa yang dimaksud dengan "unsupervised learning" dalam konteks klasifikasi?
a) Model belajar dari contoh data yang diberikan
b) Model tidak memiliki contoh data pelatihan
c) Model hanya belajar dari hasil prediksi yang salah
d) Model hanya belajar dari hasil prediksi yang benar
Jawaban: b) Model tidak memiliki contoh data pelatihan
Dalam klasifikasi, apa yang dimaksud dengan "bias-variance trade-off"?
a) Kompromi antara kualitas fitur dan jumlah fitur
b) Kompromi antara akurasi model dan jumlah sampel
c) Kompromi antara kompleksitas model dan kemampuannya untuk memgeneralisasi
d) Kompromi antara bobot kelas yang tidak seimbang
Jawaban: c) Kompromi antara kompleksitas model dan kemampuannya untuk memgeneralisasi
Manakah dari berikut ini bukan metode klasifikasi?
a) Logistic Regression
b) K-Means Clustering
c) Random Forest
d) Decision Tree
Jawaban: b) K-Means Clustering
Pada klasifikasi, apa itu "ensemble learning"?
a) Penggunaan berbagai jenis algoritma klasifikasi pada dataset yang sama
b) Penggabungan beberapa dataset untuk pelatihan model
c) Menggabungkan beberapa fitur menjadi satu
d) Membagi dataset menjadi beberapa subset untuk evaluasi
Jawaban: a) Penggunaan berbagai jenis algoritma klasifikasi pada dataset yang sama