Supervised Machine Learning
Supervised learning adalah jenis machine learning di mana mesin dilatih menggunakan data pelatihan yang diberi label dengan baik, dan berdasarkan data tersebut, mesin memprediksi output. Data berlabel berarti beberapa data input sudah diberi tag dengan output yang benar.
Dalam supervised learning, data pelatihan yang diberikan kepada mesin berfungsi sebagai supervisor yang mengajarkan mesin untuk memprediksi output dengan benar. Ini menerapkan konsep yang sama seperti seorang siswa belajar di bawah pengawasan guru.
Supervised learning adalah proses memberikan data input serta data output yang benar kepada model machine learning. Tujuan dari algoritma supervised learning adalah menemukan fungsi pemetaan untuk memetakan variabel input (x) dengan variabel output (y).
Di dunia nyata, supervised learning dapat digunakan untuk Penilaian Risiko, Klasifikasi Gambar, Deteksi Penipuan, pemfilteran spam, dll.
Cara Kerja Supervised Learning
Dalam supervised learning, model dilatih menggunakan dataset berlabel, di mana model belajar tentang setiap jenis data. Setelah proses pelatihan selesai, model diuji berdasarkan data uji (subset dari set pelatihan), dan kemudian memprediksi output.
Kerja supervised learning dapat dengan mudah dipahami melalui contoh dan diagram berikut:
Misalkan kita memiliki dataset dari berbagai jenis bentuk yang mencakup persegi, persegi panjang, segitiga, dan poligon. Langkah pertama adalah kita perlu melatih model untuk setiap bentuk.
- Jika bentuk yang diberikan memiliki empat sisi, dan semua sisinya sama, maka itu akan diberi label sebagai persegi.
- Jika bentuk yang diberikan memiliki tiga sisi, maka itu akan diberi label sebagai segitiga.
- Jika bentuk yang diberikan memiliki enam sisi yang sama maka itu akan diberi label sebagai heksagon.
Setelah pelatihan, kita menguji model kita menggunakan set uji, dan tugas model adalah mengidentifikasi bentuk.
Mesin sudah dilatih pada semua jenis bentuk, dan ketika menemukan bentuk baru, ia mengklasifikasikan bentuk tersebut berdasarkan jumlah sisi, dan memprediksi output.
Langkah-langkah dalam Supervised Learning:
- Tentukan jenis dataset pelatihan.
- Kumpulkan data pelatihan yang berlabel.
- Bagi dataset pelatihan menjadi dataset pelatihan, dataset uji, dan dataset validasi.
- Tentukan fitur input dari dataset pelatihan, yang harus memiliki pengetahuan yang cukup sehingga model dapat memprediksi output dengan akurat.
- Tentukan algoritma yang sesuai untuk model, seperti support vector machine, decision tree, dll.
- Jalankan algoritma pada dataset pelatihan. Kadang-kadang kita membutuhkan set validasi sebagai parameter kontrol, yang merupakan subset dari dataset pelatihan.
- Evaluasi akurasi model dengan memberikan set uji. Jika model memprediksi output yang benar, berarti model kita akurat.
Jenis Algoritma Supervised Machine Learning:
Supervised learning dapat dibagi lebih lanjut menjadi dua jenis masalah:
- RegresiAlgoritma regresi digunakan jika ada hubungan antara variabel input dan variabel output. Ini digunakan untuk prediksi variabel kontinu, seperti Prakiraan Cuaca, Tren Pasar, dll. Di bawah ini adalah beberapa algoritma regresi populer yang termasuk dalam supervised learning:
- Regresi Linear
- Pohon Regresi
- Regresi Non-Linear
- Regresi Linear Bayesian
- Regresi Polinomial
- KlasifikasiAlgoritma klasifikasi digunakan ketika variabel output bersifat kategorikal, yang berarti ada dua kelas seperti Ya-Tidak, Pria-Wanita, Benar-Salah, dll.
- Penyaringan Spam
- Random Forest
- Pohon Keputusan
- Regresi Logistik
- Support Vector Machines
Keuntungan Supervised Learning:
- Dengan bantuan supervised learning, model dapat memprediksi output berdasarkan pengalaman sebelumnya.
- Dalam supervised learning, kita bisa memiliki gagasan yang tepat tentang kelas objek.
- Model supervised learning membantu kita menyelesaikan berbagai masalah dunia nyata seperti deteksi penipuan, pemfilteran spam, dll.
Kerugian Supervised Learning:
- Model supervised learning tidak cocok untuk menangani tugas yang kompleks.
- Supervised learning tidak dapat memprediksi output yang benar jika data uji berbeda dari dataset pelatihan.
- Pelatihan membutuhkan banyak waktu komputasi.
- Dalam supervised learning, kita membutuhkan pengetahuan yang cukup tentang kelas objek.
//TC