Unsupervised Machine Learning
Dalam topik sebelumnya, kita belajar tentang supervised machine learning di mana model dilatih menggunakan data berlabel di bawah pengawasan data pelatihan. Namun, mungkin ada banyak kasus di mana kita tidak memiliki data berlabel dan perlu menemukan pola tersembunyi dari dataset yang diberikan. Jadi, untuk menyelesaikan jenis kasus tersebut dalam machine learning, kita memerlukan teknik unsupervised learning.
Apa itu Unsupervised Learning?
Seperti namanya, unsupervised learning adalah teknik machine learning di mana model tidak diawasi menggunakan dataset pelatihan. Sebaliknya, model itu sendiri menemukan pola dan wawasan tersembunyi dari data yang diberikan. Ini dapat dibandingkan dengan pembelajaran yang terjadi di otak manusia saat mempelajari hal-hal baru. Ini dapat didefinisikan sebagai:
Unsupervised learning adalah jenis machine learning di mana model dilatih menggunakan dataset tidak berlabel dan diizinkan untuk bertindak pada data tersebut tanpa pengawasan. Unsupervised learning tidak dapat langsung diterapkan pada masalah regresi atau klasifikasi karena tidak seperti supervised learning, kita memiliki data input tetapi tidak ada data output yang sesuai. Tujuan dari unsupervised learning adalah untuk menemukan struktur dasar dataset, mengelompokkan data tersebut menurut kesamaan, dan merepresentasikan dataset tersebut dalam format yang terkompresi.
Contoh: Misalkan algoritma unsupervised learning diberi dataset input yang berisi gambar berbagai jenis kucing dan anjing. Algoritma ini tidak pernah dilatih dengan dataset yang diberikan, yang berarti tidak memiliki ide tentang fitur-fitur dataset. Tugas algoritma unsupervised learning adalah mengidentifikasi fitur-fitur gambar secara mandiri. Algoritma unsupervised learning akan melakukan tugas ini dengan mengelompokkan dataset gambar ke dalam kelompok-kelompok menurut kesamaan antara gambar.
Mengapa Menggunakan Unsupervised Learning?
Berikut adalah beberapa alasan utama yang menggambarkan pentingnya Unsupervised Learning:
- Unsupervised learning berguna untuk menemukan wawasan yang berguna dari data.
- Unsupervised learning sangat mirip dengan cara manusia belajar berpikir berdasarkan pengalaman mereka sendiri, yang membuatnya lebih dekat dengan AI yang sesungguhnya.
- Unsupervised learning bekerja pada data tidak berlabel dan tidak dikategorikan yang membuat unsupervised learning lebih penting.
- Di dunia nyata, kita tidak selalu memiliki data input dengan output yang sesuai, jadi untuk menyelesaikan kasus-kasus tersebut, kita memerlukan unsupervised learning.
Cara Kerja Unsupervised Learning
Cara kerja unsupervised learning dapat dipahami melalui diagram berikut:
Di sini, kita telah mengambil data input yang tidak berlabel, yang berarti tidak dikategorikan dan output yang sesuai juga tidak diberikan. Sekarang, data input yang tidak berlabel ini dimasukkan ke dalam model machine learning untuk melatihnya. Pertama-tama, ia akan menginterpretasikan data mentah untuk menemukan pola tersembunyi dari data tersebut dan kemudian akan menerapkan algoritma yang sesuai seperti k-means clustering, pohon keputusan, dll.
Setelah menerapkan algoritma yang sesuai, algoritma membagi objek data ke dalam kelompok-kelompok sesuai dengan kesamaan dan perbedaan antara objek.
Jenis Algoritma Unsupervised Learning:
Algoritma unsupervised learning dapat dikategorikan lebih lanjut menjadi dua jenis masalah:
- Clustering: Clustering adalah metode pengelompokan objek ke dalam klaster-klaster sedemikian rupa sehingga objek-objek dengan kesamaan paling banyak tetap dalam satu kelompok dan memiliki sedikit atau tidak ada kesamaan dengan objek-objek dari kelompok lain. Analisis klaster menemukan kesamaan antara objek data dan mengkategorikannya berdasarkan ada atau tidaknya kesamaan tersebut.
- Association: Association rule adalah metode unsupervised learning yang digunakan untuk menemukan hubungan antara variabel dalam database besar. Ini menentukan set item yang muncul bersama dalam dataset. Association rule membuat strategi pemasaran lebih efektif. Misalnya, orang yang membeli item X (misalnya roti) juga cenderung membeli item Y (mentega/selai). Contoh khas dari Association rule adalah Market Basket Analysis.
Algoritma Unsupervised Learning:
Berikut adalah daftar beberapa algoritma unsupervised learning yang populer:
- K-means clustering
- KNN (k-nearest neighbors)
- Hierarchal clustering
- Anomaly detection
- Neural Networks
- Principal Component Analysis
- Independent Component Analysis
- Apriori algorithm
- Singular value decomposition
Keuntungan Unsupervised Learning:
- Unsupervised learning digunakan untuk tugas yang lebih kompleks dibandingkan dengan supervised learning karena dalam unsupervised learning, kita tidak memiliki data input yang berlabel.
- Unsupervised learning lebih disukai karena lebih mudah mendapatkan data yang tidak berlabel dibandingkan data yang berlabel.
Kerugian Unsupervised Learning:
- Unsupervised learning secara intrinsik lebih sulit daripada supervised learning karena tidak memiliki output yang sesuai.
- Hasil dari algoritma unsupervised learning mungkin kurang akurat karena data input tidak berlabel, dan algoritma tidak mengetahui output yang tepat di awal.
//TC