- Supervised learning (pembelajaran terpandu)
- Unsupervised learning (pembelajaran tidak terpandu / mandiri)
- Semi-supervised learning (pembelajaran semi terpandu)
- Reinforcement learning (pembelajaran dengan trial dan error)
Setiap metode learning diatas memiliki kelebihan dan kelemahan masing-masing. Penentuan metode pembelajaran pada umumnya dilihat berdasarkan kasus yang dikerjakan.
Supervised Learning
Supervised learning secara bahasa adalah pembelajaran terpandu atau terawasi. Ini artinya pembelajaran dilakukan seperti layaknya guru dan siswa dimana siswa adalah pihak yang belajar sedangkan guru adalah sebagai supervisor yang memberikan materi pelajaran. Dalam kasus pembelajaran mesin yang bertindak sebagai siswa adalah mesin atau komputer yang dilengkapi dengan algoritma pembelajaran mesin, sedangkan yang menjadi guru adalah manusia.
Ilustrasi kasus dari supervised learning adalah pembelajaran mesin untuk mengenali buah berdasarkan gambar. Dalam kasus ini sejumlah data training diberikan berupa berbagai macam gambar buah beserta labelnya, misalnya setiap gambar pisang akan diberi label pisang, setiap gambar jeruk akan diberi label jeruk, setiap gambar strawberry akan diberi label strawberry, dst.
Dapat dilihat disini pada supervised learning manusia memiliki peranan penting dalam proses klasifikasi buah dengan memberi label pada masing-masing buah. Ini artinya ketika data training diinputkan kunci jawaban juga ikut diberikan. Mesin hanya bertugas mempelajari pola hubungan antara soal (gambar buah) dan kunci jawabannya (label) sehingga setelah proses training selesai diharapkan mesin dapat mengenali dan membedakan mana buah pisang, jeruk, maupun strawberry.
Dalam menerapkan supervised learning terdapat beberapa algoritma yang sering digunakan, diantaranya adalah sbb:
- Regresi Linier
- Decision Tree
- Random Forest
- k-Nearest Neighbor
- Support Vector Machine
- Neural Networks
Unsupervised Learning
Unsupervised learning secara bahasa adalah pembelajaran tidak terpandu atau pembelajaran mandiri dimana pembelajaran tidak melibatkan bantuan manusia. Perhatikan kembali pada supervised learning. Pada supervised learning data training diinputkan beserta kunci jawaban dimana mesin hanya perlu mencari hubungan antara soal dan kunci jawaban sehingga mesin dapat menganalisa data-data baru. Hal sebaliknya dilakukan pada unsupervised training dimana data training hanya berisi kumpulan data tanpa adanya kunci jawaban. Tugas mesin sebelum melakukan pembelajaran adalah melakukan clustering atau pengelompokan dan memberi label masing-masing cluster secara mandiri.
Ilustrasi kasus unsupervised learning dalam pengenalan buah adalah berbagai gambar buah secara acak diinputkan dalam traning tanpa adanya label pada masing-masing jenis buah. Mesin akan otomatis mengelompokkan jenis-jenis buah tersebut dan memberi label secara mandiri. Ketika proses training selesai dan diuji menggunakan data tes diharapkan mesin akan tahu di kelompok mana buah itu ditempatkan.
Dalam menerapkan unsupervised learning terdapat beberapa algoritma yang sering digunakan, diantaranya adalah sbb:
- Clustering (hieararcical clustering, k-Mean, Mixture Models)
- Anomaly Detection
- Neural Network
- Self Organizing Map
Semi-supervised Learning
Semi-supervised learning secara bahasa adalah pembelajaran semi terpandu. Metode semi-supervised learning merupakan gabungan antara supervised learning dan unsupervised learning. Metode ini biasa digunakan dalam data kombinasi dimana sebagian data memiliki label namun sebagian besar lainnya tidak berlabel.
Reinforcement Learning
Reinforcement learning adalah pembelajaran berulang dengan trial dan error. Algoritma ini bekerja dengan mengamati respon dari lingkungan terhadap sesuatu yang dilakukan oleh sistem kecerdasan buatan. Terdapat dua kemungkinan respon dari lingkungan, yang pertama adalah berhasil (success), yang kedua gagal (error). Sistem pembelajaran mesin diperintah untuk mencoba mengerjakan suatu tugas berulang kali yang mana jika terjadi kegagalan sistem akan mencatat dimana letak kegagalan, apa penyebabnya, dan berusaha memperbaiki kegagalan pada percobaan berikutnya. Setelah sekian kali perulangan (mencoba, gagal, dan perbaiki) diharapkan mesin akan dapat belajar dan dapat melakukan tugas dengan hasil yang optimal.
Salah satu contoh reinforcement learning adalah yang pernah diteliti oleh Google dengan membuat virtual model humanoid beserta lingkungan dengan menerapkan hukum-hukum fisika. Model humanoid kemudian diberikan algoritma kecerdasan buatan + pembelajaran mesin dan diperintahkan untuk berjalan tanpa dipandu manusia bagaimana cara berjalan yang benar. Hasilnya, setelah ribuan bahkan jutaan kali mencoba model humanoid tersebut dapat "menemukan" cara berjalan dan melewati rintangan meskipun cara berjalannya tidak se-natural manusia. Videonya pernah dibahas pada channel tech insider.
Terdapat beberapa algoritma yang sering digunakan pada reinforcement learning, diantaranya adalah sbb: