Machine Learning : Pengertian, Cara Kerja, dan Metode yang Digunakan
Machine Learning : Pengertian, Cara Kerja, dan Metode yang Digunakan
Teknologi machine learning (ML) ini merupakan salah satu cabang dari AI. Artificial Intelligence atau kecerdasan buatan memiliki beberapa cabang yaitu Machine Learning, Natural Language processing, Expert System, Vision, Speech, Planning, dan Robotics seperti pada gambar di bawah ini
Machine Learning?
Menurut IBM, machine learning merupakan cabang dari kecerdasan buatan (AI) dan ilmu komputer yang berfokus pada penggunaan data dan algoritma untuk meniru cara manusia belajar dan secara bertahap dapat meningkatkan akurasinya. Machine learning merupakan komponen penting dari bidang ilmu tentang perkembangan data. Melalui penggunaan statistik, algoritma machine learning dilatih untuk membuat klasifikasi atau prediksi dalam pengembangan data.
Machine learning adalah metode analisis data yang dilakukan dengan otomatisasi pembuatan model analitis. Sebagai cabang dari AI, machine learning didasarkan pada gagasan bahwa sistem dapat belajar dari data, mengidentifikasi pola, dan membuat keputusan dengan sedikit intervensi manusia dalam proses tersebut.
Proses mempelajari data
Machine learning mampu mempelajari data secara otomatis sesuai metode atau tipe yang dipakai (Sumber: Pexels)
Istilah machine learning pada dasarnya menjelaskan proses komputer dalam mempelajari data. Oleh karena itu, kita pasti akan terus bersinggungan dengan data ketika mempelajari machine learning. Data bisa saja sama, akan tetapi algoritma dan pendekatannya berbeda-beda untuk mendapatkan hasil yang optimal.
Data adalah suatu bahan yang masih mentah yang membutuhkan pengolahan lebih lanjut sehingga menghasilkan informasi atau keterangan, baik kuantitatif maupun kualitatif yang menunjukkan suatu fakta (Riduwan.2009:5)
Informasi merupakan hasil pengolahan dari sebuah modal, organisasi, perubahan bentuk dari nilai tertentu, yang di gunakan untuk menambah pengatahuan yang membacanya
Cara Kerja Machine Learning
Cara kerja machine learning adalah belajar seperti manusia dengan menggunakan contoh-contoh dan setelah itu barulah dapat menjawab suatu pertanyaan terkait. Proses belajar ini menggunakan data yang disebut train dataset. Berbeda dengan program statis, machine learning diciptakan untuk membentuk program yang dapat belajar sendiri.
Dari data tersebut, komputer akan melakukan proses belajar (training) untuk menghasilkan suatu model. Proses belajar ini menggunakan algoritma machine learning sebagai penerapan teknik statistika. Model inilah yang menghasilkan informasi, kemudian dapat dijadikan pengetahuan untuk memecahkan suatu permasalahan sebagai proses input-output. Model yang dihasilkan dapat melakukan klasifikasi ataupun prediksi ke depan.
Untuk memastikan efisiensi model yang terbentuk, data akan dibagi menjadi data pembelajaran (train dataset) dan data pengujian (test dataset). Pembagian data yang digunakan bervariasi bergantung algoritma yang digunakan. Pada umumnya train dataset lebih banyak dari test dataset, misalnya dengan rasio 3:1. Test dataset digunakan untuk menghitung seberapa efisien model yang dihasilkan untuk melakukan klasifikasi atau prediksi kedepan yang disebut test score. Semakin banyak data yang digunakan, test score yang dihasilkan semakin baik. Nilai test score berada dalam rentang 0-1.
3 Metode yang Digunakan dalam Machine Learning
1. Supervised
Learning
Metode
supervised learning dilakukan dengan pemberian label pada dataset yang
digunakan oleh machine learning dan diklasifikasikan oleh pengembang
dengan memungkinkan algoritma melihat tingkat akurasi kinerjanya.
Pengawasan machine learning dalam metode ini dilakukan oleh data
berlabel yang nantinya membuat machine learning mempelajari apa
hubungan dan ketergantungan antar data.
Cara kerja metode ini adalah memasukkan informasi sebagai input dan data berlabel sebagai hasil atau output. Input dalam machine learning pinjaman bank misalnya dapat berupa data rinci seperti usia, gaji, jumlah pinjaman, jumlah terutan, riwayat pinjaman, dan lain sebagainya. Sedangkan output-nya dapat berupa hasil dari keseluruhan jumlah orang yang membayar pinjaman dan berapa jumlah orang gagal membayar.
2. Semi-supervised
Learning (Unsupervised)
Metode
semi-supervised learning bisa disebut juga sebagai metode machine
learning tanpa pengawasan. Sehingga, prosesnya dilakukan pada dataset mentah
yang tidak berlabel dan algoritma machine learning akan mencoba
mengidentifikasi pola dan relasi antar data tanpa bantuan dari pengembang.
Metode unsupervised
learning pada umumnya memang tidak ada bantuan dari manusia agar komputer
benar-benar mempelajari sebuah data dan relasinya secara mandiri. Dalam
kasusnya, dataset tidak berlabel dan mesin secara komputasi akan
mengidentifikasi pola dalam data. Unsupervised learning digunakan
untuk memudahkan pengembang mengambil keputusan.
Dalam
kasus machine learning pinjaman bank tadi, sebuah unsupervised
learning dapat mendeteksi anomali atau mengungkap transaksi atau
pembayaran yang curang. Unsupervised learning dapat secara otomatis
mencari informasi setelah mengelompokkan pola dari semua data peminjam dari
sebuah bank dan memunculkannya sebagai sebuah output tanpa harus memasukkan
data berlabel secara rinci.
3. Reinforcement
Learning
Metode machine
learning yang satu ini dijalankan dengan menggunakan dataset bersistem
“rewards/punishment” dan menawarkan umpan balik ke algoritma untuk belajar dari
pengalamannya secara coba-coba (random). Metode “coba-coba” ini hampir sama
dengan sistem pemahaman pola yang dilakukan manusia yaitu belajar dari
percobaan.
Hal
ini yang lantas membuat metode ini disebut sebagai machine learning dengan
tipe penguatan pembelajaran. Algoritma dalam metode ini akan belajar secara
terus-menerus dari lingkungan atau kebiasaan interaksi yang berhubungannya
dengannya. Dari sana nantinya algoritma akan mendapat “rewards” atau “punishment”
sebagai impresi positif dan negatif berdasarkan tindakan percobaannya. Dalam
kasus machine learning pinjaman bank, algoritma reinforcement
learning akan mengklasifikasikan pelanggan berisiko tinggi secara default dan
akan mengelompokkan pelanggan yang gagal bayar sebagai aspek negatif secara
otomatis.
Komentar
Posting Komentar