Postingan

Menampilkan postingan dari Januari, 2023

Machine Learning Evaluation

Gambar
Akurasi Klasifikasi    Akurasi klasifikasi adalah pembagian dari jumlah prediksi benar terhadap jumlah total prediksi. Akurasi bisa saja “menyesatkan”, dalam kasus dimana ketidakseimbangan kelas yang besar (large class imbalance). Model klasifikasi dapat memprediksi nilai pada kelas terbesar untuk semua prediksi dan bisa memberikan nilai akurasi yang tinggi dan tentu saja model yang dihasilkan dapat memprediksikan nilai yang salah, sehingga perlu metrik evaluasi lain yang dapat mengukur performa model klasifikasi yang kita buat. Metrik yang dimaksudkan adalah Precision, Recall dan Confusion Matrix. Confusion Matrix    Confusion Matrix merepresentasikan prediksi dan kondisi sebenarnya(aktual) dari data yang dihasilkan oleh algoritma ML. Berdasarkan Confusion Matrix, kita bisa menentukan Precision dan Recall. Recall      Recall dapat didefinisikan sebagai rasio dari jumlah total contoh positif yang diklasifikasikan bernilai benar dibagi dengan jumlah total contoh positif. H

Q-Learning

Gambar
Apa itu Q-Learning?      Q-Learning adalah kebijakan pembelajaran Penguatan yang akan menemukan tindakan terbaik berikutnya, mengingat keadaan saat ini. Q-learning memilih tindakan ini secara acak dan bertujuan untuk memaksimalkan reward.    Q-learning adalah pembelajaran penguatan di luar kebijakan yang bebas model yang akan menemukan tindakan terbaik, mengingat keadaan agen saat ini. Bergantung pada di mana agen berada di lingkungan, itu akan memutuskan tindakan selanjutnya yang akan diambil.      Tujuan dari model ini adalah untuk menemukan tindakan terbaik mengingat kondisinya saat ini. Untuk melakukan ini, ia mungkin membuat aturannya sendiri atau mungkin beroperasi di luar kebijakan yang diberikan kepadanya untuk diikuti. Ini berarti bahwa tidak ada kebutuhan aktual untuk suatu kebijakan, oleh karena itu kami menyebutnya di luar kebijakan.      Bebas model berarti bahwa agen menggunakan prediksi respons lingkungan yang diharapkan untuk bergerak maju. Itu tidak menggunakan

K-Means Machine Learning

Gambar
Apa itu K-Means Clustering?    K-means clustering adalah salah satu algoritma analisis klaster (cluster analysis) non hirarki. Analisis  klaster  merupakan  salah  satu  alat  untuk  mengelompokkan  data berdasarkan variabel atau feature.    Tujuan dari k-means clustering, seperti metode klaster lainnya, adalah untuk mendapatkan kelompok data dengan memaksimalkan kesamaan karakteristik dalam klaster dan memaksimalkan perbedaan antar klaster.    Algoritma K-means clustering mengelompokkan data berdasarkan jarak antara data terhadap titik centroid klaster yang didapatkan melalui proses berulang. Analisis perlu menentukan jumlah K sebagai input algoritma. Contoh Aplikasi  K-means Contoh penggunaan K-means clustering antara lain: Segmentasi pasar (market segmentation) Segmentasi citra Kompresi gambar Klasifikasi citra penginderaan jauh Metode Algoritma K-Means Clustering (step by step) Algoritma K-means clustering dilakukang dengan proses sebagai berikut: Langkah 1: tentu

Agglomerative Hierarchical Clustering

Gambar
Pengertian  Agglomerative Hierarchical Clustering      Algoritma AHC atau Agglomerative Hierarchical Clustering adalah sebuah metode pembelajaran yang mana tanpa adanya pengawasan dalam pembelajaran mesin, dimana algoritmanya itu dalam machinelearning dimana ia dapat menarik kesimpulan dari kumpulan data yang didapatkan atau diberikan dengan sendirinya, dengan tidak adanya campur tangan manusia sedikit pun.      Jika kita mengelompokkan dengan menggunakan kata kata sederhana, dimana bisa dibilang kita hanya mempartisi dari suatu kelompok atau data dalam kelompok yang sama dengan kemiripannya itu merupakan pengelompokkan berdasarkan kesaamaan dan perbedaannya. Algoritma AHC ini merupakan salah satu algoritma yang sering digunakan bersama dengan algoritma K-Means Jenis-Jenis Pengelompokkan dalam AHC Partisi AHC Kepadatan dalam datanya AHC berbasis model distribusi Pengelompokkan Hirarki Pengelompokkan Fuzzy Algoritma Agglomerative 1.      Hitung matriks jarak         Ada ber

Support Vector Machine

Gambar
Pengertian Support Vector Machine (SVM)      Support Vector Machine–selanjutnya disebut SVM–adalah metode pada machine learning yang dapat digunakan untuk menganalisis data dan mengurutkannya ke dalam salah satu dari dua kategori.  SVM ditemukan oleh Vladimir N. Vapnik dan Alexey Ya. Chervonenkis pada tahun 1963. Sejak itu, SVM telah digunakan dalam klasifikasi teks, hiperteks dan gambar. SVM dapat bekerja dengan karakter tulisan tangan dan algoritma ini telah digunakan di laboratorium biologi untuk melakukan tugas seperti menyortir protein.  Algoritma ini juga dikenal sebagai Support Vector Network (SVN).      SVM bekerja untuk mencari hyperplane atau fungsi pemisah (decision boundary) terbaik untuk memisahkan dua buah kelas atau lebih pada ruang input. Hiperplane dapat berupa line atau garis pada dua dimensi dan dapat berupa flat plane pada multiple plane.  Jenis-Jenis Algoritma SVM SVM dapat dibagi menjadi 2 jenis yakni: 1.      SVM Linear      SVM linear digunakan u

K-Nearest Neighbor

Gambar
 Pengertian K-Nearest Neighbor      Algoritma ini mengkelaskan data baru menggunakan kemiripan antara data baru dengan sejumlah data (k) pada lokasi yang terdekat yang telah tersedia.  KNN merupakan algoritma non parametrik, yaitu tidak membuat asumsi apapun terhadap data.      Algoritma KNN juga merupakan “lazy learner”, di mana KNN menerapkan “lazy learning” atau “instant based learning”. Artinya, algoritma tidak melakukan proses training dan membangun model. KNN menyimpan set data training dan “belajar” atau melakukan learning darinya hanya pada saat membuat prediksi secra real-time.      Algoritma KNN dapat digunakan untuk kasus klasifikasi (classification) maupun regresi (regression). Meskipun demikian, KNN lebih sering digunakan dalam proses klasifikasi. Cara Kerja KNN (step by step) Metode KNN bekerja dengan berdasarkan langkah-langkah sebagai berikut: Langkah-1: Tentukan jumlah tetangga terdekat (K) yang akan dipertimbangkan sebagai dasar klasifikasi. Langkah-2: Hit

Regresi Linear

Gambar
Apa itu Linear Regression?      Linear Regression (Regresi Linear) adalah suatu regresi linear yang digunakan untuk mengestimasi atau memprediksi hubungan antara dua variabel dalam penelitian kuantitatif. Dimana regresi linear ini mampu membuat satu asumsi tambahan yang mengkorelasikan antara variabel independen dan dependen melalui garis yang paling sesuai dari titik data garis lurus.    Tujuan Regresi      Memiliki tujuan yaitu untuk menentukan seberapa kuat hubungan antara dependen variable(Y) dan independent variable(X) Jenis- Jenis Regresi Regresi linear sederhana (simple regression) Regresi multilinear (multiple regression) Regresi polynominal (polynominal regression) Support vector regression Decision tree regression Random forest regression GAM(Generalized Additive Models)   Simple/univariate linear regression:  Y = A + BX + ϵ  Multiple/multivariate linear regression:  Y = A + B1X1 + B2X2 + B3X3 + … + BtXt + ϵ  Keterangan:  Y = variabel yang ingin diprediksi (

Naive Bayes

Gambar
Teorema Bayes      Teorema Bayes memberi probabilitas posterior dari suatu peristiwa yang diberikan apa yang dikenal sebagai pengetahuan sebelumnya.      Probabilitas sebelumnya tidak lain adalah proporsi variabel dependen (biner) dalam kumpulan data. Ini adalah tebakan terdekat yang dapat Anda buat tentang sebuah kelas, tanpa informasi lebih lanjut atau Anda dapat mengatakan seberapa besar kemungkinannya A sebelum mengamati B.      Likelihood adalah probabilitas untuk mengklasifikasikan observasi tertentu sebagai satu jenis dengan adanya variabel lain. Dengan kata lain seberapa besar kemungkinan B ketika diberikan bahwa A benar atau terjadi.      Likelihood marjinal adalah, seberapa besar kemungkinan titik data baru di bawah semua variabel yang mungkin   Algoritma Naive Bayes      Naïve Bayes Classifier merupakan sebuah metoda klasifikasi yang berakar pada teorema Bayes . Metode pengklasifikasian dengan menggunakan metode probabilitas dan statistik yang dikemukakan oleh

Visualisasi Data dan Preprocessing Data

Gambar
Visualisasi Data Pengertian Visualisasi Data       Visualisasi data adalah penyajian data dalam format grafik. Ini membantu orang memahami pentingnya data dengan meringkas dan menyajikan sejumlah besar data dalam format yang sederhana dan mudah dipahami dan membantu mengkomunikasikan informasi dengan jelas dan efektif. Ini adalah disiplin mencoba memahami data dengan menempatkannya dalam konteks visual sehingga pola, tren, dan korelasi yang mungkin tidak terdeteksi dapat diekspos. Pustaka plot yang populer: Matplotlib: level rendah, memberikan banyak kebebasan Visualisasi Panda: antarmuka yang mudah digunakan, dibangun di atas Matplotlib Seaborn: antarmuka tingkat tinggi, gaya default yang bagus ggplot: berdasarkan ggplot2 R, menggunakan Tata Bahasa Grafik Plotly: dapat membuat plot interaktif Matplotlib      Matplotlib adalah pustaka plot python paling populer. Ini adalah perpustakaan tingkat rendah dengan antarmuka seperti Matlab yang menawarkan banyak kebebasan dengan biaya