Supervise Learning dan 30 Algoritmanya
Supervise Learning
Dalam bahasa Indonesia, pembelajaran yang diawasi didefinisikan sebagai pembelajaran yang diawasi oleh pengasuh. Di sini, maksudnya ada label di setiap datanya; label ini adalah tag dari data yang ditambahkan dalam model pembelajaran mesin. Sebagai contoh, setiap gambar kucing memiliki tag "kucing" dan setiap gambar anjing memiliki tag "anjing". Clasificasi (misalnya, "anjing", "kucing", "beruang", dll.) dan regression (misalnya, berat badan, tinggi badan, dll.) adalah dua metode yang dapat digunakan dalam pembelajaran mesin untuk kategorisasi. Pola yang diprediksi sering menggunakan pembelajaran supervisi karena pola tersebut sudah ada contoh data yang lengkap, sehingga pola yang terbentuk adalah hasil pembelajaran data lengkap tersebut. Tidak diragukan lagi, ketika kita memasukkan data baru setelah proses ETL (Extract Transform Load), sample baru akan menerima informasi fitur fitur dari proses tersebut. lalu dari fitur fitur.
30 Alagoritmanya
- Stacking: Menggabungkan beberapa model menggunakan meta-model untuk prediksi final.
- Polynomial Regression: Regresi yang memperluas model linier untuk menangkap hubungan non-linier antara variabel.
- Ridge Regression: Memasukkan penalti L2 untuk mengurangi overfitting dalam regresi linear.
- K-Means Clustering: Metode clustering yang mengelompokkan data ke dalam k kelompok berdasarkan rata-rata terdekat.
- Gradient Boosting: Meningkatkan performa model dengan membangun model secara bertahap, masing-masing mengoreksi kesalahan dari model sebelumnya.
- Random Forest: Kumpulan dari banyak pohon keputusan yang digunakan untuk meningkatkan akurasi prediksi.
- Support Vector Machines (SVM): Memisahkan data ke dalam kategori yang berbeda dengan mencari hyperplane terbaik.
- Logistic Regression (Multinomial): Ekstensi regresi logistik untuk klasifikasi multikelas.
- Naive Bayes: Menggunakan teorema Bayes dengan asumsi independensi antar fitur untuk klasifikasi.
- Hierarchical Clustering: Teknik clustering yang menghasilkan dendrogram atau hirarki dari kelompok data.
- Perceptron: Unit dasar dari jaringan saraf yang dapat digunakan untuk klasifikasi biner.
- Elastic Net: Menggabungkan penalti L1 dan L2 dari regresi Ridge dan Lasso.
- Gaussian Naive Bayes: Varian Naive Bayes yang mengasumsikan bahwa distribusi data adalah Gaussian.
- Convolutional Neural Networks (CNN): Digunakan terutama untuk pengenalan citra tetapi dapat diterapkan pada teks dengan teknik tertentu.
- Hidden Markov Model (HMM): Model statistik untuk proses berurutan yang berguna dalam pengenalan pola seperti penandaan bagian dari teks.
- Boosting: Metode untuk meningkatkan performa model dengan menambahkan model baru yang memperbaiki kesalahan dari model sebelumnya.
- Multilayer Perceptron (MLP): Jaringan saraf dengan beberapa lapisan yang dapat mempelajari hubungan non-linier.
- Lasso Regression: Memasukkan penalti L1 untuk menghasilkan model yang lebih sederhana dengan beberapa koefisien menjadi nol.
- Linear Discriminant Analysis (LDA): Digunakan untuk mencari kombinasi fitur yang memisahkan dua atau lebih kelas.
- Decision Trees: Membuat model keputusan berbasis aturan yang diambil dari data pelatihan.
- Kernel SVM: Varian SVM yang menggunakan fungsi kernel untuk memodelkan hubungan non-linier.
- Transformers: Model yang sangat efektif untuk berbagai tugas NLP, termasuk prediksi teks dan klasifikasi.
- Quadratic Discriminant Analysis (QDA): Varian LDA yang mengasumsikan distribusi Gaussian untuk setiap kelas.
- AdaBoost: Algoritma boosting yang menggabungkan beberapa model lemah untuk membuat model yang kuat.
- Logistic Regression: Memodelkan probabilitas kejadian biner.
- Linear Regression: Memodelkan hubungan linier antara variabel independen dan dependen.
- K-Nearest Neighbors (K-NN): Klasifikasi berdasarkan kedekatan data baru dengan data pelatihan.
- Recurrent Neural Networks (RNN): Digunakan untuk data berurutan seperti teks, dengan unit seperti LSTM atau GRU.
- Graph Neural Networks (GNN): Jaringan saraf yang dirancang untuk memproses data yang direpresentasikan dalam bentuk graf, seperti jaringan sosial atau teks dengan hubungan antar kata.
- Bagging: Menggabungkan beberapa model untuk mengurangi varians.
Komentar
Posting Komentar