Grafik perbandingan
Dasar untuk perbandingan | Klasifikasi | Regresi |
---|---|---|
Dasar | Penemuan model atau fungsi di mana pemetaan objek dilakukan ke dalam kelas yang telah ditentukan. | Model yang dirancang di mana pemetaan objek dilakukan menjadi nilai-nilai. |
Melibatkan prediksi | Nilai diskrit | Nilai kontinu |
Algoritma | Pohon keputusan, regresi logistik, dll. | Pohon regresi (Hutan acak), Regresi linear, dll. |
Sifat data yang diprediksi | Tidak dipesan | Dipesan |
Metode perhitungan | Mengukur akurasi | Pengukuran root mean square error |
Definisi Klasifikasi
Klasifikasi adalah proses menemukan atau menemukan model (fungsi) yang membantu dalam memisahkan data menjadi beberapa kelas kategorikal. Dalam klasifikasi, keanggotaan grup dari masalah diidentifikasi, yang berarti data dikategorikan dalam label yang berbeda sesuai dengan beberapa parameter dan kemudian label diprediksi untuk data tersebut.
Model turunan dapat didemonstrasikan dalam bentuk aturan “JIKA-LALU”, pohon keputusan atau jaringan saraf, dll. Pohon keputusan pada dasarnya adalah bagan alur yang menyerupai struktur pohon di mana setiap simpul internal menggambarkan tes pada suatu atribut, dan cabang-cabangnya menunjukkan hasil tes. Proses klasifikasi berhubungan dengan masalah di mana data dapat dibagi menjadi dua atau lebih label diskrit, dengan kata lain, dua atau lebih set terpisah.
Mari kita ambil contoh, misalkan kita ingin memprediksi kemungkinan hujan di beberapa daerah berdasarkan beberapa parameter. Maka akan ada dua label hujan dan tidak ada hujan di mana daerah yang berbeda dapat diklasifikasikan.
Definisi Regresi
Regresi adalah proses menemukan model atau fungsi untuk membedakan data menjadi nilai riil kontinu alih-alih menggunakan kelas. Secara matematis, dengan masalah regresi, seseorang berusaha menemukan perkiraan fungsi dengan deviasi kesalahan minimum. Dalam regresi, ketergantungan numerik data diprediksi akan membedakannya.
Analisis Regresi adalah model statistik yang digunakan untuk memprediksi data numerik dan bukan label. Itu juga dapat mengidentifikasi pergerakan distribusi tergantung pada data yang tersedia atau data historis.
Mari kita ambil contoh serupa dalam regresi juga, di mana kita menemukan kemungkinan hujan di beberapa daerah tertentu dengan bantuan beberapa parameter. Dalam hal ini, ada kemungkinan terkait dengan hujan. Di sini kita tidak mengklasifikasikan wilayah dalam hujan dan tidak ada label hujan, melainkan kita mengklasifikasikannya dengan probabilitas yang terkait.
Perbedaan Kunci Antara Klasifikasi dan Regresi
- Proses Klasifikasi memodelkan fungsi yang melaluinya data diprediksi dalam label kelas diskrit. Di sisi lain, regresi adalah proses menciptakan model yang memprediksi kuantitas kontinu.
- Algoritma klasifikasi melibatkan pohon keputusan, regresi logistik, dll. Sebaliknya, pohon regresi (misalnya Hutan acak) dan regresi linear adalah contoh algoritma regresi.
- Klasifikasi memprediksi data yang tidak teratur sedangkan regresi memprediksi data yang dipesan.
- Regresi dapat dievaluasi menggunakan root mean square error. Sebaliknya, klasifikasi dievaluasi dengan mengukur akurasi.
Kesimpulan
Teknik klasifikasi menyediakan model atau fungsi prediktif yang memprediksi data baru dalam kategori atau label tersendiri dengan bantuan data historis. Sebaliknya, metode regresi memodelkan fungsi bernilai kontinu yang berarti memprediksi data dalam data numerik kontinu.