Selain menggunakan SVM, kita bisa melakukan klasifikasi data dengan menggunakan metode Naive Bayes. Bagus mana sih SVM apa Naive Bayes? Hemm...menurut saya, semua metode ada kekurangan dan kelebihannya (klasik bangeet :D ). Namun, sejauh ini SVM memang paling digdaya dibanding metode klasifikasi lainnya pada sebagian besar kasus (Ingat!! Tidak semua kasus yaa ). Kadang kala Naive Bayes memiliki performa yang lebih baik dari pada SVM (bergantung datasetnya). Bagi yang belum
familiar dengan Naive Bayes, bisa buka ini untuk menambah referensi: Naive Bayes by Wikipedia.
*assume that you already have the dataset* :D
Dari dataset itu, yang perlu anda ketahui adalah:
- N = Jumlah Instance, biasanya jumlah instance sama dengan jumlah row/baris yang ada di dalam dataset. (Ingat! Header atau nama/keterangan data tidak termasuk dalam hitungan)
- M = Jumlah Atribut atau Fitur, biasanya jumlah atribut sama dengan jumlah column/kolom yang ada dalam dataset. (Ingat! ID, no urut dan sejenisnya bukan termasuk fitur/atribut.
Berikut langkah-langkah klasifikasi data dengan mengunakan metode Naive Bayes pada Matlab:
- Load data yang akan diklasifikasi, simpan dalam suatu variabel, misal: temp.
- Bagi data menjadi data training dan data testing.
- Lakukan training (mencari model yang tepat)
- Lakukan prediksi/testing
- Ukur performa Naive Bayes terhadap dataset.
Gambar 1. Contoh dataset.
Gambar 2. Contoh code implementasi Naive Bayes pada Matlab.
Read More..