Nama : Muhammad Rois
Mata Kuliah : Mechine Learning
Algoritma K-Nearest Neighbor (KNN) adalah sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Termasuk dalam supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan mayoritas kedekatan jarak dari kategori yang ada dalam K-NN.
Tujuan dari algoritma ini adalah untuk mengklasifikasikan obyek baru berdasarkan atribut dan sample-sample dari training data.
Data yang digunakan yaitu Data Cryotherapy Dataset diperoleh dari UCI Machine Learning Repository https://archive.ics.uci.edu/ml/datasets.html
Berdasarkan Data Cryotherapy Dataset dapat diketahui bahwa terdapat 90 data yang menjelaskan tentang hasil perawatan kutil. Dalam data ini terdapat 7 variabel yaitu Sex , Age , Time , Number of Warts , Type , Area dan Result of Treatment. Klasifikasi Data Cryotherapy yaitu Sex : 1 = laki-laki 2 = wanita ; Type : 1 = kutil biasa 2 = kutil plantar 3 = kutil lainnya ; Result of Treatment : 1 = sembuh 2 = tidak sembuh.
Selanjutnya, klasifikasi menggunakan K-Nearest Neighbor dapat dilakukan dalam phyton seperti berikut.
Pertama, import package pandas dan numpy.
Berdasarkan output diatas, maka dapat diketahui bahwa dari data Cryotherapy tipe datanya ada float dan integer. Terdapat tipe data float sebanyak 1 dan tipe data integer sebanyak 6.
Keempat, menentukan variabel independen dari data sehingga, menghapus variabel dependen yaitu Result of Treatment.
Berdasarkan hasil output diatas yang termasuk variabel dependen yaitu Sex , Age , Time , Number of Warts , Type dan Area. Dalam variabel dependen yang terdapat klasifikasi yaitu Sex dan Type.
Kelima, menampilkan data variabel dependen yaitu Result of Treatment.
Keenam, untuk melakukan klasifikasi K-Nearest Neighbor aktifkan package sklearn.
Kesepuluh, Mengaktifkan fungsi klasifikasi.
Berdasarkan nilai ketepatan prediksi diatas maka dapat diketahui bahwa 0.84 merupakan nilai rata-rata yang cukup besar dari perhitungan yang lainnya maka hal itu menandakan ketepatan prediksi yang paling baik yaitu pada bagian precision dengan nilai 0.84 .
Ketujuhbelas, untuk mengitung nilai akurasi maka import accuracy score.
Berdasarkan nilai output diatas , maka dapat diketahui bahwa nilai akurasi yang didapatkan yaitu 0.8333 .
Sekian penjelasan saya tentang Klasifikasi dengan metode K-Nearest Neighbor yang dapat saya tuliskan, terimakasih :))
Komentar
Posting Komentar