Analisis Kinerja Metode Cross Validation dan K-Nearest Neighbor dalam Klasifikasi Data
View/ Open
Date
2020Author
Hulu, Sitefanus
Advisor(s)
Sihombing, Poltak
Sutarman
Metadata
Show full item recordAbstract
Untuk menghasilkan klasifikasi data yang memiliki akurasi data atau kesamaan kedekatan suatu hasil pengukuran dengan angka atau data yang sebenarnya, dapat dilakukan pengujian berdasarkan akurasi dengan parameter data uji dan data training yang ditentukan dengan Cross Validation. Oleh karena itu akurasi data sangat berpengaruh terhadap hasil akhir klasifikasi data dikarenakan ketika akurasi data tidak akurat akan mempengaruhi persentase pengelompokan data uji dan data training. Sedangkan pada metode K-Nearest Neighbor tidak adanya pembagian data training dan data uji. Untuk itu peneliti menganalisis penentuan data training dan data uji menggunakan algoritma Cross validation dan K-Nearest Neighbor dalam klasifikasi data. Adapun hasil dari penelitianBerdasarkan hasil evaluasi algoritma Cross Validation terhadap pengaruh jumlah K dalam K-nearest Neighbor klasifikasi data. Adapun pembagian data dengan Cross Validation memiliki pengenalan data yang lebih baik dengan persentase 100% .Hasil pengujian metode K-NN dalam klasifikasi data menggunakan data set iris dengan menggunakan uji variasi nilai 3, 4, 5, 6, 7, 8, 9, memiliki akurasi persentase 100% dengan 75 data jumlah benar dan 0 data jumlah salah. To produce data classifications that have data accuracy or similarity in the proximity of measurement results to actual figures or data, testing can be done based on accuracy with test data parameters and training data determined by Cross Validation. Therefore data accuracy is very influential on the final result of data classification because when data accuracy is inaccurate it will affect the percentage of test data grouping and training data. Whereas in the K-Nearest Neighbor method there is no division of training data and test data. For this reason, researchers analyzed the determination of training data and test data using the Cross and K-Nearest Neighbor validation algorithm in data classification. The results of this study are based on the evaluation results of the Cross Validation algorithm on the effect of the number of K in the classification of the nearest K-neighbor data. Sharing data with Cross Validation has better data recognition at a percentage of 100%. The results of testing the K-NN method in data classification using iris data sets using variation test values 3, 4, 5, 6, 7, 8, 9, have a percentage accuracy of 100% with 75 data the number of correct and 0 the number of incorrect data.
Collections
- Master Theses [621]