dc.contributor.advisor | Zarlis, Muhammad | |
dc.contributor.advisor | Efendi, Syahril | |
dc.contributor.author | Arisandi, Cut Desy | |
dc.date.accessioned | 2022-02-07T05:13:47Z | |
dc.date.available | 2022-02-07T05:13:47Z | |
dc.date.issued | 2021 | |
dc.identifier.uri | https://repositori.usu.ac.id/handle/123456789/47400 | |
dc.description.abstract | The kNN algorithm is a method in data mining that is used for the data classification
process which is quite popular. The traditional kNN method has several
disadvantages, such as: slow computation when the dimensions of the training data are
high and a strong dependence on the amount of training data. This study tested data
reduction on the kNN algorithm using the fuzzy c-means clustering and Pearson
correlation method on the training data before the data classification process was
carried out. The FCM algorithm is used in the data clustering process to obtain the
center point of the cluster and then select the training data with the lowest correlation
level using the Pearson correlation equation for further reduction. Based on the
research conducted, it can be concluded that the accuracy of data classification in the
kNN algorithm with data reduction using the fuzzy c-means clustering algorithm and
Person correlation obtained an average accuracy of 92.22% and an increase of 2.7%
compared to the classification results in kNN algorithm without data reduction with an
average accuracy gain of 89.52%. In addition, the use of the data reduction method
proposed in the kNN algorithm can reduce the training data into smaller dimensions
with an average reduction percentage of 19.22%. | en_US |
dc.description.abstract | Algoritma kNN merupakan metode di dalam data mining yang digunakan untuk
proses pengklasifikasian data yang cukup populer. Metode kNN tradisional memiliki
beberapa kelemahan, seperti: komputasi yang lambat ketika dimensi pada data
training tergolong tinggi dan ketergantungan yang kuat pada jumlah data training.
Penelitian ini melakukan pengujian reduksi data pada algoritma kNN menggunakan
metode fuzzy c-means clustering dan Pearson correlation pada data pelatihan sebelum
proses klasifikasi data dilakukan. Algoritma FCM digunakan dalam proses clustering
data untuk memperoleh titik pusat cluster dan kemudian dilakukan pemilihan data
training dengan tingkat korelasi terendah menggunakan persamaan Pearson
correlation untuk selanjutnya direduksi. Hasil dari kedua metode tersebut berupa data
hasil reduksi yang selanjutnya akan dijadikan data training dengan dimensi yang lebih
kecil untuk proses klasifikasi pada algoritma kNN. Berdasarkan penelitian yang
dilakukan dapat diambil kesimpulan bahwa akurasi klasifikasi data pada algoritma
kNN dengan reduksi data menggunakan algoritma fuzzy c-means clustering dan
Person correlation memperoleh akurasi rata-rata sebesar 92,22% dan mengalami
peningkatan sebesar 2,7% dibandingkan dengan hasil klasifikasi pada algoritma kNN
tanpa reduksi data dengan perolehan akurasi rata-rata sebesar 89,52%. Selain itu,
penggunaan metode reduksi data yang diusulkan pada algoritma kNN dapat mereduksi
data pelatihan menjadi dimensi yang lebih kecil dengan rata-rata persentase reduksi
sebesar 19,22%. | en_US |
dc.language.iso | id | en_US |
dc.publisher | Universitas Sumatera Utara | en_US |
dc.subject | Reduksi Data | en_US |
dc.subject | Algoritma kNN | en_US |
dc.subject | Fuzzy C-Means Clustering | en_US |
dc.subject | Pearson Correlation | en_US |
dc.title | Analisis Metode Fuzzy C-Means dan Pearson Correlation untuk Reduksi Data pada Algoritma KNN | en_US |
dc.type | Thesis | en_US |
dc.identifier.nim | NIM177038023 | |
dc.description.pages | 65 Halaman | en_US |
dc.description.type | Tesis Magister | en_US |