Peningkatan Kinerja K-Means Clustering berdasarkan Pembobotan Atribut Menggunakan Metode Principal Component Analysis

Agusnady, Alfian

Peningkatan Kinerja K-Means Clustering berdasarkan Pembobotan Atribut Menggunakan Metode Principal Component Analysis

dc.contributor.advisor	Sitompul, Opim Salim
dc.contributor.advisor	Tulus
dc.contributor.author	Agusnady, Alfian
dc.date.accessioned	2021-06-07T02:52:33Z
dc.date.available	2021-06-07T02:52:33Z
dc.date.issued	2021
dc.identifier.uri	http://repositori.usu.ac.id/handle/123456789/32916
dc.description.abstract	The K-Means algorithm has several weaknesses, one of which lies in the distance model used in determining the similarity between data which provides the same treatment for each data attribute, so that attributes that are less relevant and have little contribution to data variation can have a significant impact on clustering results. This of course can reduce the performance of the K-Means algorithm. Attribute weighting is one way that can be used to get the correlation of data attributes to data variations. The higher the weight value of an attribute, the greater the correlation to data variation, so that the low weight value of an attribute certainly has little contribution to data variation and can have a significant impact on performance and clustering results. In this study, the method used in calculating the weight of data attributes is Principal Component Analysis (PCA). To test the proposed method, this study uses a dataset from UCI Machine Learning which consists of 351 Ionosphere data, 4177 Abalone data and 1096 air quality data from Pekanbaru City Air Laboratory and 120 water quality data. The evaluation of the proposed clustering performance is based on the Sum of Square Error (SSE) value. The test results in this study show that the proposed method can produce a significantly smaller SSE value.	en_US
dc.description.abstract	Algoritma K-Means memiliki beberapa kelemahan, salah satunya terletak pada model jarak yang digunakan dalam penentuan kemiripan antar data yang memberikan perlakuan yang sama terhadap setiap atribut data, sehingga atribut yang kurang relevan dan memiliki sedikit kontribusi terhadap variasi data dapat memberikan dampak yang cukup berpengaruh terhadap hasil clustering. Hal ini tentu saja dapat menurunkan kinerja algoritma K-Means. Pembobotan atribut merupakan salah satu cara yang dapat digunakan untuk mendapatkan korelasi atribut data terhadap variasi data. Semakin tinggi nilai bobot dari suatu atribut maka semakin besar korelasinya terhadap variasi data, sehingga nilai bobot yang rendah dari suatu atribut tentunya memiliki sedikit kontribusi terhadap variasi data dan dapat memberikan dampak yang cukup berpengaruh terhadap kinerja dan hasil clustering. Pada penelitian ini, metode yang digunakan dalam perhitungan bobot atribut data yaitu Principal Component Analysis (PCA). Untuk melakukan pengujian terhadap metode yang diusulkan, maka penelitian ini menggunakan dataset dari UCI Machine Learning yang terdiri dari 351 data Ionosphere, 4177 data Abalone serta 1096 data kualitas udara dari Laboratorium Udara Kota Pekanbaru dan 120 data kualitas air. Evaluasi kinerja clustering yang diusulkan berdasarkan nilai Sum of Square Error (SSE). Hasil pengujian pada penelitian ini terlihat bahwa dengan metode yang diusulkan dapat menghasilkan nilai SSE yang signifikan lebih kecil.	en_US
dc.language.iso	id	en_US
dc.publisher	Universitas Sumatera Utara	en_US
dc.subject	Clustering	en_US
dc.subject	K-Means	en_US
dc.subject	Pembobotan atribut	en_US
dc.subject	Principal Component Analysis	en_US
dc.subject	Sum of Square Error	en_US
dc.title	Peningkatan Kinerja K-Means Clustering berdasarkan Pembobotan Atribut Menggunakan Metode Principal Component Analysis	en_US
dc.type	Thesis	en_US
dc.identifier.nim	NIM177038003
dc.description.pages	144 Halaman	en_US
dc.description.type	Tesis Magister	en_US

Files in this item

Name:: 177038003.pdf
Size:: 3.269Mb
Format:: PDF
Description:: Fulltext

View/Open

This item appears in the following Collection(s)

Master Theses [621]
Tesis Magister

Show simple item record