Implementasi Algoritma K-Means untuk Clustering Data Skripsi

Sani, Salsabila Syukri

Implementasi Algoritma K-Means untuk Clustering Data Skripsi

dc.contributor.advisor	Jaya, Ivan
dc.contributor.advisor	Purnamawati, Sarah
dc.contributor.author	Sani, Salsabila Syukri
dc.date.accessioned	2022-01-31T02:12:52Z
dc.date.available	2022-01-31T02:12:52Z
dc.date.issued	2021
dc.identifier.uri	https://repositori.usu.ac.id/handle/123456789/47218
dc.description.abstract	The amount of thesis document which increase continously make a clustering of thesis document more difficult because it has to many topic that can be used to make a thesis. Therefore, the clustering of thesis document is needed to produce a relevant result that can be help to clustering thesis document. The purpose of the research is to imply K-Means algorithm to clustering thesis document to find a suitable main topic. In that process, there is preprocessing step which is call tokenization, the omit of stop words, filtering and stemming. Next, classification of thesis document are done with K-Means algorithm using TD-IDF to get the weight count number. The results of the clustering using TD-IDF process would spend more time because the amount of data needed to be process in short time. The clustering results would make the thesis document which have the same topic will gather in one spot while others will make make another group by their own.	en_US
dc.description.abstract	Banyaknya dokumen skripsi yang terus bertambah membuat pengelompokan dokumen skripsi semakin sulit di karenakan banyaknya topik yang di gunakan dalam pembuatan skripsi. Oleh karena itu, pengelompokan dokumen skripsi diperlukan untuk melihat dan menghasilkan hasil relevan yang dapat membantu untuk mengkategorikan topik skripsi yang di gunakan. Penelitian ini memiliki tujuan untuk penerapan algoritma K-Means dalam pengelompokkan dokumen skripsi sesuai dengan topik besar yang ada. Tahapan preprocessing yang dilakukan yaitu tokenization, penghilangan stopwords, filtering dan stemming. Berikutnya, pengelompokan dokumen akan di lakukan dengan algoritma K-Means menggunakan TF-IDF untuk memperoleh jumlah bobot dari perhitungan kata yang di gunakan. Hasil dari pengelompokan dokumen meggunakan proses TD-IDF membutuhkan waktu lebih banyak di karena kan banyaknya kata yang di proses dalam waktu yang singkat. Hasil pengelompokan yang telah dilakukan membuat dokumen yang mempunyai kesamaan dalam topik skripsi berkumpul di suatu area dan topik yang berbeda akan membuat kelompok yang berbeda pula.	en_US
dc.language.iso	id	en_US
dc.publisher	Universitas Sumatera Utara	en_US
dc.subject	K-Means	en_US
dc.subject	Pengelompokan	en_US
dc.subject	TD-IDF	en_US
dc.subject	Topik Skripsi	en_US
dc.title	Implementasi Algoritma K-Means untuk Clustering Data Skripsi	en_US
dc.type	Thesis	en_US
dc.identifier.nim	NIM141402146
dc.description.pages	50 Halaman	en_US
dc.description.type	Skripsi Sarjana	en_US

Files in this item

Name:: 141402146.pdf
Size:: 1.742Mb
Format:: PDF
Description:: Fulltext

View/Open

This item appears in the following Collection(s)

Undergraduate Theses [797]
Skripsi Sarjana

Show simple item record