Show simple item record

dc.contributor.advisorSihombing, Poltak
dc.contributor.advisorZarlis, Muhammad
dc.contributor.authorManalu, Darwis Robinson
dc.date.accessioned2021-07-01T05:13:39Z
dc.date.available2021-07-01T05:13:39Z
dc.date.issued2015
dc.identifier.urihttp://repositori.usu.ac.id/handle/123456789/34044
dc.description.abstractMeasures the percentage similarity becomes important documents today because of the many digital documents in particular scientific work. Measurements were performed by using keywords solution of some of the documents that the user selected after the competition keywords. The process of determining keywords alogorithm solution with genetics to produce the latest generation of the best with Jaccard and Cosine Similarity method. Then the similarity calculation process will be done using the keyword query comparing the solution with an existing document in a database that is in the post title, abstract, keywords and references. Similarity calculation method used is the Percentage of Similarity (POSI) Formulation. The number of keywords found on each document will be distributed in the whole of keywords that are found to produce a percentage of similarity. From the tests results obtained similarity of documents idDoc-661 amounted to 32.26%, 24.19% in the second sequence idDoc-665 and the third number of 19.35% on idDoc-663 and fourth at 12.90% in idDoc -667 and the latter by 11.29% in idDoc- 666. Based on these tests a user can find out similarities with the other documentsen_US
dc.description.abstractMengukur persentase kemiripan dokumen menjadi penting saat ini karena banyaknya dokumen digital khususnya karya ilmiah. Pengukuran yang dilakukan dengan menggunakan kata kunci solusi dari beberapa dokumen yang dipilih user setelah proses kompetisi kata kunci. Proses penentuan kata kunci solusi dengan alogoritma genetika sampai menghasilkan generasi terakhir yang terbaik dengan metode Jaccard dan Cosine Similarity. Kemudian proses perhitungan kemiripan akan dilakukan dengan menggunakan query membandingkan kata kunci solusi dengan dokumen yang ada dalam database yaitu pada judul tulisan, abstrak, kata kunci dan referensi. Metode perhitungan kemiripan yang digunakan adalah Percentage of Similarity (POSI) Formulation. Jumlah yang kata kunci yang ditemukan pada setiap dokumen akan dibagikan pada keseluruhan kata kunci yang ditemukan untuk menghasilkan persentase kemiripan. Dari pengujian yang dilakukan diperoleh hasil kemiripan dari dokumen IdDoc-661 sebesar 32,26%, urutan kedua 24,19% pada IdDoc-665 dan urutan ketiga sejumlah 19,35% pada IdDoc-663 dan urutan keempat sebesar 12,90% pada IdDoc-667 dan yang terakhir sebesar 11,29% pada IdDoc-666. Berdasarkan pengujian tersebut user dapat mengetahui kemiripan sebuah dokumen dengan yang lainnya. Kataen_US
dc.language.isoiden_US
dc.publisherUniversitas Sumatera Utaraen_US
dc.subjectDocument similarity,en_US
dc.subjectGenetic Algorithm (GA),en_US
dc.subjectCosine Similirity,en_US
dc.subjectPOSI Formulationen_US
dc.titlePengukuran Tingkat Kemiripan Dokumen Teks dengan Proses Algoritma Genetika Menggunakan Posi Formulationen_US
dc.typeThesisen_US
dc.identifier.nimNIM127038077
dc.description.pages94 Halamanen_US
dc.description.typeTesis Magisteren_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record