• Login
    View Item 
    •   USU-IR Home
    • Faculty of Computer Science and Information Technology
    • Department of Information Technology
    • Master Theses
    • View Item
    •   USU-IR Home
    • Faculty of Computer Science and Information Technology
    • Department of Information Technology
    • Master Theses
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Pengukuran Tingkat Kemiripan Dokumen Teks dengan Proses Algoritma Genetika Menggunakan Posi Formulation

    View/Open
    Fulltext (4.891Mb)
    Date
    2015
    Author
    Manalu, Darwis Robinson
    Advisor(s)
    Sihombing, Poltak
    Zarlis, Muhammad
    Metadata
    Show full item record
    Abstract
    Measures the percentage similarity becomes important documents today because of the many digital documents in particular scientific work. Measurements were performed by using keywords solution of some of the documents that the user selected after the competition keywords. The process of determining keywords alogorithm solution with genetics to produce the latest generation of the best with Jaccard and Cosine Similarity method. Then the similarity calculation process will be done using the keyword query comparing the solution with an existing document in a database that is in the post title, abstract, keywords and references. Similarity calculation method used is the Percentage of Similarity (POSI) Formulation. The number of keywords found on each document will be distributed in the whole of keywords that are found to produce a percentage of similarity. From the tests results obtained similarity of documents idDoc-661 amounted to 32.26%, 24.19% in the second sequence idDoc-665 and the third number of 19.35% on idDoc-663 and fourth at 12.90% in idDoc -667 and the latter by 11.29% in idDoc- 666. Based on these tests a user can find out similarities with the other documents
     
    Mengukur persentase kemiripan dokumen menjadi penting saat ini karena banyaknya dokumen digital khususnya karya ilmiah. Pengukuran yang dilakukan dengan menggunakan kata kunci solusi dari beberapa dokumen yang dipilih user setelah proses kompetisi kata kunci. Proses penentuan kata kunci solusi dengan alogoritma genetika sampai menghasilkan generasi terakhir yang terbaik dengan metode Jaccard dan Cosine Similarity. Kemudian proses perhitungan kemiripan akan dilakukan dengan menggunakan query membandingkan kata kunci solusi dengan dokumen yang ada dalam database yaitu pada judul tulisan, abstrak, kata kunci dan referensi. Metode perhitungan kemiripan yang digunakan adalah Percentage of Similarity (POSI) Formulation. Jumlah yang kata kunci yang ditemukan pada setiap dokumen akan dibagikan pada keseluruhan kata kunci yang ditemukan untuk menghasilkan persentase kemiripan. Dari pengujian yang dilakukan diperoleh hasil kemiripan dari dokumen IdDoc-661 sebesar 32,26%, urutan kedua 24,19% pada IdDoc-665 dan urutan ketiga sejumlah 19,35% pada IdDoc-663 dan urutan keempat sebesar 12,90% pada IdDoc-667 dan yang terakhir sebesar 11,29% pada IdDoc-666. Berdasarkan pengujian tersebut user dapat mengetahui kemiripan sebuah dokumen dengan yang lainnya. Kata

    URI
    http://repositori.usu.ac.id/handle/123456789/34044
    Collections
    • Master Theses [621]

    Repositori Institusi Universitas Sumatera Utara - 2025

    Universitas Sumatera Utara

    Perpustakaan

    Resource Guide

    Katalog Perpustakaan

    Journal Elektronik Berlangganan

    Buku Elektronik Berlangganan

    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV
     

     

    Browse

    All of USU-IRCommunities & CollectionsBy Issue DateTitlesAuthorsAdvisorsKeywordsTypesBy Submit DateThis CollectionBy Issue DateTitlesAuthorsAdvisorsKeywordsTypesBy Submit Date

    My Account

    LoginRegister

    Repositori Institusi Universitas Sumatera Utara - 2025

    Universitas Sumatera Utara

    Perpustakaan

    Resource Guide

    Katalog Perpustakaan

    Journal Elektronik Berlangganan

    Buku Elektronik Berlangganan

    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV