• Login
    View Item 
    •   USU-IR Home
    • Faculty of Computer Science and Information Technology
    • Department of Information Technology
    • Undergraduate Theses
    • View Item
    •   USU-IR Home
    • Faculty of Computer Science and Information Technology
    • Department of Information Technology
    • Undergraduate Theses
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Normalisasi Teks pada Spam Sms Berbahasa Indonesia dengan Menggunakan Rule Based, Dictionary Based, dan Algoritma Levenshtein Distance

    View/Open
    Fulltext (1.557Mb)
    Date
    2022
    Author
    Azurah, Mayang Dyah
    Advisor(s)
    Rahmat, Romi Fadillah
    Purnamawati, Sarah
    Metadata
    Show full item record
    Abstract
    On mobile devices, there is a facility to send short messages, namely Short Message Service (SMS). There are many parties who use SMS services to send annoying messages or commonly known as SMS spam. The process of an SMS can be done if the words in the message are standard and in accordance with the rules of the Indonesian language. However, the content of SMS spam circulating now is written in non-standard sentences and many are changed with characters or numbers so that they are not detected SMS spam. So as not to be detected as SMS spam. Therefore, it requires the ability to process and normalize SMS spam Texts automatically. The Normalization of spam SMS Text in this study uses Rule Based, Dictionary Based and Levenshtein Distance algorithms with reference to Indonesian dictionary. The data used in this study were 1000 spams SMS with accuracy value of 92%, 94% of precision, 92% of recall and 0.92 value of f-score.
     
    Di dalam perangkat seluler, terdapat fasilitas untuk mengirimkan pesan singkat yaitu Short Message Service (SMS). Terdapat banyak pihak yang memanfaatkan layanan SMS untuk mengirimkan pesan-pesan yang cukup mengganggu atau biasa disebut dengan SMS spam. Proses identifikasi suatu SMS dapat dilakukan apabila kata dalam pesan tersebut baku dan sesuai dengan kaidah bahasa Indonesia. Namun, isi dari SMS spam yang beredar sekarang ditulis dengan kalimat yang tidak baku dan banyak diubah dengan karakter atau angka agar tidak terdeteksi sebagai SMS spam. Oleh karena itu, diperlukan kemampuan untuk memroses dan melakukan Normalisasi teks SMS spam secara otomatis. Normalisasi teks SMS spam pada penelitian ini menggunakan Rule Based, Dictionary Based dan algoritma Levenshtein Distance dengan acuan Kamus Besar Bahasa Indonesia. Data yang digunakan pada penelitian ini sebanyak 1000 SMS spam dengan menghasilkan akurasi yang besarnya 91%, presisi yang besarnya 94%, recall yang besarnya 92% dan nilai f-score yang besarnya 0.92.

    URI
    https://repositori.usu.ac.id/handle/123456789/48588
    Collections
    • Undergraduate Theses [796]

    Repositori Institusi Universitas Sumatera Utara (RI-USU)
    Universitas Sumatera Utara | Perpustakaan | Resource Guide | Katalog Perpustakaan
    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV
     

     

    Browse

    All of USU-IRCommunities & CollectionsBy Issue DateTitlesAuthorsAdvisorsKeywordsTypesBy Submit DateThis CollectionBy Issue DateTitlesAuthorsAdvisorsKeywordsTypesBy Submit Date

    My Account

    LoginRegister

    Repositori Institusi Universitas Sumatera Utara (RI-USU)
    Universitas Sumatera Utara | Perpustakaan | Resource Guide | Katalog Perpustakaan
    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV