Show simple item record

dc.contributor.advisorRahmat, Romi Fadillah
dc.contributor.advisorPurnamawati, Sarah
dc.contributor.authorAzurah, Mayang Dyah
dc.date.accessioned2022-05-23T03:10:00Z
dc.date.available2022-05-23T03:10:00Z
dc.date.issued2022
dc.identifier.urihttps://repositori.usu.ac.id/handle/123456789/48588
dc.description.abstractOn mobile devices, there is a facility to send short messages, namely Short Message Service (SMS). There are many parties who use SMS services to send annoying messages or commonly known as SMS spam. The process of an SMS can be done if the words in the message are standard and in accordance with the rules of the Indonesian language. However, the content of SMS spam circulating now is written in non-standard sentences and many are changed with characters or numbers so that they are not detected SMS spam. So as not to be detected as SMS spam. Therefore, it requires the ability to process and normalize SMS spam Texts automatically. The Normalization of spam SMS Text in this study uses Rule Based, Dictionary Based and Levenshtein Distance algorithms with reference to Indonesian dictionary. The data used in this study were 1000 spams SMS with accuracy value of 92%, 94% of precision, 92% of recall and 0.92 value of f-score.en_US
dc.description.abstractDi dalam perangkat seluler, terdapat fasilitas untuk mengirimkan pesan singkat yaitu Short Message Service (SMS). Terdapat banyak pihak yang memanfaatkan layanan SMS untuk mengirimkan pesan-pesan yang cukup mengganggu atau biasa disebut dengan SMS spam. Proses identifikasi suatu SMS dapat dilakukan apabila kata dalam pesan tersebut baku dan sesuai dengan kaidah bahasa Indonesia. Namun, isi dari SMS spam yang beredar sekarang ditulis dengan kalimat yang tidak baku dan banyak diubah dengan karakter atau angka agar tidak terdeteksi sebagai SMS spam. Oleh karena itu, diperlukan kemampuan untuk memroses dan melakukan Normalisasi teks SMS spam secara otomatis. Normalisasi teks SMS spam pada penelitian ini menggunakan Rule Based, Dictionary Based dan algoritma Levenshtein Distance dengan acuan Kamus Besar Bahasa Indonesia. Data yang digunakan pada penelitian ini sebanyak 1000 SMS spam dengan menghasilkan akurasi yang besarnya 91%, presisi yang besarnya 94%, recall yang besarnya 92% dan nilai f-score yang besarnya 0.92.en_US
dc.language.isoiden_US
dc.publisherUniversitas Sumatera Utaraen_US
dc.subjectNormalisasi Teksen_US
dc.subjectSMS spamen_US
dc.subjectRule Baseden_US
dc.subjectDictionary Baseden_US
dc.subjectLevenshtein Distanceen_US
dc.titleNormalisasi Teks pada Spam Sms Berbahasa Indonesia dengan Menggunakan Rule Based, Dictionary Based, dan Algoritma Levenshtein Distanceen_US
dc.typeThesisen_US
dc.identifier.nimNIM161402050
dc.description.pages107 Halaman
dc.description.typeSkripsi Sarjanaen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record