Normalisasi Teks pada Spam Sms Berbahasa Indonesia dengan Menggunakan Rule Based, Dictionary Based, dan Algoritma Levenshtein Distance
View/ Open
Date
2022Author
Azurah, Mayang Dyah
Advisor(s)
Rahmat, Romi Fadillah
Purnamawati, Sarah
Metadata
Show full item recordAbstract
On mobile devices, there is a facility to send short messages, namely Short Message Service (SMS). There are many parties who use SMS services to send annoying messages or commonly known as SMS spam. The process of an SMS can be done if the words in the message are standard and in accordance with the rules of the Indonesian language. However, the content of SMS spam circulating now is written in non-standard sentences and many are changed with characters or numbers so that they are not detected SMS spam. So as not to be detected as SMS spam. Therefore, it requires the ability to process and normalize SMS spam Texts automatically. The Normalization of spam SMS Text in this study uses Rule Based, Dictionary Based and Levenshtein Distance algorithms with reference to Indonesian dictionary. The data used in this study were 1000 spams SMS with accuracy value of 92%, 94% of precision, 92% of recall and 0.92 value of f-score. Di dalam perangkat seluler, terdapat fasilitas untuk mengirimkan pesan singkat yaitu Short Message Service (SMS). Terdapat banyak pihak yang memanfaatkan layanan SMS untuk mengirimkan pesan-pesan yang cukup mengganggu atau biasa disebut dengan SMS spam. Proses identifikasi suatu SMS dapat dilakukan apabila kata dalam pesan tersebut baku dan sesuai dengan kaidah bahasa Indonesia. Namun, isi dari SMS spam yang beredar sekarang ditulis dengan kalimat yang tidak baku dan banyak diubah dengan karakter atau angka agar tidak terdeteksi sebagai SMS spam. Oleh karena itu, diperlukan kemampuan untuk memroses dan melakukan Normalisasi teks SMS spam secara otomatis. Normalisasi teks SMS spam pada penelitian ini menggunakan Rule Based, Dictionary Based dan algoritma Levenshtein Distance dengan acuan Kamus Besar Bahasa Indonesia. Data yang digunakan pada penelitian ini sebanyak 1000 SMS spam dengan menghasilkan akurasi yang besarnya 91%, presisi yang besarnya 94%, recall yang besarnya 92% dan nilai f-score yang besarnya 0.92.
Collections
- Undergraduate Theses [796]