Analisis Sentimen pada Layanan Gojek Indonesia Menggunakan Xtreme Gradient Boosting
View/ Open
Date
2021Author
Simanjuntak, Sondang Tesalonika
Advisor(s)
Aulia, Indra
Gunawan, Dani
Metadata
Show full item recordAbstract
Gojek is one of the most popular local online transportation service providers in Indonesia, and is one of the most popular choices for people who have high mobility. The level of satisfaction of Gojek service users varies, influenced by things such as service quality, proximity, speed, accessibility, cost, and security. One of the responses of users to the Gojek service is delivered through comments on Twitter which are very widely used by users to convey their opinions about the Gojek service. Analyzing and understanding the opinions of Gojek users in a large number of tweets will take a lot of time and effort. It is for this reason, therefore, that sentiment analysis - a method that can extract opinions on a specific topic or service and then analyze them - is needed. This study aims to implement the XGBoost algorithm in the process of classifying the sentiments of gojek. This study used 1445 tweets with positive, negative, and neutral labels. The preprocessing stages are carried out, namely, casefolding to change all letters to lowercase, cleaning to clean every tweet from unnecessary symbols and punctuation, stopwords removal, normalization of words and stemming. At the stage of giving weight to each word, this study uses the TF-IDF Vectorizer to convert each word into a number. The classification stage uses the XGBoost method and is maximized with several hyperparameters on XGBoost. The evaluation process in this study uses confusion matrix and an accuracy rate of 92% is obtained. Gojek merupakan salah satu penyedia jasa transportasi online lokal yang sangat populer di Indonesia, dan merupakan salah satu pilihan yang paling diminati bagi masyarakat yang memiliki mobilitas tinggi. Tingkat kepuasan pengguna layanan Gojek yang bervariasi, dipengaruhi oleh hal-hal seperti kualitas layanan, kedekatan, kecepatan, aksesibilitas, biaya, dan keamanan. Respon para pengguna terhadap layanan gojek salah satunya disampaikan melalui komentar pada Twitter yang sangat banyak digunakan pengguna untuk menyampaikan pendapat mereka mengenai layanan Gojek. Menganalisis dan memahami opini dari pengguna Gojek dalam jumlah tweets yang banyak akan membutuhkan banyak waktu dan usaha. Oleh karena itu, untuk alasan inilah analisis sentimen - sebuah metode yang dapat mengekstrak opini dengan topik ataupun layanan yang spesifik dan kemudian menganalisisnya - diperlukan. Penelitian ini bertujuan untuk mengimplementasikan algoritma XGBoost dalam proses pengklasifikasian sentiment terhadap gojek. Penelitian ini menggunakan data sebanyak 1445 tweet dengan label positif, negatif, dan netral. Tahapan pada preprocessing yang dilakukan yaitu, casefolding untuk mengubah seluruh huruf menjadi huruf kecil, cleaning untuk membersihkan setiap tweet dari symbol dan tanda baca yang tidak perlu, penghapusan kata sambung (stopwords removal), normalisasi kata dan stemming. Pada tahap pemberian bobot untuk setiap kata penelitian ini menggunakan TF-IDF Vectorizer untuk mengkonversikan setiap kata menjadi angka. Tahap pengklasifikasian menggunakan metode XGBoost dan dimaksimalkan dengan beberapa hyperparameter pada XGBoost. Proses evaluasi pada penelitian ini menggunakan confusion matrix dan diperoleh tingkat akurasi sebesar 92%.
Collections
- Undergraduate Theses [803]