Aspect Based Sentiment Analysis Pada Review Produk Kecantikan Menggunakan Extreme Gradient Boosting
View/ Open
Date
2021Author
Silalahi, Jessie Gabriella
Advisor(s)
Purnamawati, Sarah
Gunawan, Dani
Metadata
Show full item recordAbstract
Beauty products or cosmetics is one part that quite popular in various circles, especially for woman. Each beauty or cosmetic product has a different function to maintain and care for cleanliness of the body. The development pattern of life quite rapidly causing widespread new brands that are present to offer the advantages of each product. It causing consumer to choose the best type of beauty product that is accordance with their needs. Each consumer has a right to leave a comment, review or feedback regarding the product that they used. It can give an information and viewpoint to others consumer that want to use a beauty product. Besides that, the results of a review feedback about a beauty product also can provide information to the company that making that beauty products to improve the quality of their beauty product. Review of beauty product has given by user has kind of sentiment such as positive, negative, and neutral. But in the process of identity the reviews product, the analysis sentiment based on an aspect product are needed. Aspect based sentiment analysis based on an aspect gives an identification more obvious and the benefits well for the development of service products. It takes an approach to overcome the problem of analysis of sentiment toward the reviews product based on an aspect product to establish a system to identify sentiment based on an aspect. This study uses 1500 data of beauty product reviews on femaledaily site. The preprocessing stages carried out of this study were deleting all emoji and other character that not important, changing all words to lowercase, deleting of symbols and punctuation, normalization all the words, and delete all the stopwords. This study also uses a weighting words into vector using TF-IDF and will be identifies using the Extreme Gradient Boosting method. By applying the evaluation method of confussion matrix, produces an average accuracy of 90%. Produk kecantikan atau kosmetik merupakan salah satu bagian yang cukup populer di berbagai kalangan, termasuk pada kalangan wanita. Setiap produk kecantikan atau kosmetik memiliki fungsi yang berbeda untuk menjaga dan merawat kebersihan tubuh. Perkembangan pola hidup yang cukup pesat menyebabkan maraknya brand baru yang hadir menawarkan keunggulan masing-masing produk. Hal ini menyebabkan pengguna kesulitan untuk memilih jenis produk kecantikan yang sesuai dengan kebutuhan mereka. Setiap pengguna berhak untuk memberikan review atau tanggapan mengenai produk yang mereka gunakan. Sehingga dapat menjadi informasi dan pandangan kepada pengguna lain yang ingin menggunakan sebuah produk. Selain itu, hasil review tanggapan mengenai suatu produk kecantikan juga dapat memberikan informasi kepada pihak perusahaan pembuat produk untuk memperbaiki kualitas produk kecantikan mereka. Review berupa produk yang kecantikan yang diberikan pengguna memiliki jenis sentimen yang beragam seperti positif, negatif atau netral. Namun pada proses identifikasi review produk tersebut, masih perlu dilakukan analisis terhadap sentimen produk berdasarkan aspek produk yang terdapat dalam kalimat review. Analisis sentimen berdasarkan aspek produk dilakukan untuk memberian identifikasi yang lebih jelas dan manfaat yang lebih baik untuk pengembangan pelayanan produk. Untuk itu dibutuhkan suatu pendekatan untuk mengatasi permasalahan analisa sentimen terhadap review produk berdasarkan aspek produk tersebut dengan membangun sistem untuk mengidentifikasi sentimen berdasarkan aspek. Penelitian ini menggunakan 1500 data yang berupa review produk kecantikan pada situs femaledaily. Tahapan preproses yang dilakukan pda penelitian ini berupa cleaning, case folding, punctual removal, normalization, stopword removal, dan stemming. Penerapan ekstraksi fitur berupa TF-IDF dilakukan untuk proses pembobotan kata menjadi vector dan akan diidentifikasi menggunakan metode Extreme Gradient Boosting. Dengan menerapkan metode evaluasi confussion matrix mendapatkan total rata-rata nilai akurasi berdasarkan empat aspek produk sebesar 90%.
Collections
- Undergraduate Theses [801]