Kinerja Deep Learning dalam Analisis Sentimen

Manalu, Boy Utomo

View/Open

Fulltext (2.084Mb)

Date

2020

Author

Manalu, Boy Utomo

Advisor(s)

Tulus

Efendi, Syahril

Metadata

Show full item record

Abstract

Masalah analisis sentimen adalah representasi teks, yang mengkodekan teks ke dalam vektor kontinu dengan mengatur proyeksi dari semantik ke titik-titik dalam ruang dimensi tinggi. Metode pembelajaran mendalam telah banyak digunakan untuk menyelesaikan berbagai masalah analisis sentimen. Untuk meningkatkan kinerja pembelajaran mendalam dalam analisis sentimen diperlukan metode representasi teks yang baik untuk digunakan sebagai lapisan penyematan. Dalam penelitian ini menganalisis pembelajaran mendalam yaitu metode Recurrent Neural Network (RNN) dengan varian Long Short-Term Memory (LSTM), yang dibandingkan dengan RNN-LSTM dan Word2Vec sebagai embedding kata dalam klasifikasi sentimen. Data sentimen yang digunakan berasal dari ulasan-ulasan terhadap sebuah aplikasi yang disediakan pengguna di Google Play. Dalam proses pelatihan melibatkan lapisan Dropout dan Early Stopping points untuk mencegah overfitting. Hasil penelitian menunjukkan bahwa jaringan LSTM menggunakan Word embedded Word2Vec dengan dimensi 300 kata menerima nilai kesalahan rendah 0,3287 dengan akurasi 86,76%. Sedangkan hasil tes LSTM tanpa Word2Vec mendapatkan kesalahan terendah 0,3751 dengan akurasi 84,14%.

Problem of sentiment analysis is the text representation, which encodes text into a continuous vector by arranging projections from semantics to points in high dimensional space. Deep learning methods have been widely used to solve various sentiment analysis problems. To improve the performance of deep learning in sentiment analysis requires a good method of text representation to be used as an embedding layer. In this study, we analyzed deep learning with the Recurrent Neural Network (RNN) method with Long Short-Term Memory (LSTM) variants, which were compared with RNN-LSTM and Word2Vec as word embedding in sentiment classification. Sentiment data used is derived from user-provided reviews of the applications in Google Play. In the training process involves Dropout layer and Early Stopping points to prevent overfitting. The results showed that the LSTM network using word embedding Word2Vec with 300 words dimension received a low error value of 0.3287 with an accuracy of 86.76%. While the LSTM test results without Word2Vec get the lowest error of 0.3751 with an accuracy of 84.14%.

URI

http://repositori.usu.ac.id/handle/123456789/28796

Collections

Master Theses [622]