Identifikasi Pernyataan Misogini Berbahasa Indonesia Berdasarkan Komentar Youtube Menggunakan Glove Embedding dan Random Forest Classifier
View/ Open
Date
2021Author
Damanik, Arnesa Julia
Advisor(s)
Nababan, Erna Budhiarti
Purnamawati, Sarah
Metadata
Show full item recordAbstract
In today's highly connected social media world, misogyny or expressions of hatred
against women can occur anytime and anywhere, even in cyberspace or online, namely
in the form of comments, posts, or tweets on social media. Misogyny is prevalent on all
platforms social media especially on the Youtube platform and this has become an
increasingly relevant issue in recent years and becoming increasingly worrying. These
expressions or statements have serious consequences for women's lives and can cause
anxiety and discomfort to women. However, it is still difficult to identify such misogyny
statements because of the millions of contributions that continue to increase by users on
platforms social media every day, so it takes a lot of precision and time to identify
misogyny statements manually. For this reason, an approach is needed to overcome
these problems by building a system to identify misogyny statements. This study aims
to identify misogyny statements in Indonesian based on Youtube’s comments using
Glove Embedding and Random Forest Classifier. This study uses 600 data which are
comments on female youtuber account in Indonesia. The preprocessing stages carried
out in this study were emoji deletion, changing all words to lowercase, deletion of
symbols and punctuation, normalization, deletion of stopwords, and tokenization. This
study uses word embedding, namely Glove Embedding to convert all the words in the
data into vectors and will be identified using the method Random Forest Classifier. The
evaluation method in this study uses a confussion matrix and produces an accuracy of
92.5%. Based on the evaluation, it can be concluded that the algorithm used in this study
can identify misogyny statements with good performance. Di dunia media sosial yang sangat terhubung saat ini, misogini ataupun ungkapan
kebencian terhadap perempuan dapat terjadi kapanpun dan di manapun, bahkan dapat
dinyatakan di ruang siber atau online, yaitu dalam bentuk komentar, posting, atau tweet
pada sosial media. Misogini lazim di semua platform media sosial khususnya pada
platform Youtube dan hal ini menjadi isu yang semakin relevan dalam beberapa tahun
terakhir dan semakin mengkhawatirkan. Ungkapan ataupun pernyataan tersebut
memiliki konsekuensi yang serius bagi kehidupan perempuan dan dapat menimbulkan
keresahan dan ketidaknyamanan terhadap perempuan. Namun, masih sulit untuk
mengidentifikasi pernyataan misogini tersebut karena jutaan kontribusi yang terus
meningkat oleh pengguna di platform media sosial setiap hari, sehingga membutuhkan
ketelitian dan waktu yang lama untuk mengidentifikasi pernyataan misogini secara
manual. Untuk itu dibutuhkan pendekatan untuk mengatasi permasalahan tersebut
dengan membangun sistem untuk mengidentifikasi pernyataan misogini. Penelitian ini
bertujuan untuk mengidentifikasi pernyataan misogini berbahasa indonesia berdasarkan
komentar Youtube menggunakan Glove Embedding dan Random Forest Classifier.
Penelitian ini menggunakan 600 data yang merupakan komentar-komentar pada akun
youtuber perempuan yang ada di Indonesia. Tahapan preproses yang dilakukan pada
penelitian ini yaitu penghapusan emoji, pengubahan semua kata menjadi huruf kecil,
penghapusan simbol dan tanda baca, normalisasi, penghapusan stopword, serta
tokenisasi. Penelitian ini menggunakan word embedding yaitu Glove Embedding untuk
mengubah seluruh kata yang ada dalam data menjadi vektor dan akan diidentifikasi
menggunakan metode Random Forest Classifier. Metode evaluasi pada penelitian ini
menggunakan confussion matrix dan menghasilkan akurasi sebesar 92,5%. Berdasarkan
hasil evaluasi yang didapat, maka dapat diambil kesimpulan bahwa algoritma yang
digunakan dalam penelitian ini dapat mengidentifikasi pernyataan misogini dengan
performa yang baik.
Collections
- Undergraduate Theses [801]