• Login
    View Item 
    •   USU-IR Home
    • Faculty of Computer Science and Information Technology
    • Department of Information Technology
    • Undergraduate Theses
    • View Item
    •   USU-IR Home
    • Faculty of Computer Science and Information Technology
    • Department of Information Technology
    • Undergraduate Theses
    • View Item
    JavaScript is disabled for your browser. Some features of this site may not work without it.

    Identifikasi Pernyataan Misogini Berbahasa Indonesia Berdasarkan Komentar Youtube Menggunakan Glove Embedding dan Random Forest Classifier

    View/Open
    Fulltext (1.406Mb)
    Date
    2021
    Author
    Damanik, Arnesa Julia
    Advisor(s)
    Nababan, Erna Budhiarti
    Purnamawati, Sarah
    Metadata
    Show full item record
    Abstract
    In today's highly connected social media world, misogyny or expressions of hatred against women can occur anytime and anywhere, even in cyberspace or online, namely in the form of comments, posts, or tweets on social media. Misogyny is prevalent on all platforms social media especially on the Youtube platform and this has become an increasingly relevant issue in recent years and becoming increasingly worrying. These expressions or statements have serious consequences for women's lives and can cause anxiety and discomfort to women. However, it is still difficult to identify such misogyny statements because of the millions of contributions that continue to increase by users on platforms social media every day, so it takes a lot of precision and time to identify misogyny statements manually. For this reason, an approach is needed to overcome these problems by building a system to identify misogyny statements. This study aims to identify misogyny statements in Indonesian based on Youtube’s comments using Glove Embedding and Random Forest Classifier. This study uses 600 data which are comments on female youtuber account in Indonesia. The preprocessing stages carried out in this study were emoji deletion, changing all words to lowercase, deletion of symbols and punctuation, normalization, deletion of stopwords, and tokenization. This study uses word embedding, namely Glove Embedding to convert all the words in the data into vectors and will be identified using the method Random Forest Classifier. The evaluation method in this study uses a confussion matrix and produces an accuracy of 92.5%. Based on the evaluation, it can be concluded that the algorithm used in this study can identify misogyny statements with good performance.
     
    Di dunia media sosial yang sangat terhubung saat ini, misogini ataupun ungkapan kebencian terhadap perempuan dapat terjadi kapanpun dan di manapun, bahkan dapat dinyatakan di ruang siber atau online, yaitu dalam bentuk komentar, posting, atau tweet pada sosial media. Misogini lazim di semua platform media sosial khususnya pada platform Youtube dan hal ini menjadi isu yang semakin relevan dalam beberapa tahun terakhir dan semakin mengkhawatirkan. Ungkapan ataupun pernyataan tersebut memiliki konsekuensi yang serius bagi kehidupan perempuan dan dapat menimbulkan keresahan dan ketidaknyamanan terhadap perempuan. Namun, masih sulit untuk mengidentifikasi pernyataan misogini tersebut karena jutaan kontribusi yang terus meningkat oleh pengguna di platform media sosial setiap hari, sehingga membutuhkan ketelitian dan waktu yang lama untuk mengidentifikasi pernyataan misogini secara manual. Untuk itu dibutuhkan pendekatan untuk mengatasi permasalahan tersebut dengan membangun sistem untuk mengidentifikasi pernyataan misogini. Penelitian ini bertujuan untuk mengidentifikasi pernyataan misogini berbahasa indonesia berdasarkan komentar Youtube menggunakan Glove Embedding dan Random Forest Classifier. Penelitian ini menggunakan 600 data yang merupakan komentar-komentar pada akun youtuber perempuan yang ada di Indonesia. Tahapan preproses yang dilakukan pada penelitian ini yaitu penghapusan emoji, pengubahan semua kata menjadi huruf kecil, penghapusan simbol dan tanda baca, normalisasi, penghapusan stopword, serta tokenisasi. Penelitian ini menggunakan word embedding yaitu Glove Embedding untuk mengubah seluruh kata yang ada dalam data menjadi vektor dan akan diidentifikasi menggunakan metode Random Forest Classifier. Metode evaluasi pada penelitian ini menggunakan confussion matrix dan menghasilkan akurasi sebesar 92,5%. Berdasarkan hasil evaluasi yang didapat, maka dapat diambil kesimpulan bahwa algoritma yang digunakan dalam penelitian ini dapat mengidentifikasi pernyataan misogini dengan performa yang baik.

    URI
    http://repositori.usu.ac.id/handle/123456789/42644
    Collections
    • Undergraduate Theses [801]

    Repositori Institusi Universitas Sumatera Utara (RI-USU)
    Universitas Sumatera Utara | Perpustakaan | Resource Guide | Katalog Perpustakaan
    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV
     

     

    Browse

    All of USU-IRCommunities & CollectionsBy Issue DateTitlesAuthorsAdvisorsKeywordsTypesBy Submit DateThis CollectionBy Issue DateTitlesAuthorsAdvisorsKeywordsTypesBy Submit Date

    My Account

    LoginRegister

    Repositori Institusi Universitas Sumatera Utara (RI-USU)
    Universitas Sumatera Utara | Perpustakaan | Resource Guide | Katalog Perpustakaan
    DSpace software copyright © 2002-2016  DuraSpace
    Contact Us | Send Feedback
    Theme by 
    Atmire NV