dc.contributor.advisor | Zarlis, Muhammad | |
dc.contributor.advisor | Mawengkang, Herman | |
dc.contributor.advisor | Efendi, Syahril | |
dc.contributor.author | Wahyudi, Mochamad | |
dc.date.accessioned | 2021-11-11T07:28:23Z | |
dc.date.available | 2021-11-11T07:28:23Z | |
dc.date.issued | 2021 | |
dc.identifier.uri | https://repositori.usu.ac.id/handle/123456789/45577 | |
dc.description.abstract | Undoubtedly that the huge business data could make data analysis becomes more
complicated such that the decision making process would be out of reach. This
condition happens in the fields of consumer buying behaviour. Sentiment analysis
is a method of processing information to determine the customer opinion and
responses in the form of text or responses received from social media sources. It is
a process of identifying and categorizing the opinions of customers in the text
format. It is also known as opinion mining. It determines whether the contents of
documents are either in positive or in negative sense. It also describes that how
customer feels towards any particular product, brand or any other thing. One of
the approach in solving the sentiment analysis is feature selection technique. The
main target of feature selection is to choose relevant features from a large feature
set. However this technique contains a combinatorial behaviour and the analysis of
the huge data can experience uncertainty parameter. This dissertation addresses
an optimization model for solving the sentiment analysis based on feature selection
approach using a stochastic combinatorial programming. From the optimization
point of view, feature selection is a difficult combinatorial optimization problem.
Firstly, since the size of the feature subset is not known a priori, the dimensionality
of the decision space is non-reducible. Secondly, since the features may have
complementary or contradictory interactions with each other, the decision space is
non-separable. Thus, given an m-dimensional feature set, the number of all possible
feature subsets is as large as 2m, which makes it very unlikely (if not impossible) to
solve it with traditional exhaustive search approaches. This paper proposes a new
metaheuristic approach based on the movement of non basic variables, which starts
from exploring the decision space to get the feasible integer point. As a
computational experience a dataset taken from people’s comment about the
advertisement of Universitas Bina Sarana Informatika was analyzed. | en_US |
dc.description.abstract | Tidak diragukan lagi, besarnya data bisnis dapat membuat analisis data menjadi
lebih rumit sehingga proses pengambilan keputusan menjadi tidak terjangkau.
Kondisi ini terjadi pada bidang perilaku pembelian konsumen. Analisis sentimen
(sentiment analysis) merupakan metode pengolahan informasi untuk mengetahui
pendapat dan tanggapan pelanggan berupa teks atau tanggapan yang diterima dari
sumber media sosial. Ini adalah proses mengidentifikasi dan mengkategorikan
pendapat pelanggan dalam format teks. Ini juga dikenal sebagai penambangan opini
(opinion mining). Ini menentukan apakah isi dokumen baik dalam arti positif atau
negatif. Ini juga menggambarkan bagaimana perasaan pelanggan terhadap produk,
merek, atau hal lain apa pun. Salah satu pendekatan dalam menyelesaikan analisis
sentimen (sentiment analysis) adalah teknik pemilihan fitur (feature selection
technique). Target utama pemilihan fitur adalah memilih fitur yang relevan dari
sekumpulan fitur yang besar. Namun teknik ini mengandung perilaku
kombinatorial dan analisis data yang sangat besar dapat mengalami parameter
ketidakpastian. Disertasi ini membahas model optimasi untuk menyelesaikan
analisis sentimen (sentiment analysis) berdasarkan pendekatan pemilihan fitur
(feature selection) menggunakan pemrograman kombinatorial stokastik (stochastic
combinatorial programming). Dari sudut pandang optimasi, pemilihan fitur
(feature selection) adalah masalah optimasi kombinatorial yang sulit. Pertama,
karena ukuran subset fitur tidak diketahui secara apriori, maka dimensi ruang
keputusan tidak dapat direduksi. Kedua, karena fitur mungkin memiliki interaksi
yang saling melengkapi atau kontradiktif satu sama lain, ruang keputusan tidak
dapat dipisahkan. Jadi, dengan adanya himpunan fitur berdimensi-m, jumlah semua
subset fitur yang mungkin adalah sebesar 2m, yang membuatnya sangat tidak
mungkin (jika bukan tidak mungkin) untuk menyelesaikannya dengan pendekatan
pencarian lengkap tradisional. Penelitian ini mengusulkan pendekatan
metaheuristik baru berdasarkan pergerakan variabel non-dasar, yang dimulai dari
mengeksplorasi ruang keputusan hingga mendapatkan titik integer yang layak.
Sebagai pengalaman komputasi, dataset yang diambil untuk dianalisis adalah
komentar dari account media sosial (Facebook, Instagram dan Twitter) Universitas
Bina Sarana Informatika. | en_US |
dc.language.iso | id | en_US |
dc.publisher | Universitas Sumatera Utara | en_US |
dc.subject | Machine Learning | en_US |
dc.subject | Classification | en_US |
dc.subject | Combinatorial Optimization | en_US |
dc.subject | Metaheuristics | en_US |
dc.title | Pendekatan Optimisasi Stokastik Kombinatorial untuk Analisis Sentimen di Media Sosial Berdasarkan Teknik Pemilihan Fitur | en_US |
dc.type | Thesis | en_US |
dc.identifier.nim | NIM188123013 | |
dc.description.pages | 138 Halaman | en_US |
dc.description.type | Disertasi Doktor | en_US |