Text
SKRIPSI ANALISIS SENTIMEN PADA MEDIA SOSIAL X MENGGUNAKAN ALGORITMA NAÏVE BAYES DENGAN KOMBINASI FITUR HYBRID TF-IDF DAN WORD EMBEDDING
Karakteristik data pada media sosial X yang tidak terstruktur dan informal menjadi
tantangan utama dalam analisis sentimen. Fenomena penggunaan tagar
#KaburAjaDulu di media sosial X mencerminkan dinamika opini publik terhadap
kondisi sosial, ekonomi, dan kebijakan di Indonesia, yang memunculkan beragam
opini publik. Analisis sentimen terhadap unggahan dengan tagar tersebut menjadi
penting untuk memahami kecenderungan opini masyarakat secara komprehensif
dan berbasis data. Penelitian ini bertujuan mengevaluasi performa algoritma Naïve
Bayes dengan mengusulkan pendekatan fitur Hybrid (gabungan TF-IDF dan
Word2Vec) pada studi kasus tagar #kaburajadulu. Data penelitian sebanyak 13.587
unggahan diproses melalui tahapan preprocessing sistematis yang meliputi case
folding, cleaning, serta normalisasi 15.000 kata slang. Reduksi morfologi dilakukan
melalui tokenization dan stemming Sastrawi untuk penyesuaian dengan kamus Inset
lexicon pada tahap pelabelan otomatis. Hybrid sampling SMOTE-Tomek Links
diterapkan untuk mengatasi dominasi kelas negatif (82,2%) pada data latih guna
mempertajam batas keputusan antar kelas. Hasil pengujian pada pembagian data
80:20 menunjukkan bahwa skenario TF-IDF dengan Multinomial Naïve Bayes
mencapai performa terbaik dengan akurasi 77%. Sebaliknya, fitur Hybrid
memberikan akurasi terendah sebesar 70% karena dimensi fitur yang tinggi justru
menimbulkan noise (curse of dimensionality). Penelitian ini menyimpulkan bahwa
representasi statistik TF-IDF lebih efektif dan stabil dibandingkan fitur semantik
maupun Hybrid untuk klasifikasi sentimen pada data dengan karakteristik linguistik
spesifik seperti tagar #kaburajadulu.
Tidak tersedia versi lain