Dalam menganalisis sentimen, saya menggunakan 1900 data yang saya kumpulkan melalui teknik web scraping dari Twitter, dengan menggunakan JavaScript. Saya memanfaatkan fitur pencarian di Twitter, yang terintegrasi dalam sebuah program Node.js. Data yang saya ambil berkaitan dengan kata kunci 'partai', dan saya mengumpulkannya mulai dari tanggal 1 Februari 2024 hingga 14 Februari 2024. Saya merasa periode ini sangat tepat karena bersamaan dengan masa kampanye politik dan pemilihan umum, sehingga memberikan gambaran yang cukup representatif.

Setelah melakukan proses data scraping, dilakukan preprocessing data dan cleaning. Dari data awal yang berjumlah 1900 entri, saya berhasil menfilter menjadi 1817 entri yang layak untuk diolah lebih lanjut. Data tersebut Kemudian di labeling secara manual didampingi oleh Afiatul Muthmainnah S.pd,Gr yaitu guru bahasa Indonesia dari SMAN 1 Kalisat. dengan data train sejumlah 1305 dan data test yaitu 514 dengan perbandingan 70:30

Setelah dilakukan analisis lebih lanjut, ditemukan bahwa data tersebukkan hasil sentimen yang dominan terhadap partai politik adalah sentimen negatif. jumlah sentimen negatif mencapai 917 data, sementara sentimen positif sebanyak 383 data, dan sentimen netral sebanyak 517 data. Hal ini juga tergambar dalam diagram lingkaran (pie chart), yang menunjukkan bahwa persentase sentimen negatif mencapai 50,47%, diikuti oleh sentimen positif sebesar 21,08%, dan sentimen netral sebesar 28,45%.

Setelah melakukan klasifikasi menggunakan metode Naive Bayes, saya menambahkan sebuah parameter tambahan dalam klasifikasi, yaitu klasifikasi terindikasi buzzer. Di sini, ketika seorang buzzer melakukan tweet positif atau negatif terhadap partai politik yang telah diolah dengan menggunakan Naive Bayes lebih dari 4 kali , maka tweet tersebut dianggap sebagai terindikasi buzzer. Keputusan ini diambil dengan pertimbangan jumlah data yang tersedia dan hasil dari proses reprocessing data.

Berikut adalah word cloud yang menampilkan kata-kata yang sering muncul dalam data.yang terbagi dalam 3 kategori yaitu positif, negatif, dan netral.s



Hasil klasifikasi terindikasi buzzer dapat dilihat dalam diagram batang (bar chart). Dari hasil tersebut, terlihat bahwa jumlah tweet yang terindikasi sebagai buzzer, baik positif maupun negatif, relatif sedikit dibandingkan dengan jumlah tweet yang bukan dari buzzer. Dari kesimpulan ini, dapat disimpulkan bahwa data yang terindikasi sebagai buzzer tidak cukup signifikan untuk mengubah sentimen yang sudah ada.

dan Untuk visualisasi data terakhir menggunakan line chart, kita dapat memperlihatkan bagaimana pergerakan sentimen setiap harinya. Ini memungkinkan untuk memantau secara visual perubahan sentimen dari waktu ke waktu. Dengan menggunakan line chart, kita dapat melihat tren apakah sentimen terhadap partai politik mengalami peningkatan, penurunan, atau stabil dari hari ke hari selama periode waktu yang diteliti.