Seminar Universitas PGRI Semarang, MATHEMATICS AND SCIENCES FORUM II 2016

Font Size: 
Penerapan Algoritma K-Means dengan Seleksi Fitur Information Gain Untuk Optimasi Analisis Sentimen Movie Review
Setyo Budi

Last modified: 2016-11-04

Abstract


Keberadaan website memberikan kemudahan dan kebebasan bagi manusia untukmenyampaikan informasi dan pendapatnya, yang kemudian tersimpan didalam kumpulan dokumen. Dalam kurun waktu yang lama kumpulan dokumen teks bertambah besar, sehingga ada pemikiran untuk melakukan penggalian dokumen.Analisis sentimen merupakan salah satu metode penggalian dokumen teks, dimana terdapat proses memahami, mengekstrak, dan mengolah informasi tekstual secara otomatis.Banyak penelitian analisis sentimen menggunakanalgoritma yang berbeda baik yang supervised learning atau unsupervised learning. Hal inidisebabkan karena perbedaan akurasinya dan kecepatannya.Dokumen teks yang berasal dari website masih terdapat atribut yang tidak relevan yang digunakan pada dataset, sehingga dibutuhkan seleksi fitur.Seleksi fitur yang digunakan di penelitian ini adalah Information Gain(IG). Hasil pengujian algoritma K-Means tanpa seleksi fitur Information Gain dengan dataset 300 dokumen negatif dan positif akurasinya masih rendah yaitu 57.83%, setelah menggunakan seleksi fitur Information Gain akurasinya naik menjadi 78.67%. Pengujian dengan dataset 700 dokumen review negatif dan positif tanpa seleksi fitur akurasinya 56.71%, setelah menggunakan seleksi fitur menjadi 72.79%, selanjutnya untuk dataset 1000 dokumen review negatif dan positif akurasi K-Means tanpa seleksi fitur akurasinya 50.40%, setelah menggunakan seleksi fitur akurasinya 72.15%. Sehingga dengan model yang peneliti usulkan, algoritma K-Means menggunakan seleksi fitur Information Gain dapat meningkatkan optimasi analisis sentimen movie review.Tetapi sesuai hasil pemgujian model ada kelemahan algoritma K-Means yaitu semakin besar dataset yang digunakan semakin menurun akurasinya..

 

Kata Kunci : Analisis Sentimen, K-Means, Information Gain


Full Text: PDF