Sentiment Analysis Hate Speech di Twitter Menggunakan R
Christian (52414379)
Oktaviana Prasetyanti (58414333)
Rina Hafizhah Utami (59414416)
Rizka Febrila Sari (59414588)
Pembahasan kali ini yaitu Sentiment Analysis Using R. Analisis sentimen adalah bidang ilmu yang mempelajari bagaimana menganalisa opini, sentimen, evaluasi, penilaian, sikap dan emosi dari sebuah entitas yang dapat berupa produk, pelayanan, organisasi, individu, isu-isu, peristiwa, dan topik. Analisis sentimen biasa digunakan untuk menilai kesukaan atau ketidaksukaan publik terhadap suatu barang atau jasa. Sentimen tersebut merupakan informasi tekstual yang bersifat subjektif dan memiliki polaritas positif dan negatif. Nilai polaritas ini dapat digunakan sebagai parameter dalam menentukan suatu keputusan. Disini kita menggunakan R-Programming dalam mengambil atau crawling data Twitter untuk melakukan analisa informasi dengan memanfaatkan API.
Sebelumnya, kita harus memiliki API key dan access token dari Twitter yaitu dengan membuat aplikasi pada Twitter.
Oktaviana Prasetyanti (58414333)
Rina Hafizhah Utami (59414416)
Rizka Febrila Sari (59414588)
Pembahasan kali ini yaitu Sentiment Analysis Using R. Analisis sentimen adalah bidang ilmu yang mempelajari bagaimana menganalisa opini, sentimen, evaluasi, penilaian, sikap dan emosi dari sebuah entitas yang dapat berupa produk, pelayanan, organisasi, individu, isu-isu, peristiwa, dan topik. Analisis sentimen biasa digunakan untuk menilai kesukaan atau ketidaksukaan publik terhadap suatu barang atau jasa. Sentimen tersebut merupakan informasi tekstual yang bersifat subjektif dan memiliki polaritas positif dan negatif. Nilai polaritas ini dapat digunakan sebagai parameter dalam menentukan suatu keputusan. Disini kita menggunakan R-Programming dalam mengambil atau crawling data Twitter untuk melakukan analisa informasi dengan memanfaatkan API.
Sebelumnya, kita harus memiliki API key dan access token dari Twitter yaitu dengan membuat aplikasi pada Twitter.
- Masuk ke halaman https://apps.twitter.com lalu login menggunakan akun Twitter, Create New App dan isi form berikut ini :
- Beri nama aplikasi dan deskripsinya pada kolom Name dan Description. Kemudian untuk kolom Website masukkan URL diawali http:// atau https://. Jika tidak punya website, bisa diisi dengan akun Github.
- Ceklist Yes, I agree untuk menyetujui Developer Agreement
- Kemudian klik “Create your Twitter application”.
- Langkah selanjutnya, masuk ke tab “Keys and Access Tokens”, untuk melihat Consumer Key (API key) dan Consumer Secret (API secret) dan klik tombol “Create my access token”, untuk mendapatkan access tokensnya.
- Kita sudah memiliki Consumer Key (API key), Consumer Secret (API secret), Access Token dan Access Token Secret yang digunakan untuk proses authentication nantinya.
- Tahap selanjutnya yaitu instalasi packages yang diperlukan pada R. Adapun packages yang harus diinstall yaitu :
install.packages("twitteR")
install.packages("stringr")
install.packages("xlsx")
install.packages("plyr")
Untuk melakukan mining twitter ini, hanya dibutuhkan beberapa packages penting yaitu:
- stringr
- Xlsx
8. Meload library R yang diperlukan yaitu :
9. Untuk mengambil data pada Twitter API, kita membutuhkan :
api_Key <- "isi dengan API key"
api_Secret <- "isi dengan API secret"
accessToken <- "isi dengan Access token"
accessTokenSecret <- "isi dengan Access token secret"
setup_twitter_oauth(api_key,api_secret, accessToken, accessTokenSecret
Setelah melakukan langkah ini, kita mendapatkan secure connection ke Twitter API sehingga dapat mengambil data.
Untuk mengubah directory di R kita menggunakan setwd(dir), dengan dir adalah specify path yang diinginkan.
Fungsi scan() akan memindai semua kata yang berada didalam file .txt baik kata negatif maupun positif dengan memindai karakternya.
Fungsi sentiment untuk mengubah tweet menjadi informasi yang bermanfaat dimana semua kalimat dibersihkan sehingga menjadi kata-kata yang dapat diproses untuk menemukan kata-kata apa saja yang mewakili istilah negatif dan positif. Prinsip kerja utama analisis sentimen adalah menemukan kata-kata dalam tweet yang mewakili sentimen positif dan menemukan kata-kata di tweet yang mewakili sentimen negatif.
Analisis sentimen menggunakan dua paket plyr dan stringr untuk memanipulasi string. Score dari hasil sentimen tersebut menggunakan fungsi laply untuk mengolah tweet ke dalam bentuk array, kemudian diproses untuk hasil score nya.
Keseluruhan perintah diatas adalah untuk mengolah tweet yang sudah di dapat agar dapat diperoleh hasil bersih karakter yang diinginkan, contohnya dengan menghapus tanda baca, nomor, dan sebagainya. Kemudian dari tweet yang sudah diolah dilakukan proses matching, yaitu apabila ditemukan tweet yang sesuai dengan bank kata yang terdapat di file .txt (pos & neg) maka tweet tersebut termasuk kriteria kata positif dan negatif.
Perintah diatas untuk mencari 100 tweet dalam bahasa Indonesia yang mengandung kata “jelek” atau “sampah" dan mengolah tweet yang telah ditemukan dengan fungsi sentiment untuk dinilai tingkat positif dan negatifnya.
Fungsi hist() untuk membuat histogram dari data.
Didapatkan bentuk histogram seperti gambar di bawah ini :
Untuk memindahkan hasil ke dalam bentuk excel dengan menggunakan library xlsx dan menyimpannya ke file excel bernama myResults.xlsx.
Hasil sentiment analysis hate speech dalam bahasa indonesia di Twitter dalam bentuk file xlsx.
Komentar
Posting Komentar