Membuat Program Sentimen Analisis menggunakan Twitter API
Untuk membuat program sentiment
analisis ini, kita membutuhkan secure authorized request ke twitter API, cara
membuatnya adalah pergi ke laman http://apps.twitter.com
lalu login dengan twitter dan create new application
Selanjutnya kita akan
membuat program sentiment analisis ini dengan bahasa R, software yang digunakan
disini adalah RStudio
Buka RStudio lalu install
package berikut :
install.packages(twitteR)
install.packages(ROAuth)
install.packages(plyr)
install.packages(RCurl)
install.packages(wordcloud)
install.packages(corpus)
install.packages(tm)
Packages twitteR adalah
package yang utama, karena package tersebut merupakan package official dari
twitter yang digunakan untuk mengakses twitter API, sisanya merupakan package
pendukung yang akan digunakan untuk mining data dari twitter. Setelah package
terinstall, selanjutnya gunakan perintah require pada masing-masing package
untuk mengaktifkan package yang telah terinstall dan akan digunakan.
require(twitteR)
require(ROAuth)
require(plyr)
require(RCurl)
require(wordcloud)
require(corpus)
require(tm)
Selanjutnya kita masukkan
consumer key, consumer key secret, access token, dan access token secret agar
terhubung dengan app yang telah kita buat tadi untuk mengakses twitter API. Untuk
mengecek consumer key, dkk bisa dilihat di tab keys and access tokens di app
kita tadi.
consumer_key <- “insert
your consumer key”
consumer_secret
<- “insert your consumer secret”
access_token <- “insert
your access token”
access_secret <- “insert
your access token secret”
setup_twitter_oauth(consumer_key,consumer_secret,access_token,access_secret)
Setup_twitter_oauth
digunakan untuk mengakses token dan kode yang telah kita masukkan tadi dan
mengauthentikasinya apakah valid atau tidak kode tersebut.
Selanjutnya kita akan
memulai proses mining tweet pada twitter
miningtweets <-
searchTwitter('ahok+muslim', lang = "id", n=500, resultType =
"recent")
kita akan mencari tweet yang
berhubungan dengan ahok dan muslim, karena kelompok kami mengangkat tema SARA
sesuai dengan kasus yang pernah popular di beberapa bulan yang lalu, lalu tweet
tersebut dicari dengan bahasa Indonesia dengan jumlah tweet 500 dan tipenya
adalah recent (sekarang/terbaru)
lalu kita konversi tweet
tersebut ke dalam text dan tampilkan semua tweet yang telah kita mining
miningtweets <-
sapply(miningtweets,function(x)x$getText())
str(miningtweets)
sara <-
Corpus(VectorSource(miningtweets))
inspect(sara)
kemudian akan muncul seperti
ini
Selanjutnya kita akan
menghilangkan tanda baca, angka, spasi dan kata kunci yang kita gunakan untuk
mendapatkan kata-kata dari tweet yang telah kita mining
sara_clear
<- tm_map(sara,removePunctuation)
sara_clear
<- tm_map(sara_clear,removeNumbers)
sara_clear
<- tm_map(sara_clear,stripWhitespace)
sara_clear
<- tm_map(sara_clear,removeWords,c("ahok","muslim"))
Kemudian kita munculkan
kata-kata yang telah kita bersihkan tadi
wordcloud(sara_clear)
Seperti ini hasilnya
By : Kelompok 8 Mata Kuliah
Pengantar Algoritma Deep Learning
- Puja Putralaksana- Widia Tripurnamasari
- Joaoginho
- Hafidz Haque
4IA10
Comments
Post a Comment