HOME/Articles/

RでWebスクレイピング11(gtrendsRで「某首相補佐官」と「某厚生労働省大臣官房審議官」)

Article Outline

RでWebスクレイピング10(gtrendsRで「某首相補佐官」と「某厚生労働省大臣官房審議官」)

某首相補佐官と、某厚生労働省大臣官房審議官の○倫報道があったので調べてみました。

interest_over_time

Last seven days

huri01

思った以上に○倫報道された女性に関する情報を求めていることがわかります。
○倫報道された男性に比べて2倍以上は検索されているようです。

Rコード

Last seven days

interest_over_time

「某首相補佐官」と「某厚生労働省大臣官房審議官」

今回は、キーワードが2つですのでggplot2パッケージを使ったほうが楽にグラフにできます。

  • legendを一部伏せ字にするためにscale_fill_manualを使用(labelsの順序に気をつける)

  • 下の隙間をなくすためにscale_y_continuousを使用。

    日本時間に直すためにdateに9時間(9×60×60 秒)加えます。

#devtools::install_github("PMassicotte/gtrendsR")
library(gtrendsR)
library(ggplot2)
library(xts)
# 一部伏せ字(検索するときには氏名を入れています)
gtr <- gtrends(c("○坪 ○子","和○ 洋○"), geo ="JP",time="now 7-d")
### interest_over_time
#簡単にグラフにできる
#plot(gtr)
# ggplot2を使って棒グラフ
# キーワードを複数にしている場合 ketword 項目もdatに入れる
# 今回はデータのhits項目に"<1" (1未満)がみられるので"<"を取り除く
dat<-gtr[[1]][,c("date", "hits","keyword")]
dat$hits<-as.numeric(gsub("<","",dat$hits))
# xtsクラスへ
dat.xts <- xts(dat[,-1], strptime(dat$date, "%Y-%m-%d %H:%M:%S"))
# 日本時間に直すために9時間(9*60*60 秒)加える
index(dat.xts)<-index(dat.xts)+9*60*60
#
g <- ggplot(dat,aes (x =date,y =as.numeric(hits),fill = keyword ))
g <- g + geom_bar(stat = "identity",position = "dodge")
# 下の隙間をなくす。
g <- g + scale_y_continuous(expand =c(0,0),limits=c(0,max(df$hits)*1.01),breaks = seq(0,100,20),labels = seq(0,100,20)) 
g <- g + theme_bw()
# labelsの順序は ○坪寛○ が先。
g <- g + scale_fill_manual(labels = c("○坪寛○","○泉洋○"), values = c("red","green")) 
g <- g + labs(x="",y="",title="ピーク時を100としたときの検索割合の推移(キーワード:大○ ○子 , 和○ ○人)")
#png("huri01.png",width=1000,height=800)
g
#dev.off()