RでGoogle Analytics:検索キーワードをタグクラウドでプロット


検索キーワードをタグクラウドでプロットで出力するコマンドを作成しました。

サイトのidとトークンファイルの取得と保存方法は「RでGoogle Analyticsの目次」から「RGoogleAnalyticsパッケージ基本的な利用方法」を確認してください。

また、解析環境が整っていない場合は「解析の準備」の項目を確認してください。初心者でも実行できるようにまとめています。

解析コマンドなどのまとめはこちらから:RでGoogle Analyticsの目次


MeCabのインストール

記事を参考にしてください。

Rでウェブ解析:テキストマイニングとタグクラウド


タグクラウドでプロットで出力するコマンド

#ライブラリの読み込み
library("RGoogleAnalytics")
library("XLConnect")
library("tcltk")
library("ggplot2")
library("RMeCab")
library("wordcloud")
library("RColorBrewer")

TableID <- "ga:データを取得するサイトのidを入力"

#取得パラメータの設定
query.list <- Init(start.date = "2014-12-01",
                   end.date = "2014-12-31",
                   dimensions = "ga:keyword",
                   metrics = "ga:users",
                   max.results = 10000,
                   table.id = TableID)

#取得パラメーターを処理
query <- QueryBuilder(query.list)

#データの取得
keyWordData <- GetReportData(query, oauth_token)

#(not provided)の削除
keyWordData <- subset(keyWordData[, 1], "(not provided)" != keyWordData[, 1])

#(not set)の削除
keyWordData <- subset(keyWordData[, 1], "(not set)" != keyWordData[, 1])

#ユーザー数で並び替え
CityData <- CityData[order(CityData[, 2], decreasing = TRUE), ]

###単語の出現数設定。3以上での抽出結果となります。出現数は適時調整してください。#####
WordFreq <- 3
########

###単語解析######
res <- docMatrixDF(keyWordData, pos = c("名詞", "形容詞"))
res <- res[row.names(res)!= "[[LESS-THAN-1]]", ] #[[LESS-THAN-1]]の削除
resc <- res[row.names(res)!= "[[TOTAL-TOKENS]]", ] #[[TOTAL-TOKENS]]の削除
########

###単語解析結果をデータフレーム化#####
AnalyticsFileDoc <- as.data.frame(apply(resc, 1, sum)) #単語の出現率を集計
AnalyticsFileDoc <- subset(AnalyticsFileDoc, AnalyticsFileDoc[, 1] >= WordFreq) #出現数で抽出
colnames(AnalyticsFileDoc) <- "出現数" #行名の設定
########

###タグクラウドのテキストの色を設定#####
Col <- brewer.pal(9, "BuGn") #文字色の指定
Col <- Col[-(1:3)] #見やすく薄い色を削除
########

###タグクラウドのプロット#####
#par(family = "HiraKakuProN-W3") #実行でMACの文字化け防止
wordcloud(row.names(AnalyticsFileDoc), AnalyticsFileDoc[, 1], scale=c(6,.2),
          random.order = T, rot.per = .15, colors = Col)
########

出力されるプロット

Rplot01


少しでも、あなたのウェブや実験の解析が楽になりますように!!

スポンサードリンク

おすすめコンテンツ


スポンサードリンク