RでGoogle Analytics:検索キーワードをタグクラウドでプロット

公開日 2015-02-05

Rの解析に役に立つ記事

検索キーワードをタグクラウドでプロットで出力するコマンドを作成しました。

サイトのidとトークンファイルの取得と保存方法は「RでGoogle Analyticsの目次」から「RGoogleAnalyticsパッケージ基本的な利用方法」を確認してください。

また、解析環境が整っていない場合は「解析の準備」の項目を確認してください。初心者でも実行できるようにまとめています。

解析コマンドなどのまとめはこちらから：RでGoogle Analyticsの目次

＜おすすめのRに関する書籍です＞

多変量解析の基礎 II　主成分分析（改訂版）: 理論とRによる演習 | 古橋武 | 工学 | Kindleストア

Amazonで古橋武の多変量解析の基礎 II　主成分分析（改訂版）: 理論とRによる演習。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみいただけます。

www.amazon.co.jp

MeCabのインストール

記事を参考にしてください。

Rでウェブ解析：テキストマイニングとタグクラウド

タグクラウドでプロットで出力するコマンド

#ライブラリの読み込み
library("RGoogleAnalytics")
library("XLConnect")
library("tcltk")
library("ggplot2")
library("RMeCab")
library("wordcloud")
library("RColorBrewer")

TableID <- "ga:データを取得するサイトのidを入力"

#取得パラメータの設定
query.list <- Init(start.date = "2014-12-01",
                      end.date = "2014-12-31",
                      dimensions = "ga:keyword",
                      metrics = "ga:users",
                      max.results = 10000,
                      table.id = TableID)

#取得パラメーターを処理
query <- QueryBuilder(query.list)

#データの取得
keyWordData <- GetReportData(query, oauth_token)

#(not provided)の削除
keyWordData <- subset(keyWordData[, 1], "(not provided)" != keyWordData[, 1])

#(not set)の削除
keyWordData <- subset(keyWordData[, 1], "(not set)" != keyWordData[, 1])

#ユーザー数で並び替え
CityData <- CityData[order(CityData[, 2], decreasing = TRUE), ]

###単語の出現数設定。3以上での抽出結果となります。出現数は適時調整してください。#####
WordFreq <- 3
########

###単語解析######
res <- docMatrixDF(keyWordData, pos = c("名詞", "形容詞"))
res <- res[row.names(res)!= "[[LESS-THAN-1]]", ] #[[LESS-THAN-1]]の削除
resc <- res[row.names(res)!= "[[TOTAL-TOKENS]]", ]　#[[TOTAL-TOKENS]]の削除
########

###単語解析結果をデータフレーム化#####
AnalyticsFileDoc <- as.data.frame(apply(resc, 1, sum)) #単語の出現率を集計
AnalyticsFileDoc <- subset(AnalyticsFileDoc, AnalyticsFileDoc[, 1] >= WordFreq) #出現数で抽出
colnames(AnalyticsFileDoc) <- "出現数" #行名の設定
########

###タグクラウドのテキストの色を設定#####
Col <- brewer.pal(9, "BuGn") #文字色の指定
Col <- Col[-(1:3)] #見やすく薄い色を削除
########

###タグクラウドのプロット#####
#par(family = "HiraKakuProN-W3") #実行でMACの文字化け防止
wordcloud(row.names(AnalyticsFileDoc), AnalyticsFileDoc[, 1], scale=c(6,.2),
          random.order = T, rot.per = .15, colors = Col)
########

出力されるプロット

少しでも、あなたのウェブや実験の解析が楽になりますように！！

＜おすすめのRに関する書籍です＞

初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析(改訂第2版) | 神田善伸

Amazonで神田善伸の初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析(改訂第2版)。アマゾンならポイント還元本が多数。

＜おすすめのRに関する書籍です＞

MeCabのインストール

タグクラウドでプロットで出力するコマンド

出力されるプロット

＜おすすめのRに関する書籍です＞

関連記事