別名「ワードクラウド」と紹介されることもある「タグクラウド」の作成が可能な「tagcloud」パッケージを紹介します。本パッケージは、他のタグクラウド作成パッケージよりもコマンドが単純かと思います。
参考までに、2015年1月から6月に「からだにいいもの」への検索キーワードをGoogle Analyticsより取得しタグクラウドで表現するコマンドを紹介します。意外とアニメでの検索流入が多いです。アニメからRが広がらないか模索しています。
Google Analyticsとの連携は下記「目次」を参考ください。
https://www.karada-good.net/rgoogleanalyticsindex/
「tagcloud」パッケージのバージョンは0.6。R version 3.2.0でコマンドを確認しています。
実行コマンドに必要なパッケージのインストール
下記コマンドを実行してください。
#パッケージのインストール
install.packages(c("RGoogleAnalytics", "tagcloud"))
実行コマンドの紹介
詳細はコメント、過去記事ならびに各パッケージヘルプを確認してください。
#パッケージの読み込み
library("RGoogleAnalytics")
library("tagcloud")
###GoogleAnalyticsへのアクセス設定#####
#クライアントIDを設定
client.id <- "クライアントID"
#クライアントシークレットを設定
client.secret <- "クライアントシークレット"
#クライアントIDおよびシークレットのトークンを取得
oauth_token <- Auth(client.id, client.secret)
#プロファイルidを表示
GetProfiles(oauth_token)
#データを取得するプロファイルidを設定
TableID <- "ga:プロファイルid"
###取得年,月を設定#####
year <- 2015 #取得したい年を設定
month <- 1:6 #取得したい月を開始:終了で設定
########
#繰返し用
###取得年,月のベクトルを作成#####
StartDate <- as.Date(paste(year, "-", formatC(head(month, 1), width = 2, flag="0"), "-01", sep = ""))
EndDate <- as.Date(paste(year, "-", formatC(tail(month, 1), width = 2, flag="0"), "-01", sep = ""))
########
##キーワードに対するセッションあたりのページビュー数を取得#####
Dimensions <- c("ga:keyword")
Metrics <- c("ga:pageviewsPerSession")
#取得パラメータの設定
query.list <- Init(start.date = as.character(StartDate),
end.date = as.character(EndDate),
dimensions = Dimensions,
metrics = Metrics,
max.results = 10000,
table.id = TableID)
#取得パラメーターを処理
query <- QueryBuilder(query.list)
#データの取得
AccessData <- GetReportData(query, oauth_token)
#キーワードに対するセッションあたりのページビュー数Top100を抽出
AccessData <- head(AccessData[order(AccessData[, 2], decreasing = TRUE),], 100)
#色の設定
#キーワードに対するセッションあたりのページビュー数を基準
#少から多い順に色を指定
palf <- colorRampPalette(c("red", "#a87963", "gray", "#4b61ba"))
colors <- smoothPalette(AccessData[, 2], palfunc = palf)
#Macでの日本語文字化防止
par(family = "HiraKakuProN-W3")
#普通にプロット
#algorithmオプション:"oval","fill","snake","random","list","clist"
#初期値は"oval"です。
tagcloud(AccessData[, 1], weights = AccessData[, 2],
col = colors, order = "size", algorithm = "oval")
#algorithmオプション:"clist"を設定
#キーワードに対するセッションあたりのページビュー数Top20
tagcloud(AccessData[, 1][1:20], weights = AccessData[, 2][1:20],
col = colors[1:20], order = "size", algorithm = "clist")
出力例
・普通にプロット

・algorithmオプション:”clist”を設定

少しでも、あなたのウェブや実験の解析が楽になりますように!!