RでGoogle Analytics:検索キーワードをタグクラウドでプロット


検索キーワードをタグクラウドでプロットで出力するコマンドを作成しました。

サイトのidとトークンファイルの取得と保存方法は「RでGoogle Analyticsの目次」から「RGoogleAnalyticsパッケージ基本的な利用方法」を確認してください。

また、解析環境が整っていない場合は「解析の準備」の項目を確認してください。初心者でも実行できるようにまとめています。

解析コマンドなどのまとめはこちらから:RでGoogle Analyticsの目次


MeCabのインストール

記事を参考にしてください。

Rでウェブ解析:テキストマイニングとタグクラウド


タグクラウドでプロットで出力するコマンド

#ライブラリの読み込み
library("RGoogleAnalytics")
library("XLConnect")
library("tcltk")
library("ggplot2")
library("RMeCab")
library("wordcloud")
library("RColorBrewer")

TableID <- "ga:データを取得するサイトのidを入力" #取得パラメータの設定 query.list <- Init(start.date = "2014-12-01", end.date = "2014-12-31", dimensions = "ga:keyword", metrics = "ga:users", max.results = 10000, table.id = TableID) #取得パラメーターを処理 query <- QueryBuilder(query.list) #データの取得 keyWordData <- GetReportData(query, oauth_token) #(not provided)の削除 keyWordData <- subset(keyWordData[, 1], "(not provided)" != keyWordData[, 1]) #(not set)の削除 keyWordData <- subset(keyWordData[, 1], "(not set)" != keyWordData[, 1]) #ユーザー数で並び替え CityData <- CityData[order(CityData[, 2], decreasing = TRUE), ] ###単語の出現数設定。3以上での抽出結果となります。出現数は適時調整してください。##### WordFreq <- 3 ######## ###単語解析###### res <- docMatrixDF(keyWordData, pos = c("名詞", "形容詞")) res <- res[row.names(res)!= "[[LESS-THAN-1]]", ] #[[LESS-THAN-1]]の削除 resc <- res[row.names(res)!= "[[TOTAL-TOKENS]]", ] #[[TOTAL-TOKENS]]の削除 ######## ###単語解析結果をデータフレーム化##### AnalyticsFileDoc <- as.data.frame(apply(resc, 1, sum)) #単語の出現率を集計 AnalyticsFileDoc <- subset(AnalyticsFileDoc, AnalyticsFileDoc[, 1] >= WordFreq) #出現数で抽出 colnames(AnalyticsFileDoc) <- "出現数" #行名の設定 ######## ###タグクラウドのテキストの色を設定##### Col <- brewer.pal(9, "BuGn") #文字色の指定 Col <- Col[-(1:3)] #見やすく薄い色を削除 ######## ###タグクラウドのプロット##### #par(family = "HiraKakuProN-W3") #実行でMACの文字化け防止 wordcloud(row.names(AnalyticsFileDoc), AnalyticsFileDoc[, 1], scale=c(6,.2), random.order = T, rot.per = .15, colors = Col) ######## [/code]


出力されるプロット

Rplot01


少しでも、あなたのウェブや実験の解析が楽になりますように!!

スポンサードリンク

関連コンテンツ


スポンサードリンク