各データのクラスやタイプだけでなく要約やTop/Bottom 5を表示するパッケージの紹介です。ふらっと、散歩に行きましたが、この時期、北海道は最高です。
出力されるデータの要約を「作業フォルダにCSVで保存する」コマンドと合わせて紹介します。ファイルはエクセルなどで読み込んでみてください。
また、札幌大通り公園では、明日9月11日(金)から10月4日(日)まで「さっぽろオータムフェスト2015」が開催されます。北海道市町村の名物料理とワインなどが集結します。札幌を訪れる方は要チェックです。美味しい食べ物を横に置き、美しい街並みの札幌で思索するのもアリかと思います。残念ながら私は散歩の時期がちょっと早かったようです。
さっぽろオータムフェスト2015
http://www.sapporo-autumnfest.jp/
パッケージのバージョン0.1.0。実行コマンドはR version 3.2.2で確認しています。
パッケージのインストール
下記コマンドを実行してください。
#パッケージのインストール
install.packages("profilr")
実行コマンドの紹介
使い方は非常に簡単です。
#パッケージの読み込み
library("profilr")
###データ例の作成#####
n <- 100
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
Data1 = sample(1:10, n, replace = TRUE),
Data2 = runif(n))
#####
#データの要約,Top/Bottom 5を表示:profileコマンド
DataPro <- profile(TestData)
DataPro
#データの要約
.column_name .column_class .column_type .count_elements .count_uniques .percent_uniques .count_NULLs .percent_NULLs
1 Group factor integer 100 5 0.05 0 0
2 Data1 integer integer 100 10 0.10 0 0
3 Data2 numeric double 100 100 1.00 0 0
.count_NAs .percent_NAs .count_zeroes .percent_zeros .mean_value .sd_value .q0_value .q25_value .q50_value
1 0 0 0 0 NA NA Group1 NA NA
2 0 0 0 0 5.9700000 2.9351750 1 3.0000000 6.0000000
3 0 0 0 0 0.5394982 0.2736481 0.00828328402712941 0.3297626 0.5526151
.q75_value .q100_value
1 NA Group5
2 8.0000000 10
3 0.7556116 0.992955713532865
#Top/Bottom 5
.top_5_values
1 (1) Group2 [21]\n (1) Group4 [21]\n (1) Group5 [21]\n (4) Group1 [19]\n (5) Group3 [18]\n
2 (1) 10 [17]\n (2) 5 [13]\n (2) 8 [13]\n (4) 6 [11]\n (5) 2 [9]\n
3 (1) 0.00828328402712941 [1]\n (1) 0.0252241331618279 [1]\n (1) 0.031874967738986 [1]\n
(1) 0.0403659413568676 [1]\n (1) 0.0674886098131537 [1]\n
.bottom_5_values
1 (5) Group3 [18]\n (4) Group1 [19]\n (1) Group5 [21]\n (1) Group4 [21]\n (1) Group2 [21]\n
2 (10) 4 [5]\n (9) 9 [7]\n (7) 7 [8]\n (7) 1 [8]\n (5) 3 [9]\n
3 (1) 0.992955713532865 [1]\n (1) 0.979553350480273 [1]\n (1) 0.971928166225553 [1]\n
(1) 0.963768856832758 [1]\n (1) 0.949774149339646 [1]\n
#作業フォルダにファイルを保存
write.csv(DataPro, "データプロファイル.csv")
csvファイル内容
エクセルで内容を表示。

少しでも、あなたのウェブや実験の解析が楽になりますように。