Rで解析:データセットの情報・性質一覧「profilr」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

各データのクラスやタイプだけでなく要約やTop/Bottom 5を表示するパッケージの紹介です。ふらっと、散歩に行きましたが、この時期、北海道は最高です。

出力されるデータの要約を「作業フォルダにCSVで保存する」コマンドと合わせて紹介します。ファイルはエクセルなどで読み込んでみてください。

また、札幌大通り公園では、明日9月11日(金)から10月4日(日)まで「さっぽろオータムフェスト2015」が開催されます。北海道市町村の名物料理とワインなどが集結します。札幌を訪れる方は要チェックです。美味しい食べ物を横に置き、美しい街並みの札幌で思索するのもアリかと思います。残念ながら私は散歩の時期がちょっと早かったようです。

さっぽろオータムフェスト2015
http://www.sapporo-autumnfest.jp/

パッケージのバージョン0.1.0。実行コマンドはR version 3.2.2で確認しています。


スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("profilr")

実行コマンドの紹介

使い方は非常に簡単です。

#パッケージの読み込み
library("profilr")

###データ例の作成#####
n <- 100
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
                       Data1 = sample(1:10, n, replace = TRUE),
                       Data2 = runif(n))
#####

#データの要約,Top/Bottom 5を表示:profileコマンド
DataPro <- profile(TestData)
DataPro
#データの要約
.column_name .column_class .column_type .count_elements .count_uniques .percent_uniques .count_NULLs .percent_NULLs
1        Group        factor      integer             100              5             0.05            0              0
2        Data1       integer      integer             100             10             0.10            0              0
3        Data2       numeric       double             100            100             1.00            0              0
.count_NAs .percent_NAs .count_zeroes .percent_zeros .mean_value .sd_value           .q0_value .q25_value .q50_value
1          0            0             0              0          NA        NA              Group1         NA         NA
2          0            0             0              0   5.9700000 2.9351750                   1  3.0000000  6.0000000
3          0            0             0              0   0.5394982 0.2736481 0.00828328402712941  0.3297626  0.5526151
.q75_value       .q100_value
1         NA            Group5
2  8.0000000                10
3  0.7556116 0.992955713532865

#Top/Bottom 5
.top_5_values
1  (1) Group2 [21]\n (1) Group4 [21]\n (1) Group5 [21]\n (4) Group1 [19]\n (5) Group3 [18]\n
2  (1) 10 [17]\n (2) 5 [13]\n (2) 8 [13]\n (4) 6 [11]\n (5) 2 [9]\n
3  (1) 0.00828328402712941 [1]\n (1) 0.0252241331618279 [1]\n (1) 0.031874967738986 [1]\n
(1) 0.0403659413568676 [1]\n (1) 0.0674886098131537 [1]\n
.bottom_5_values
1  (5) Group3 [18]\n (4) Group1 [19]\n (1) Group5 [21]\n (1) Group4 [21]\n (1) Group2 [21]\n
2  (10) 4 [5]\n (9) 9 [7]\n (7) 7 [8]\n (7) 1 [8]\n (5) 3 [9]\n
3  (1) 0.992955713532865 [1]\n (1) 0.979553350480273 [1]\n (1) 0.971928166225553 [1]\n
(1) 0.963768856832758 [1]\n (1) 0.949774149339646 [1]\n

#作業フォルダにファイルを保存
write.csv(DataPro, "データプロファイル.csv")

csvファイル内容

エクセルで内容を表示。

image

少しでも、あなたのウェブや実験の解析が楽になりますように。

タイトルとURLをコピーしました