Rで解析:データセットの情報・性質一覧「profilr」パッケージ

各データのクラスやタイプだけでなく要約やTop/Bottom 5を表示するパッケージの紹介です。ふらっと、散歩に行きましたが、この時期、北海道は最高です。

出力されるデータの要約を「作業フォルダにCSVで保存する」コマンドと合わせて紹介します。ファイルはエクセルなどで読み込んでみてください。

また、札幌大通り公園では、明日9月11日(金)から10月4日(日)まで「さっぽろオータムフェスト2015」が開催されます。北海道市町村の名物料理とワインなどが集結します。札幌を訪れる方は要チェックです。美味しい食べ物を横に置き、美しい街並みの札幌で思索するのもアリかと思います。残念ながら私は散歩の時期がちょっと早かったようです。

さっぽろオータムフェスト2015
http://www.sapporo-autumnfest.jp/

パッケージのバージョン0.1.0。実行コマンドはR version 3.2.2で確認しています。


パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("profilr")

実行コマンドの紹介

使い方は非常に簡単です。

#パッケージの読み込み
library("profilr")

###データ例の作成#####
n <- 100
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
                       Data1 = sample(1:10, n, replace = TRUE),
                       Data2 = runif(n))
#####

#&#12487;&#12540;&#12479;&#12398;&#35201;&#32004;,Top/Bottom 5&#12434;&#34920;&#31034;:profile&#12467;&#12510;&#12531;&#12489;
DataPro <- profile(TestData)
DataPro
#&#12487;&#12540;&#12479;&#12398;&#35201;&#32004;
.column_name .column_class .column_type .count_elements .count_uniques .percent_uniques .count_NULLs .percent_NULLs
1        Group        factor      integer             100              5             0.05            0              0
2        Data1       integer      integer             100             10             0.10            0              0
3        Data2       numeric       double             100            100             1.00            0              0
.count_NAs .percent_NAs .count_zeroes .percent_zeros .mean_value .sd_value           .q0_value .q25_value .q50_value
1          0            0             0              0          NA        NA              Group1         NA         NA
2          0            0             0              0   5.9700000 2.9351750                   1  3.0000000  6.0000000
3          0            0             0              0   0.5394982 0.2736481 0.00828328402712941  0.3297626  0.5526151
.q75_value       .q100_value
1         NA            Group5
2  8.0000000                10
3  0.7556116 0.992955713532865

#Top/Bottom 5
.top_5_values
1  (1) Group2 [21]\n (1) Group4 [21]\n (1) Group5 [21]\n (4) Group1 [19]\n (5) Group3 [18]\n
2  (1) 10 [17]\n (2) 5 [13]\n (2) 8 [13]\n (4) 6 [11]\n (5) 2 [9]\n
3  (1) 0.00828328402712941 [1]\n (1) 0.0252241331618279 [1]\n (1) 0.031874967738986 [1]\n
(1) 0.0403659413568676 [1]\n (1) 0.0674886098131537 [1]\n
.bottom_5_values
1  (5) Group3 [18]\n (4) Group1 [19]\n (1) Group5 [21]\n (1) Group4 [21]\n (1) Group2 [21]\n
2  (10) 4 [5]\n (9) 9 [7]\n (7) 7 [8]\n (7) 1 [8]\n (5) 3 [9]\n
3  (1) 0.992955713532865 [1]\n (1) 0.979553350480273 [1]\n (1) 0.971928166225553 [1]\n
(1) 0.963768856832758 [1]\n (1) 0.949774149339646 [1]\n

#&#20316;&#26989;&#12501;&#12457;&#12523;&#12480;&#12395;&#12501;&#12449;&#12452;&#12523;&#12434;&#20445;&#23384;
write.csv(DataPro, "&#12487;&#12540;&#12479;&#12503;&#12525;&#12501;&#12449;&#12452;&#12523;.csv")

csvファイル内容

エクセルで内容を表示。

image

少しでも、あなたのウェブや実験の解析が楽になりますように。

Prices and shipping availability may change. Please refer to the product page at time of purchase.
Content displayed on this site is provided by Amazon and may be updated or removed.
Amazon Associate, karada-good earns income through qualifying sales.
タイトルとURLをコピーしました