Rで解析:データ特徴を図で確認「visdat」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データ特徴を確認するコマンドに「str」「sumarry」「class」コマンドなどがありますが、図でザクッと確認したい方へオススメのパッケージです。

パッケージバージョンは0.6.0.9000。実行コマンドはR version 3.2.3で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("devtools")
devtools::install_github("tierneyn/visdat")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("visdat")

###データ例の作成#####
n <- 30
#data.frame class
TestData <- data.frame(Group = sample(paste0("Group ", 1:5), n, replace = TRUE),
                       Data1 = sample(0:700, n, replace = TRUE),
                       Data2 = sample(c(40:80, NA), n, replace = TRUE),
                       Data3 = sample(60:1000, n, replace = TRUE),
                       Data4 = as.numeric(sample(c(80:90, NA), n, replace = TRUE)),
                       Data5 = sample(LETTERS[1:24], n, replace = TRUE),
                       Data6 = sample(c("Group", 1:5, NA, "2016/03/12", 5.3,
                                        LETTERS[1:24], 0.000321), n, replace = TRUE))
########

#&#12487;&#12540;&#12479;&#27083;&#36896;&#12398;&#30906;&#35469;
str(TestData)
'data.frame':   30 obs. of  7 variables:
  $ Group: Factor w/ 5 levels "Group 1","Group 2",..: 3 3 5 3 2 2 5 5 1 4 ...
$ Data1: int  392 334 631 493 435 504 514 654 500 165 ...
$ Data2: int  63 47 66 61 56 63 71 56 63 75 ...
$ Data3: int  922 627 779 140 575 846 444 665 360 273 ...
$ Data4: num  85 87 89 88 83 81 88 89 87 89 ...
$ Data5: Factor w/ 18 levels "A","B","C","D",..: 13 18 2 3 17 8 6 1 17 14 ...
$ Data6: Factor w/ 20 levels "2016/03/12","3",..: 3 2 12 15 17 NA 12 1 20 16 ..

#&#12487;&#12540;&#12479;&#27083;&#36896;&#12434;&#22259;&#24335;&#21270;:vis_dat&#12467;&#12510;&#12531;&#12489;
#class&#27598;&#12395;&#20006;&#12403;&#26367;&#12360;&#35373;&#23450;:sort_type&#12458;&#12503;&#12471;&#12519;&#12531;
vis_dat(TestData, sort_type = FALSE)

#&#12487;&#12540;&#12479;&#12398;&#27424;&#25613;&#20516;&#12434;&#22259;&#24335;&#21270;:vis_miss&#12467;&#12510;&#12531;&#12489;
#&#27424;&#25613;&#20516;&#12434;&#12414;&#12392;&#12417;&#12390;&#34920;&#31034;:cluster&#12458;&#12503;&#12471;&#12519;&#12531;
vis_miss(TestData, cluster = TRUE)

#&#37197;&#21015;&#20869;&#12398;&#12487;&#12540;&#12479;&#27083;&#36896;&#12434;&#22259;&#24335;&#21270;:vis_guess&#12467;&#12510;&#12531;&#12489;
vis_guess(TestData[, 6:7])

出力例

・vis_datコマンド

vis_dat

・vis_missコマンド

vis_miss

・vis_guessコマンド

vis_guess

少しでも、あなたのウェブや実験の解析が楽になりますように!!

タイトルとURLをコピーしました