データ特徴を確認するコマンドに「str」「sumarry」「class」コマンドなどがありますが、図でザクッと確認したい方へオススメのパッケージです。
パッケージバージョンは0.6.0.9000。実行コマンドはR version 3.2.3で確認しています。
パッケージのインストール
下記、コマンドを実行してください。
#パッケージのインストール
install.packages("devtools")
devtools::install_github("tierneyn/visdat")
実行コマンド
詳細はコメント、パッケージのヘルプを確認してください。
#パッケージの読み込み
library("visdat")
###データ例の作成#####
n <- 30
#data.frame class
TestData <- data.frame(Group = sample(paste0("Group ", 1:5), n, replace = TRUE),
Data1 = sample(0:700, n, replace = TRUE),
Data2 = sample(c(40:80, NA), n, replace = TRUE),
Data3 = sample(60:1000, n, replace = TRUE),
Data4 = as.numeric(sample(c(80:90, NA), n, replace = TRUE)),
Data5 = sample(LETTERS[1:24], n, replace = TRUE),
Data6 = sample(c("Group", 1:5, NA, "2016/03/12", 5.3,
LETTERS[1:24], 0.000321), n, replace = TRUE))
########
#データ構造の確認
str(TestData)
'data.frame': 30 obs. of 7 variables:
$ Group: Factor w/ 5 levels "Group 1","Group 2",..: 3 3 5 3 2 2 5 5 1 4 ...
$ Data1: int 392 334 631 493 435 504 514 654 500 165 ...
$ Data2: int 63 47 66 61 56 63 71 56 63 75 ...
$ Data3: int 922 627 779 140 575 846 444 665 360 273 ...
$ Data4: num 85 87 89 88 83 81 88 89 87 89 ...
$ Data5: Factor w/ 18 levels "A","B","C","D",..: 13 18 2 3 17 8 6 1 17 14 ...
$ Data6: Factor w/ 20 levels "2016/03/12","3",..: 3 2 12 15 17 NA 12 1 20 16 ..
#データ構造を図式化:vis_datコマンド
#class毎に並び替え設定:sort_typeオプション
vis_dat(TestData, sort_type = FALSE)
#データの欠損値を図式化:vis_missコマンド
#欠損値をまとめて表示:clusterオプション
vis_miss(TestData, cluster = TRUE)
#配列内のデータ構造を図式化:vis_guessコマンド
vis_guess(TestData[, 6:7])
出力例
・vis_datコマンド

・vis_missコマンド

・vis_guessコマンド

少しでも、あなたのウェブや実験の解析が楽になりますように!!