パッケージの導入に手こずるかもしれませんが、欠損値の情報を得るのに便利なパッケージの紹介です。Rに慣れているとコマンドの方が楽ですが、面白いので試してみてはいかがでしょうか。
パッケージではグラフをpng、データをcsvやrdaで出力することができます。
パッケージバージョンは0.2-2。実行コマンドはR version 3.2.2で確認しています。
パッケージのインストール
下記、コマンドを実行してください。
#パッケージのインストール
install.packages("RGtk2")
install.packages("MissingDataGUI")
実行コマンド
詳細はコメント、パッケージのヘルプを確認してください。
#パッケージの読み込み
library("MissingDataGUI")
#使用環境がMACでエラーが出た場合
#GTK+ 2.xを下記URLからインストールしてください
#http://r.research.att.com/
#インストール後、再度パッケージをインストールすることで
#エラーが出なくなります
###データ例の作成#####
set.seed(1234)
n <- 10
TestData <- data.frame(Group = sample(paste0("Group", 1:3), n, replace = TRUE),
Data1 = sample(c(NA, 1:3), n, replace = TRUE),
Data2 = sample(c(NA, 1:2), n, replace = TRUE))
########
#GUIの立ち上げ
MissingDataGUI(TestData)
###以下、参考コマンド#####
#データ内容の確認
TestData
Group Data1 Data2
1 Group1 2 NA
2 Group2 2 NA
3 Group2 1 NA
4 Group2 3 NA
5 Group3 1 NA
6 Group2 3 2
7 Group1 1 1
8 Group1 1 2
9 Group2 NA 2
10 Group2 NA NA
#要約
summary(TestData)
Group Data1 Data2
Group1:3 Min. :1.00 Min. :1.00
Group2:6 1st Qu.:1.00 1st Qu.:1.75
Group3:1 Median :1.50 Median :2.00
Mean :1.75 Mean :1.75
3rd Qu.:2.25 3rd Qu.:2.00
Max. :3.00 Max. :2.00
NA's :2 NA's :6
#グループ,データ毎にNA値の数を検出
GetNA <- vector("list", 2)
for(n in seq(GetNA)){
#NA値の検出
GetNA[[n]] <- tapply(TestData[, n + 1], TestData[, 1], function(x) sum(is.na(x)))
#list成分名の付与
names(GetNA)[n] <- colnames(TestData[n + 1])
}
#内容の確認
GetNA
$Data1
Group1 Group2 Group3
0 2 0
$Data2
Group1 Group2 Group3
1 4 1
GUI表示の例
・全体表示

・欠損値情報

・グラフ表示1

・グラフ表示2

少しでも、あなたの解析が楽になりますように!!