Rと解析:欠損値の情報をGUIで確認「MissingDataGUI」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

パッケージの導入に手こずるかもしれませんが、欠損値の情報を得るのに便利なパッケージの紹介です。Rに慣れているとコマンドの方が楽ですが、面白いので試してみてはいかがでしょうか。

パッケージではグラフをpng、データをcsvやrdaで出力することができます。

パッケージバージョンは0.2-2。実行コマンドはR version 3.2.2で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("RGtk2")
install.packages("MissingDataGUI")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("MissingDataGUI")
#使用環境がMACでエラーが出た場合
#GTK+ 2.xを下記URLからインストールしてください
#http://r.research.att.com/
#インストール後、再度パッケージをインストールすることで
#エラーが出なくなります

###データ例の作成#####
set.seed(1234)
n <- 10
TestData <- data.frame(Group = sample(paste0("Group", 1:3), n, replace = TRUE),
                       Data1 = sample(c(NA, 1:3), n, replace = TRUE),
                       Data2 = sample(c(NA, 1:2), n, replace = TRUE))
########

#GUI&#12398;&#31435;&#12385;&#19978;&#12370;
MissingDataGUI(TestData)

###&#20197;&#19979;&#12289;&#21442;&#32771;&#12467;&#12510;&#12531;&#12489;#####
#&#12487;&#12540;&#12479;&#20869;&#23481;&#12398;&#30906;&#35469;
TestData
Group Data1 Data2
1  Group1     2    NA
2  Group2     2    NA
3  Group2     1    NA
4  Group2     3    NA
5  Group3     1    NA
6  Group2     3     2
7  Group1     1     1
8  Group1     1     2
9  Group2    NA     2
10 Group2    NA    NA

#&#35201;&#32004;
summary(TestData)
Group       Data1          Data2     
Group1:3   Min.   :1.00   Min.   :1.00  
Group2:6   1st Qu.:1.00   1st Qu.:1.75  
Group3:1   Median :1.50   Median :2.00  
Mean   :1.75   Mean   :1.75  
3rd Qu.:2.25   3rd Qu.:2.00  
Max.   :3.00   Max.   :2.00  
NA's   :2      NA's   :6   

#&#12464;&#12523;&#12540;&#12503;,&#12487;&#12540;&#12479;&#27598;&#12395;NA&#20516;&#12398;&#25968;&#12434;&#26908;&#20986;
GetNA <- vector("list", 2)
for(n in seq(GetNA)){
  
  #NA&#20516;&#12398;&#26908;&#20986;
  GetNA[[n]] <- tapply(TestData[, n + 1], TestData[, 1], function(x) sum(is.na(x)))
  #list&#25104;&#20998;&#21517;&#12398;&#20184;&#19982;
  names(GetNA)[n] <- colnames(TestData[n + 1])
  
}
#&#20869;&#23481;&#12398;&#30906;&#35469;
GetNA
$Data1
Group1 Group2 Group3 
0      2      0 
$Data2
Group1 Group2 Group3 
1      4      1 

GUI表示の例

・全体表示

MissingDataGUI1

・欠損値情報

MissingDataGUI2

・グラフ表示1

MissingDataGUI3

・グラフ表示2

MissingDataGUI_Below10_hist_1

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました