Rで解析:データの欠損値の状況を把握するのに大変便利「ggmice」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データの欠損値の状況を把握するのに大変便利なプロットを作成できるパッケージの紹介です。欠損値をパターン表示、influx-outflux plot、データ間の相関を表示が作成できます。

パッケージバージョンは0.0.1。実行コマンドはwindows 11のR version 4.1.3で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("ggmice")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("ggmice")

###データ例の作成#####
#tidyverseパッケージがなければインストール
if(!require("tidyverse", quietly = TRUE)){
  install.packages("tidyverse");require("tidyverse")
}
set.seed(12345)
n <- 300
TestData <- tibble(Group = sample(paste0("Group", 1:2), n,
                                  replace = TRUE),
                   Data1 = sample(c(1:50, NA), n, replace = TRUE),
                   Data2 = sample(c(LETTERS, NA), n, replace = TRUE),
                   Data3 = sample(c(100:150, NA), n, replace = TRUE))
########

#&#27424;&#25613;&#20516;&#12434;&#12497;&#12479;&#12540;&#12531;&#34920;&#31034;:plot_pattern&#12467;&#12510;&#12531;&#12489;
#&#34920;&#31034;&#12377;&#12427;&#12487;&#12540;&#12479;&#12434;&#36984;&#25246;:vrb&#12458;&#12503;&#12471;&#12519;&#12531;;&#24517;&#35201;&#12364;&#12354;&#12428;&#12400;&#21015;&#21517;&#12434;&#25351;&#23450;
#&#12475;&#12523;&#12398;&#27491;&#26041;&#24418;/&#38263;&#26041;&#24418;:square&#12458;&#12503;&#12471;&#12519;&#12531;;TRUE:&#27491;&#26041;&#24418;/FALSE:&#38263;&#26041;&#24418;
#Variable&#12398;&#12521;&#12505;&#12523;&#12434;90&#24230;&#22238;&#36578;:rotate&#12458;&#12503;&#12471;&#12519;&#12531;;TRUE/FALSE
plot_pattern(data = TestData, vrb = "all",
             square = TRUE, rotate = FALSE)

#influx-outflux plot&#12398;&#20316;&#25104;:plot_flux&#12467;&#12510;&#12531;&#12489;
#plot&#12398;&#24847;&#21619;&#12399;https://cran.r-project.org/web/packages/ggmice/vignettes/ggmice.html&#12434;&#21442;&#29031;
#&#12471;&#12531;&#12508;&#12523;&#12521;&#12505;&#12523;&#12398;&#12503;&#12525;&#12483;&#12488;&#20301;&#32622;:label&#12458;&#12503;&#12471;&#12519;&#12531;;&#12503;&#12525;&#12483;&#12488;&#20869;:TRUE
plot_flux(data = TestData, vrb = "all",
          label = FALSE, caption = TRUE)

#&#12487;&#12540;&#12479;&#38291;&#12398;&#30456;&#38306;&#12434;&#34920;&#31034;:plot_corr&#12467;&#12510;&#12531;&#12489;
#&#30456;&#38306;&#20418;&#25968;&#12434;&#34920;&#31034;:label&#12458;&#12503;&#12471;&#12519;&#12531;
#&#21516;&#12487;&#12540;&#12479;&#38291;&#12398;&#30456;&#38306;&#12434;&#34920;&#31034;:diagonal&#12458;&#12503;&#12471;&#12519;&#12531;
plot_corr(data = TestData, vrb = "all",
          square = TRUE, rotate = FALSE,
          label = TRUE, diagonal = FALSE)

出力例

・plot_patternコマンド

・plot_fluxコマンド

・plot_corrコマンド


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました