Rで解析:データの欠損値の状況を把握するのに大変便利「ggmice」パッケージ

Rの解析に役に立つ記事

データの欠損値の状況を把握するのに大変便利なプロットを作成できるパッケージの紹介です。欠損値をパターン表示、influx-outflux plot、データ間の相関を表示が作成できます。

パッケージバージョンは0.0.1。実行コマンドはwindows 11のR version 4.1.3で確認しています。

スポンサーリンク
スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("ggmice")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("ggmice")

###データ例の作成#####
#tidyverseパッケージがなければインストール
if(!require("tidyverse", quietly = TRUE)){
  install.packages("tidyverse");require("tidyverse")
}
set.seed(12345)
n <- 300
TestData <- tibble(Group = sample(paste0("Group", 1:2), n,
                                  replace = TRUE),
                   Data1 = sample(c(1:50, NA), n, replace = TRUE),
                   Data2 = sample(c(LETTERS, NA), n, replace = TRUE),
                   Data3 = sample(c(100:150, NA), n, replace = TRUE))
########

#欠損値をパターン表示:plot_patternコマンド
#表示するデータを選択:vrbオプション;必要があれば列名を指定
#セルの正方形/長方形:squareオプション;TRUE:正方形/FALSE:長方形
#Variableのラベルを90度回転:rotateオプション;TRUE/FALSE
plot_pattern(data = TestData, vrb = "all",
             square = TRUE, rotate = FALSE)

#influx-outflux plotの作成:plot_fluxコマンド
#plotの意味はhttps://cran.r-project.org/web/packages/ggmice/vignettes/ggmice.htmlを参照
#シンボルラベルのプロット位置:labelオプション;プロット内:TRUE
plot_flux(data = TestData, vrb = "all",
          label = FALSE, caption = TRUE)

#データ間の相関を表示:plot_corrコマンド
#相関係数を表示:labelオプション
#同データ間の相関を表示:diagonalオプション
plot_corr(data = TestData, vrb = "all",
          square = TRUE, rotate = FALSE,
          label = TRUE, diagonal = FALSE)

出力例

・plot_patternコマンド

・plot_fluxコマンド

・plot_corrコマンド


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました