Rで解析:データ構造をヒートマップで確認「visdat」パッケージ

Rの解析に役に立つ記事

データ構造をヒートマップで確認するのに便利なパッケージです。確認は欠損値だけでなく条件に該当やデータの比較が可能です。

パッケージバージョンは0.5.3。実行コマンドはwindows 11のR version 4.1.2で確認しています。

スポンサーリンク
スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("visdat")

実行コマンド

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読込み
library("visdat")

###データ例の作成#####
n <- 300
TestData <- data.frame("Group" = factor(sample(paste0("Group", 1:3),
                                               n, replace = TRUE)),
                       "Data1" = sample(c(rnorm(3), NA), n, replace = TRUE),
                       "Data2" = sample(c(rnorm(3), NA), n, replace = TRUE),
                       "Character" = sample(c("ABC", "CDE", NA), n, replace = TRUE),
                       "Logical" = rep(c(TRUE, NA), each = n/2),
                       stringsAsFactors = FALSE)
#構造確認
#str(TestData)
########

#データタイプ,欠損値を表示:vis_datコマンド
#色を指定:palette;"default","qual","cb_safe"
#データの並び順:sort_type;FALSEで元データ順
vis_dat(x = TestData, palette = "default", sort_type = FALSE)

#欠損値の出現割合を表示:vis_missコマンド
#欠損値の出現割合が高い順に表示:sort_miss;TRUE/FALSE
vis_miss(x = TestData, sort_miss = TRUE)

#条件に該当するか視覚化:vis_expectコマンド
#条件式を設定:expectation;~.x 条件式で設定
#該当したデータ割合を表示:show_perc
vis_expect(data = TestData, 
           expectation = ~.x %in% !NA,
           show_perc = TRUE)

#データを比較して表示:vis_compareコマンド
###比較用のデータを準備#####
Data2 <- TestData
Data2[50:199, 3] <- sample(c(rnorm(3), NA), 150, replace = TRUE)
#####
vis_compare(TestData, Data2)

出力例

・vis_datコマンド

・vis_missコマンド

・vis_expectコマンド

・vis_compareコマンド


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました