Rで解析:データ構造をヒートマップで確認「visdat」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データ構造をヒートマップで確認するのに便利なパッケージです。確認は欠損値だけでなく条件に該当やデータの比較が可能です。

パッケージバージョンは0.5.3。実行コマンドはwindows 11のR version 4.1.2で確認しています。

スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("visdat")

実行コマンド

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読込み
library("visdat")

###データ例の作成#####
n <- 300
TestData <- data.frame("Group" = factor(sample(paste0("Group", 1:3),
                                               n, replace = TRUE)),
                       "Data1" = sample(c(rnorm(3), NA), n, replace = TRUE),
                       "Data2" = sample(c(rnorm(3), NA), n, replace = TRUE),
                       "Character" = sample(c("ABC", "CDE", NA), n, replace = TRUE),
                       "Logical" = rep(c(TRUE, NA), each = n/2),
                       stringsAsFactors = FALSE)
#&#27083;&#36896;&#30906;&#35469;
#str(TestData)
########

#&#12487;&#12540;&#12479;&#12479;&#12452;&#12503;,&#27424;&#25613;&#20516;&#12434;&#34920;&#31034;:vis_dat&#12467;&#12510;&#12531;&#12489;
#&#33394;&#12434;&#25351;&#23450;:palette;"default","qual","cb_safe"
#&#12487;&#12540;&#12479;&#12398;&#20006;&#12403;&#38918;:sort_type;FALSE&#12391;&#20803;&#12487;&#12540;&#12479;&#38918;
vis_dat(x = TestData, palette = "default", sort_type = FALSE)

#&#27424;&#25613;&#20516;&#12398;&#20986;&#29694;&#21106;&#21512;&#12434;&#34920;&#31034;:vis_miss&#12467;&#12510;&#12531;&#12489;
#&#27424;&#25613;&#20516;&#12398;&#20986;&#29694;&#21106;&#21512;&#12364;&#39640;&#12356;&#38918;&#12395;&#34920;&#31034;:sort_miss;TRUE/FALSE
vis_miss(x = TestData, sort_miss = TRUE)

#&#26465;&#20214;&#12395;&#35442;&#24403;&#12377;&#12427;&#12363;&#35222;&#35226;&#21270;:vis_expect&#12467;&#12510;&#12531;&#12489;
#&#26465;&#20214;&#24335;&#12434;&#35373;&#23450;:expectation;~.x &#26465;&#20214;&#24335;&#12391;&#35373;&#23450;
#&#35442;&#24403;&#12375;&#12383;&#12487;&#12540;&#12479;&#21106;&#21512;&#12434;&#34920;&#31034;:show_perc
vis_expect(data = TestData, 
           expectation = ~.x %in% !NA,
           show_perc = TRUE)

#&#12487;&#12540;&#12479;&#12434;&#27604;&#36611;&#12375;&#12390;&#34920;&#31034;:vis_compare&#12467;&#12510;&#12531;&#12489;
###&#27604;&#36611;&#29992;&#12398;&#12487;&#12540;&#12479;&#12434;&#28310;&#20633;#####
Data2 <- TestData
Data2[50:199, 3] <- sample(c(rnorm(3), NA), 150, replace = TRUE)
#####
vis_compare(TestData, Data2)

出力例

・vis_datコマンド

・vis_missコマンド

・vis_expectコマンド

・vis_compareコマンド


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました