Rで解析:データ構造をプロットで確認「visdat」パッケージ


データ構造をプロットで確認するのに便利なパッケージの紹介です。

パッケージバージョンは0.5.2。windows 10のR version 3.5.1で動作を確認しています。


パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("visdat")

コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読込み
library("visdat")

###データ例の作成#####
n <- 300 TestData <- data.frame("Group" = factor(sample(paste0("Group", 1:3), n, replace = TRUE)), "Data1" = sample(c(rnorm(3), NA), n, replace = TRUE), "Data2" = sample(c(rnorm(3), NA), n, replace = TRUE), "Character" = sample(c("ABC", "CDE", NA), n, replace = TRUE), "Logical" = rep(c(TRUE, NA), each = n/2), stringsAsFactors = FALSE) #構造確認 #str(TestData) ######## #データタイプ,欠損値を表示:vis_datコマンド #色を指定:palette;"default","qual","cb_safe" #データの並び順:sort_type;FALSEで元データ順 vis_dat(x = TestData, palette = "default", sort_type = FALSE) #欠損値の出現割合を表示:vis_missコマンド #欠損値の出現割合が高い順に表示:sort_miss;TRUE/FALSE vis_miss(x = TestData, sort_miss = TRUE) #条件に該当するか視覚化:vis_expectコマンド #条件式を設定:expectation;~.x 条件式で設定 #該当したデータ割合を表示:show_perc vis_expect(data = TestData, expectation = ~.x %in% !NA, show_perc = TRUE) #データの同一性を表示:vis_compareコマンド ###比較用のデータを準備##### Data2 <- TestData Data2[50:199, 3] <- sample(c(rnorm(3), NA), 150, replace = TRUE) ##### vis_compare(TestData, Data2) [/code]


出力例

・vis_datコマンド

・vis_missコマンド

・vis_expectコマンド

・vis_compareコマンド


少しでも、あなたの解析が楽になりますように!!

スポンサードリンク

関連コンテンツ


スポンサードリンク