インタラクティブな散布図マトリクスでデータの探索が可能なパッケージの紹介です。コマンドだけではなくGUIで操作しデータの探索ができます。直感で操作できるので大変便利だと思います。
なお、「tibble class」のデータ形式ではカテゴリ変数が上手く取り込まれませんでした。データ形式は「data.frame」で実行してください。
パッケージバージョンは0.2.0。実行コマンドはRStudioのRStudio Desktop 2021.09.2+382、windows 11のR version 4.1.3で確認しています。
パッケージのインストール
下記、コマンドを実行してください。
#パッケージのインストール
install.packages("scatterPlotMatrix")
実行コマンド
詳細はコメント、パッケージのヘルプを確認してください。
#パッケージの読み込み
library("scatterPlotMatrix")
###データ例の作成#####
set.seed(1234)
n <- 50
TestData <- data.frame(Group = factor(sample(paste0("Group", 1:4), n,
replace = TRUE)),
X_1_Data = sample(c(1:50), n, replace = TRUE),
Y_1_Data = sample(c(51:100), n, replace = TRUE),
X_2_Data = sample(c(1:50), n, replace = TRUE),
Y_2_Data = sample(c(51:100), n, replace = TRUE),
Cha_Data = factor(sample(LETTERS[1:5], n, replace = TRUE)))
########
#インタラクティブな散布図マトリクス:scatterPlotMatrixコマンド
scatterPlotMatrix(data = TestData,
#表示設定:slidersPositionオプション
#listで指定する
slidersPosition = list(
dimCount = 4, #表示する数
xStartingDimIndex = 2, #X側のスライダー位置
yStartingDimIndex = 3 #y側のスライダー位置
),
#データの初期グループ基準を指定:zAxisDimオプション
#マトリクスのデータラベルをクリックしグループを設定可能
zAxisDim = "Group",
#カテゴリ変数がグループ基準時の色:categoricalCSオプション;
#"Category10","Accent","Dark2","Paired","Set1"
categoricalCS = "Dark2",
#連続変数がグループ基準時の色:continuousCSオプション;
#"Viridis","Inferno","Magma","Plasma","Warm",
#"Cool","Rainbow","CubehelixDefault","Blues",
#"Greens","Greys","Oranges","Purples","Reds",
#"BuGn","BuPu","GnBu","OrRd","PuBuGn","PuBu",
#"PuRd","RdBu","RdPu","YlGnBu","YlGn","YlOrBr","YlOrRd"
continuousCS = "Blues",
#右上部の表現方法を指定:corrPlotTypeオプション;
#"Empty","Circles","Text","AbsText"
corrPlotType = "Text",
#グラフ形式を指定:distribTypeオプション;
#1:density_plot,2:histogram,NULL
distribType = 1,
#散布図に回帰線を追加:regressionTypeオプション;
#1:linear,2:loess,NULL
regressionType = 1,
#散布図の書式設定:plotPropertiesオプション
#listで指定する
plotProperties = list(
point = list(alpha = 0.8,
radius = 3)
)
)
#guiで操作しながらインタラクティブな散布図マトリクス
#controlWidgetsオプション:TRUE/FALSE
scatterPlotMatrix(data = TestData, controlWidgets = TRUE)
出力例
X、Y側のグレイのスクロールバーはデータ表示数の機能を持っています。バーの端をドラッグすることで表示数を調整することが可能です。また、各データラベルをクリックすることで、データのグループ基準を指定可能です。
少しでも、あなたの解析が楽になりますように!!