Rで解析:データをインタラクティブに探索「scatterPlotMatrix」パッケージ

Rの解析に役に立つ記事

インタラクティブな散布図マトリクスでデータの探索が可能なパッケージの紹介です。コマンドだけではなくGUIで操作しデータの探索ができます。直感で操作できるので大変便利だと思います。

なお、「tibble class」のデータ形式ではカテゴリ変数が上手く取り込まれませんでした。データ形式は「data.frame」で実行してください。

パッケージバージョンは0.2.0。実行コマンドはRStudioのRStudio Desktop 2021.09.2+382、windows 11のR version 4.1.3で確認しています。

スポンサーリンク
スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("scatterPlotMatrix")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("scatterPlotMatrix")

###データ例の作成#####
set.seed(1234)
n <- 50
TestData <- data.frame(Group = factor(sample(paste0("Group", 1:4), n,
                                             replace = TRUE)),
                       X_1_Data = sample(c(1:50), n, replace = TRUE),
                       Y_1_Data = sample(c(51:100), n, replace = TRUE),
                       X_2_Data = sample(c(1:50), n, replace = TRUE),
                       Y_2_Data = sample(c(51:100), n, replace = TRUE),
                       Cha_Data = factor(sample(LETTERS[1:5], n, replace = TRUE)))
########

#インタラクティブな散布図マトリクス:scatterPlotMatrixコマンド
scatterPlotMatrix(data = TestData,
                  #表示設定:slidersPositionオプション
                  #listで指定する
                  slidersPosition = list(
                    dimCount = 4, #表示する数
                    xStartingDimIndex = 2, #X側のスライダー位置
                    yStartingDimIndex = 3 #y側のスライダー位置
                  ),
                  
                  #データの初期グループ基準を指定:zAxisDimオプション
                  #マトリクスのデータラベルをクリックしグループを設定可能
                  zAxisDim = "Group",
                  
                  #カテゴリ変数がグループ基準時の色:categoricalCSオプション;
                  #"Category10","Accent","Dark2","Paired","Set1"
                  categoricalCS = "Dark2",
                  
                  #連続変数がグループ基準時の色:continuousCSオプション;
                  #"Viridis","Inferno","Magma","Plasma","Warm",
                  #"Cool","Rainbow","CubehelixDefault","Blues",
                  #"Greens","Greys","Oranges","Purples","Reds",
                  #"BuGn","BuPu","GnBu","OrRd","PuBuGn","PuBu",
                  #"PuRd","RdBu","RdPu","YlGnBu","YlGn","YlOrBr","YlOrRd"
                  continuousCS = "Blues",
                  
                  #右上部の表現方法を指定:corrPlotTypeオプション;
                  #"Empty","Circles","Text","AbsText"
                  corrPlotType = "Text",
                  
                  #グラフ形式を指定:distribTypeオプション;
                  #1:density_plot,2:histogram,NULL
                  distribType = 1,
                  
                  #散布図に回帰線を追加:regressionTypeオプション;
                  #1:linear,2:loess,NULL
                  regressionType = 1,
                  
                  #散布図の書式設定:plotPropertiesオプション
                  #listで指定する
                  plotProperties = list(
                    point = list(alpha = 0.8,
                                 radius = 3)
                  )
                  )

#guiで操作しながらインタラクティブな散布図マトリクス
#controlWidgetsオプション:TRUE/FALSE
scatterPlotMatrix(data = TestData, controlWidgets = TRUE)

出力例

X、Y側のグレイのスクロールバーはデータ表示数の機能を持っています。バーの端をドラッグすることで表示数を調整することが可能です。また、各データラベルをクリックすることで、データのグループ基準を指定可能です。


少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました