Rで解析:データの特徴を一気に確認。「GGally」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

「ggplot2」パッケージを利用して多変数の特徴をプロットすることができるパッケージの紹介です。データの解釈に非常に便利なパッケージかと思います。また、複数のggplotオブジェクトのプロットが可能な「ggmatrix」コマンドも収録されています。

パッケージバージョンは2.1.2。実行コマンドはwindows 11のR version 4.1.2で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("GGally")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("GGally")

###データ例の作成#####
n <- 50
TestData <- data.frame(Group = sample(paste0("Group", 1:5),
                                      n, replace = TRUE),
                       Data1 = rnorm(n),
                       Data2 = rnorm(n) + rnorm(n) + rnorm(n),
                       Data3 = sample(0:1, n, replace = TRUE),
                       Data4 = sample(LETTERS[1:26], n, replace = TRUE))
#######

#&#12487;&#12540;&#12479;&#12398;&#29305;&#24500;&#12434;&#19968;&#27671;&#12395;&#12503;&#12525;&#12483;&#12488;:ggpairs&#12467;&#12510;&#12531;&#12489;
#&#34920;&#31034;&#21015;&#12434;&#25351;&#23450;:columns&#12458;&#12503;&#12471;&#12519;&#12531;;&#21021;&#26399;&#20516;:1:ncol(data)
#&#33394;&#20998;&#12369;&#12487;&#12540;&#12479;&#12398;&#25351;&#23450;:mapping&#12458;&#12503;&#12471;&#12519;&#12531;
#&#19978;&#37096;,&#19979;&#37096;&#12398;&#12503;&#12525;&#12483;&#12488;&#20869;&#23481;&#12434;&#25351;&#23450;:upper,lower&#12458;&#12503;&#12471;&#12519;&#12531;:blank&#12391;&#38750;&#34920;&#31034;
##&#25351;&#23450;&#20869;&#23481;&#12399;&#20197;&#19979;&#12398;&#36890;&#12426;,list(&#22793;&#25968;&#22411; = &#34920;&#31034;&#20869;&#23481;)&#12391;&#25351;&#23450;
##&#22793;&#25968;&#22411;;&#34920;&#31034;&#20869;&#23481;
##continuous;"points","smooth","density","cor","blank"
##combo;"box","dot","facethist","facetdensity","denstrip","blank"
##discrete;"facetbar","ratio","blank" ##na;"na","blank"
#&#23550;&#35282;&#32218;&#12398;&#12503;&#12525;&#12483;&#12488;&#20869;&#23481;&#12434;&#25351;&#23450;:diag&#12458;&#12503;&#12471;&#12519;&#12531;:NULL&#12391;&#38750;&#34920;&#31034;
##continuous;"densityDiag","barDiag","blankDiag"
##discrete;"barDiag","blankDiag"
##na;"naDiag","blankDiag"
#&#25991;&#23383;&#21015;/&#22240;&#23376;&#21015;&#12391;&#35377;&#21487;&#12377;&#12427;&#26368;&#22823;&#25968;:cardinality_threshold&#12458;&#12503;&#12471;&#12519;&#12531;
ggpairs(data = TestData, columns = c(1, 5, 2, 3),
        mapping = aes(color = Group),
        upper = list(continuous = "smooth"),
        lower = list(combo = "facetdensity"),
        diag = list(continuous = "barDiag"),
        cardinality_threshold = 30)

#&#35079;&#25968;&#12398;&#12464;&#12521;&#12501;&#12434;&#12503;&#12525;&#12483;&#12488;:ggmatrix&#12467;&#12510;&#12531;&#12489;
#&#34892;&#25968;&#12398;&#25351;&#23450;:nrow&#12458;&#12503;&#12471;&#12519;&#12531;
#&#21015;&#25968;&#12398;&#25351;&#23450;:ncol&#12458;&#12503;&#12471;&#12519;&#12531;
#x&#36600;&#26041;&#21521;&#12521;&#12505;&#12523;&#12434;&#25351;&#23450;:xAxisLabels&#12458;&#12503;&#12471;&#12519;&#12531;
#y&#36600;&#26041;&#21521;&#12521;&#12505;&#12523;&#12434;&#25351;&#23450;:yAxisLabels&#12458;&#12503;&#12471;&#12519;&#12531;
#&#12479;&#12452;&#12488;&#12523;&#12434;&#25351;&#23450;:title&#12458;&#12503;&#12471;&#12519;&#12531;
#&#25551;&#20889;&#12464;&#12521;&#12501;&#12399;list class&#12395;&#26684;&#32013;&#12375;&#12414;&#12377;
PlotList <- list()
list(for (i in 1:3) {
  #&#31665;&#12402;&#12370;&#22259;
  PlotList[[i]] <- qplot(data = TestData, x = Group,
                         y = Data1, fill = Group, geom = "boxplot")
  #&#25955;&#24067;&#22259;
  PlotList[[i + 3]] <- qplot(data = TestData, x = Data2,
                             y = Data1, color = Group, geom = "point") +
                       ggtitle("TEST")
  })

#&#12503;&#12525;&#12483;&#12488;
ggmatrix(PlotList, nrow = 2, ncol = 3,
         xAxisLabels = 1:3, yAxisLabels = 1:2, title = "TEST")

出力結果

・ggpairsコマンド

ggpairs

・ggmatrixコマンド

ggmatrix

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました