Rで解析:データの分布をグラフで確認「ggridges」パッケージ


投稿日: Rの解析に役に立つ記事

データの分布を確認するのに便利かもしれないパッケージの紹介です。

パッケージバージョンは0.4.1。windows 10のR version 3.4.1で動作を確認しています。


パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("ggridges")



コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読み込み:libraryコマンド
library("ggridges")

###データ例の作成#####
n <- 500
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
                       Time = sample(1:5, n, replace = TRUE),
                       height = rnorm(n),
                       Data2 = rnorm(n) + rnorm(n) + rnorm(n))
#geom_ridgeline用のデータ
library("dplyr")
TestRidgeLine <- TestData %>% group_by(Group, Time) %>%
  summarise_all(funs(mean)) %>% mutate(Yposi = recode(Group, Group1 = 0,
                                                      Group2 = .3, Group3 = .5,
                                                      Group4 = .7, Group5 = .9))
#######

#高さを指定したエリアプロットを作成:geom_ridgelineコマンド
#0以下の高さ表示する範囲を指定:min_heightオプション
ggplot(TestRidgeLine, aes(x = Time, y = Yposi,
                          height = height, group = Yposi,
                          fill = Group)) +
  geom_ridgeline(show.legend = F, alpha = .5,
                 min_height = min(TestRidgeLine[, 3]))

#データ分布をプロット:geom_density_ridgesコマンド
#グラフ下部線付きプロット:geom_density_ridges2コマンド
ggplot(TestData, aes(x = height, y = Group, fill = Group)) +
  geom_density_ridges2(scale = 1) + facet_wrap(~Group)

#塗色を指定:scale_fill_cyclicalコマンド
#枠線を指定:scale_color_cyclicalコマンド
ggplot(TestData, aes(x = height, y = Group, fill = Group, color = Group)) +
  geom_density_ridges2(scale = 1, size = 1.5) + facet_wrap(~Group) +
  scale_fill_cyclical(values = c("blue", "green", "yellow")) +
  scale_color_cyclical(values = c("red", "black"))

出力例

・geom_ridgelineコマンド

・geom_density_ridgesコマンド

・scale_fill_cyclicalコマンド


少しでも、あなたの解析が楽になりますように!!

スポンサードリンク

おすすめコンテンツ


スポンサードリンク