Rで解析:ダミー変数の作成に便利です。「fastDummies」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

行列方向にダミー変数を作成するのに便利なパッケージの紹介です。

パッケージバージョンは1.6.3。windows 11のR version 4.1.2で確認しています。

スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("fastDummies")

コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("fastDummies")

###データ例の作成#####
set.seed(1234)
n <- 4
TestData <- data.frame(Number = 1:n,
                       FactorNum = factor(1:n),
                       ID = paste0("ID", 1:n),
                       Group = sample(paste0("Group", 1:3),
                                      n, replace = TRUE))
########

#&#25968;&#20516;&#20197;&#22806;&#12398;&#20840;&#22793;&#25968;&#12398;&#32068;&#12415;&#21512;&#12431;&#12379;&#12391;&#12480;&#12511;&#12540;&#22793;&#25968;&#12434;&#21015;&#20596;&#12395;&#20316;&#25104;:dummy_rows&#12467;&#12510;&#12531;&#12489;
#&#12487;&#12540;&#12479;&#12434;&#25351;&#23450;:.data&#12458;&#12503;&#12471;&#12519;&#12531;
#&#23550;&#35937;&#21015;&#12434;&#25351;&#23450;:select_columns&#12458;&#12503;&#12471;&#12519;&#12531;,&#25968;&#20516;&#12399;&#23550;&#35937;&#22806;
#&#25968;&#20516;&#12414;&#12383;&#12399;&#23550;&#35937;&#21015;&#22806;&#12395;&#22475;&#12417;&#12427;&#20516;:dummy_value&#12458;&#12503;&#12471;&#12519;&#12531;,&#21021;&#26399;&#20516;:NA
dummy_rows(.data = TestData, select_columns = c("ID", "Group"),
           dummy_value = "Dummy")
   Number FactorNum  ID  Group
1       1         1 ID1 Group2
2       2         2 ID2 Group2
3       3         3 ID3 Group1
4       4         4 ID4 Group3
5   Dummy     Dummy ID1 Group1
6   Dummy     Dummy ID2 Group1
7   Dummy     Dummy ID4 Group1
8   Dummy     Dummy ID3 Group2
9   Dummy     Dummy ID4 Group2
10  Dummy     Dummy ID1 Group3
11  Dummy     Dummy ID2 Group3
12  Dummy     Dummy ID3 Group3

#&#12480;&#12511;&#12540;&#22793;&#25968;&#12434;&#34892;&#20596;&#12395;&#20316;&#25104;:dummy_cols&#12467;&#12510;&#12531;&#12489;
#&#21015;&#12395;&#21547;&#12414;&#12428;&#12427;&#21021;&#12417;&#12398;&#22793;&#25968;&#12434;&#38500;&#22806;:remove_first_dummy&#12458;&#12503;&#12471;&#12519;&#12531;
dummy_cols(.data = TestData, select_columns = c("ID", "Group"),
           remove_first_dummy = FALSE)
Number FactorNum  ID  Group ID_ID1 ID_ID2 ID_ID3 ID_ID4 Group_Group1
1      1         1 ID1 Group2      1      0      0      0            0
2      2         2 ID2 Group2      0      1      0      0            0
3      3         3 ID3 Group1      0      0      1      0            1
4      4         4 ID4 Group3      0      0      0      1            0
Group_Group2 Group_Group3
1            1            0
2            1            0
3            0            0
4            0            1

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました