Rで解析:データを区分するのに便利です。「fancycut」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データを指定した範囲で区分しラベルを付与するパッケージの紹介です。データの区分は大変重要です。簡単に作業できる「fancycut」パッケージはおすすめです。

パッケージバージョンは0.1.2。実行コマンドはwindows 11のR version 4.1.2で確認しています。

スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("fancycut")

実行コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("fancycut")

###データ例の作成#####
set.seed(220306)
n <- 100
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
                       Data1 = sample(c(-5:5, NA), n, replace = TRUE))
#&#20869;&#23481;&#30906;&#35469;
head(TestData)
#   Group Data1
#1 Group4     2
#2 Group2    -3
#3 Group2     0
#4 Group4     4
#5 Group5    -1
#6 Group1     3
#Data1&#12398;&#20998;&#24067;&#12434;&#30906;&#35469;
summary(factor(TestData[, 2]))
#-5   -4   -3   -2   -1    0    1    2    3    4    5 NA's 
#6   10   13    8    4    9    8   11    7    7    6   11 
#######

#&#12487;&#12540;&#12479;&#12434;&#21306;&#20998;&#12369;&#12377;&#12427;:wafflecut&#12467;&#12510;&#12531;&#12489;
#&#12487;&#12540;&#12479;&#12434;&#25351;&#23450;:x&#12458;&#12503;&#12471;&#12519;&#12531;
#&#21306;&#20998;&#12369;&#20869;&#23481;&#12434;&#25351;&#23450;:intervals&#12458;&#12503;&#12471;&#12519;&#12531;;[:&#21547;&#12417;&#12427;,(:&#21547;&#12417;&#12394;&#12356;
#&#12521;&#12505;&#12523;&#12434;&#25351;&#23450;:buckets&#12458;&#12503;&#12471;&#12519;&#12531;
#&#21306;&#20998;&#12369;&#20869;&#23481;&#22806;&#12398;&#12521;&#12505;&#12523;&#12434;&#25351;&#23450;:unmatched.bucket&#12458;&#12503;&#12471;&#12519;&#12531;
CutLabel <- wafflecut(x = TestData[, 2],
                      intervals = c("[-5, -2)", "[-2, 3)", "[3, 5]"),
                      buckets = c("&#23567;", "&#20013;", "&#22823;"),
                      unmatched.bucket = "&#31684;&#22258;&#22806;")
#&#20869;&#23481;&#30906;&#35469;
summary(CutLabel)
#&#23567;     &#20013;     &#22823;   <NA> &#31684;&#22258;&#22806; 
#29     40     20      0     11 
#&#20803;&#12487;&#12540;&#12479;&#12395;&#32080;&#21512;
TestData <- cbind(TestData, CutLabel)
#&#20869;&#23481;&#30906;&#35469;
head(TestData)
#  Group Data1 CutLabel
#1 Group4     2       &#20013;
#2 Group2    -3       &#23567;
#3 Group2     0       &#20013;
#4 Group4     4       &#22823;
#5 Group5    -1       &#20013;
#6 Group1     3       &#22823;

あなたの解析がとっても楽になりますように!!

タイトルとURLをコピーしました