Rで解析:以上、以下、超えるに未満!データの操作「fancycut」パッケージ


指定した範囲のデータを母データから作成するのに便利なパッケージの紹介です。操作後のデータはuniqueコマンドなどで処理が必要な場合がありますが、大抵の場合は本パッケージの範囲で解決するかと思います。

パッケージバージョンは0.1.0。実行コマンドはR version 3.2.2で確認しています。


パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("fancycut")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("fancycut")

###データの作成#####
TestData <- sample(1:10, 100, replace = TRUE)
########

#データラベル範囲の指定
#"("との組み合わせ;含まない
#"["との組み合わせ;含む
#下記例は4,6,7はラベル設定に該当しない
intervals <- c("[1, 3]", "(4, 6)", "[8, 10]")

#データラベルの設定
DataLabels <- c("Group1", "Group2", "Group3")

#指定したデータ範囲,ラベルで処理:fancycutコマンド
#下記例は4,6,7はラベル設定に"てすと"を指定
FcData <- fancycut(TestData, intervals = intervals, buckets = DataLabels,
                   na.bucket = "てすと", unmatched.bucket = "てすと")

#元データと結合
TeFcData <- data.frame(TestData, FcData)

#内容の確認
#tableコマンド
table(TeFcData)
FcData
TestData Group1 Group2 Group3 てすと
1      12      0      0      0
2      11      0      0      0
3      11      0      0      0
4       0      0      0      5
5       0     13      0      0
6       0      0      0      7
7       0      0      0     10
8       0      0     11      0
9       0      0      8      0
10      0      0     12      0
#xtabsコマンド
xtabs(~TeFcData[, 2])
TeFcData[, 2]
Group1 Group2 Group3 てすと 
34     13     31     22 

#図で確認
#Macで文字化け防止
par(family = "HiraKakuProN-W3")
barplot(xtabs(~TeFcData[, 2]), ylab = "Frequency",
        col = c("#4b61ba", "#deb7a0", "#a87963", "black"))

出力例

図で確認
fancycut


少しでも、あなたのウェブや実験の解析が楽になりますように!!

スポンサードリンク

おすすめコンテンツ


スポンサードリンク