Rで解析:出現率をラクラク確認「extdplyr」パッケージ


data.frameの欠損値や特定条件の出現率を確認するのに便利なパッケージだと考えます。
 
パッケージバージョンは0.1.4。windows 10のR version 3.3.2で動作を確認しています。


パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("extdplyr")

コマンドの紹介

詳細はコマンド、各パッケージのヘルプを確認してください。

#パッケージの読み込み
library("extdplyr")


###データ例の作成#####
n <- 15
TestData <- data.frame("Group" = sample(paste0("Group", 1:5), n, replace = TRUE),
                       "Data1" = sample(c(40:60, NA), n, replace = TRUE),
                       "Data2" = sample(c(1, NA), n, replace = TRUE),
                       "LETTERS" = sample(LETTERS[1:24], n, replace = TRUE))
#確認
TestData
    Group Data1 Data2 LETTERS
1  Group5    52    NA       E
2  Group4    53    NA       X
3  Group3    52     1       N
4  Group4    50     1       V
5  Group3    46     1       V
6  Group3    42     1       A
7  Group5    58     1       D
8  Group5    44    NA       W
9  Group2    49    NA       A
10 Group3    51    NA       L
11 Group1    50    NA       C
12 Group1    42     1       C
13 Group2    56     1       S
14 Group3    58     1       N
15 Group1    53    NA       F
########

#データの欠損値を計算:check_missingコマンド
#数または割合を指定:rep_propオプション;FALSE:個数
check_missing(data = TestData, ret_prop = TRUE)
Group Data1     Data2 LETTERS
1     0     0 0.4666667       0

#抽出条件に適合しているか新規列を追加し判断:grp_routineコマンド
#抽出条件が重なったりNAが含まれているとエラー
grp_routine(data = TestData[complete.cases(TestData),],
            col = "Check",
            #以降に抽出条件を入力
            OK = Data1 > 50,
            NO = Data1 <= 50)
   Group Data1 Data2 LETTERS Check
1 Group3    52     1       N    OK
2 Group4    50     1       V    NO
3 Group3    46     1       V    NO
4 Group3    42     1       A    NO
5 Group5    58     1       D    OK
6 Group1    42     1       C    NO
7 Group2    56     1       S    OK
8 Group3    58     1       N    OK

#指定した分類での出現率を表示:pct_routineコマンド
#dataオプション以降に分類を記述
pct_routine(data = TestData, Group, LETTERS)
    Group LETTERS       pct
   <fctr>  <fctr>     <dbl>
1  Group1       C 0.6666667
2  Group1       F 0.3333333
3  Group2       A 0.5000000
4  Group2       S 0.5000000
5  Group3       A 0.2000000
6  Group3       L 0.2000000
7  Group3       N 0.4000000
8  Group3       V 0.2000000
9  Group4       V 0.5000000
10 Group4       X 0.5000000
11 Group5       D 0.3333333
12 Group5       E 0.3333333
13 Group5       W 0.3333333

少しでも、あなたの解析が楽になりますように!!このすば「第7話このふてぶてしい鈍らに招待を!」観ました。アクア様の表情最高です。

スポンサードリンク

関連コンテンツ


スポンサードリンク