Rで解析：出現率をラクラク確認「extdplyr」パッケージ

公開日 2017-03-01

Rの解析に役に立つ記事

data.frameの欠損値や特定条件の出現率を確認するのに便利なパッケージだと考えます。

パッケージバージョンは0.1.5。R version 3.2.4で動作を確認しています。

＜おすすめのRに関する書籍です＞

Rによるやさしい統計学 | 山田剛史, 杉澤武俊, 村井潤一郎

Amazonで山田剛史, 杉澤武俊, 村井潤一郎のRによるやさしい統計学。アマゾンならポイント還元本が多数。

www.amazon.co.jp

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("extdplyr")

コマンドの紹介

詳細はコマンド、各パッケージのヘルプを確認してください。

#パッケージの読み込み
library("extdplyr")

###データ例の作成#####
n <- 15
TestData <- data.frame("Group" = sample(paste0("Group", 1:5), n, replace = TRUE),
                       "Data1" = sample(c(40:60, NA), n, replace = TRUE),
                       "Data2" = sample(c(1, NA), n, replace = TRUE),
                       "LETTERS" = sample(LETTERS[1:24], n, replace = TRUE))
########

#データの欠損値を計算:check_missingコマンド
#数または割合を指定:rep_propオプション;FALSE:個数
check_missing(data = TestData, ret_prop = TRUE)
Group Data1     Data2 LETTERS
1     0     0 0.4666667       0

#抽出条件に適合しているか新規列を追加し判断:grp_routineコマンド
#抽出条件が重なったりNAが含まれているとエラー
grp_routine(data = TestData[complete.cases(TestData),],
            col = "Check",
            #以降に抽出条件を入力
            OK = Data1 &gt; 50,
            NO = Data1 &lt;= 50)

#指定した分類での出現率を表示:pct_routineコマンド
#dataオプション以降に分類を記述
pct_routine(data = TestData, Group, LETTERS)

少しでも、あなたの解析が楽になりますように！！このすば「第7話このふてぶてしい鈍らに招待を！」観ました。アクア様の表情最高です。

＜おすすめのRに関する書籍です＞

超入門! Rでできるビジュアル統計学学会・論文発表に役立つデータ可視化マニュアル | 藤井亮輔, 鈴木康司

Amazonで藤井亮輔, 鈴木康司の超入門! Rでできるビジュアル統計学学会・論文発表に役立つデータ可視化マニュアル。アマゾンならポイント還元本が多数。

＜おすすめのRに関する書籍です＞

パッケージのインストール

コマンドの紹介

＜おすすめのRに関する書籍です＞

関連記事