Rで解析:出現数を楽々表示「frequencies」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

2変数の組み合わせだけでなく、1変数内のデータの出現数を計算してくれるパッケージの紹介です。なお、利用にはR version 3.4.0以上が必要です。

パッケージバージョンは0.1.1。windows 10のR version 3.4.0で動作を確認しています。

スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("frequencies")

コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("frequencies")

###データ例の作成#####
n <- 15
TestData <- data.frame(Group = sample(paste0("Group", 1:5), n, replace = TRUE),
                          Data1 = sample(LETTERS[1:5], n, replace = TRUE),
                          Data2 = sample(LETTERS[1:26], n, replace = TRUE))
#######

#2&#22793;&#25968;&#20869;&#12398;&#20986;&#29694;&#25968;&#12434;&#34920;&#31034;:freq_two_vects&#12467;&#12510;&#12531;&#12489;
#&#20027;&#12392;&#12394;&#12427;&#22793;&#25968;&#12434;&#25351;&#23450;:col1&#12458;&#12503;&#12471;&#12519;&#12531;
#&#23550;&#35937;&#12398;&#22793;&#25968;&#12434;&#25351;&#23450;:col2&#12458;&#12503;&#12471;&#12519;&#12531;
#&#32080;&#26524;&#12434;data.frame&#12391;&#20986;&#21147;:separate_tables&#12458;&#12503;&#12471;&#12519;&#12531;
ResultData <- freq_two_vects(df = TestData, col1 = Data1, col2 = Data2,
                                separate_tables = FALSE)
#&#30906;&#35469;
ResultData
# A tibble: 55 x 4
   Data1  Data2 Count Percentage
1      A      A     1         50
2      A      N     1         50
3      A      B     0          0
4      A      F     0          0
5      A      H     0          0
6      A      Q     0          0
7      A      R     0          0
8      A      W     0          0
9      A      X     0          0
10      A      Y     0          0
# ... with 45 more rows

#&#20986;&#29694;&#25968;&#12364;&#65297;&#20197;&#19978;&#12434;&#25277;&#20986;
subset(ResultData, ResultData[, 3] &gt; 0)
# A tibble: 14 x 4
   Data1  Data2 Count Percentage
1      A      A     1       50.0
2      A      N     1       50.0
3      B      A     1       16.7
4      B      B     1       16.7
5      B      Q     1       16.7
6      B      R     1       16.7
7      B      W     1       16.7
8      B      X     1       16.7
9      C      H     2       50.0
10      C      F     1       25.0
11      C      Z     1       25.0
12      D      Y     1      100.0
13      E      R     1       50.0
14      E      Z     1       50.0

#1&#22793;&#25968;&#20869;&#12398;&#20986;&#29694;&#12434;&#34920;&#31034;:freq_vect&#12467;&#12510;&#12531;&#12489;
#&#20986;&#29694;&#25968;&#12434;&#38477;&#38918;&#12395;&#20006;&#12403;&#26367;&#12360;:sort_by_count&#12458;&#12503;&#12471;&#12519;&#12531;
freq_vect(data_vector = TestData[, 2], sort_by_count = TRUE, total_row = TRUE)
# A tibble: 6 x 4
   data Count Percentage  Cum.
1     B     6         40    40
2     C     4       26.7  66.7
3     A     2       13.3    80
4     E     2       13.3  93.3
5     D     1        6.7   100
6 Total    15        100   100

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました