Rで解析:記述統計に役に立つかも?「ds」パッケージ

Rの解析に役に立つ記事

因子間の相関やデータセットの記述統計を出力することができます。本パッケージの出力は基本コマンドの組み合わせで再現することができますが、地味に便利なパッケージだと思います。

パッケージのバージョンは4.0。実行コマンドはR version 4.2.2で確認しています。

スポンサーリンク
スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("ds")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("ds")

###データ例の作成#####
n <- 100
TestDF <- data.frame(Data1 = sample(1:100, n, replace = TRUE),
                     Data2 = rnorm(n),
                     Data3 = sample(1:100, n, replace = TRUE),
                     Data4 = sample(1:100, n, replace = TRUE))
########

#データ間の相関を計算:dscorコマンド
#計算方法の指定:methodオプション;Pearson = 1,Spearman = 2
dscor(TestDF, method = 1)
            pairs correlation p-value
1 Data1 and Data2      0.2138  0.0327
2 Data1 and Data3     -0.0885  0.3815
3 Data1 and Data4     -0.0062  0.9515
4 Data2 and Data3     -0.0807  0.4247
5 Data2 and Data4      0.1001  0.3219
6 Data3 and Data4      0.0806  0.4253

#データの記述統計を表示:gdaコマンド
gds(TestDF)
                                Data1    Data2    Data3    Data4
Mean                          48.7100   0.2029  49.1600  52.7000
Maximum                      100.0000   3.3109  99.0000 100.0000
Minimum                        1.0000  -2.0614   1.0000   1.0000
Median                        48.0000   0.2081  53.0000  55.5000
Mean + 3 standard deviation  135.5529   3.0087 135.9531 140.7501
Mean + 2 standard deviation  106.6053   2.0735 107.0221 111.4001
Mean + 1 standard deviation   77.6576   1.1382  78.0910  82.0500
Mean - 1 standard deviation   19.7624  -0.7323  20.2290  23.3500
Mean - 2 standard deviation   -9.1853  -1.6676  -8.7021  -6.0001
Mean - 3 standard deviation  -38.1329  -2.6029 -37.6331 -35.3501
Quantile (99.87%)             99.8713   3.1819  98.7426  99.8713
Quantile (97.73%)             98.0000   2.0439  96.5054  96.7527
Quantile (84.14%)             82.5972   1.0503  80.5972  87.5972
Quantile (15.87%)             18.7113  -0.8093  11.0000  18.0000
Quantile (2.28%)               5.2572  -1.3383   2.2572   3.7716
Quantile (0.14%)               1.1386  -2.0124   1.1386   1.1386
n                            100.0000 100.0000 100.0000 100.0000
Range                         99.0000   5.3723  98.0000  99.0000
Variance                     837.9656   0.8747 837.0044 861.4242
Standard deviation            28.9476   0.9353  28.9310  29.3500
Standard error of the mean     2.8948   0.0935   2.8931   2.9350
Coefficient of variation (%)  59.4285 460.9083  58.8508  55.6927
Skewness                       0.1550   0.1971  -0.0704  -0.0823
Kurtosis                       1.7487   3.3125   1.7917   1.7428
P-value (Shapiro-Wilk)         0.0003   0.5936   0.0009   0.0005

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました