Rで解析:中心値に関するコマンド。算術、中央、幾何、調和平均。そして、いつか分散へ・・・

Rの解析に役に立つ記事

Rは非常に便利なソフトウェアです。でも、あまりにも便利なため「基本」の統計量を算出する方法を蔑ろにしがちです。勉強、何かのきっかけになればと思います。なお、分散は「いつか」紹介します。

算術平均、中央値、幾何平均、調和平均を算出するコマンドの紹介です。データの傾向を知るためにはどれも重要な指標です。

はて、地球の中心値。球体ではなく「地球を平面で見たときの中心値(地?)」はどこでしょうか。地図では発行国が中心になる傾向が多いようですが。秋の夜長に思慮してみるのもオツかも知れません。

実行コマンドはR version 4.2.2で確認しています。

スポンサーリンク
スポンサーリンク

実行コマンド

詳細はコメントを確認してください。

###データ例の作成####
set.seed(1234)
TestData <- rnorm(100, mean = 2, sd = 10)
GeoMData <- c(500, 1500, 20000, 1500, 500)
########

#ヒストグラムの描写
hist(TestData)

#算術平均
mean(TestData, na.rm = TRUE)
[1] 2.110568
#下記と同じ
#残念ながら欠損値は考慮していません
sum(TestData)/length(TestData)
[1] 2.110568

#中央値
median(TestData, na.rm = TRUE)
[1] 1.830129

#幾何平均
#0や負を含まない
#ベクトルの積積:cumprodコマンド
max(cumprod(GeoMData))^(1/length(GeoMData))
[1] 1622.671
#下記と同じ
exp(mean(log(abs(GeoMData))))
[1] 1622.671

#調和平均
length(TestData)/sum(1/TestData)
[1] 7.232387
#下記も同じ
1/mean(1/TestData)
[1] 7.232387

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました