Rで解析:中心値に関するコマンド。算術、中央、幾何、調和平均。そして、いつか分散へ・・・


Rは非常に便利なソフトウェアです。でも、あまりにも便利なため「基本」の統計量を算出する方法を蔑ろにしがちです。勉強、何かのきっかけになればと思います。なお、分散は「いつか」紹介します。

算術平均、中央値、幾何平均、調和平均を算出するコマンドの紹介です。データの傾向を知るためにはどれも重要な指標です。

はて、地球の中心値。球体ではなく「地球を平面で見たときの中心値(地?)」はどこでしょうか。地図では発行国が中心になる傾向が多いようですが。秋の夜長に思慮してみるのもオツかも知れません。

実行コマンドはR version 3.2.2で確認しています。


実行コマンド

詳細はコメントや専門書を確認してください。

###データ例の作成####
set.seed(1234)
TestData <- rnorm(100, mean = 2, sd = 10) GeoMData <- c(500, 1500, 20000, 1500, 500) ######## #ヒストグラムの描写 hist(TestData) #算術平均 mean(TestData, na.rm = TRUE) [1] 2.110568 #下記と同じ #残念ながら欠損値は考慮していません sum(TestData)/length(TestData) [1] 2.110568 #中央値 median(TestData, na.rm = TRUE) [1] 1.830129 #幾何平均 #0や負を含まない #ベクトルの積積:cumprodコマンド max(cumprod(GeoMData))^(1/length(GeoMData)) [1] 1622.671 #下記と同じ exp(mean(log(abs(GeoMData)))) [1] 1622.671 #調和平均 length(TestData)/sum(1/TestData) [1] 7.232387 #下記も同じ 1/mean(1/TestData) [1] 7.232387 [/code] 少しでも、あなたのウェブや実験の解析が楽になりますように!!

スポンサードリンク

スポンサードリンク