先日は分散について学びました。
数学の復習◇分散とは?◇わかりやすく解説 - 子持ち共働き社会人がセミリタイアを目指すブログ
今日はその続きで標準偏差について学んでみたいと思います。
標準偏差とは?
標準偏差とは平均値からどの程度離れているかの指標です。
英語ではstandard deviationで、SDと略されることが多いです。
記号で表記する場合はsやσになります。
算出方法は?
標準偏差は平均から個々の数値をひいた数値の二乗の合計をデータの数で割った数の平方根です。
平方根をとるまえの数値は分散ですので、分散の平方根が標準偏差ということになります。
分散で得られた数値は二乗されているということで、単位も元々のデータにあった単位の二乗(cmならcm^2、gならg^2)になってしまいます。
そこで、最後に平方根をつけることにより、もとのデータと単位をあわせます。
これで、標準偏差を算出すれば、データのばらつき具合が評価できます。
例
例えば、ある植物の高さのデータが以下のようになっていた場合を考えてみます。
例1 ばらつきが大きい場合
10 cm, 15 cm, 10 cm, 12 cm,18 cm
平均値は65cm÷5で13 cmとなります。
平均値と個々のデータの差は以下のようになります。
10 cm-13 cm=-3 cm , 15 cm-13 cm=2 cm , 10cm-13 cm=-3 cm,
12 cm-13 cm=-1 cm, 18 cm-13 cm=5 cm
次にこの結果を二乗します。
9 cm^2, 4 cm^2, 9 cm^2, 1 cm^2, 25 cm^2
これらの合計は48 cm^2
自由度で割ると
48 cm^2÷4=12 cm^2
最後にルートをとると、だいたい3.5 cmとなります。
例2 ばらつきが小さい場合
10 cm, 11 cm, 9 cm, 10 cm, 10 cm
平均は10 cm
個々のデータとの差は
0 cm, 1 cm, 1 cm, 0 cm, 0 cm
二乗の合計は
2 cm^2
自由度で割ると
0.5 cm^2
ルートをとると、およそ0.7 cmとなります。
見た目にも例1の方がばらつきが大きいですし、標準偏差としても例1の方がかなり大きいことがわかりますね。
相対標準偏差とは?
ちなみに、この標準偏差を平均で割ったものを変動係数(coefficient of variation CV)や相対標準偏差(relative standard deviation SRD)といい、平均が異なるデータの比較に使用したりします。