今日は正規分布について復習したいと思います。
正規分布とは、確率分布の一つで、平均を中心に、ひと山形となる分布です。
正規分布は平均と分散で以下のように表せます。
N(μ,σ^2)
人の身長や果実の重さ等、自然界で一般的に見られる分布になります。
また、自然界のもののみならず、工場等で製造される製品の特性値等も正規分布に従うことが多いです。
例えば、容量100 mLのジュース等のように、ねらいの数値があるもの等は、ねらい通り製造できていれば、平均が100 mL付近になり、偶然誤差でプラス側とマイナス側にそれぞれすこしずつぶれたような正規分布になります。
製造の精度が高ければ、±0.1 mLだったり、平均あたりに集中した分布になるでしょうし、精度が低ければ、±5 mLといったように、平均から裾野が広いような分布になるでしょう。
いずれにしましても、通常は、100 mLを狙っていれば、その辺りの製品がもっとも多くなり、平均からずれたものほど少なくなるのは感覚的に理解できることかと思います。
データが正規分布に従う場合、平均値と標準偏差がわかれば以下の便利な性質が利用できます。
平均値±σの範囲に約68%のデータが、±2σの範囲に約95%のデータが、±3σの範囲にデータの99.7%が含まれるという性質です。
この性質を考えると、得られたデータがどの程度の頻度で発生するか想像するのに役立ちますね。