正規分布(単変量)(Normal distribution)
あの鐘を鳴らすのは正規分布
ベル=カーブ
**正規分布(英名 "Normal distribution")**は確率・統計で間違いなく最も重要な分布です。実際これを知らないと何もできない程!19世紀最大の科学者カール・フリードリヒ・ガウスが導入したことから、ガウス分布とも呼ばれています(彼の故郷、ドイツの旧10マルク紙幣にはガウスの自身と正規分布の形が描かれていました)。
先ずは正規分布の確率密度関数の形を見てみましょう。
- 左右対称
- 中心部分が一番高く、中心から離れれば離れるほど急速に減少していく
- (見ただけでは分からないけど)実はグラフは永遠に伸びていて、水平軸に接することはない。
均整のとれたこの形は古き良き時代の鐘を想起させることから「ベル=カーブ」という愛称も持っています。
分布の特徴
正規分布の形状はなんとたった2つの情報で決まってしまいます。
数式を少々(我慢我慢)
とにかく重要でどこにでも顔を出す分布なので、ここはひとつ数式を見てみましょう。他でもしょっちゅう出てくるものばかりで、きっと試験にも出ます。どうにか我慢してお付き合いください。
-
確率密度関数
上でみたベル=カーブを描き出す関数は、と与えられます。ここで、としてみると(つまり標準正規分布)、
となります。この関数は (ギリシャ文字の "ファイ" の小文字)と表記されます。この を使うと、標準じゃない正規分布は、
となります。
-
累積分布関数
累積分布関数は確率密度関数を積分したもの!としかいいようがありません。これも標準正規分布の場合には特別な表記が与えられています。
はギリシャ文字の"ファイ"の大文字です。この を使うと標準じゃない正規分布は、
となります。
その他のトピック
- 左右対称ということから、この分布の歪度(ゆがみ)は 0
- 正規分布の尖度(とがり具合)を 0 として、この分布より裾が厚い分布(尖度が正)を "Leptokurtic"な分布、裾が薄い分布(尖度が負)を "Platykurtic"な分布と呼ぶ
- 多数の分布の極限が正規分布になるということと、多数の不確定要素の積み重ねが正規分布を生み出す(中心極限定理)という事実によって、この分布はどこにでも顔を出す。
分布の形状
基本情報
- 無限区間 で定義された連続分布です。
確率
-
ここで は標準正規分布の確率密度関数です。
-
Excel での累積分布関数 (c.d.f.) と 確率密度関数 (p.d.f.)の求め方
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 0.5 | 対象となる値 |
3 | 8 | 分布のパラメータ M の値 |
4 | 2 | 分布のパラメータ Sigma の値 |
5 | 数式 | 説明(計算結果) |
6 | =NTNORMDIST((A2-A3)/A4,TRUE) | 上のデータに対する累積分布関数の値 |
7 | =NTNORMDIST((A2-A3)/A4,FALSE) | 上のデータに対する確率密度関数の値 |
- 関連 NtRand 関数 : NTNORMDIST
- 第2引数が TRUE の場合、NtRand 関数 NTNORMDIST は Excel 関数 NORMSDIST と同等です。
分位点
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 0.7 | この分布の確率 |
3 | 1.7 | 分布のパラメータ M の値 |
4 | 0.9 | 分布のパラメータ Sigma の値 |
5 | 数式 | 説明(計算結果) |
6 | =A4*NORMSINV(A2)+A3 | 上のデータに対する累積分布関数の逆関数の値 |
- NORMSINV は Excel 関数です。