一様分布(離散)(Discrete uniform distribution)
ギャンブルに勝つ!一様分布(離散)
どの教科書でもまず間違いなく最初に挙げる確率の事例といえば、やっぱりサイコロじゃないでしょうか(ベルヌーイ分布よりも確率っぽい)。
6面体のサイコロをふって、1の出る確率は?じゃあ偶数の出る確率は?などなど聞き覚えがあるでしょう。
ここで現れる重要なキーワードは「同様に確からしい」。 つまり、1が出る確率も6が出る確率も同じということ。したがって、どの目が出る確率もみんな 1/6 となるのです(確率を全部足したら 1 にならないといけないからね)。これこそが一様分布の一様(全て同じ)たる所以ですね。
グラフにするとこんな感じ。
例えば、ルーレットも代表的な一様分布の事例。みんな知っている通り、円盤の円周を等間隔に区切って、転がしたボールがどの区間に落ちるかを当てるゲームですね。 この場合も、どの目が出るか(どこにボールが落ちるか)は「同様に確からしい」ので、一様分布になります。
ちなみに、実際のルーレットの区画の数は 37(ヨーロピアンスタイル)、38(アメリカンスタイル)、39(メキシカンスタイル)の3種類あったりします。ちょっと得したでしょ?
サイコロにしても、ルーレットにしても確率的に発生する事象は番号がつけられます(サイコロなら目そのもの。ルーレットなら、適当な区画から順に番号をつければいいですね)。 また、必ず上限と下限があります。番号の最小値をa、最大値をbとすると、どの目が出る確率も、
となります(分母の +1 に注意!植木算をがんばって思い出してください)。サイコロならば ですね。
特別な条件下の一様分布には特別な名前 が付いているものです。
-
公正なコイン(裏表のどちらが出るかが同様に確からしいコイン)を使ったコイントスで、表を 1、裏を 0 としたもの。これは成功確率が0.5のベルヌーイ分布と一致します。
-
目が1つしかない場合(2枚のコインを張り合わせて、両面表にしたコインでの表の出る確率)も考えられます(いや、面白いかじゃなくてあくまで可能性ですから!)。この分布は退化分布と呼ばれています。
もうひとつの特別な状況が連続極限で、その場合は一様分布(連続)となります。
分布の形状
基本情報
-
2つのパラメータ が必要です。
これらのパラメータはそれぞれ、分布の最小値と最大値を表します。
-
整数 で定義された離散分布です。
確率
-
Excel での累積分布関数 (c.d.f.) と 確率質量関数 (p.m.f.)の求め方
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 3 | 対象となる値 |
3 | 1 | 分布のパラメータ A の値 |
4 | 6 | 分布のパラメータ B の値 |
5 | 数式 | 説明(計算結果) |
6 | =IF(A2<A3,0,IF(A2<=A4, (A2-A3+1)/(A4-A3+1),1)) | 上のデータに対する累積分布関数の値 |
7 | =IF(AND(A3<=A2,A2<=A4),1/(A4-A3+1), 0) | 上のデータに対する確率質量関数の値 |
分布の特徴
平均 -- 分布の"中心"はどこ? (定義)
-
分布の平均 は次式で与えられます。
-
Excel での計算法
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 1 | 分布のパラメータ A の値 |
3 | 6 | 分布のパラメータ B の値 |
4 | 数式 | 説明(計算結果) |
5 | =(A2+A3)/2 | 上のデータに対する分布の平均 |
標準偏差 -- 分布はどのくらい広がっているか(定義)
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 1 | 分布のパラメータ A の値 |
3 | 6 | 分布のパラメータ B の値 |
4 | 数式 | 説明(計算結果) |
5 | =SQRT(((A3-A2+1)^2-1)/12) | 上のデータに対する分布の標準偏差 |
歪度 -- 分布はどちらに偏っているか(定義)
- 分布の歪度 は です。
尖度 -- 尖っているか丸まっているか (定義)
-
分布の尖度 は次式で与えられます。
-
Excel での計算法
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 1 | 分布のパラメータ A の値 |
3 | 6 | 分布のパラメータ B の値 |
4 | 数式 | 説明(計算結果) |
5 | =-6*((A3-A2+1)^2+1)/(5*((A3-A2+1)^2-1)) | 上のデータに対する分布の尖度 |
乱数
- Excel での乱数生成法
A | B | |
---|---|---|
1 | データ | 説明 |
2 | 1 | 分布のパラメータ A の値 |
3 | 6 | 分布のパラメータ B の値 |
4 | 数式 | 説明(計算結果) |
5 | =INT((A3-A2+1)*NTRAND(100))+A2 | 100個の一様乱数を Mersenne Twister アルゴリズムで生成します。 |
メモ: この使用例の数式は、配列数式として入力する必要があります。使用例を新規ワークシートにコピーした後、A5:A104 のセル範囲 (配列数式が入力されているセルが左上になる) を選択します。F2 キーを押し、Ctrl キーと Shift キーを押しながら Enter キーを押します。この数式が配列数式として入力されていない場合、単一の値 2 のみが計算結果として返されます。