メインコンテンツまでスキップ

確率分布 Navi

星の数ほどある確率分布から、あなたの目的にピッタリの分布がきっと見つかる!

(データの特徴から最適な分布を見つける⇒確率分布の世界

件数や人数など整数を対象にしている場合

件数や人数など整数を対象にしている場合

データ範囲分布名説明
有限

ベルヌーイ

成功か失敗か。イチかバチかのモデル。コイントスが代表的な事例。

一様(離散)

「同様に確からしい」分布。

  • サイコロ,ルーレット
  • 無作為抽出
  • 並べ替え(ランダムシャッフル)

公正なコイン。コイントスをして表が出たら右に1歩、裏が出たら左に1歩…これが1次元ランダムウォークです。


正4面体のサイコロ。各面には「右」「左」「前」「後ろ」と書いてある。サイコロを振って、出た面に従って1歩…これが2次元ランダムウォークです。


正6面体のサイコロ。各面には「右」「左」「前」「後ろ」「上」「下」と書いてある。サイコロを振って、出た面に従って1歩…これが3次元ランダムウォークです。

無限

ポアソン

たまにデタラメに発生する事故のようなものの分布。

  • 1時間あたりの E-mail 数
  • 1年間あたりの 飛行機事故数
  • 国道1km当たりのレストラン数

「たまに」というのが大事。頻度が大きい場合には

正規分布

で近似できる。

重さ、長さ、時間、収益率... 整数に限らずどんな値でもとる場合

整数に限らずどんな値でもとる場合

データ範囲分布名説明
有限

ベータ分布

分布形状の自由度がかなり高いので、様々な分布にフィットさせることが出来る。有限区間のデータで、素性がはっきりしなくて、正規分布ではうまくいかないようなものはこれを試してみると良い。

ジョンソン SB

有限区間で、非対称な形状の分布として

ベータ分布

と同様に素性不明のデータのフィットに使える。平均、標準偏差、歪度、尖度を自由に調整できる。 林学での利用事例あり(森林の樹木の幹の直径の分布)

クマラスワミー

ベータ分布やジョンソン SB 分布は手に負えない。かといって三角分布ではシンプルすぎる...これくらいがちょうどいいかも

三角

分布関数が簡単な数式なので扱いやすい。有限区間で、山が1つの分布で、左右非対称を実現する分布として、

ベータ分布

ジョンソン SB 分布

の代わりに使える。

一様

逆関数法で他の分布に従う乱数を生成する際に元になる乱数

U字型2次

U字型の分布としては最もシンプルなもの。ベータ分布の替わりになる。
半無限

指数

たまに起きる事故のようなものの「間隔」の分布。

  • 事故が起きる間隔
  • コンビニに客がやってくる間隔
  • 放射性崩壊の間隔

この分布にしたがって事故が発生すると、その頻度は

ポアソン分布

になる。

ガンベル(タイプ2)

極値理論

対数正規

  • 年収の分布
  • 株価の対数収益率の分布

これらのデータの対数をとると正規分布になる。この場合元のデータは対数正規分布に従っている。

パレート

元々は収入の分布のモデルとして誕生した分布。ベキ分布といわれる分布群の1つ。今はさまざまな事象がベキ分布に従うということが分かってきて、その存在感を増している。

  • 貯蓄額の分布
  • 分布の裾の形(極値理論)

ワイブル

信頼性工学における故障率を表す代表的な分布。極値理論でも使われる。

カイ誰か教えて!

カイ2乗

カイ2乗検定

ガンマ

降水量分布。保険クレーム額分布。
FF 検定
無限

コーシー

正規分布と同じ、無限区間で山が1つの分布。しかし、正規分布では到底説明できないくらいに外れ値の多い分布として利用される。

ガンベル(タイプ1)

極値理論

ジョンソン SU

正規分布より裾が厚く、歪度や尖度も調整可能なため、VaR の計算などでこの分布を正規分布の代わりに使うことが注目されている。

ラプラス

誰か教えて!

ロジスティック

正規分布に良く似ているが、裾が少し厚い。正規分布より式が簡単で扱いやすいので正規分布の代わりに使われることがある。 また、この分布の

累積分布関数

は「ロジスティック曲線」と呼ばれ、様々な分野で応用されいる。

  • 伝染病の広がり方
  • 新製品の売れ方
  • 人口増加モデル
  • 習熟度

正規(単変量)

どこにでも顔を出す基本的な分布。これを知らないと何もできない。

正規(多変量)

モンテカルロシミュレーションによるポートフォリオの VaR の算出に使用。

tt 検定