必要となるたびに勉強しては、すぐ忘れてしまう確率論の用語等を、自分のために一通りまとめておく。
今回参考にしたのは、以下の2冊。(両方とも値段以上の価値のある良書だと思います。)
- [1]結城浩, 数学ガール(乱択アルゴリズム)
- [2]平岡和幸, 堀玄 プログラミングのための確率統計
確率には以下の3種類があり、ここで扱いたいのは2番目.
コインの裏表、サイコロの出る目など、離散的な事象を扱う場合、離散(型)確率分布を考える.
-
標本空間『 Ω 』 : 施行の結果として起こりうるすべての事柄の集合.全事象とも呼ばれる.
例) 1個のサイコロを投げたとき出うる全ての目{⚀ , ⚁ , ⚂ , ⚃ , ⚄ , ⚅}
-
標本(点) 『 ω ∈ Ω 』 : 標本空間の元.施行の結果起こりうる個々の事柄.
例) 1個のサイコロを投げたとき実際に出た目 ⚂
-
事象 『 A ⊂ Ω 』: 標本空間の部分空間. 施行の結果起こりうる事柄.
例) 1個のサイコロを投げたとき2以下の目が出る,という事象は {⚀, ⚁ } この二つの結果の集合になる
-
確率変数 『 X(ω) 』: 標本空間Ωから実数Rへの関数(標本点に実数値を対応させるもの).
例) サイコロの出目は現象であって、実数値への対応は定義する必要がある.例えばサイコロの出目の300倍の点をもらえるゲームの得点の確率変数は,
X(⚀)=300, X(⚁)=600, X(⚂)=900, X(⚃)=1200, X(⚄)=1500, X(⚅)=1800,
と定義できる.
-
確率 : ある事象の起こりやすさを表す. 必ず起こるなら1.
例) 600点もらえる確率は P(X(ω)=600)
-
確率分布 『P(A) or P(X)』: 任意の事象Aが起こる頻度を表すもの (注123).
例) 下を参照
確率分布の例2 : 1, 2, 3の目が無くて,4, 5, 6の目が2個ずつあるサイコロ
ω |
X |
P(X(ω)) |
⚀ | 300 | 0 |
⚁ | 600 | 0 |
⚂ | 900 | 0 |
⚃ | 1200 | 2/6 |
⚄ | 1500 | 2/6 |
⚅ | 1800 | 2/6 |
注1)確率論では, 確率, 確率分布, 確率変数と,"確率"のつく異なる用語が出てくるので混乱を招きやすい.これらをちゃんと区別する.
注2)確率分布(単に分布と呼ばれることも)は, すべての確率1を,各事象へどう振り分けているかを表すもので,離散分布なら上のように表の形で表せる.
注3)確率分布を考えるとき,事象そのものでなく確率変数の値に注目すると, 「確率変数Xが値xとなる頻度はどの程度か」 を表すものとも言える.
この場合,P(X=x)と表記する.
少し進むと裏にある事象は無視して,確率変数とその確率分布に対する議論で話が進む.
注4)
確率変数というのが,確率の話をわかりにくくしている気がする.これは英語で言うとrandom variableで,ランダムにいろんな値を取りうる変数という事.
で,各値を取る確率が確率分布P(X=x)で指定されている.
サイコロの出目のような離散的な標本空間でなく, 「ルーレットを回した時の針の角度[0,2π)」、
「次に電話が鳴るまでの時間」のような連続的な標本空間を考える.
-
標本空間 『 Ω 』
例) ルーレットを回した時の針の角度が取りうる値の集合, {θ|θ∈[0,2π)}.
-
標本(点) 『 ω∈Ω 』
例) ルーレットを回した時の針の角度の値, θ=π/2.
-
事象 『 A⊂Ω 』
例) ルーレットを回したときの針のが左上になる,π/2≦θ≦π.事象は標本空間の部分空間になる.
-
確率変数 『 X(ω) 』
例) 針の角度そのものを確率変数とすると: X(θ)=θ
針の角度の300倍を確率変数とすると: Y(θ)=300θ
-
確率
例) 針がπ/2とπの間を向く確率を, P(π/2≦X≦π)と表記する
-
確率分布 『 P(A) or P(X) 』
例) 確率密度関数を用いて表される(下参照).
連続的な確率変数を扱う場合,確率変数が広がりを持つ値をとる確率
はゼロでないが、その値がちょうどある値になる確率はゼロになる,
,
ため, 確率分布(任意の事象Aにどの様に確率1を割り振るか)は, 離散確率分布のように表の形で書く事が出来ない.
そこで,連続な標本空間の確率分布は,確率密度関数f
X(X)や累積分布関数F
X(X)を用いて表す.
累積分布関数 F
X(x) : 確率変数Xの値がx以下である確率,P(X≦x), を表す.
- F
X(x)は,0≦F
X(x)≦1を満たす(広義)単調増加関数.
- 連続確率分布では,X=aという標本点を考えても確率がゼロなので,広がりのある部分空間( X≦ a )を考えている.
確率密度関数 f
X(x) : 累積分布関数の導関数で,X=x付近での確率の密度を表す.
-次の関係が成り立つ.
戻る 確率論2へ