2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計...

44
確率・統計 (青山学院大学理工学部 2020 年度前期講義ノート) 松本裕行 2020 3 23 日改訂

Upload: others

Post on 30-Sep-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

確率・統計(青山学院大学理工学部2020年度前期講義ノート)

松本裕行

2020年 3月 23日改訂

Page 2: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

2

はじめに

何を学習するにも,教科書を持っているべきだと思います.この講義であれば,指定

した

確率・統計の基礎 (松本裕行),学術図書

を買ってくれるとウレシイです.

私は講義でこのノートを見ながら話をするので,参考のために公開します.数学上の誤

り,ミスタイプ,計算間違いなどあると思います.見つけた場合は,是非教えて下さい.

このノートは,私のHP

http://www.gem.aoyama.ac.jp/ matsumoto/index.html

においてあり,重要な間違いがあると学期内でも修正します.その場合は,ここにメモし

ようと思っています.修正の有無は,表紙の日付で確認して下さい. 重要な公式

(x+ y)n =n∑

r=0

nCrxryn−r 二項定理

ex =∞∑r=0

xr

r!指数関数のマクローリン展開

∞∑r=0

cxr =c

1− x(|x| < 1) 等比級数の和

Page 3: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

3

目 次

第 1章 確率変数,確率分布 5

1.1 離散分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.1 二項分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1.2 幾何分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.3 一般の離散分布,平均,分散 . . . . . . . . . . . . . . . . . . . . . 7

1.1.4 ポアソン分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.2 連続分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2.1 一様分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2.2 一般の連続分布,平均,分散 . . . . . . . . . . . . . . . . . . . . . 13

1.2.3 指数分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1.2.4 正規分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.3 独立確率変数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.3.1 独立な事象 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.3.2 独立な確率変数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

第 2章 極限定理 27

2.1 極限定理とは . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.2 大数の法則 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.3 モンテカルロ法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

2.4 中心極限定理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

第 3章 推定・検定 37

3.1 母比率の推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2 母平均の推定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

3.3 母比率の検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.4 母平均の検定 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Page 4: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂
Page 5: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

5

第1章 確率変数,確率分布

1.1 離散分布

例から始める.

1.1.1 二項分布

サイコロを n回ふるとき 6の目が r回出る確率は,

nCr

(16

)r(1− 1

6

)n−r

である.このとき,6の回数をXと書くと,Xはサイコロを振る前は値が分からず,X = r

の確率が上のように分かっているだけである.

このような変数を確率変数という.

サイコロを振るという試行を一般化することにより,確率・統計で最も基本的な二項分

布が定義される. 定義 1.1. pを 0 < p < 1を満たす実数とし,nを自然数とする.確率変数 X が,

0, 1, 2, ..., nに値をもち,X = rの確率 P (X = r)が

P (X = r) = nCrpr(1− p)n−r (r = 0, 1, 2, ..., n)

によって与えられるとき,Xは二項分布B(n, p)に従うという. 同じ試行を独立に n回繰り返すとき,確率 pの事象が起きる回数は二項分布に従う.統

計において,世論調査やテレビ番組の視聴率などを統計的に考える際の基本である.

なお,二項定理

(x+ y)n =n∑

r=0

nCrxryn−r

を用いると,∑n

r=0 nCrpr(1− p)n−r = 1が分かる.

Page 6: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

6 第 1章 確率変数,確率分布

1.1.2 幾何分布

サイコロを何回も独立に振るとき,始めて 6が出るまでに 6以外の目が出る回数をX

とすると,X = rの確率 P (X = r)は次で与えられる:

P (X = r) =(1− 1

6

)r 1

6(r = 0, 1, 2, ...).

このように,同じ試行を独立に繰り返すとき,確率 pの事象が始めて起きるまでに何回

試行を行ったかを考える. 定義 1.2. pを 0 < p < 1を満たす実数とする.確率変数Xが,0以上の整数に値をも

ち,X = rの確率 P (X = r)が

P (X = r) = (1− p)rp (r = 0, 1, 2, ...)

によって与えられるとき,Xはパラメータ pの幾何分布に従うという. 等比数列の和の公式

∞∑r=0

cxr =c

1− x(|x| < 1)

を用いると,∑∞

r=0(1− p)rpが分かる.

上で少しもどかしい言い方をしたのは,次の命題を簡単に述べるためである. 命題 1.3. m, rを 1以上の整数とし,Xが指数分布に従うとすると,X = mの下での

X = r +mの条件付き確率について次が成り立つ:

P (X ≧ r +m | X ≧ m) = P (X ≧ r). X ≧ rは r回までに,考えている事象が起きなかったということを意味する.上の命

題は,m回試行を行って起きなかったときにさらに r回試行を行っても起きないという事

象の確率はmには依らず,最初から考えて r回までに起きない確率と等しいことを意味

する.

証明. 等比数列の和の公式より,自然数 nに対して

P (X ≧ n) =∞∑k=n

(1− p)kp =(1− p)np

1− (1− p)= (1− p)n

である.したがって,

P (X ≧ r +m | X ≧ m) =P (X ≧ r +m かつ X ≧ m)

P (X ≧ m)=

P (X ≧ r +m)

P (X ≧ m)

=(1− p)r+m

(1− p)m= (1− p)r = P (X ≧ r)

となる.

Page 7: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.1. 離散分布 7

1.1.3 一般の離散分布,平均,分散

二項分布や幾何分布に従う確率変数のように,取り得る値が実数の離散的な部分集合で

ある確率変数を離散型確率変数という.

Xが離散型確率変数のとき,取り得る値の集合を a1, a2, ..., aNと書き,その確率を

P (X = ai) = pi (i = 1, 2, ...)

と書く.幾何分布のように,N = ∞となる場合もある.取り得る値とその確率のペア (ai, pi)Ni=1によって定まる値のばらつきを,離散分布と

いう.試験の結果は,piを結果が aiである受験生の割合とすると,離散分布の例を与える.

離散分布の特徴を表す量が,次の平均と分散である. 定義 1.4. (1) 確率変数Xが (ai, pi)Ni=1によって定まる離散分布に従うとき,

N∑i=1

appi

をXの期待値または平均と呼び,E[X]またはmによって表す.

(2) X −mをXの偏差と呼び,(X −m)2の期待値

E[(X −m)2] =N∑i=1

(ai −m)2pi

をXの分散と呼び,V [X]または σ2 (σ > 0)と表す. 分散は散らばりの広さを表す基本的な量である.分散がゼロであるのは,確率変数の取

り得る値が1つだけで確率的でない場合である.分散の平方根 σ =√V [X]を標準偏差と

呼ぶが,この講義ではあまり使わない.

(ai, pi)Ni=1が試験の結果の場合,平均については容易に理解されると思う.そして,

ai −m

σ× 10 + 50

が,得点 aiの偏差値である. 命題 1.5. α, βを定数とすると,

E[αX + β] = αE[X] + β, V [αX + β] = α2V [X]

が成り立つ.とくに,T =X −m

σとおくと,T の平均は 0,分散は 1である.

確率変数 T をXの正規化と呼ぶ.

Page 8: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

8 第 1章 確率変数,確率分布

証明. 平均については直感的に,分散については定義から容易に分かるが,丁寧に示して

おく.

確率変数Xが (ai, pi)Ni=1によって定まる離散分布に従うとする.平均については,

E[αX + β] =N∑i=1

(αai + β)pi = α

N∑i=1

aipi +N∑i=1

pi = αE[X] + β

となる.

分散についても,E[X] = mと書くと,

V [αX + β] = E[(αX + β − (αm+ β)2] = E[α2(X −m)2]

であり (これが α2E[(X − m)2]に等しいと言っても良いが,それで分からないなら,さ

らに),

E[α2(X −m)2] =N∑i=1

α2(ai −m)2pi = α2

N∑i=1

(ai −m)2pi = α2V [X]

となり結論を得る. 注意 1.6. V [X] = E[X2]− (E[X])2が成り立ち,分散の計算に便利である.実際,確

率変数Xが (ai, pi)Ni=1によって定まる離散分布に従うとき,

V [X] =N∑i=1

(ai −m)2pi =N∑i=1

(a2i − 2mai +m2)2pi

=n∑

i=1

a2i pi2mN∑i=1

aipi +m2

N∑i=1

pi

となり,

V [X] = E[X2]− 2mE[X] +m2 = E[X2]−m2

となる.記号としてはもっと簡単に,

V [X] = E[(X−m)2] = E[X2−2mX+m2] = E[X2]−2mE[X]+m2 = E[X2]−m2

と計算しても,同じ結果が得られる.

Page 9: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.1. 離散分布 9

二項分布,幾何分布の平均と分散を計算する.

二項分布の平均,分散 命題 1.7. Xが二項分布B(n, p)に従う確率変数のとき,平均と分散は次で与えられる:

E[X] = np, V [X] = np(1− p). 証明. 講義中に与える.

幾何分布の平均,分散 命題 1.8. Xがパラメータ pの幾何分布に従う確率変数のとき,平均と分散は次で与

えられる:

E[X] =1− p

p, V [X] =

1− p

p2.

証明. 講義中に与える.

確率分布を解析するときに,母関数と呼ばれる関数を用いることが多い.平均,分散な

どの計算にも役に立つので,ここで与える.

確率母関数,積率母関数 定義 1.9. 離散型確率変数Xの確率分布を (ai, pi)Ni=1とするとき,

BX(s) = E[sX ] =N∑i=1

saipi, MX(t) = E[etX ] =N∑i=1

etaipi

によって定まる sの関数BX(s),tの関数MX(t)を,それぞれXの確率母関数,積率

母関数と呼ぶ.ただし,N = ∞のときは,s, tは無限級数∑∞

i=1 |s|aipi,∑∞

i=1 etaipiが

収束する範囲で考える. 少なくとも形式的には問題ないし,べき級数の収束半径の話を学習すると分かることだ

が1,N = ∞のときでも母関数が定義される s, tの範囲内で,

d

dsBX(s) =

N∑i=1

aisai−1pi,

d

dtMX(t) =

N∑i=1

aietaipi

が成り立つ.従って,s = 1, t = 0を代入すると,

B′X(1) =

N∑i=1

aipi, M ′X(0) =

N∑i=1

aipi

となって,ともにXの平均となる.1青学では,解析学 IIで話をします.

Page 10: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

10 第 1章 確率変数,確率分布

さらに,

d2

ds2BX(s) =

N∑i=1

ai(ai − 1)sai−2pi,d2

dt2MX(t) =

N∑i=1

(ai)2etaipi

となるので,

B′′X(1) =

N∑i=1

ai(ai − 1)pi = E[X(X − 1)], M ′′X(0) =

N∑i=1

(ai)2pi = E[X2]

が成り立つ.分散は V [X] = E[X2]− (E[X])2をみたすので

V [X] = B′′X(1) +B′

X(1)− (B′X(1))

2 または V [X] = M ′′X(0)− (M ′

X(0))2

と,これらの母関数を用いて求めることができる.

二項分布や幾何分布などの代表的な確率分布に関しては,母関数が具体的な関数となる

ので解析に用いることができる.結果と証明を確認し,平均と分散を計算してみること. 命題 1.10. (1) Snを二項分布B(n, p)に従う確率変数とすると,Snの確率母関数,積

率母関数は,それぞれ次で与えられる:

BSn(s) = (ps+ 1− p)n, MSn(t) = (pet + 1− p)n.

(2) Xをパラメータ pの幾何分布に従う確率変数とすると,Xの確率母関数,積率母

関数は,それぞれ次で与えられる:

BX(s) =p

1− (1− p)s, MX(t) =

p

1− (1− p)et.

証明. (1) 定義から,

BSn(s) =n∑

r=0

sr nCrpr(1− p)n−r =

n∑r=0

nCr(ps)r(1− p)n−r,

MSn(t) =n∑

r=0

etr nCrpr(1− p)n−r =

n∑r=0

nCr(pet)r(1− p)n−r

であるから,二項定理を用いればよい.

(2) 二項分布の場合と同様に,

BX(s) =∞∑r=0

sr(1−p)rp =∞∑r=0

((1−p)s)rp, MX(t) =∞∑r=0

etr(1−p)rp =∞∑r=0

((1−p)et)rp

であるから,等比級数の和の公式を用いればよい.

Page 11: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.1. 離散分布 11

1.1.4 ポアソン分布

確率変数Snが二項分布B(n, p)に従うとし,nが大きな数で pが 0に近い場合を考える.

日常生活において,このような状況は多く現れる.例えば,nを世界中の一日の飛行機の

フライト数とし pを各機がトラブルを起こす確率とした場合,nを大きな病院への来院者

数とし pをある稀な病気の人の割合とした場合などを思い浮かべれば良い.また,nを放

射性物質の数とし pを1つの分子が崩壊する確率とする場合など,物理現象にも現れる.

他の例についてはあとで触れることにして,二項分布B(n, p)において,平均npを一定

(λとする)にしたままn → ∞,p → 0とした極限を考える.P (Sn = r) = nCrpr(1−p)n−r

に対して p =λ

nを代入すると,

P (Sn = r) =n!

r!(n− p)!

(λn

)r(1− λ

n

)n−r

となる.n → ∞のとき,n!

(n− p)!nr=

(1− 1

n

)(1− 2

n

)· · ·

(1− r − 1

n

)→ 0,(

1− λ

n

)n−r

=(1− λ

n

)n(1− λ

n

)−r

→ e−λ

であるから,r = 0, 1, 2, ...に対して

n!

r!(n− p)!

(λn

)r(1− λ

n

)n−r

→ e−λλr

r!

が成り立つ.この収束をポアソンの少数の法則と呼ぶことがある.

なお,指数関数のマクローリン展開から∞∑r=0

e−λλr

r!= e−λ

∞∑r=0

λr

r!= e−λeλ = 1

に注意すると,e−λλr

r!(r = 0, 1, 2, ...)によって離散分布が定まっていることが分かる.

定義 1.11. λを正の実数とする.確率変数Xが,0以上の整数に値をもち,X = rの

確率 P (X = r)が

P (X = r) = e−λλr

r!(r = 0, 1, 2, ...)

によって与えられるとき,Xはパラメータ pのポアソン分布に従うという. ポアソン分布の平均,分散 命題 1.12. X がパラメータ λのポアソンに従う確率変数のとき,平均と分散は次で

与えられる:

E[X] = λ, V [X] = λ.

Page 12: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

12 第 1章 確率変数,確率分布

証明. 計算すべき量は∞∑r=0

re−λλr

r!=

∞∑r=1

re−λλr

r!

である.ただし,r = 0の項は平均に寄与しないので和から除いた.

r = 0を除いたので,「約分」ができて∞∑r=1

re−λλr

r!=

∞∑r=1

e−λ λr

(r − 1)!= e−λ

∞∑r=1

λλr−1

(r − 1)!

となる.r − 1 = kとすると

e−λ

∞∑r=1

λλr−1

(r − 1)!= λe−λ

∞∑k=0

λk

k!= λ

となり.平均が λであることが分かる.

同様に,

E[X(X − 1)] =∞∑r=0

r(r − 1)e−λλr

r!=

∞∑r=2

r(r − 1)e−λλr

r!

が成り立つ.r ≧ 2のときは右辺の各項において「約分」ができるので,

E[X(X − 1)] =∞∑r=2

e−λ λr

(r − 2)!= e−λλ2

∞∑r=2

λr−2

(r − 2)!= λ2e−λ

∞∑k=0

λk

k!= λ2

となる.よって,

V [X] = E[X2]− (E[X])2 = E[X(X − 1)] + E[X]− (E[X])2 = λ2 + λ− λ2 = λ

となる.

会社などにかかってくる電話や放射性物質の崩壊などのように,時間の経過に伴ってあ

る事象Aが起きたりおきなかったりしているとし,時間間隔 [0, T ]内にAが起きる回数を

考える.

次の仮定をおく:

仮定 1.時間区間 [0, T ]を n等分するとき,それぞれの区間においてAは高々1回しか起

きず,起きる確率は,λを正の定数とし o(1)を n → ∞のとき o(1) → 0をみたす関数と

して,λT

n(1 + o(1))と書ける;

仮定 2.Aが起きるかどうかは,異なる区間で独立である.

このとき,[0, T ]においてAが起きる回数は二項分布に従い,Aが r回起きる確率は,

nCr

(λTn

)r(1− λT

n

)n−r

(1 + o(1)), (r = 0, 1, 2, ..., n)

という形に書ける.上で示したように (λが λT になっている以外本質的な違いはない),r

を固定して n → ∞とするとこの確率は e−λT (λT )r

r!に収束する.つまり,[0, T ]において

Aが起きる回数は,平均 λT のポアソン分布に従うと考えてよいことが分かる.

Page 13: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.2. 連続分布 13

1.2 連続分布

例から述べる.

1.2.1 一様分布

物質の質量や長さの測定値を四捨五入して小数点第1位までの小数で表すとき,誤差は

−0.05と 0.05の間である.測定値を四捨五入で整数で表すならば,誤差は−0.5から 0.5

の間であり,その値は「一様」に散らばると考えて良いであろう. 定義 1.13. a < bとする.確率変数Xが,区間 [a, b]に値をもち,a < c < d < bのと

き c ≦ X ≦ dの確率 P (c ≦ X ≦ d)が

P (c ≦ X ≦ d) =d− c

b− a

によって与えられるとき,Xは [a, b]上の一様分布に従うという. 1.2.2 一般の連続分布,平均,分散

一様分布のように,確率変数Xの取り得る値の集合が実数全体またはその部分区間で

あるとき,X を連続型確率変数という.ここでは,c ≦ X ≦ dの確率が,R上の非負関

数 f を用いて

P (c ≦ X ≦ d) =

∫ d

c

f(x)dx

によって積分で与えられる場合を考える.f を確率密度または確率密度関数と呼ぶ.

Xが [a, b]上の一様分布に従う場合は

f(x) =

1

b− a, a ≦ x ≦ b,

0, その他

である.このように,確率変数が値を取らないような xにおいては f(x) = 0として確率

密度 f の定義域を明示しないのが通例である.

Page 14: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

14 第 1章 確率変数,確率分布

定義 1.14. (1) 確率変数Xを確率密度 f をもつ連続型確率変数のとき,∫ ∞

−∞xf(x)dx

をXの期待値または平均と呼び,E[X]またはmと表す.

(2) (X −m)2の平均

E[(X −m)2] =

∫ ∞

−∞(x−m)2f(x)dx

をXの分散と呼び,V [X]または σ2 (σ > 0)と表す.σ =√

V [X]をXの標準偏差と

呼ぶ.

(3) BX(s) = E[sX ],MX(t) = E[etX ]を,Xの確率母関数,積率母関数と呼ぶ:

BX(s) =

∫ ∞

−∞sxf(x) dx, MX(t) =

∫ ∞

−∞etxf(x) dx.

注意 1.15. 連続型確率変数についても,離散型の場合と同様に,

V [X] = E[X2]− (E[X])2, E[αX+β] = αE[X]+β, V [αX+β] = α2V [X]

が成り立つ.証明は,離散型のときの確率をかけて和をとるという操作を,確率密度

を掛けて積分することに置きかえれば良い.例えば,3番目の主張であれば

V [αX + β] = E[(αX + β)− (αm+ β)

2

] = E[α2(X −m)2]

=

∫ ∞

−∞α2(x−m)2f(x)dx = α2

∫ ∞

−∞(x−m)2f(x)dx = α2V [X]

と証明される.

また,母関数を用いると,

B′X(s) =

∫ ∞

−∞sxs−1f(x) dx, M ′

X(t) =

∫ ∞

−∞xetxf(x) dx

より,B′X(1) = M ′

X(0) = E[X]が成り立つ.同様に,

B′′X(0) = E[X(X − 1)], M ′′

X(0) = E[X2]

であり,これらから分散も計算できる.

「原理的は」離散型確率変数の場合と同じで,和をとる代わりに積分すればよい. 積率母関数と確率分布は 1対 1対応をするなど便利なことが多くあり,応用上有用であ

る.積率母関数は,解析学における,ラプラス変換と本質的に同じものである.

Page 15: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.2. 連続分布 15

1.2.3 指数分布 定義 1.16. λを正の実数とする.確率変数Xの確率密度 f が

f(x) =

λe−λx,    x ≧ 0

0, x < 0

によって与えられるとき,Xはパラメータ λの指数分布に従うという. 指数分布は幾何分布の「連続版」と考えることができる.実際,次が成り立つ. 命題 1.17. 確率変数X がパラメータ λの指数分布に従うとき,任意の s, t > 0に対

して

P (X ≧ s+ t | X ≧ s) = P (X ≧ t)

が成り立つ. 証明. すべての u > 0に対して,

P (X ≧ u) =

∫ ∞

u

λe−λxdx = eλu

が成り立つ.したがって,

P (X ≧ s+ t | X ≧ s) =P (X ≧ s+ t かつ X ≧ s)

P (X ≧ s)=

P (X ≧ s+ t)

P (X ≧ s)

=e−λ(s+t)

e−λs= e−λt = P (X ≧ t)

となる.

命題の性質をみたす確率分布は指数分布に限ることも証明できるが省略する.また,時

間が連続に流れている中である事象がランダムに起きたり起きなかったりするとき,この

事象が始めて起きる時間をXとするとXが指数分布に従うことが証明できる.教科書 49

ページを参照のこと. 命題 1.18. 確率変数Xがパラメータ λの指数分布に従うとき,平均と分散は

E[X] =1

λ, V [X] =

1

λ2

によって与えられる.

Page 16: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

16 第 1章 確率変数,確率分布

証明. 平均は,部分積分により∫ ∞

0

xλe−λxdx = [x(−e−λx)]∞x=0 +

∫ ∞

0

e−λxdx =1

λ

と計算される.

分散は,X2の平均が,同様に,

E[X2] =

∫ ∞

0

x2λe−λxdx =2

λ2

となるので,

V [X] =2

λ2−(1λ

)2

=1

λ2

となる.

積率母関数を用いると,

MX(t) =

∫ ∞

0

etxλe−λx dx = λ

∫ ∞

0

e−(λ−t)x dx =λ

λ− t

が t < λであれば成り立つ.従って,M ′(0),M ′′(0)を求めれば,それぞれE[X], E[X2]に

等しいので,平均,分散が求まる.

この命題により,パラメータ λの指数分布を,平均1

λの指数分布とも呼ぶ.パラメー

タ λの指数分布という呼び方は,次のような場合に便利である. 命題 1.19. 確率変数X,Y が,それぞれパラメータ λ, µの指数分布に従い,独立であ

ると仮定する.このとき,minX,Y はパラメータ λ+ µの指数分布に従う. 証明. 示すべきことは,min(X,Y )の確率密度 f(x)が (λ+ µ)e−(λ+µ)x となることだが,

P (min(X,Y ) ≦ x) ≡∫ x

0

f(t) dt = e−(λ+µ)x

を示せば,両辺を微分して結論を得る.

このために,まず

P (minX,Y ≧ t) = P (X ≧ t かつ Y ≧ t)

に注意する.Xと Y は独立という仮定から2,

P (minX,Y ≧ t) = P (X ≧ t)P (Y ≧ t) = e−λte−µt = e−(λ+µ)t

であり,結論を得る.2独立性に関しては後で述べるが,既知のことと思う.

Page 17: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.2. 連続分布 17

1.2.4 正規分布

正規分布は最も重要な確率分布である. 定義 1.20. 実数m,σ (σ > 0)に対して,確率変数Xの確率密度 f が

f(x) =1√2πσ

e−(x−m)2

2σ2  

によって与えられるとき,Xは正規分布N(m,σ)に従うという.とくに,N(0, 1)を

標準正規分布と呼ぶ. t =

x−m

σによって置換積分をすると,∫ ∞

−∞

1√2πσ

e−(x−m)2

2σ2 dx =

∫ ∞

−∞

1√2π

e−t2

2 dt

が成り立つ.これらの積分の値が 1であることは,重積分の計算と極座標による変数変換

が必要である.簡単に書くと,∫ ∞

−∞e−

t2

2 dt

∫ ∞

−∞e−

s2

2 ds =

∫∫R2

e−t2+s2

2 dtds =

∫ ∞

0

∫ 2π

0

e−r2

2 rdrdθ = 2π

∫ ∞

0

e−xdx = 2π

となることから分かる.ただし,r2

2= xによって置換積分を行った.

命題 1.21. 確率変数Xが正規分布N(m,σ)に従うとき,

E[X] = m, V [X] = σ2, MX(t) = emt+ 12σ2t2

が成り立つ. 証明. 平均については,

E[X] =

∫ ∞

−∞x

1√2πσ

e−(x−m)2

2σ2 dx =

∫ ∞

−∞(x−m)

1√2πσ

e−(x−m)2

2σ2 dx+m

∫ ∞

−∞

1√2πσ

e−(x−m)2

2σ2 dx

に注意する.第 2項はmに等しい.第 1項に対しては∫ ∞

−∞(x−m)

1√2πσ

e−(x−m)2

2σ2 dx = σ

∫ ∞

−∞

1√2π

te−t2

2 dt

となるので 0であることが分かる.

分散については,

V [X] =

∫ ∞

−∞(x−m)2

1√2πσ

e−(x−m)2

2σ2 dx == σ2

∫ ∞

−∞t2

1√2π

e−t2

2 dt

Page 18: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

18 第 1章 確率変数,確率分布

である.さらに,∫ ∞

−∞t2

1√2π

e−t2

2 dt = 2

∫ ∞

0

t21√2π

e−t2

2 dt =2√2π

∫ ∞

0

t(−e−t2

2 )′dt

となるので,

V [X] = σ2 × 2√2π

∫ ∞

0

e−t2

2 dt = σ2

∫ ∞

−∞

1√2π

e−t2

2 dt = σ2

となる.

積率母関数に対しては,

MX(t) =

∫ ∞

−∞etx

1√2πσ

e−(x−m)2

2σ2 dx

であり,指数部分を平方完成すると

tx− (x−m)2

2σ2= − x2

2σ2+

m+ σ2t

σ2x− m2

2σ2= −(x− (m+ σ2t))2

2σ2+

(σ2t+m)2

2σ2− m2

2σ2

= −(x− (m+ σ2t))2

2σ2+mt+

1

2σ2t2

となるから,

MX(t) =

∫ ∞

−∞

1√2πσ

e−(x−(m+σ2t))2

2σ2 dx× emt+ 12σ2t2 = emt+ 1

2σ2t2

となる.M ′X(0) = m,M ′′

X(0) = σ2 +m2は容易に確認できる. 命題 1.22. 確率変数Xが正規分布N(m,σ)に従うとき,実数 p, qに対してY = pX+q

はN(pm+ q, p2σ2)に従う. 証明. p > 0として示す.XがN(m,σ2)に従うことから,

P (a < Y < b) = P(a− q

p< X <

b− q

p

)=

∫ (b−q)/p

(a−q)/p

1√2πσ

e−(x−m)2

2σ2 dx

が成り立つ.ここで,y = px+ qによって置換積分をすると,

P (a < Y < b) =

∫ b

a

1√2πσp

exp−

(y−qp

−m)2

2σ2

dy =

∫ b

a

1√2πpσ

e− (y−(pm+q))2

2p2σ2 dy

を得る.これは,Y がN(pm+ q, p2σ2)に従うことを示す.

p < 0のときは,

P (a < Y < b) = P(b− q

p< X <

a− q

p

)に注意すれば,同様に証明することができる.

Page 19: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.2. 連続分布 19

とくに,T =X −m

σは標準正規分布に従う.T をXの正規化または標準化と呼ぶ.

z > 0に対して

P (0 ≦ T ≦ z) =

∫ z

0

1√2π

e−t2

2 dt

の値を与えるのが正規分布表である.逆に,P (T ≧ z)の値から zを与える表も正規分布

表と呼ばれる.後者は,推定,検定を行う際に便利である.

a < bに対して,

P (a < X < b) = P(a−m

σ< T <

b−m

σ

)が成り立つ.この右辺は,m,σが与えられれば正規分布表から求めることができる. 例題. 確率変数Xが正規分布N(m,σ)に従うし,Xの正規化を T とする.

(1) P (T ≦ a) = 0.1587, P (T ≦ b) = 0.9332となる a, bを正規分布表から求めよ.

(2) P (X ≦ 6) = 0.1587, P (T ≦ 16) = 0.9332であるとき,Xの平均と分散を求めよ.

Page 20: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

20 第 1章 確率変数,確率分布

1.3 独立確率変数

1.3.1 独立な事象 定義 1.23. 2つの事象A,B (ただし,P (A) > 0 とする)に対して,P (B | A)を

P (B | A) = P (B ∩ A)

P (A)

によって定義し,条件Aの下でのBの条件付確率という. この意味は,事象Aが起きる場合のみを考えて,その中で事象Bの起きる確率を考え

ているということである. 定義 1.24. 2つの事象A,B (ただし,P (A) > 0 とする)に対して,

P (B | A) = P (B | Ac) = P (B)

が成り立つとき,BはAと独立であるという.独立でないとき,従属という. BがAと独立ということは,Aが起きようが起きまいが,Bの起きる確率には影響を

与えないということである.このことを,条件付確率を使わずにA,Bに対称な形で表す

ことができるので,「AとBは (互いに)独立である」という言い方をする. 命題 1.25. 事象A,Bに対して,P (A) > 0を仮定する.このとき,BがAと独立で

あるための必要十分条件は,

P (B ∩ A) = P (A)P (B)

が成り立つことである. 証明は,乗法定理

P (B ∩ A) = P (B | A)P (A)

を用いれば容易にできるので演習問題とする.

Page 21: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.3. 独立確率変数 21

1.3.2 独立な確率変数 定義 1.26. 2つの確率変数X,Y が独立であるとは,a ≧ b, c ≧ dであれば

P (a ≦ X ≦ b, c ≦ Y ≦ d) = P (a ≦ X ≦ b)P (c ≦ Y ≦ d)

が成り立つことである. 例 1.27. (1) サイコロを 2回振るとき,1回目,2回目の目をそれぞれX,Y とすると,

Xと Y は独立である.

(2) Z = Y −Xとおくと,Xと Y は独立ではない. 注意 1.28. 上の例の (2)は,上の定義の条件を確認するのは面倒であるが,意味を考

えると当然である. 命題 1.29. 確率変数X,Y がともに離散型確率変数であり,確率分布が

P (X = ai) = pi (i = 1, 2, ...,M), P (Y = bj) = qj (j)1, 2, ..., N) (1.1)

によって与えられているとする.このとき,X と Y が独立であるための必要十分条

件は,すべての i = 1, ...,M と j = 1, ..., N に対して

P (X = ai, Y = bj) = P (X = ai)P (Y = bj)

が成り立つことである. X,Y が連続型確率変数のときは,

P (a ≦ X ≦ b, c ≦ Y ≦ d) =

∫∫[a,b]×[c,d]

f(x, y)dxdy

によって (X,Y )の散らばりを与える 2変数関数 f(x, y)が存在するときは,それぞれの確

率密度を fX(x), fY (y)と書くと

f(x, y) = fX(x)fY (y) (1.2)

が成り立つとき,Xと Y は独立である.詳細は,省略する.

いずれの場合も,次の重要なことが成り立つ.

Page 22: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

22 第 1章 確率変数,確率分布

定理 1.30. 2つの確率変数Xと Y が独立であれば,その積の平均について

E[XY ] = E[X]E[Y ]

が成り立つ. 証明. まず,Xと Y が離散型確率変数で,(1.1) を満たす場合に示す.この場合は,

E[XY ] =M∑i=1

N∑j=1

aibjP (X = ai, Y = bj) =M∑i=1

N∑j=1

aibjP (X = ai)P (Y = bj)

=M∑i=1

aiP (X = ai)N∑j=1

bjP (Y = bj) = E[X]E[Y ]

となり,結論を得る.

X,Y が連続型確率変数で,(X,Y ), X, Y の確率密度 f(x, y), fX(x), fY (y)が (1.2) をみ

たすとする.このときは,

E[XY ] =

∫ ∞

−∞

∫ ∞

−∞xyf(x, y) dx dy =

∫ ∞

−∞

∫ ∞

−∞xyfX(x)fY (y) dx dy

=

∫ ∞

−∞xfX(x) dx×

∫ ∞

−∞yfY (y) dy = E[X]E[Y ]

となる.

正規分布に従う独立な確率変数の和は,やはり正規分布に従う.これを正規分布の再生

性という.応用上,非常に重要である. 定理 1.31. 確率変数X,Y は独立で,それぞれ正規分布N(mX , σ

2X), N(mY , σ

2Y )に従

うとすると,X + Y は正規分布N(mX +mY , σ2X + σ2

Y )に従う. 証明. 積率母関数を用いる.示すべきことは,X + Y の積率母関数が正規分布N(mX +

mY , σ2X + σ2

Y )の積率母関数 (命題 1.21)となること,つまり

E[et(X+Y )] = e(mX+mY )t+ 12(σ2

X+σ2Y )t2

が成り立つことである.

これは,etX と etY は独立だから,前の定理を用いると,

E[et(X+Y )] = E[etXetY ] = E[etX ]E[etY ] = etmX+ 12σ2X t2etmY + 1

2σ2Y t2

となることから分かる.

Page 23: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.3. 独立確率変数 23

独立確率変数の数が多くなっても,正規分布の再生性は成り立つ. 定理 1.32. 確率変数X1, X2, ..., Xnは独立で,すべて正規分布N(m,σ2)に従うとする

と,X1 +X2 + · · ·+Xnは正規分布N(nm, nσ2)に従う.また,X1 +X2 + · · ·+Xn

nは正規分布N(m, σ

2

n)に従う.

この講義では,独立でない確率変数を考えることはないが,応用上は重要である.その

際に,次が重要である. 定義 1.33. 2つの確率変数 X と Y に対して,それぞれの平均を mX ,mY,分散を

V [X], V [Y ]と書くとき共分散Cov[X,Y ],相関係数 ρ[X,Y ]を

Cov[X,Y ] = E[(X −mX)(Y −mY )], ρ[X,Y ] =Cov[X,Y ]√V [X]

√V [Y ]

によって定義する. Xと Y が独立であれば,ともに 0である.−1 ≦ ρ[X,Y ] ≦ 1であり,ρ[X,Y ] > 0のと

きXと Y に正の相関があるといい,ρ[X,Y ] < 0のときXと Y に負の相関があるという.

Page 24: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

24 第 1章 確率変数,確率分布

1章の問題

問題 1.1. Snを二項分布B(n, p)に従う確率変数とするとき,確率母関数BSn(s),MSn(t)

を求め,それぞれの s = 1, t = 0における微分係数を計算することにより Snの平均と分

散を求めよ.

問題 1.2. X,Y を独立で,それぞれ二項分布B(m, p), B(n, p)に従う確率変数とするとき,

P (X + Y = n)を求めよ.X + Y の確率分布は何か3.

問題 1.3. X,Y を独立で,それぞれパラメータ λ, µのポアソン分布に従うとするとき,

P (X + Y = n)を求めよ.X + Y の確率分布は何か.

問題 1.4. Xをパラメータ λの幾何分布に従う確率変数とする.

(1) Xの確率母関数BX(s),積率母関数MX(t)を求めよ.これらが定義される s, tの区

間も求めること.

(2) s = 1および t = 0が (1)で求めた区間に属することに注意して,確率母関数BSn(s),

MSn(t)を求め,それぞれの s = 1, t = 0における微分係数を計算することによりX

の平均と分散を求めよ.

問題 1.5. X,Y を独立で,それぞれパラメータ p1, p2の幾何分布に従うとするとき,P (X+

Y = n)を求めよ.

問題 1.6. 袋に赤玉がR個,白玉がN −R個入っている.この袋から玉を n個取り出す.

ただし,取りだした球は元に戻さないとする.

(1) 赤玉の個数が k個である確率 PN,R(r)を求めよ.

(2) 0 < p < 1なる pに対して,R

N= pを保ってN → ∞, R → ∞とするときの PN,R(r)

の極限値を予想して,それを確かめよ.

問題 1.7. X がパラメータ λの指数分布に従うとき,X の積率母関数MX(t)を微分する

ことにより平均と分散を求めよ.

問題 1.8. X,Y が独立で,ともにパラメータ λの指数分布に従うとするとき,maxX,Y の確率密度を求めよ.

問題 1.9. Xが正規分布N(m,σ2)に従うとき,Xの積率母関数MX(t)を微分することに

より平均と分散を求めよ.

問題 1.10. 定理 1.32を示せ.

3意味を考えると,結論は直ぐに分かる.

Page 25: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

1.3. 独立確率変数 25

問題 1.11. y = g(x)を 0 ≦ g(x) ≦ 1をみたす [0, 1]上の連続関数とする.X,Y を [0, 1]上

の一様分布に従う独立な確率変数として,U1を次で定める:

U1 =

1, Y ≦ g(X)

0, Y > g(X).

(X,Y )を xy-平面上の正方形 [0, 1]× [0, 1]上の一様分布する確率変数 (ベクトル)と考えて,

(X,Y )が y = f(x)のグラフより下にあれば U1 = 1で,そうでないならば U1 = 0と考え

ると分かりやすい.また,U2, U3を次で定める:

U2 = g(X), U3 =g(X) + g(1−X)

2.

(1) E[U1] = E[U2] = E[U3] =

∫ 1

0

f(x) dxを示せ.

(2) V [U1], V [U2], V [U3]を求めよ.

問題 1.12. 命題 1.25 を証明せよ.

問題 1.13. F (x), −∞ < x < ∞を連続分布の分布関数とし,すべての x ∈ Rに対して

F (x) > 0と仮定し,単調増加関数 F の逆関数を F−1と書く.このとき,T を (0, 1)上の

一様分布に従う確率変数とし,X = F−1とおくと,Xの分布関数がF であることを示せ.

この主張は,(0, 1)上の一様乱数があれば,任意の確率分布に対応する乱数が構成でき

ることを意味する.ただし,Rの部分区間上の確率分布の場合は修正が必要である.ま

た,離散分布についても,修正を施せば,類似の主張ができる.

以下,1章の話題に関するおまけの問題

問題 1.14. 当たりがm本,外れが n本入っているくじを二人の人が引くとき,初めに引

く人と後に引く人のどちらが有利か.

問題 1.15. (ベイズの定理) 全事象をΩとする.事象列A1, A2, ..., Anが,

Ai ∩ Aj = ∅ (i = j) かつ Ω = A1 ∪ A2,∪ · · · ∪ An = Ω

をみたすならば,事象BのもとでのAiの条件付確率に対して

P (Ai|B) =P (Ai)P (B|Ai)

P (A1)P (B|A1) + P (A2)P (B|A2) + · · ·+ P (An)P (B|An)

が成り立つことを示せ.

問題 1.16. ある製品はA,B,C,Dの 4工場で作られていて,各工場の生産量の比は

3 : 3 : 4 : 5である.また,それぞれの工場における不良品の割合は,3%, 4%, 3%, 7%であ

るという.1つ不良品が出たとき,それがA,B,C,Dの製品である確率をそれぞれ求

めよ.

Page 26: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

26 第 1章 確率変数,確率分布

問題 1.17. nを正整数とするとき,X1, X2, ..., Xnを独立で P (Xi = ±1) =1

2をみたす確

率変数列とし,Snを Sn = X1 +X2 + · · ·+Xnで定める.

(1) P (Sn = 0)を求めよ.

(2) E[Sn], V [Sn]を求めよ.

問題 1.18. nを正整数,0 < p < 1とするとき,X1, X2, ..., Xnを独立で P (Xi = 1) = p,

P (Xi = −1) = 1− pをみたす確率変数列とし,Snを Sn = X1 +X2 + · · ·+Xnで定める.

(1) P (Sn = 0)を求めよ.

(2) E[Sn], V [Sn]を求めよ.

Page 27: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

27

第2章 極限定理

2.1 極限定理とは

確率変数が多くあるときに種々の量の散らばりの様子を調べた結果を総称して,極限定

理と呼んでいる.たとえば,サイコロを何回もふるときの目の数の平均が真の平均 3.5に

近いことが予想されるように,同じ試行を繰り返したときのランダムな量の平均は,真の

平均の値に近いことが期待される.これは大数 (たいすう)の法則と呼ばれる「定理」の

形に述べられる.また,この際の誤差は,多くの場合,正規分布だと考えてよい.これは

中心極限定理呼ばれる定理で表すことができる.中心極限定理は,読んで字のごとく,極

限定理の「中心」をなす定理という意味で,著名な数学者 (解析学者)のポリヤが名付け

たと言われている.

極限定理は統計の話題の中だと理解しやすいので,先走って統計の話を少しする.

数理統計学の基本的な目的は,母集団と呼ばれる我々がその性質を知りたい集合があっ

て,全体は数が多くてすべてを調べることが不可能な場合に,母集団からいくつかランダ

ムに選んだ結果 (標本という)から母集団の性質を知ろうとすることである.

例えば,あるテレビ番組の関東地方における視聴率を考える.知りたいのは関東地方全

体における視聴率であるが,すべての世帯のテレビを調査するのは不可能である.そこ

で,調査会社は 900件程度の世帯を選んで視聴率調査を行い,その結果を公表しているの

である.これは,調査結果から全体を推定しようとしていると考えて良いであろう.新聞

各社の行う世論調査も同様である.

また,自動車会社は各車種の燃費などの数値を公開している.1台 1台で燃費などの特

性量には誤差が含まれるが,すべての自動車を調査するのは不可能である.調査すると新

車でなくなるし,この場合の対象は将来に製造される自動車も考察の対象に入っているか

らである.この場合も数台をテスト走行させて,その数値を公開していると思われる.

したがって,母集団の性質を「正確に知る」ことは不可能で,その一部を抜き出して,

その一部から全体を「知ろうとする」ことが求められる.これが統計学の目的である.

標本をランダムに選ぶということを,標本の値は 1つの確率分布に従い,それをいくつ

か調べたと考える.蛍光灯の寿命は 1本 1本異なり,調べてみないと分からない.つまり,

それぞれの寿命はある確率分布に従い,寿命が長いものもあれば短いものもあると考える

のである.

Page 28: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

28 第 2章 極限定理

このように,標本とは母集団の値の散らばりを表す確率分布に従う確率変数であり,標

本を選んで調査することにより (サイコロを振ったときの目のように) 確率変数の実現値

が得られるということである.母集団の平均をm,標本をX1, X2, ..., Xnと書くとき,m

の値は未知であり,標本の中の平均

Xn =X1 +X2 + · · ·+Xn

n=

1

n

n∑i=1

Xi

を考えて,Xnとmの値が近いことを期待するのは当然であろう.実際,n → ∞のときXnがmに収束することが証明できる.これが,大数の法則である.

また,Xnはやはり確率変数であるし,標本数の nは有限な値である.したがって,Xn

とmの差を考慮しないといけない場合がある.nが十分大きいならばこの差が正規分布

に従うと考えて良いことを示すのが,中心極限定理である.

Page 29: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

2.2. 大数の法則 29

2.2 大数の法則

サイコロを n回振ったときに 1の目の出る割合を pn =1

nSnとすると,nが大きいなら

ば pnが1

6に近いことを期待するのは自然であろう.また,出た目の和を Snとすると,1

回当たりの平均Sn

nが 3.5十近いことも予想される.これらのことを数学的に述べるのが

大数の法則と呼ばれる定理である.

大数の法則 定理 2.1. X1, X2, ...を互いに独立で,同じ確率分布に従う確率変数列とし,それぞれ

の平均をm,分散を σ2とする.このとき,

Sn = X1 +X2 + · · ·+Xn, Xn =Sn

n

とおくと,任意の ε > 0に対して

P (|Xn −m| ≧ ε) → 0 (n → ∞)

が成り立つ. X1, X2, ...を互いに独立で,同じ確率分布に従う確率変数列とするということは,独立

に同じ試行を繰り返すときの結果を並べているということである.サイコロを何度も振る

とき,Xiとして i回目の目を考えれば理解しやすい.

定理 2.1のような収束を確率収束という.もっと強く,確率 1でXnはmに収束するこ

と,または n → ∞のときXnがmに収束しないような事象はいくつも考えることができ

るがその確率は 0であることを示すことができる.ただし,証明は少し大変になる.確率

収束の意味の大数の法則であれば,比較的容易に証明することができる.

証明の前に,冒頭に述べたサイコロを何回も振ったときの 1の出る割合のような,比率

の話にも上の定理が適用できることを示す.

独立に同じ試行を繰り返すとして,ある確率 pの事象Aを考える.サイコロを何回も

振る場合であれば,1が出るという事象を念頭におけば良い.このとき,X1, X2, ...を,

Xi =

1, i回目にAが起きた,

0, i回目にAが起きなかった,

とおくと,Sn = X1 + · · ·+Xnは n回中Aの起きた回数を表し,Snは二項分布B(n, p)に

従う.そして,Xn =Sn

nは n回中Aの起きた割合を表す.Xiの平均は

E[Xi] = 1× p+ 0× (1− p) = p

となるから,定理 2.1 より次を得る.

Page 30: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

30 第 2章 極限定理

系 2.2. 同じ試行を n回独立に行ったとき,ある確率 pの事象が起きた割合を pnとす

ると,任意の ε > 0に対して

P (|pn − p| ≧ ε) → 0 (n → ∞)

が成り立つ. 定理 2.1 の証明を与える.その本質は,SnおよびXnの平均と分散の計算にある. 補題 2.3. 定理 2.1 と同じ仮定の下で,

E[Sn] = nm, V [Sn] =σ2

n,

E[Xn] = m, V [Xn] =σ2

n.

が成り立つ. 証明. 平均に関する主張については省略する.

分散については,まず定義から次の変形を行う (講義では n = 2, 3の場合も話す):

V [Sn] = E[(X1 + · · ·+Xn − nm)2] = E[(X1 −m) + · · ·+ (Xn −m)

2

]

= E[ n∑

i=1

(Xi −m)2 + 2∑i<j

(Xi −m)(Xj −m)]

=n∑

i=1

E[(Xi −m)2] + 2∑i<j

E[(Xi −m)(Xj −m)].

右辺第 1項については,E[(Xi −m)2] = σ2 (i = 1, 2, ..., , n)だから

n∑i=1

E[(Xi −m)2] = nσ2

が成り立つ.第 2項については,Xi −mとXj −mは独立で平均は 0だから

E[(Xi −m)(Xj −m)] = E[Xi −m]E[Xj −m] = 0であり,∑i<j

E[(Xi −m)(Xj −m)] = 0

である.よって,V [Sn] = nσ2となる.

V [Xn]については,

V [Xn] = E[(Xn −m)2] = E[(Sn

−m)2]

=1

n2E[(Sn − nm)2] =

1

n2V [Sn]

となるから,上で示した V [Sn] = nσ2から結論を得る.

Page 31: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

2.2. 大数の法則 31

補題より,n → ∞のとき V [Xn] → 0でありXnの散らばりがなくなることが分かる.

これが大数の法則の本質である.このことを数学的に示すには,次を用いる.

チェビシェフの不等式 定理 2.4. 確率変数Xの平均をE[X],分散を V [X]とすると,任意の ε > 0に対して

P (|X − E[X]| ≧ ε) ≦ V [X]

ε2

が成り立つ. 証明. Xが確率密度 f をもつ連続型確率変数のときに示す.分散の定義

V [X] =

∫ ∞

−∞(x−m)2f(x)dx

の右辺の積分を,(−∞,m− ε), [m− ε,m+ ε], (m+ ε,∞)の 3区間に分ける.すると,被

積分関数は非負だから,

V [X] ≧∫ m−ε

−∞(x−m)2f(x)dx+

∫ ∞

m+ε

(x−m)2f(x)dx

となり,さらに右辺の積分区間において (x−m)2 ≧ ε2が成り立つので,

V [X] ≧∫ m−ε

−∞ε2f(x)dx+

∫ ∞

m+ε

ε2f(x)dx = ε2∫ m−ε

−∞f(x)dx+ ε2

∫ ∞

m+ε

f(x)dx

= ε2P (|X −m| ≧ ε)

となる.これから,結論を得る.

チェビシェフの不等式を用いると,大数の法則は容易に得られる.

定理 2.1の証明. V [Xn] =σ2

nより,チェビシェフの不等式を用いると

P (|Xn −m| ≧ ε) ≦ 1

ε2σ2

n→ 0 (n → ∞)

となる.

Page 32: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

32 第 2章 極限定理

2.3 モンテカルロ法

モンテカルロ法とは,定積分の計算など決定論的な (確率的でない)問題を,大数の法

則を応用して,乱数の助けを借りて考えるという方法である.ここでは,その最も基本的

な場合を述べる.

g(x)を区間 [0, 1]上の連続関数とし,0 ≦ g(x) ≦ 1 (0 ≦ x ≦ 1)と仮定し

p =

∫ 1

0

g(x)dx

とおく.

X1, X2, ..., Y1, Y2, ...を [0, 1]上の一様分布に従う独立確率変数列とし,

Ui = g(Xi), Zi =

1, Yi ≧ g(Xi),

0, Yi > g(Xi)

とおく.このとき,Ui, Ziの平均はともに pであり (i = 1, 2, ...),大数の法則から

U1 + U2 + · · ·+ Un

n→ p,

Z1 + Z2 + · · ·+ Zn

n→ p (n → ∞)

が成り立つ.分散については,問題 1.11 を参照のこと.

計算機に (一様)乱数を発生させて左辺の値をシミュレーションすることにより pの近

似値を求めることができる.このような 1次元の場合は,他に多くの方法が知られている

ので,あまり有用ではない.しかし,同じ原理で多変数関数の定積分の近似値を求めるこ

とができるので,変数が多い場合は有用である.

Page 33: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

2.4. 中心極限定理 33

2.4 中心極限定理

大数の法則のときと同様,X1, X2, ...を互いに独立で,同じ確率分布に従う確率変数列

とし,それぞれの平均をm,分散を σ2とする.このとき,大数の法則は

Sn = X1 +X2 + · · ·+Xn, Xn =Sn

n

とおくと,経験的な平均とも言うべきXnが,真の平均mに収束することを示している.

その証明で鍵となるのは,V [Xn] =σ2

n2という等式であり,これが n → ∞のとき 0に

収束することから大数の法則は証明された.しかし,統計に応用するような実際の問題で

は試行回数 nは有限であり (世論調査では n = 2000程度である),Xnの分散σ2

nが無視で

きない場合がある.

そこで,Xnの正規化

Tn =Xn −m√

σ2/n=

Sn − nm√nσ2

を考える.Tnの平均は 0,分散は 1であるが,さらに Tnの確率分布が,元々のXiの確率

分布がどのようなものでも,n → ∞のとき標準正規分布に収束すること,したがって n

が十分大きいときは標準正規分布に従うと考えて良いことが証明される.これが,中心極

限定理である.

中心極限定理 定理 2.5. X1, X2, ...を互いに独立で,同じ確率分布に従う確率変数列とし,それぞれ

の平均をm,分散を σ2とする.このとき,

Sn = X1 +X2 + · · ·+Xn, Xn =Sn

n

とおくと,これらの正規化 Tn =Xn −m√

σ2

n

=Sn − nm√

nσ2の確率分布は,n → ∞のとき,

標準正規分布N(0, 1)に収束する.とくに,

P (a ≦ Tn ≦ b) →∫ b

a

1√2π

e−x2

2 dx (n → ∞)

が成り立つ.

Page 34: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

34 第 2章 極限定理

大数の法則のときと同様,同じ試行を独立に繰り返すとき,ある確率 pの事象Aを考

えて

Xi =

1, i回目にAが起きる,

0, i回目にAが起きない

とおくと,Sn = X1 + · · ·+Xnは n回中Aの起きた回数を表し,Snは二項分布B(n, p)に

従う.よって,定理 2.5 より次を得る.

ド・モワブル-ラプラスの定理 定理 2.6. Snを二項分布B(n, p)に従う確率変数列とするとき,

Tn =Sn − nm√

nσ2

の確率分布は,n → ∞のとき,標準正規分布N(0, 1)に収束する.とくに,

P (a ≦ Tn ≦ b) →∫ b

a

1√2π

e−x2

2 dx (n → ∞)

が成り立つ. 正規分布が現れることの必必然性を後で述べることにして,まずは使ってみる. 例 2.7. サイコロを 50回投げるとき,1の出る回数を S50とする.6 ≦ S50 ≦ 10の確

率を求める.

まず,二項分布に従うことから,

P (6 ≦ S50 ≦ 10) = P (S50 = 6) + P (S50 = 7) + · · ·+ P (S50 = 10)

≒ 0.112 + 0.140 + 0.151 + 0.141 + 0.116 ≒ 0.66

である.

一方,ド・モワブル-ラプラスの定理を用いると,半目の補正を行って,

P (6 ≦ S50 ≦ 10) = P (5.5 ≦ S50 ≦ 10.5) = P(5.5− 50 · 1

6√50 · 1

6· 56

≦ Tn ≦10.5− 50 · 1

6√50 · 1

6· 56

)

となる.よって,正規分布表から

P (6 ≦ S50 ≦ 10) ≒ P (−1.07 ≦ Tn ≦ 0.82) ≒ 0.36 + 0.29 = 0.65

となる.

Page 35: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

2.4. 中心極限定理 35

中心極限定理に正規分布が現れる必然性は,次から分かる. 命題 2.8. 定理 2.5 と同じ仮定の下で,さらにXiの積率母関数 E[etXi ]がすべての t

に対して定義されるとする.このとき,T nの積率母関数Mn(t) = E[etTn ]に対して

Mn(t) → et2

2 (n → ∞)

が成り立つ. e

t2

2 は標準正規分布の積率母関数であり,命題は中心極限定理の証明と言っても良い.

しかし,証明になっていることを示すのが容易ではない.

証明. Tnの定義から,

Mn(t) = E[etTn

]= E

[etSn−nm√

nσ2

]= E

[etX1+···+Xn−nm√

nσ2

]= E

[e

t√nσ2

((X1−m)+···+(Xn−m))]= E

[e

t√nσ2

(X1−m) × · · · × et√nσ2

(Xn−m)]

である.

X1, Xn, ..., Xnの独立性と同分布性から

Mn(t) = E[e

t√nσ2

(X1−m)]× · · · × E

[e

t√nσ2

(Xn−m)]=

E[e

t√nσ2

(X1−m)]n

である.さらに,指数関数のマクローリン展開を用いると

E[e

t√nσ2

(X1−m)]= E

[1 +

t√nσ2

(X1 −m) +1

2

( t√nσ2

(X1 −m))2

+O(n−3/2)]

= 1 +t√nσ2

E[X1 −m] +t2

2nσ2E[(X1 −m)2] +O(n−3/2)

= 1 +t2

2n+O(n−3/2)

が成り立つので,n → ∞のとき

Mn(t) =(1 +

t2

2n+O(n−3/2)

)n

→ et2

2

となる.

Page 36: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

36 第 2章 極限定理

2章の問題

問題 2.1. 硬貨を 100回投げたときの表の回数を Sとするとき,次の事象の確率をド・モ

ワブル-ラプラスの定理を用いて求めよ.3つの確率の和が 1に等しいまたは近いことを確

認すること.

(1) S ≧ 56 (2) 45 ≦ S ≦ 55 (3) S ≦ 44

問題 2.2. Snを二項分布B(n, p)に従う確率変数とする.

(1) Snの積率母関数を求めよ.

(2) Snを正規化した確率変数 Tn =Sn − np√np(1− p)

の積率母関数Mn(t) = E[et Sn−np√

np(1−p) ]が,

n → ∞のとき標準正規分布の積率母関数 et2

2 に収束することを示せ.

問題 2.3. 50人の人の面接を行うとする.一人当たりの面接時間は、平均が 5(分)で標準

偏差が 1.5(分)であるとする.

(1) 各人の面接時間を互いに独立な確率変数であると考えて,50人全員の面接が終わる

までの時間 T の平均,分散および標準偏差を求めよ.

(2) T ≧ 60の確率を求めよ.

問題 2.4. X1, Xn, ...を互いに独立で,すべて標準正規分布N(0, 1)に従う確率変数とする.

(1) E[X41 ] = 3を示せ.

(2) χ2n = X2

1 +X22 + · · ·+X2

nとおくとき (カイ 2乗と読む),確率変数 χ2の平均と分散

を求めよ.

(3) 次を示せ:

P (χ2 ≦ n+√2nx) →

∫ x

−∞

1√2π

e−z2

2 dz (n → ∞).

問題 2.5. X1, Xn, ...を互いに独立で,すべて平均 1のポアソン分布に従う確率変数とし,

X = X1 +X2 + · · ·+Xnとおく.

(1) P (0 ≦ X ≦ n) = e−n

n∑r=0

nr

r!が成り立つ理由を言え.

(2) P (0 ≦ X ≦ n) → 1

2(n → ∞)を示せ.(

したがって,e−n

n∑r=0

nr

r!→ 1

2(n →∞) が示された.

)

Page 37: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

37

第3章 推定・検定

前章の初めに統計の考え方については述べた.この章では,中心極限定理と正規分布の

再生性を用いて,母比率,母平均についての推定と検定に関して述べる.

3.1 母比率の推定

関東地方におけるあるテレビ番組の視聴率を考える.知りたいことは全体の視聴率で,

時点を決めればある値である.しかし,正確に知ることは事実上不可能である.

知ることができるのは,全体から何世帯かを抽出して,その中での視聴率を調べること

である.通常,約 900世帯を調査しているようである1.

この際,調査対象が変わると,その中の視聴率は変わるのは当然であろう.したがって,

調査結果は全体の視聴率と等しくはなく,誤差があると考える必要がある.この誤差の大

きさを考えるのが,推定または区間推定である.

以下,本節では,我々がその特性を知りたい集合 (母集団という.上の視聴率では,関

東地方の全世帯)が,ある特性Aをもつものとそうでないものからなっているとし,Aを

もつものの割合 (母比率という) p を,全体からいくつか抽出した結果 (標本調査という)

から区間推定する方法を述べる.上に述べたテレビ番組の視聴率や新聞社などが定期的に

行う世論調査を念頭において欲しい.

たとえば,2018年 12月 21日のミュージックステーションスーパーライブ 2018の関東

地方における視聴率は 13.8%であった,というデータを考える.知りたいことは,関東地

方などの地域における視聴率である.この値は時点を決めればある値に違いないが,その

値を正確に知ることは事実上不可能である.決して,13.8%ではない.調査対象の中の視

聴率が 13.8%であるにすぎない.

このように母集団から大きさ nの標本を抽出したとき,nA個が特性Aをもっていたと

する.問題は, pA =

nA

nとおくとき,誤差 αを適当に定めて,母比率 pを (pA − α, pA + α)の形で推

定することである. 1https://www.videor.co.jp/tvrating/pdf/handbook.pdf

Page 38: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

38 第 3章 推定・検定

Snを二項分布B(n, p)に従う確率変数とする.母集団から標本を抽出する前はどれだけ

がAをもつか分からないので,確率変数と考えればよいであろう.Snの平均は np,分散

は np(1− p)であり,ド・モワブル-ラプラスの定理より

Tn =Sn − np√np(1− p)

は標準正規分布N(0, 1)に従うと考えてよい.

区間推定を行うには,100%の確率で母比率 pが入るような区間を定めることは不可能

なので,信頼度を決める必要がある.ここでは,95%としよう.正規分布表から,T を標

準正規分布に従う確率変数とすると

P (−1.96 < T < 1.96) = 0.95

であることが分かる.よって,

P(− 1.96 <

Sn − np√np(1− p)

< 1.96)= 0.95

としてよく,

−1.96

√p(1− p)

n<

Sn

n− p < 1.96

√p(1− p)

n

または

Sn

n− 1.96

√p(1− p)

n< p <

Sn

n+ 1.96

√p(1− p)

n

が成り立つ確率が 0.95である.

ここで,Sn

nを実際の標本中の割合 pAでおきかえると,

pA − 1.96

√p(1− p)

n< p < pA + 1.96

√p(1− p)

n

を得る.このおきかえに論理性はないことに注意して欲しい.

これを pに対する二次不等式と考えて解いてもよいが,通常は,右辺,左辺の母比率 p

を標本の中の比率 pAでおきかえて得られる不等式

pA − 1.96

√pA(1− pA)

n< p < pA + 1.96

√pA(1− pA)

n

から,区間(pA − 1.96

√pA(1− pA)

n, pA +1.96

√pA(1− pA)

n

)で母比率 pに対する推定を

行う.この区間を,信頼度 95%の信頼区間と呼ぶ.

Page 39: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

3.1. 母比率の推定 39

なお,T を上と同じく標準正規分布に従う確率変数とすると,正規分布表から

P (−2.58 < T < 2.58) = 0.99, P (−1.65 < T < 1.65) = 0.90

である.よって,

信頼度 99%の信頼区間は(pA − 2.58

√pA(1− pA)

n, pA + 2.58

√pA(1− pA)

n

),

信頼度 90%の信頼区間は(pA − 1.65

√pA(1− pA)

n, pA + 1.65

√pA(1− pA)

n

)となる.信頼度を上げると信頼区間は大きくなり,下げると信頼区間は小さくなることに

注意すること.当然ことであろう.

注意 3.1. 評価式

p(1− p) = −(p− 1

2

)2

+1

4≦ 1

4

に注意すると,信頼度 95%であれば,信頼区間は(pA − 1.96

√1

4n, pA + 1.96

√1

4n

)に含まれることが分かる.

これから,例えば信頼度 95%の信頼区間の幅を 0.02にしたいならば,

2× 1.96

√1

4n< 0.02

となるように標本の大きさ nを定めれば良いことが分かる.

Page 40: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

40 第 3章 推定・検定

3.2 母平均の推定

データが正規分布に従うと仮定するとき,その母集団を正規母集団と呼ぶ.この節で

は,標本調査の結果得られたデータ x1, x2, ..., xnから全体の平均 (母平均)を区間推定する

方法を述べる.母集団の確率分布の分散 (母分散)σ2の値が既知であると仮定する. 例 3.2. ある車種の自動車の燃費を調べるために 10台を調査したところ,10台の平

均が 23.1(km/L)であった.このとき,母平均に対する信頼度 95%,99%の信頼区間

を求めよ.ただし,母分散が,過去のデータから (1.2km/L)2と既知であるとする. 考え方は,前節と同じである.X1, X2, ..., Xnを正規母集団N(m,σ2)からの無作為標本,

つまり,それぞれが正規分布N(m,σ2)に従う独立確率変数列とする.

正規分布の再生性 (定理 1.32)より,標本平均Xn,

Xn =X1 +X2 + · · ·+Xn

n=

1

n

n∑i=1

Xi,

は正規分布N(m, σ2

n)に従う.よって,その正規化

Xn −m√σ2

n

は標準正規分布N(0, 1)に従う.

よって,正規分布表から

P(− 1.96 <

Xn −m√σ2

n

< 1.96) = 0.95

となる.つまり,標本平均と母分散の差Xn−mが±1.96√

σ2

nの間に含まれるような標本

が得られる確率が 0.95である.

ここで,実際の標本調査の結果の標本平均 xn,

xn =x1 + x2 + · · ·+ xn

n=

1

n

n∑i=1

xi,

と母平均との差 xn −mも同じ範囲に含まれると考えると,不等式

xn − 1.96

√σ2

n< m < xn + 1.96

√σ2

n

を得る.この区間(xn − 1.96

√σ2

n, xn + 1.96

√σ2

n

)が,母平均mに対する信頼度 95%の信頼区間である.

言うまでもなく,信頼度を 90%や 95%に変えると,信頼度に応じて 1.96が別の数値に

なる.

Page 41: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

3.3. 母比率の検定 41

3.3 母比率の検定

視聴率が 30%であったテレビ番組の視聴率が,ある週は 32%になったとする.このこ

とから視聴率に変化があったと言って良いであろうか.33%という数字には誤差が含まれ

ており,母比率の推定には標本の大きさが大きく関係するので,これだけの情報では結論

は出せないことが分かるであろうか.

まず調査対象が 900軒であったとする,つまり 900軒中 900 × 0.32 = 288軒がこの

番組を見ていたとする.そして,視聴率は変化していなかったと仮定してみる.このと

き,S900を二項分布B(900, 0.3)に従う確率変数として,S900が平均 900× 0.3 = 270から

288− 270 = 18離れる確率を考えると,ド・モワブル-ラプラスの定理 (定理 2.6)より

P (|S900 − 270| ≧ 18) = P( |S900 − 270|√

900× 0.3× 0.7≧ 18√

900× 0.3× 0.7

)= P

( |S900 − 270|√900× 0.3× 0.7

≧ 1.31)≒ 0.19

である.

これは,視聴率に変化がなくても 2%以上の変化が起きる確率が 0.19あることを示して

いる.したがって,起こりにくい事象とは考えられず,視聴率が変化したとは言えないと

いうことになる.

もし,調査対象が 3000軒であったとする,つまり 3000軒中 3000× 0.32 = 960軒がこ

の番組を見ていたとする.そして,視聴率は変化していなかったと仮定してみる.このと

き,S3000を二項分布B(3000, 0.3)に従う確率変数として,S3000が平均 3000 × 0.3 = 900

から 960− 900 = 60離れる確率を考えると,

P (|S3000 − 900| ≧ 60) = P( |S3000 − 900|√

3000× 0.3× 0.7≧ 60√

3000× 0.3× 0.7

)= P

( |S3000 − 900|√900× 0.3× 0.7

≧ 2.39)≒ 0.02

となる.

これは,視聴率に変化がなかったとすると,めったに起きない差が見られたことを意味

する.よって,視聴率に変化があった,つまり視聴率は上がったという判断が下される.

いずれの場合も,標本調査の結果から視聴率に変化があったと判断できるかどうかが問

題である.つまり,視聴率が変化したいないという仮定を否定できるかどうかが,この場

合の議論の目的である.このように否定することを目的とする仮定を帰無仮説という.標

本数が 900の場合のように帰無仮説を否定できなかったとき採択といい,標本数が 3000

の場合のように帰無仮説を否定したとき棄却したという.

注意すべきことは,帰無仮説の採択は肯定を意味しているのではないということであ

る.つまり上の例では,「変化しているとは言えない」ということであり,決して「変化し

ていない」と判断したわけではない.

Page 42: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

42 第 3章 推定・検定

また,標本数 3000の場合は確率 0.02の事象が起こりにくいと考えたから帰無仮説は棄

却されたのである.よって,どの程度の確率の事象がめったに起きないと考えるかが問題

となる.統計学の習慣では,確率が 0.05または 0.01以下の事象を指すことが多い.この

確率を危険率または有意水準という.危険率は標本調査の前に決めておくべきであること

は言うまでもない.

したがって,標本数 3000の場合の正確な結論は,全体の視聴率を pとして帰無仮説Hを

H: p = 0.3

としたとき,「帰無仮説Hは危険率 5%で棄却され,視聴率が変化したと判定する」という

ことになる.危険率を 1%にすると,Hは採択され視聴率が上がったとは言えない,とい

うことになる.

危険率 5%で帰無仮説Hを棄却したが,Hが正しいという可能性が完全に否定されたわ

けではない.Hが正しかった場合は,正しい帰無仮説を棄却したことになる.このような

誤りを第一種の誤りという.

一方,標本数 900の場合は危険率 5%でHを採択することになるが,Hは正しくないか

もしれない.この場合の正しくない帰無仮説を採択するという誤りを第二種の誤りという. 注意 3.3. 仮説の検定の議論は,「

√2は無理数である」ことの証明などで用いられる,

背理法に似ている.ただ,あくまでも話は確率的なので,上で見たようにいくつか注

意が必要である. babababababababababababababababababababab

歌番組やスポーツ中継の視聴率を考える.ある週に,普段は目にしない人気歌

手が出演する予告があった場合やタイトルがかかるなど重要な試合の場合は,通

常よりも視聴率が上がることが予想される.つまり,下がることはないと考えて

よい.

このような場合に視聴率が通常よりも高いかどうかを検定するならば,この節

の議論のように仮説の下で平均からどの程度「離れる」ことが起こりにくいかを

考えるのではなく,どの程度「多い」ことが起こりにくいかを考えるべきである.

一方が起きえないという事前情報があって行う検定を「片側検定」,本節のよ

うに事前情報がない場合の検定を「両側検定」という.ここでの目的は,検定の

概要をつかむことなので片側検定については省略する.

Page 43: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

3.4. 母平均の検定 43

3.4 母平均の検定

正規母集団N(m,σ2)の母分散が既知とできる場合に,帰無仮説

H:m = m0

に対する検定を考える. 例 3.4. ある工場で製造されているボルトの長さは,平均 5.0cm,分散 (0.15)2とされ

ている.定期検査で 20本無作為に選んで長さを調べたところ,平均が 4.93cmであっ

た.調整する必要があるだろうか.危険率 5%で検定せよ.ただし,母分散の値は変

化していないとする. 母平均の推定のときと同様,X1, X2, ..., Xnを正規母集団N(m,σ2)からの無作為標本,

x1, x2, ..., xnを実際の標本調査の結果とする.上の例であれば,σ = 0.15, n = 20であり,

xn =1

20

20∑i=1

xi = 4.93

である.

帰無仮説Hの下で,標本平均Xn =1

n

n∑i=1

Xiは正規分布N(m0,σ2

n)に従い,その正規化

Xn −m0√σ2

n

は標準正規分布N(0, 1)に従う.従って,正規分布表から,

P

(∣∣∣∣Xn −m0√σ2

n

∣∣∣∣ > 1.96

)= 0.05

が成り立つ.

これは,仮説Hが正しいとすると,標本平均Xnが

|Xn −m0| > 1.96

√σ2

n

をみたすような標本がめったに現れないことを示している.

よって,実際の標本の標本平均 xnが

|xn −m0| > 1.96

√σ2

n

をみたしていれば,危険率 5%で帰無仮説Hを棄却して,m = m0と判定する.また,

|xn −m0| < 1.96

√σ2

n

であれば,危険率 5%で仮説Hは採択される.

Page 44: 2020年度前期講義ノート 松本裕行matsumoto/lecture/2020_probab_stat.pdf確率・統計 (青山学院大学理工学部2020年度前期講義ノート)松本裕行 2020年3月23日改訂

44 第 3章 推定・検定

第3章の問題

問題 3.1. 2018年 12月 21日のミュージックステーションスーパーライブ2018は視聴

率 13.8%であった.標本数は 900であったとして,関東地方全体の視聴率に対する信頼度

95%,信頼度 90%の信頼区間を求めよ.

問題 3.2. 母比率の区間推定を行うとき,信頼度 95%の信頼区間の幅を 0.2より小さくする

ためにはどの程度の大きさの標本を抽出する必要があるか.信頼度 80%の場合はどうか.

問題 3.3. 母平均,母分散の信頼区間の幅は,信頼度を大きくすると広くなることの理由

を述べよ.

問題 3.4. ある種類のパソコンの起動時間は,分散 25(秒)2(標準偏差 5(秒))の正規分布に

従うという.あるとき,10台の起動時間を調べたところ,10台の平均が 42秒であった.

(1) 母平均に対する信頼度 90%,95%の信頼区間を求めよ.

(2) 信頼区間の幅を 4(秒)以内にするには,何台のパソコンを調べればよいか.

問題 3.5. ある講義の欠席率は 5%であるという.ある日は,登録者数 155人中欠席者が

14人いたという.これはいつもと違うと言えるだろうか.

(1) 検定すべき帰無仮説を書け.

(2) 危険率 5%,1%で検定せよ.

問題 3.6. 例 3.4に対する解答を与えよ.