高校数学[総目次]
数学B 第3章 統計的な推測
スライド | ノート | 問題 | |
1. 確率変数と確率分布 | |||
2. 確率変数の期待値と分散 | |||
3. 確率変数の変換 | |||
4. 確率変数の和と期待値 | |||
5. 独立な確率変数と期待値・分散 | |||
6. 二項分布 | |||
7. 正規分布 | |||
8. 母集団と標本 | [会員] | ||
9. 推定 | |||
10. 仮説検定 |
9.推定
9.1 母平均の推定
前節までは,母平均や母分散,母標準偏差といった情報がわかっている前提の議論であったが,実際にはそういった統計量は事前にはわかっていないのが普通である.そこで,標本平均から母平均を推定する方法について考える.
母平均 $m$,母標準偏差 $\sigma$ の母集団から無作為抽出された大きさ $n$ の標本の標本平均 $\overline{X}$ は,$n$ が十分大きいときには近似的に正規分布 $N\left(m,\dfrac{\sigma^2}n\right)$ に従うのであった(中心極限定理 ).更にこれを
\[Z=\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\]
によって標準化すると,確率変数 $Z$ は近似的に標準正規分布 $N(0,1)$ に従う.
正規分布表によれば,標準正規分布に従う確率変数 $Z$ は $P(|Z|\leqq 1.96)\fallingdotseq 0.95$ であるから,$Z$ がこの範囲にあるとき,
\[\begin{align*} &\hspace{20mm}|Z|\leqq1.96\\[5pt] \iff&\hspace{15mm}\left|\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\right|\leqq 1.96\\[5pt] \iff&-1.96\leqq\frac{\overline{X}-m}{\frac\sigma{\sqrt n}}\leqq 1.96\\[5pt] \iff&\overline{X}-1.96\cdot\frac\sigma{\sqrt n}\leqq m \leqq\overline{X}+1.96\cdot\frac\sigma{\sqrt n} \end{align*}\]
つまり,
\[P\left(\overline{X}-1.96\cdot\frac\sigma{\sqrt n}\leqq m \leqq\overline{X}+1.96\cdot\frac\sigma{\sqrt n}\right)=0.95 \]
である.従ってこの計算された範囲
\[\overline{X}-1.96\cdot\dfrac\sigma{\sqrt n}\leqq x \leqq\overline{X}+1.96\cdot\dfrac\sigma{\sqrt n}\]
に母平均 $m$ が含まれていることが約95%の確からしさで期待できる.
この区間を母平均 $m$ に対する信頼度95% の信頼区間という.
信頼区間は [ ] を用いて次のように表される.
\[\left[\overline{X}-1.96\cdot\frac\sigma{\sqrt n},\ \overline{X}+1.96\cdot\frac\sigma{\sqrt n}\right]\]
母平均の推定 標本の大きさ $n$ が大きいとき,母平均に対する信頼度95%の信頼区間は,標本平均を $\overline{X}$,標本標準偏差を $S$ とすると \[\left[\overline{X}-1.96\cdot\frac \sigma{\sqrt n},\ \overline{X}+1.96\cdot\frac \sigma{\sqrt n}\right]\]
信頼度95% の信頼区間を求めることを「母平均 $m$ を信頼度95% で推定する」という.
補足
上の式から母平均を信頼度95%で推定するためには
①標本平均 $\overline{X}$ ②母標準偏差 $\sigma$ ③標本の大きさ $n$
の3つの情報が必要であるが,②の母標準偏差だけは事前にわかっていないのが普通である.標本の大きさ $n$ が大きいときは標本標準偏差
\[S=\sqrt{\frac1n\sum_{k=1}^n(X_k-\overline{X})^2}\]
の値を用いてもよい.
例題 ある製品を100個無作為抽出し,長さを測定したところ,平均値42.1cm,標準偏差1.0cmとなった.この製品の平均の長さに対する信頼度95%の信頼区間を求めよ.
こたえ
「信頼度95%の信頼区間」の意味
すぐ上の例題では,信頼度95%の信頼区間として $[41.9,\ 42.3]$ を得たが,母平均 $m$ (定数!)はこの区間に入っているか入っていないかのどちらかでしかない.今回たまたま選ばれた100の無作為標本から得た $\overline{X}$ を用いて計算した結果が区間 $[41.9,\ 42.3]$ であって,無作為抽出をやり直してもう一度計算すると,今度はまた別の区間が得られるであろう.「信頼度95%」の95%とは,このような手順を繰り返し行って多数の信頼区間を作ると,そのうち母平均 $m$ を含むものが95%程度あるという意味である.この例題では区間 $[41.9,\ 42.3]$ に母平均 $m$ が含まれる確率が0.95,含まれない確率が0.05である.
「信頼度95%の信頼区間」の誤った解釈としてよくあるのが「母平均 $m$ が区間 $[41.9,\ 42.3]$ に存在する確率が0.95である」というものである.これだと母平均 $m$ が確率的に変動するような印象を与える.母平均 $m$ は定数であって,確率的に変動するのは信頼区間の両端である $\overline{X}\pm1.96\cdot\dfrac\sigma{\sqrt n}$ の方なのである.
9.2 母比率の推定
ある母集団において,ある特性をもつ母比率が $p$ であるとする.このとき,大きさ $n$ の無作為標本において,その特性をもつ標本比率 $R$ は, $n$ が十分大きいとき近似的に正規分布 $N\left(p,\dfrac{p(1-p)}n\right)$ に従うのであった.(母比率と標本比率)
よって,母比率 $p$ は確率0.95で
区間$\left[R-1.96\cdot\sqrt{\dfrac{p(1-p)}n},\ R+1.96\cdot\sqrt{\dfrac{p(1-p)}n}\ \right]$
に含まれる.
$n$ が十分大きいとき,大数の法則 により標本比率 $R$ は母比率 $p$ に近い値だと考えられるから,先の区間における根号の中の $p$ を $R$ に置き換えることができる.すなわち次が成り立つ.
母比率の信頼区間 標本の大きさ $n$ が大きいとき,ある特性をもつ標本比率を $R$ とすると,母比率 $p$ に対する信頼度95% の信頼区間は \[\left[R-1.96\cdot\sqrt{\frac{R(1-R)}n},\ R+1.96\cdot\sqrt{\frac{R(1-R)}n}\ \right]\]
例題 あるりんご農園で無作為に抽出した400個について,糖度が基準値未満である個数を調べたところ,40個であった.このりんご農園のりんごの糖度が基準値未満である割合を,信頼度95%で推定せよ.
答
解答例を表示する このページで疑問は解決されましたか?
こちら から数学に関するご質問・ご要望をお寄せください。
高校数学[総目次]
数学B 第3章 統計的な推測
スライド | ノート | 問題 | |
1. 確率変数と確率分布 | |||
2. 確率変数の期待値と分散 | |||
3. 確率変数の変換 | |||
4. 確率変数の和と期待値 | |||
5. 独立な確率変数と期待値・分散 | |||
6. 二項分布 | |||
7. 正規分布 | |||
8. 母集団と標本 | [会員] | ||
9. 推定 | |||
10. 仮説検定 |