高校数学[総目次]
数学Ⅰ 第3章 データの分析
スライド | ノート | |
1. データの代表値 | ||
2. データの散らばりと四分位範囲 | ||
3. 分散と標準偏差 | ||
4. 2つの変量の間の関係 | ||
5. 仮説検定の考え方 |
5.仮説検定の考え方
5.1 仮説検定とは
得られたデータをもとにして,ある主張が正しいかどうかを判定する統計的手法を仮説検定という.
例 硬貨を20回投げたところ,表の面が15回出た.この硬貨は表の面が出やすいと判断してよいか.
表と裏が等確率で出る硬貨を投げたのであれば,表と裏は概ね10回ずつ出ると期待されるのであるが,ここでは15回も表が出たものだから「表が出やすいような作りになっているのでは?」ということになった訳である.そこでいま「この硬貨は表の面が出やすい」と主張したいとする.これが主観による決めつけなのか,数学的にも根拠のある主張なのか,統計的な手法を借りて検証していこう.
仮説検定の手順
① 主張を否定する仮定(帰無仮説)を立てる.
② ①での仮定が正しいものとして,観測された出来事が起こりにくいかどうかを調べる.
③ ②で起こりにくいと判断されれば,その元となった①での仮定が正しくないとする.(帰無仮説が棄却される.)
④ ③のとき,元の主張は正しいと判断してよい.
手順① 主張を否定する仮定を立てる.
「表の面が出やすい」の否定は「表の面が出やすいとはいえない」であることに注意する.「裏の面が出やすい」ではない.
手順② ①での仮定が正しいものとして,観測された出来事が起こりにくいかどうかを調べる.
①での仮定とは「表の面が出やすいとはいえない」であり,これを「硬貨の表と裏の出やすさは同じ」と言い換える.つまり「裏の面が出やすい」は考えない.この辺りは何となくすっきりしないかもしれないが慣れるしかない.
表と裏の出る確率がそれぞれ $\dfrac12$ であるとすれば,20回中15回以上(「15回」ではない)表の面が出る確率を実際に計算すると,約 $0.02$ となる.つまり公正な硬貨を投げたとき,表の面が15回以上出る確率は $2\%$ 程度であり,かなり起こりにくいと考えられる.
手順③ ②で起こりにくいと判定されれば,その元となった①での仮定が正しくないとする.
実際に観測されたのは「15回表の面が出た」であるからこれは確率 $2\%$ 程度の相当にまれなことが起こったといえる.そしてこれを「まれなことが偶然に起こった」とするのではなく,「公正な硬貨を投げた」とする仮定が間違っていたと結論付ける.ここも統計的手法の独自思考であり,慣れが必要である.
手順④ ③のとき,元の主張は正しいと判断してよい.
「公正な硬貨を投げた」という仮定が否定されたので,投げた硬貨は公正なものではなかった.すると残された可能性は「表の面が出やすい」と「裏の面が出やすい」であるが,先に確認したように「裏の面が出やすい」という方は考えないので「表の面が出やすい」と判断できる.
補足
ここでは確率 $0.02$ を「まれ」としたが,確率 $0.01$ 以下をまれとするならば,観測された結果はまれではないということになる.この基準となる確率(有意水準)は,検定を行う前に予め定めておかなければならない.
5.2 いくつかの例
例題1 さいころを30回投げたところ,1回だけ1の目が出た.このさいころは1の目が出にくいと判断してよいか.基準となる確率を $0.05$ として考察せよ.
答
手順① 主張を否定する仮定(帰無仮説)を立てる.
「1の目が出にくい」の否定は「1の目が出にくいとは言えない」である.
手順② ①での仮定が正しいものとして,観測された出来事が起こりにくいかどうかを調べる.
「1の目が出にくいとは言えない」を「どの目が出ることも同程度に期待される」と言い換え,これが正しいものとして,さいころを30回投げたときに1の目が1回以下の場合の確率を計算すると約 $0.03$ となる.これは基準となる確率 $0.05$ より小さいので起こることがかなりまれであると考えられる.
手順③ ②で起こりにくいと判定されれば,その元となった①での仮定が正しくないとする.(帰無仮説が棄却される.)
実際に観測された結果は①での仮定の下では起こりにくいので,①での仮定すなわち「どの目が出ることも同程度に期待される」という仮定が正しくないと判断する.
手順④ ③のとき,元の主張は正しいと判断してよい.
1の目の出る回数が少なかったことも加味して,1の目が出にくいと判断できる.
例題2 消しゴムを製造している会社が従来品のAと新製品のBについて,無作為に選んだ25人にどちらが消しやすいか調査したところ,16人がBと回答した.消しゴムBはAより消しやすくなったと判断してよいか.基準となる確率を $0.05$ として考察せよ.
答
手順① 主張を否定する仮定(帰無仮説)を立てる.
「BはAより消しやすい」の否定は「BはAより消しやすいとはいえない」である.
手順② ①での仮定が正しいものとして,観測された出来事が起こりにくいかどうかを調べる.
「BはAより消しやすいとは言えない」を「AとBのどちらが消しやすいかはランダムに選ぶ」と言い換え,これが正しいものとして,25人のうち16人以上Bを選ぶ場合の確率を計算すると約 $0.11$ となる.これは基準となる確率を $0.05$ を越えており,起こることがまれであるとはいえない.
手順③ ②で起こりにくいと判定されれば,その元となった①での仮定が正しくないとする.(帰無仮説が棄却される.)
手順②で起こりにくいと判断されなかったので,仮説検定はここで終わり.
注意
手順③で,①での仮定のもとで,観測された出来事が起こりにくいと判断できないとき,換言すれば観測された出来事が起こることもあり得ると判断されたとき,その元となった①での仮定の正しさが証明された訳ではない.観測された結果が①での仮定と矛盾しなかったということがいえるだけである.
例題2の場合,被験者が消しやすい方の消しゴムをランダムチョイスしていると証明されたわけではない.「ランダムチョイスをしていると考えても今回観測された結果と矛盾しない」というだけである.
仮説検定とはつまりは背理法である.ある仮定をして議論を進めたとき矛盾を導くことに失敗すれば,そこから明確に導ける事柄はない.
例えば2つの数 $a$ と $b$ の和が100という現象が観測されたとき,「$a$ も $b$ も正の数ではなかろうか」と推測したとする.そして「$a+b=100$ のとき,$a$ も $b$ も正の数である」という主張の正当性を背理法で示そうとしたとする.「$a$ も $b$ も正の数でない,すなわち $a$ と $b$ の少なくとも一方が負の数である」という仮定をおいて矛盾を導くことができれば「$a$ も $b$ も正の数である」を擁護できる.ところが $a=120, b=-20$ とすれば $a+b=100$ になって矛盾が生じない.しかしだからといって「$a+b=100$ のとき,$a$ と $b$ の少なくとも一方が負である」と結論付ける訳にはいかない.
このページで疑問は解決されましたか?
こちら から数学に関するご質問・ご要望をお寄せください。