今回は、統計学に基づいた研究の意義や世界の見え方について思うことを書きます。
研究にとっての統計的仮説検定というツール
研究では、何らかのアイデア(仮説と呼びます)が、実際に何かの現象をうまく説明できたり、何かに役立ったりすることなどを検証します。その際、多くの実証研究では統計的仮説検定という手続きを経て、主張の説得力(研究上の言葉で言えば妥当性)を高めようとします。統計的仮説検定では、帰無仮説と対立仮説という二つの仮説を立てます。
帰無仮説:研究者が主張したいこととは逆の内容にあたります。例えば、商品Aと商品Bは売れ方が違うと思っている時に、あえて商品Aと商品Bの売れ方は等しいと仮定するような仮説です。
対立仮説:研究者が主張したい仮説はこちらです。
統計的仮説検定は、主張したい内容と逆の帰無仮説を立てて、収集したデータの観測値が帰無仮説を前提にするとありえないことを示し、帰無仮説を取り下げます(棄却すると言います)。これはすなわち対立仮説を採用するということにあたります。
似たようなロジックの立て方に、数学の背理法があります。背理法も、ある仮定から式展開を始めて、明らかな矛盾が得られた時に、最初の仮定を取り下げることで、その逆の内容を採用するという手続きですね。
実証研究における統計的仮説検定と数学の背理法の違いは、ありえないこと(つまり矛盾)の示し方です。数学の背理法では、絶対的な矛盾を示しますが、実証研究の統計的仮説検定では「確率」を利用して、確率的に非常に低い、確率的にありえないということを示します。
第1種の過誤と第2種の過誤
上記で述べたように、統計的仮説検定では、確率の概念の導入が肝になっています。ここで確率で考えるということの意味を考えてみましょう。数学の絶対的な矛盾とことなり、統計的仮説検定では「ある事象の生起の可能性が非常に低い」という議論になります。しかし、「非常に低い」とはいえ、0ではないので、ここで主張されるのは絶対的な矛盾ではありません。そして、常に結論に誤りが生じる可能性を残すことになります。誤りには2種類あり以下のような名前がついています。
真の状態 | 正しい判断 | 誤った判断 |
帰無仮説が正しい | 帰無仮説を保持する | 帰無仮説を棄却する(第1種の過誤) |
対立仮説が正しい | 帰無仮説を棄却する | 帰無仮説を保持する(第2種の過誤) |
上の表にあるように第1種の過誤とは帰無仮説が正しいにもかかわらず、誤って棄却してしまうことです。最初に述べた例で考えれば、商品Aと商品Bの売り上げに差がないにもかかわらず、誤って差があるとしてしまうことにあたります。
第2種の過誤は、第1種の過誤の逆です。対立仮説が正しいにもかかわらず、帰無仮説を棄却しない場合にあたります。例で考えれば、商品Aと商品Bの売り上げに差があるにもかかわらず、そのような差を見つけられない場合にあたります。
第1種の過誤と第2種の過誤のトレードオフ
第1種の過誤と第2種の過誤。どちらもできるだけその可能性を低めたいのですが、これらの過誤の間にはトレードオフの関係があることが知られています。つまり、「ないものをある(第1種の過誤)」可能性を低めようとすることは、「あるものを見落とす(第2種の過誤)」可能性を高めることになります。なので、研究者は常にこの二つの過誤のバランスをとりながら研究の精度をたかめようとします。研究の場合、「ないものをある(第1種の過誤)」というのは危険なので、「あるものを見落とす(第2種の過誤)」を犠牲にしながら、その可能性を低めています。
統計的仮説検定の意味
もう一度、上記の表について考えます。あらゆる研究で得られた結果は、この表の4つの場合のどれかに当てはまります。そして大事なポイントとして、真実は常に4つのセルの外側にあるということです。つまり科学者は真実を突き止めるのではなく、真実とは異なる結論をなるべくしないような努力をしているんだと思います。統計的仮説検定というか人間の限界みたいなものを感じます。
統計学を通してみる世界
上で考えたことは、世界の見方としてもう少し一般的な事柄にも当てはまりそうです。例えば、病気の検診の結果、陰性か陽性が伝えられますが、それがすなわちその人が病に冒されていることを意味しません。検査で陽性でも最終的に病気ではないことはあります。また、刑事裁判を例に考えれば、真犯人を見逃す可能性や冤罪の存在があげられます。きちんとした検証を行っていたとしても、真実を知ることは難しいわけです。そして科学的な検証が済んだ事実(例えば学校教科書に書かれているようなこと)でも、それが覆る可能性は0ではありません。こんな風に考えると、人間はいかにあやふやな世界に生きていているのかと思います。そして、それが安定していると考えられる不思議な存在でもあるなと思います。