読者です 読者をやめる 読者になる 読者になる

jnobuyukiのブログ

JavaScriptとR言語を中心に研究活動に役立つwebアプリケーション技術について考えていきます。twitter ID: @j_nobuyuki

統計解析上達のポイント(2)

一般

前回に続いて、統計解析上達のポイントとして、統計解析を利用する目的について考えてみましょう。

統計解析の目的

統計解析には大きく分けて、記述統計と推理統計があります。記述統計では、データについての数量的性質を述べることを目的とします。一方、推理統計では、
研究上の仮説(や主張)に関連した帰無仮説が、ある確率以下になるかどうかを検証します。もう少しくだけた言い方をすると、得られたデータが偶然の確率でも起き得るものなのか、それとも偶然では説明しにくいほど起きにくい事象であるかを調べます。

もう少し大きな意味で考えると

次に、もう少し大きな意味で統計解析を利用する目的を考えてみましょう。なぜ研究に統計解析を利用するのか?その一つの答えは、「その方が説得力があるから」
ではないかと思います。研究では、仮説として何らかの主張を行い、その主張の妥当性(くだけた言い方をすれば納得がいくものであるか)を何らかの手段で検証します。その検証方法の一つが統計解析による推論です。実際に収集、測定したデータが偶然とは呼べないほど低い確率で起きるものであれば、それを読んだり聞いたりした人は、「きっと何かしらの意味があるに違いない」という考えに賛同してくれやすくなります。

大事なのは解析部分だけではない

上で書いた内容をより具体的に考えるため、研究成果の報告について先に説明します。研究成果の報告手順は、研究フィールドによってさまざまです。例えば、私が属しているところの心理学では、研究の目的(仮説を述べる)、方法(データの取得手順を述べる)、結果(統計解析などを利用してデータを説明)、考察(仮説の妥当性を議論する)といった順序で論文や発表が構成されるのが典型的です。

研究成果の報告手順のうち、統計解析は、結果のセクションで主に利用されます。でも、研究成果の聞き手・読み手は、結果だけを独立に考えるわけではないと思います。方法のセクションで述べられている手続きで得られたデータは、述べられた統計解析の手順で適切に解析されるのかを判断しているでしょう。また、考察のセクションでは、得られたデータやその解析結果と考察の議論に飛躍や矛盾がないかを判断しているはずです。これをふまえれば、研究の目的から考察までが矛盾や飛躍なしに淀みなく流れているのが理想的な研究成果報告といえます。なので、統計解析だけを独立に考えるのではなく、データの取得方法や仮説とのマッチングを意識することが統計解析をツールとする上での大事なポイントとなります。このポイントは、研究ごとにより良い答えが変わります。なのでこれを身につけるにはある程度の経験を必要とするでしょう。実践あるのみです。

ここまでは、個人的に大事だと思っていることを述べてきました。次回は、最終回として、統計解析の学習を実践する上で役に立ちそうなアイデアを紹介します。