jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

統計解析上達のポイント(1)

先日、統計に関する勉強会を聴いていたら次のようなお願いをされました。
「統計が苦手という文系の学生のために、統計解析上達のポイントを一言でコメントしてほしい。」

正直に言うと、なかなか一言でというのは難しいなと感じました。そこで、即席のスライドを作ってLTしてみました。そのときのスライドを元に、ここでも少し個人的な意見を、書いてみたいと思います。対象は実証研究を行う文系学部生です。彼らを励ますことを目的にしているので、厳密さを欠くところや極端な話もしますが、そこはあらかじめご容赦ください。

毎度計算の詳細まで悩まなくていい

統計学が苦手と感じている人の中には「統計学って何をどういう順番で勉強すればいいのかわからない」という人がいます。統計学自体が専門でない限り、統計解析はあくまでも道具であると考えて見ましょう。そしてそれを念頭に置くと、多少、学習の進め方に見通しが立つと思います。

道具として考えるとはどういうことなのかを理解するために、身近にある道具を例にしてみます。例えば、電子レンジ。電子レンジは、マイクロ波加熱という原理を使用して、ものを温めます。しかし、電子レンジを使うときに、どんな原理で働いているのかを考えたりしません。考えなければならないのは、扉を閉めてから加熱することのような使用法と金箔やアルミホイルを中に入れないことのような注意事項です。

統計解析も似たようなところがあります。毎回毎回、計算の詳細を考える必要はなくて、詳細な計算は統計パッケージアプリケーションにまかせられます。大事なのは、入力データをどのような形式にしなければならないか、アプリケーション内のどのボタンを押すか、出力をどのように読み取るかといった使用法と明らかに間違った分析方法を適用しないようにすることです。

お勧めの学習手順

以下のように2段階で学んでいくと「ある程度理解した」という実感を持ちながら統計を使えるようになるかもしれません。

最初は解析手続きに集中しよう

最初は、統計パッケージの使い方を覚えることに集中しましょう。このごろはR言語SPSSなど便利な統計パッケージがたくさんあって、解析方法、入力データ出力パラメータを設定すれば、あとはアプリケーションが自動で計算してくれます。

シンプルな例で手計算もやってみよう

このままだと解析方法全体がブラックボックスになってしまいます。なので、統計パッケージによる解析手順を覚えたら、一番シンプルなデータを使って、手計算による解析結果の再現をやってみましょう。既に正しい計算結果をパッケージ利用で求めているので、それを再現できれば十分です。

この作業は一見するといわゆる『車輪の再発明』で、わざわざ時間をかけるのは無駄に思えるかもしれません。でも、この作業を通して、t検定や分散分析のような統計解析は、四則演算(+-x÷)だけでできていることがわかります。また、データのどんな性質を使って計算を行うのかをより直感的に理解できるかもしれません。ただしこれを毎回やる必要はありません。あくまでも計算方法の理解のためです。

次回は、統計解析の目的について考えてみます。