jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

読者参加型のメタ分析

この記事は
Data Visualization Advent Calendar 2014 - Qiitaの9日目の記事です。
最近、心理学実験のデータをまとめていた研究者と一緒に可視化ツールを作成したので、それを紹介します。

概要

  • メタ分析とは何か?
  • InPhonDBプロジェクト
  • 可視化ツールの特徴
  • 読者参加型のメタ分析の意義

メタ分析とは何か?

心理学ではしばしば実験で仮説を検証します。実験は、ある現象の生起に複数の要因が影響する場合で特に有効です。実験では、自分の興味のある要因の違いを作りながら、その他の要因の影響を極力小さくするので、結果の解釈が容易になるからです。その一方で、いろいろな要因を統制しすぎると、得られた結果がどこまで汎用性のあるものなのかが分かりにくくなります。このようなジレンマのせいで、「これ1つで完璧」といえるような実験研究が行われることはありません。

そのような実験研究の限界を補う手段の一つにメタ分析があります。メタ分析では、同じトピックの実験研究データをできるだけたくさん集め、結果に影響しそうな要因を整理します。また本当に影響力のある要因であるかを多くの研究結果から推論します。例えば多くの研究で確実に再現されている実験なのか、ほとんど再現不可能なのかを全体的な傾向から判断します*1

InPhonDBプロジェクト

InPhonDB (Infant Phonetic Discrimination Database)プロジェクトは、乳児がどのような音声の区別をできるのかを調べた研究を集めているメタ分析のプロジェクトです。

乳児が音声の区別をしていることを確かめることがまず至難の業です。さらに区別できるかどうかを調べるとは言っても、それほど単純ではありません。乳児の育っている母語の環境、乳児の月齢、音声の特徴などによって音声の区別のし易さが変化するからです。また、研究のそれぞれで、実にいろいろな工夫がなされています。結果を示す指標も様々です。なので、得られた結果は、そのままでは他の研究と比較できません。そこで、このデータベースでは、効果量を指標にして、音声の区別のしやすさを表現しています。効果量は特定の単位を持たないので、異なる手法の研究同士も比較できます。乳児が音声をどのように区別するのかに興味を持った方は、ぜひプロジェクトのサイトをご覧ください。

InPhonDB

可視化ツールの特徴

InPhonDBプロジェクトでは、メタ分析に使用したデータを公開しています。そこで、データを可視化するツールを作成してみたところ、プロジェクトの一部として採用していただけました。
Easy InPhonDB Visualizerと名付けられた可視化のページは以下にあります。
http://www.lscp.net/persons/acristia/inphondb_visualizer.html

今回の可視化ツールの特徴は以下のとおりです。

  • バブルチャートによるデータの可視化
  • バブルの大きさまたは縦軸の値を従属変数として、3つまたは4つの要因の影響を考慮可能
  • 可視化されたバブルのクリックで、そのデータを収録している論文の文献情報を表示
  • セレクトボックスにより横軸、縦軸、バブルの色、大きさ、ラベルを変更可能

読者参加型メタ分析の意義

この可視化ツールは、セレクトボックスを利用して、バブルチャートの縦軸、横軸、バブルの大きさ、色、ラベルをデータベース内の変数から自由に割り当てられます。これにより、データベースの動的な可視化が実現しました。このような可視化の形式のメタ分析は、今までにないものです。従来の典型的なメタ分析では、著者がデータベースの分析の軸を決定してきました。読者はそれを読んで納得するかしないかのどちらかになるでしょう。しかし、Easy InPhonDB Visualizerでは、読者が自分の視点でメタ分析できます。その結果として、著者の考えが及ばなかったような新たなデータの活用法が生まれるかもしれません。

具体例を一つお見せします。可視化ツールのデフォルトは、横軸が乳児の平均日齢、縦軸が効果量、バブルの色とラベルが実験方法に設定されています。これを以下のように変更します。

  • 横軸:研究が出版された年
  • 縦軸:参加乳児の平均日齢
  • バブルの大きさ:効果量
  • バブルの色・ラベル:実験方法

すると次のようなグラフができました。

f:id:jnobuyuki:20141207230600j:plain
このブラフを見ると、年代ごとに流行した研究方法や、特に研究が集中的になされた乳児の月齢などが分かってきます。1980年代までの研究では、新生児に近い乳児が主に研究されていて、その後、対象となる乳児の月齢が拡大したように見えます。また、バブルの色をみると、年代ごとによく用いられる実験方法が変わってきたことも直感的に理解できます。このような見通しを持つと、この研究テーマにおけるトレンドを把握しやすくなるでしょう。
1点注意したいのは、得られた結果がこのデータベースに収録されている研究に限定されていることです。今後、より多くの研究者が論文以外の形式でもデータや結果をデータベースに提供すると、得られる結論がより信頼できるものになります。それが実現できれば、メタ分析で得られる知見が、一部の研究者だけで使われる情報から、皆で共有できる知に生まれ変わるかもしれません。

*1:出版バイアスという問題があるのですが、ここでは割愛します。