jnobuyukiのブログ

JavaScriptとR言語を中心に研究活動に役立つwebアプリケーション技術について考えていきます。twitter ID: @j_nobuyuki

一般

累積PVが30万を越えました。ありがとうございます。

タイトルの通り、累積のPVが30万を越えました。たくさんの方に検索していただいているのだと思うと、もっと良い記事をたくさん投稿しようと思います。そして、数は少ないのですが、常連で読んでくださる方、これからもどうぞよろしくお願いします。

サンプルサイズが条件ごとに異なる一要因分散分析

今回は、一要因分散分析について考えます。典型的な教科書では、分散分析の条件ごとのサンプルサイズが揃っている場合を扱います。もしも条件ごとのサンプルサイズが大きく異なる場合はどんな問題に気をつければよいかを見てみましょう。ちなみに似たような…

R言語での変数の型確認の重要性(1)

今回は、R言語で統計解析を学び始めた人にとって分かりにくい点について書きます。 Rの変数オブジェクトは型宣言しないが、型がある Rは、統計パッケージアプリケーションという捉え方と、データ処理のためのプログラム言語という捉え方があります。後者に関…

三平方の定理で理解する回帰分析における分散の分解

今回は、回帰分析の細かいモデルの話を中学校で習う「三平方の定理」を利用して考えてみます。 最小2乗法による推定 回帰分析では、最小2乗法という計算方法で、回帰直線をひくための2つの推定値(切片と傾き)を決めます。何を最小にするかというと実際に…

相関と回帰は何が違うか?

今回は、相関分析と回帰分析は何が違うのかを考えます。 相関と回帰の共通点、類似点 相関分析と回帰分析はどちらも、2つの連続量変数(数量型データ)の関係を調べるために行います。ここでの「連続量変数」とは、単に数字で表したデータという意味ではな…

アクセス数の合計が200,000を超えました!ありがとうございます!

本日は、ご報告とお礼です。本ブログのアクセス数の合計が200,000を超えました。前回のご報告でアクセス数100,000突破が今年2016年2月のことでしたので、1年かからずに100,000アクセスをいただいたことになります。 最近のアクセス傾向 これまでのアク…

データリテラシー向上のためのブートストラップは何か?

今回は、統計や確率、データ解析についてもっと理解し、理解してもらうためのヒントについて考えてみます。最初に言いますが、結論はないです。 確率や統計の学習は難しい 統計やデータは確率という目に見えない概念を論理的、数学的に扱う必要があります。…

RStudio バージョン1.0でインタラクティブな解析

今回は、R言語を便利に操作するためのアプリケーションRStudioについてです。いよいよバージョン1.0になったRStudioにできた新機能を試してみます。 Rmarkdownファイルを利用した解析(旧バージョン) RStudioの便利機能の一つにRmarkdownファイルによる解析…

「数学ガールの秘密ノート やさしい統計」の感想(2)

今回も「数学ガール秘密ノート やさしい統計」の感想を書きたいと思います。 第4章 「コインを10回投げたとき」 この章では、コインの表が出るか裏がでるかという2つの事象の確率を2項分布で明らかにしていきます。「数学ガール」では、問題への取り組…

「数学ガールの秘密ノート やさしい統計」の感想(1)

今回は、統計学を扱った書籍の感想を2回に分けて述べたいと思います。タイトルでわかる通り、数学ガールの関連書籍で、メインのシリーズというよりは中高生向けのシリーズと認識しています。 そう、著者は結城浩先生です。書評というよりデータリテラシーと…

統計学の用語のややこしさ(2)

前回に引き続き、今回も統計学の用語で「言い方が違うのに指している内容は同じ」ものを紹介します。## 回帰分析の原因と結果に関する変数の名前 統計学で利用される分析方法の1つに回帰分析があります。回帰分析では、ある事柄の程度を示す数値を予測する…

統計学の用語のややこしさ(1)

今回は、統計学やデータリテラシーで使われる用語のややこしさについて書いてみたいと思います。## 統計学の用語 どんな専門領域でもその領域で通じる用語というものがありますよね。細かい言い回しを一言でまとめられれば、話の進みが早くてすみます。ただ…

大学生への教育を教員による「知的なクローニング」と考えてみる

今回は、大学教育というか教育一般について思うことを書きます。 学生は何を学ぶんだろう? 近年、学生による能動的な学びを促す仕組みが含まれる教授法をアクティブラーニングと呼び、大学をはじめとする高等教育機関で試行錯誤が続いています。学生がぼー…

データの散らばりは誤差にも情報にもなる

今回は、統計を使い始めの人が「ややこしい」と感じそうな話です。 データの散らばりとは 社会科学でも自然科学でも何かデータをとって(難しい言葉使いだと「実証的」)、そのデータから自分の考えを主張したい場合があります。このときデータは、2回以上…

2要因の分散分析での交互作用効果と単純主効果検定の関係

今回は、2要因の分散分析をするときの交互作用と単純主効果について説明します。ややこしい話題ですが、具体的なストーリーで説明して、ちょっとでもわかりやすくと思っています。 想定例:学生の専門分野による文章内の図表の挿入効果の違い 今回は、ある…

多重共線性によって重回帰分析の推定は不安定になる(のはなぜか?)

今回は、回帰分析を実用する上で気をつけたい問題の1つである多重共線性について考えます。 多重共線性って? 回帰分析では、一つの従属変数(予測される変数)に対して一つ以上の独立変数(予測する変数)を構成して予測モデルとします*1。このとき、予測…

研究者とは何をする人か?それに必要な資質は?

今回は、「研究者って何か?」を考えます。一応研究者であるので、職業としての研究者や自分の経歴を紹介する機会があります。しかし、先日のそのような機会では、そもそも研究者が何かをうまく語れなかったんです。なので、反省文も兼ねて、研究者やその資…

学会・研究会における保育サービスについて思うこと

今回は、子育て世代研究者あるあるのような話題で、それについて思うことを書きます。 学会における保育サービス 学会や研究会において、子連れでの参加を促すために保育サービスが提供されることがあります。子育て世代の研究者にとって、このサービスはそ…

10万PVになりました。ありがとうございます。

今回は、このブログを見てくださった皆様へのお礼です。 100,000PV 100,000PVは、このブログを始めた時、そして始めてしばらくの間には考えもつかなかった数字です。しかも2014年11月に10,000pv達成だったので、1年1〜2ヶ月の間に指数的にpvが伸びています。…

卒論でよく言われる「まだ検討されていない」研究テーマについて思うこと

大学の卒業論文の季節ですね。今回は、卒業論文でよく見られる表現について考えたことを書きます。 科学が目指すもの 科学が目指すものは「新たな知の獲得」です*1。今まで誰も知らなかったことを調べてみて、面白い結果が得られたらそれを皆で共有します。…

統計学を通して見える世界

今回は、統計学に基づいた研究の意義や世界の見え方について思うことを書きます。 研究にとっての統計的仮説検定というツール 研究では、何らかのアイデア(仮説と呼びます)が、実際に何かの現象をうまく説明できたり、何かに役立ったりすることなどを検証…

子供が使うPCのスペック

今回は、タイトルの内容について思ったことをただそのまま書いてみたいと思います。 予算だけを言えば、できるだけ抑えたい PCの価格は常に下がり続けています。以前なら30万円を超えるような PCと同等性能のPCが10万円、場合によってはそれ以下で購入で…

書評「新米探偵データ分析に挑む」

今回は、Rに関する書籍の書評に挑戦してみます。 石田基弘(著)「新米探偵データ分析に挑む」 こちらです。 Amazon CAPTCHAこの書籍は、ライトノベルとR(正確にはRStudio)を利用した統計解析の解説が一つになっています。 主人公の田中くんは、探偵事務所…

文系と理系の溝

本日は文系と理系の間にあると感じられる溝について考えてみたいと思います。 文系と理系の違い まず、文系と理系の違いについて簡単に考えてみます。下世話な言い方をすれば、これは高校における科目履修の違いです。どれだけ自然科学系の科目(数学や理解…

調べてみたら予想と違ったときに思うこと

最近はずっとR言語に関するまとめが続いたので、たまには単純に考えたことを書きます。 予想が外れるのは「失敗」か? 研究に関する色々な過程の中でも一番楽しいのは、実験や調査によって収集したデータを解析し始める瞬間です。「ああかもしれない」「こう…

データハンドリングはスクリプトを利用して

欠損値や外れ値の設定、数量データをカテゴリーデータに変換、データの並べ方の変更などいわゆるデータハンドリングについて思うところをまとめておきます。 データハンドリングは、データ解析のなかでも最も大事 今更強調して言うことでもないかもしれませ…

オープンデータを用いたデータの可視化

今回は、公開されているデータを利用して、仮説検証型のデータの可視化をやってみます。 きっかけ Googleの及川卓也氏のブログで、先日、興味深いブログ記事を目にしました。地方自治体公式サイトのスマートフォン対応 - Nothing ventured, nothing gained.…

統計解析上達のポイント(3)

前回までで、2回ほど統計解析を使いこなすポイントについての私的な考えを述べてきました。最後に、統計解析を学ぶ上でのポイントを2点ほど紹介します。 分からないことは人に聞こう 特に、仮説の検証のために統計解析を利用していると「これでいいのか?」…

統計解析上達のポイント(2)

前回に続いて、統計解析上達のポイントとして、統計解析を利用する目的について考えてみましょう。 統計解析の目的 統計解析には大きく分けて、記述統計と推理統計があります。記述統計では、データについての数量的性質を述べることを目的とします。一方、…

統計解析上達のポイント(1)

先日、統計に関する勉強会を聴いていたら次のようなお願いをされました。 「統計が苦手という文系の学生のために、統計解析上達のポイントを一言でコメントしてほしい。」正直に言うと、なかなか一言でというのは難しいなと感じました。そこで、即席のスライ…