jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

R言語

Shinyを利用してインタラクティブにデータを解析

R言語は強力な統計ツールの開発がどんどん進んでいます。今回紹介するShinyはR言語をブラウザ上で使用するためのパッケージです。うまく利用すると、実験やシミュレーションの結果をわかりやすく伝えられそうな気がします。 Shinyのインストール CRANに登録…

ビッグデータ解析と統計的帰無仮説による検証の関係

今日は、昨今大変注目を集めているビッグデータについて思うところを述べてみます。というのは、こんな記事がFBの拡散で届いたからです。 http://googleenterprise-ja.blogspot.jp/2014/09/google-bigquery.html これのソース記事はこちらです。 Towards Psy…

R言語を使った第1種の過誤のシミュレーション

心理学では、データに基づく仮説の証明に統計学を利用します。帰無仮説と呼ばれる、当初の仮説とは正反対の仮定から始めて、それが確率的に非常に低いことを示し、その結果から当初の仮説の妥当性を確認するというロジックになっています。しかし、「確率的…

R言語における最頻値の求め方

ある数値データの集団の代表性を示す方法には、(加算)平均、中央値、最頻値の3つがあります。 今回は最頻値の求め方を紹介します。 平均、中央値、最頻値 3つの代表値の違いをまとめておきます。 平均: すべてのデータの数値を加えた合計をデータの数で割…

行列やデータフレームの列名・変数名の変更

R言語で作業をしていて、つまらないことに時間がかかったので、次回以降の作業用にメモしておきます。 列名、変数名の取得と設置:colnames(),names() R言語では、データ行列を保存できるオブジェクトが二種類あります。行列(matrix)とデータフレーム(data.f…

read.table()によるテキストファイルの読み込み

R言語で、テキストファイルを読み込むときのコツをまとめます。基本的にread.table()が便利です。通常用いるargumentは header= TRUE: 一行目に変数名が含まれている場合にTRUEにします。 sep = "\t":一行の中のデータの区切り文字。"\t"はタブ記号です。 fi…