jnobuyukiのブログ

JavaScriptとR言語を中心に研究活動に役立つwebアプリケーション技術について考えていきます。twitter ID: @j_nobuyuki

研究方法を学ぶ重要性とそこで終わらない重要性

今回は具体的な方法論ではなく、研究方法のとらえ方について書いてみます。 研究方法を学ぶ重要性 研究をしてみたいと思ったら、まずは過去の研究を読んでみたり、関連する話題を研究している研究者に質問したりして、研究方法を学びましょう。研究方法を覚…

評価という手段を目的にしてしまうと教育に何が起きるか

今回は,とても抽象的なことを書きます。自分としてもまだ問題の整理が完全に済んでいないので,これを書きながら少しでも整理できたものが残せればいいなと祈りながら書き始めます。 教育における評価の機能 様々な教育場面において,しばしば評価が行われ…

検定力(検出力)の求め方

今回は,当たり前に思っていたことが実はそんなことなかったという話です。 検定力とは何か? 私達が,観察したデータについて,そのデータを取得した大元の集団について考えたいときがあります。そのようなときには統計的仮説検定の手続きにのっとって,推…

論文を書く予定がある人は,まずはできるだけ論文を読みましょう

今回は,最近考えていることを共有したいと思って書きます。タイトルが言いたいことそのままなのですが。 論文には構造がある 論文には,構造があります。研究領域や学術雑誌によって,その構造自体は異なることもあります。最も典型的な形式としてIMRAD (In…

R言語でデータを分割してから,それぞれに同じ操作を繰り返す

今回はR言語の使い方のヒントを皆様と共有します。 データの分割はsplit関数 データを分割するには,split関数が便利です。split関数では2つの引数をとり,1つ目がデータオブジェクト,2つ目が分割するための基準となる変数を設定します。 以下の例を見て…

数式は(そんなに)怖くない(3)

本日は,数式怖くないシリーズ3つめの話題です。共分散を取り上げます。 共分散とは 共分散とは2つの変数の変動(または連動)する様子を1つの値に要約したものです。ある変数の値が高くなるときに,他の変数も同じように値が高くなるのか,逆に低くなる…

サンプル平均の期待値はサンプルサイズがいくつでも同じです

本日は,久々の投稿な上に,ちょっと込み入った話です。込み入っているけど,推測統計を理解するためにぜひ抑えておきたいポイントについて書きたいと思います。 サンプルの平均を母平均の推定に使う 推測統計学では,実際に持っているデータをデータを取っ…

分析はプログラミングを利用したほうが良いのはなぜか?(初学者向け)

今回は,統計学やデータ分析の初学者の方に向けて,「なぜプログラミングを利用したほうが良いのか?」を考えてみます。 データ分析の方法 何らかの方法でデジタル化されたデータがあれば,それを使って,計算し,データの特徴を調べられます。数量で扱える…

Rをアップデートしたらjupyter notebookの設定もアップデート

これまでに2回ほどjupyter notebook(またはipython notebook)のインストールについて紹介しました。この度,Rのメジャーアップデートをしたので,その後の設定についてメモを共有します。 必要なパッケージのインストール 以下のページに載っているように,…

盗用・剽窃はなぜいけないのか

今回は,最近,考えたことを書きます。 盗用と剽窃 例えば何か研究成果を発表するときに,他人の意見を自分の意見であるかのように述べること,他人のデータを自分のものであるかのように紹介すること。これらは盗用や剽窃と呼ばれます。学会,学校様々な場…

アクセス数が500,000になりました

本日累積のアクセス数が500,000になりました。このブログを御覧の皆様。あなたのおかげです。ありがとうございます。今回はちょっとだけこのブログについて振り返り,今後の計画について書ける範囲で書こうと思います。 このブログを作ったきっかけ 自分の作…

数式は(そんなに)怖くない(2)

では,前回のイントロにつづいて具体的に2つほど数式を見ていきましょう。 まずは平均 平均値の計算は,直感的にも,計算手続きも親しみがある方が多いと思うので,これをとりかかりにしてみましょう。 まず,直感的な理解としては,あるデータの集まりの中…

数式は(そんなに)怖くない(1)

今回は,統計学やデータ解析の教科書に出てくる数式が苦手という人に向けた応援的内容です。 数式でものを考えるということ 統計学やデータ解析の教科書では,しばしば数式が出てきます。例えば,以下のような式は平均の計算手続きを示しています。 こんな式…

ロボットがヒト区別つかなくなる世界

今日も,最近思っていることを書きたいと思います。最近,人工知能の話題がとても盛り上がっています。この勢いが続けば,人間に寄り添うパートナーロボットが作られる日が来るかもしれません。今日は,そんなときにどんなことが起きるのかをちょっと想像し…

大きなマウスパッドのすすめ

今回は,最近購入したマウスパッドの良いところを紹介します。 なぜマウスパッドが欲しかったのか? 私は,マウスが苦手です。普段は,ラップトップPCで作業することが多いので,主にタッチパネルを使っているからです。最近,デスクトップPCを入手したので…

教育に新しい技術を導入することのメリット・デメリット

今回は,最近考えていることを書きたいと思います。教育に新しいICTを取り入れるときに気をつけたほうが良いことについてです。 新しい技術はどんどん取り入れれば良いのか? 私は新しいものが大好きです。これまでにできなかったこと,難しかったことが新技…

R言語でデータを保存する

今回もR言語のちょっとした使用上のヒントを投稿します。 save関数でデータを保存 R言語を利用してデータ解析をする際,解析が長くなると一時的に保存したファイルを永続的に保存,または他の人と共有したことがあります。そのような場合に,データオブジェ…

R言語での計算の繰り返しのバリエーション

R言語は,統計解析に用いられるプログラミング言語です。プログラミング言語なので,他のプログラミング言語にあるような繰り返し計算や条件分岐などを行えます。今回は,R言語における繰り返し計算の方法をまとめます。 for関数による繰り返し for関数では…

Rのtable関数の出力表をもっと「表らしく」するには?

今回も,Rを利用したデータ解析の細かい話です。 Rで2つのカテゴリー変数のクロス集計表(それぞれの変数の値の組み合わせ度数を数えたもの)はtable関数簡単に求められます。 data <- data.frame(x = sample(1:5,100, replace = TRUE), y= sample(c("a","b…

Rのplot関数で作るグラフの軸とその値の色を変えたい

Rはグラフをプログラミングコードで簡単に作図できるという強みがあります。とりあえずplot関数を使えばグラフをつくれるものの,いろいろな目的に合ったグラフを作るには細かい調整が欠かせません。今回は,軸や軸の値の色を変える方法を紹介します。 引数f…

Rのデータフレームから数値変数だけを抜き出したい

今回は,ありそうでなさそうなデータハンドリングに関して,メモ代わりにやり方を共有します。 Rを利用しながらデータ解析を行う際に,データフレームという数値変数も文字列変数も一緒に保存できる形式が便利です。便利なのを良いことに,順序をあまり考慮…

R言語で複数のスペースで区切られたデータを読み込む

今回は本当にちょっとしたことですが、ハマる内容なので皆様と共有します。 read.table関数でテキストデータを読み込む データ分析をするときに、何かのアプリケーションで作成したテキストデータをRに読み込ませることがあります。もっとも汎用的な関数はre…

累積PVが30万を越えました。ありがとうございます。

タイトルの通り、累積のPVが30万を越えました。たくさんの方に検索していただいているのだと思うと、もっと良い記事をたくさん投稿しようと思います。そして、数は少ないのですが、常連で読んでくださる方、これからもどうぞよろしくお願いします。

Videoタグで埋め込まれた動画の再生スピードを変えたい

今回は、ウエブ上に置かれている動画の操作について、ちょっとしたやり方を書きます。自分自身へのメモ代わりです。 動画の再生 インターネット上の動画コンテンツは以前はFlashというプラグインを利用して閲覧することが多かったのですが、最近はvideoタグ…

R言語での変数の型確認の重要性(3)

前回、R言語で変数型を意識した方が良い例として重回帰分析を紹介しました。その投稿を見てくれた知り合いが、自身の失敗談を教えてくれたので、今回はその話をします。知り合いの話では、「本来数値データとして独立変数に入れるつもりが、なぜかファクター…

R言語での変数の型確認の重要性(2)

前回、R言語では変数の型を明示的にしていしないので、注意が必要だという投稿をしました。 今回は、型変換に気をつけたほうが良い例として回帰分析をとりあげます。 回帰分析 回帰分析は、ある変数を別の変数で予測に用います。予測に使用する変数の値に適…

Jupyter notebookでRを使う:2017年1月版

今回は、以前紹介したjupyter notebookでRを使うための設定方法を再び紹介します。macを買ったので、新たに設定しようとしたところ以前とはだいぶやり方が違ったので、2017年1月版として紹介します。 今回のインストール環境 OS: macOS Sierra 10.12.2 …

サンプルサイズが条件ごとに異なる一要因分散分析

今回は、一要因分散分析について考えます。典型的な教科書では、分散分析の条件ごとのサンプルサイズが揃っている場合を扱います。もしも条件ごとのサンプルサイズが大きく異なる場合はどんな問題に気をつければよいかを見てみましょう。ちなみに似たような…

R言語での変数の型確認の重要性(1)

今回は、R言語で統計解析を学び始めた人にとって分かりにくい点について書きます。 Rの変数オブジェクトは型宣言しないが、型がある Rは、統計パッケージアプリケーションという捉え方と、データ処理のためのプログラム言語という捉え方があります。後者に関…

音の印象を尋ねるウエブページの構築

本日は、音声を聞いて、その印象を尋ねるウエブページをHTML5の標準技術で(プラグインや別のサービスなし)作ることを試みます。これができると音声を聴取する調査がぐっと簡単になりますよね。## 概要 音声を提示する 反応を取得する 音声を提示する 音声…