jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

p値とは何なのか?

今回は、統計学の知識があまりない人向けの記事にしようと思います。昨今のデータが社会中に溢れている環境では、データから上手に自分の知りたい情報を抜き出せるかどうかが重要だと思います。その時に、統計学に基づいた意思決定やデータの解釈を行うのが…

質問は何のためにするのか改めて考えてみた

今回は、以前に投稿した以下の投稿内容を更新したいと思い、まとまらなそうな考えを何とかまとめる方向でメモ書きしていきたいと思います。webbeginner.hatenablog.com なぜ改めて考えたくなったのか 以前投稿した内容に不満があるわけではないのですが、以…

ブログの閲覧回数が100万回になりました!

本日はお知らせとお礼です。 100万回達成について このブログの閲覧回数が100万回を超えました。 見返してみたら最初の投稿は2013年12月でしたので、丸々8年での達成となります。達成と書くといかにも目指していたようですが、そのようなことは一切ありませ…

学術雑誌で論文を出すとはどういうことなのか?(1)

今回は、論文が学術雑誌に掲載される*1ことのプロセスや意味などを考えてみたいと思います。世の大半の人にはどうでも良いことなのかもしれないのですが、中には「研究者が何かといえば論文、論文と騒いでいるが、論文が出るのがそんなに大事・大変なことな…

Rのfactanal関数で因子分析した時に因子負荷行列を全て表示したい

今回はRを利用した分析に関する非常に細かい話です。 因子分析とは 因子分析は、ある個人・対象について、複数の指標で計測を行った場合に、それらの指標を上手に要約する方法の1つです。例えば、ある学校のある学年の生徒に国語・算数・理科・社会のテスト…

機械学習の精度指標

昨今、いわゆる機械学習の技術は、学術研究だけでなく、様々な産業応用がなされています。ユーザーとしては、実際に使ってみて、それが便利であるか否かで利用を判断すれば良いと思います。一方で、こういった技術がどの程度、客観性があったり、信用できる…

心理学の構成概念について

本日は、心理学が扱う「構成概念」を取り上げます。独特な考え方をするのもポイントですが、一般的にも用いる単語が構成概念を指す用語として扱われるとどうなるかについて考えてみます。 そもそも構成概念とは 構成概念というのは実体を持たない説明のため…

Rで作成した度数分布表のラベルと値をすぐに使いたい

今回はRの使い方の話です。最初に考えた方法がうまくいかなかったので、意外に解決策を見つけるのに手間取ったので自分のためのメモ。でも同じ問題で行き詰まる方にも共有します。 Rで表を作るならtable関数 Rのbaseパッケージで度数分布表を作るときはtable…

インプットとアウトプット(1)

久しぶりに書きたいことが出てきたので、インプットとアウトプットについて考えていることを何回か書いてみたいと思います。ここで言っているインプットとアウトプットはプログラミングや統計で利用する関数の入力・出力のことではありません。読書やインタ…

Rを利用したデータのまとめ方(1)

R

今回は、久しぶりにRの基本的な使い方について説明します。 データをまとめる方法 アンケート調査や実験などでデータを取得し、スプレッドシートなどになっているデータについて、色々な方法でまとめることができます。 変数の特徴を知る方法:summary関数で…

尤度を計算してみる(1)

今回は、尤度について考えます。尤度とは「観測されたデータが、こちらで仮定したモデルから生じたものだとするとそれがどの程度尤もらしいか」を測る指標です。「尤もらしさ」が抽象的で分かりにくいのですが、ある種の確率で表されるものと考えれば良いか…

2つの相関係数の使い分け

今回は2つの変数の関連性を表す指標である相関係数について、特に2種類の相関係数の使い分けという観点から考えてみます。 相関係数とは 相関係数は、2つの変数の大小関係の結びつき方(関連性)の方向と強さを表す指標です。大小関係の結びつき方という…

QuickTime Playerで動画の再生スピードを変えたい

本日は、QuickTime PlayerについてのTipsです。最近、大学、高校でオンラインの授業が増えていたり、社会人もオンラインのコースで学ぶ機会が増えてきました。その際、動画を視聴する機会が数多くあると思います。今回はダウンロードした動画でも再生スピー…

児童虐待対応の2つの立場の違いを第1種の過誤と第2種の過誤で考える

久しぶりの投稿です。最近のニュース記事などで児童虐待への対応について児童相談所と裁判で異なる行動基準があるという議論を見かけました。 今回は、これを第1種の過誤と第2種の過誤という科学的な検証で想定される2種類の誤りという観点で考えてみます…

社会科学の知見を社会に実装する

本日は研究の目標について考えてみたことを書きます。 研究者は何をする人か? これは研究者によっても考え方に差があるものなので、私自身の考えで書きます。研究は科学のルールを使って「まだ誰も知らないことを明らかにすること」か「今の社会を改善、問…

このブログの説明について

とっても柔らかい話。 このブログの説明 「JavaScriptとR言語を中心に研究活動に役立つwebアプリケーション技術について考えていきます。」 もうすぐ累積PVが70万になろうとする段に来て、ふとブログの説明を見たらおかしさに気づきました。 JavaScriptもR…

学習心理学から考えたポモドーロテクニックの改善法

今回は、学習心理学について復習した際に思いついた、作業の効率について書きます。 ポモドーロテクニックとは 作業への集中と休憩を時間できちんと決めることで効率化を図る方法です。ライフハックの一種ですね。やり方としては、30分を1つの作業時間枠とし…

研究方法を学ぶ重要性とそこで終わらない重要性

今回は具体的な方法論ではなく、研究方法のとらえ方について書いてみます。 研究方法を学ぶ重要性 研究をしてみたいと思ったら、まずは過去の研究を読んでみたり、関連する話題を研究している研究者に質問したりして、研究方法を学びましょう。研究方法を覚…

評価という手段を目的にしてしまうと教育に何が起きるか

今回は,とても抽象的なことを書きます。自分としてもまだ問題の整理が完全に済んでいないので,これを書きながら少しでも整理できたものが残せればいいなと祈りながら書き始めます。 教育における評価の機能 様々な教育場面において,しばしば評価が行われ…

検定力(検出力)の求め方

今回は,当たり前に思っていたことが実はそんなことなかったという話です。 検定力とは何か? 私達が,観察したデータについて,そのデータを取得した大元の集団について考えたいときがあります。そのようなときには統計的仮説検定の手続きにのっとって,推…

論文を書く予定がある人は,まずはできるだけ論文を読みましょう

今回は,最近考えていることを共有したいと思って書きます。タイトルが言いたいことそのままなのですが。 論文には構造がある 論文には,構造があります。研究領域や学術雑誌によって,その構造自体は異なることもあります。最も典型的な形式としてIMRAD (In…

R言語でデータを分割してから,それぞれに同じ操作を繰り返す

今回はR言語の使い方のヒントを皆様と共有します。 データの分割はsplit関数 データを分割するには,split関数が便利です。split関数では2つの引数をとり,1つ目がデータオブジェクト,2つ目が分割するための基準となる変数を設定します。 以下の例を見て…

数式は(そんなに)怖くない(3)

本日は,数式怖くないシリーズ3つめの話題です。共分散を取り上げます。 共分散とは 共分散とは2つの変数の変動(または連動)する様子を1つの値に要約したものです。ある変数の値が高くなるときに,他の変数も同じように値が高くなるのか,逆に低くなる…

サンプル平均の期待値はサンプルサイズがいくつでも同じです

本日は,久々の投稿な上に,ちょっと込み入った話です。込み入っているけど,推測統計を理解するためにぜひ抑えておきたいポイントについて書きたいと思います。 サンプルの平均を母平均の推定に使う 推測統計学では,実際に持っているデータをデータを取っ…

分析はプログラミングを利用したほうが良いのはなぜか?(初学者向け)

今回は,統計学やデータ分析の初学者の方に向けて,「なぜプログラミングを利用したほうが良いのか?」を考えてみます。 データ分析の方法 何らかの方法でデジタル化されたデータがあれば,それを使って,計算し,データの特徴を調べられます。数量で扱える…

Rをアップデートしたらjupyter notebookの設定もアップデート

これまでに2回ほどjupyter notebook(またはipython notebook)のインストールについて紹介しました。この度,Rのメジャーアップデートをしたので,その後の設定についてメモを共有します。 必要なパッケージのインストール 以下のページに載っているように,…

盗用・剽窃はなぜいけないのか

今回は,最近,考えたことを書きます。 盗用と剽窃 例えば何か研究成果を発表するときに,他人の意見を自分の意見であるかのように述べること,他人のデータを自分のものであるかのように紹介すること。これらは盗用や剽窃と呼ばれます。学会,学校様々な場…

アクセス数が500,000になりました

本日累積のアクセス数が500,000になりました。このブログを御覧の皆様。あなたのおかげです。ありがとうございます。今回はちょっとだけこのブログについて振り返り,今後の計画について書ける範囲で書こうと思います。 このブログを作ったきっかけ 自分の作…

数式は(そんなに)怖くない(2)

では,前回のイントロにつづいて具体的に2つほど数式を見ていきましょう。 まずは平均 平均値の計算は,直感的にも,計算手続きも親しみがある方が多いと思うので,これをとりかかりにしてみましょう。 まず,直感的な理解としては,あるデータの集まりの中…

数式は(そんなに)怖くない(1)

今回は,統計学やデータ解析の教科書に出てくる数式が苦手という人に向けた応援的内容です。 数式でものを考えるということ 統計学やデータ解析の教科書では,しばしば数式が出てきます。例えば,以下のような式は平均の計算手続きを示しています。 こんな式…