jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

R言語でデータセットの一部を抜き出す

今回は、データの一部を抜き出すときに便利なsubset関数の使い方をまとめます。

subset関数

subset関数の引数は以下の通りです。

  • x データフレームオブジェクト
  • subset 抜き出す条件式 欠損値は自動的に除外されます
  • select 抜き出す変数名。データフレーム全体ではなく、指定された変数だけを抜き出すことができます。

subset関数の使い方のポイント

subsetは真偽値を返すような条件式を設定します。例えば、ある変数が奇数の場合のデータを取り出すなら以下のようになります。
data <- data.frame(ID = seq(1:5), Value = c(100,200,150,250, 300))
subsetData = subset(data, subset = ID%%2 == 1)
selectで変数も一部だけ取り出し

subsetは選びたいケースを指定しますが、selectは選びたい変数を指定します。

subsetData = subset(data, subset = ID%%2 == 1,select = Values)