R言語でデータセットの一部を抜き出す
今回は、データの一部を抜き出すときに便利なsubset関数の使い方をまとめます。
subset関数
subset関数の引数は以下の通りです。
- x データフレームオブジェクト
- subset 抜き出す条件式 欠損値は自動的に除外されます
- select 抜き出す変数名。データフレーム全体ではなく、指定された変数だけを抜き出すことができます。
subset関数の使い方のポイント
subsetは真偽値を返すような条件式を設定します。例えば、ある変数が奇数の場合のデータを取り出すなら以下のようになります。
data <- data.frame(ID = seq(1:5), Value = c(100,200,150,250, 300)) subsetData = subset(data, subset = ID%%2 == 1)
selectで変数も一部だけ取り出し
subsetは選びたいケースを指定しますが、selectは選びたい変数を指定します。
subsetData = subset(data, subset = ID%%2 == 1,select = Values)