R言語で変数を変換する
前回に引き続き、データハンドリングに利用できる関数の使い方をまとめます。
今回は、データの単位やスケールの変換に利用できるtransform関数を見てみます。
transform関数
transform関数はデータフレーム内に変数を追加する関数です。既にある変数を変換して、新しい変数として追加すると便利です。引数は以下の通り。
- x 操作するデータオブジェクト名
- 変数名 = 変換式 追加する変数名とどのように変換するかの指定
使用上のポイント
他の関数と組み合わせると良いです。例えば、元の変数の対数変換値の変数を作ることができます。
data <- data.frame(Values = c(1,10,100,1000,10000), ID = seq(1:5)) data <- transform(data, logValues = log(Values), log10Values = log(Values, base = 10))
前回紹介したcut関数と組み合わせるとデータフレーム内に数量データからカテゴリーデータに変換した変数を追加できます。
data <- data.frame(Values = c(1,10, 100, 1000, 10000), ID = seq(1:5)) data <- transform(data, CategoryValues = cut(Values, breaks = 2, labels = c("low", "high"))