jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

R言語で変数を変換する

前回に引き続き、データハンドリングに利用できる関数の使い方をまとめます。
今回は、データの単位やスケールの変換に利用できるtransform関数を見てみます。

transform関数

transform関数はデータフレーム内に変数を追加する関数です。既にある変数を変換して、新しい変数として追加すると便利です。引数は以下の通り。

  • x 操作するデータオブジェクト名
  • 変数名 = 変換式 追加する変数名とどのように変換するかの指定

使用上のポイント

他の関数と組み合わせると良いです。例えば、元の変数の対数変換値の変数を作ることができます。

data <- data.frame(Values = c(1,10,100,1000,10000), ID = seq(1:5))
data <- transform(data, logValues = log(Values), log10Values = log(Values, base = 10))

前回紹介したcut関数と組み合わせるとデータフレーム内に数量データからカテゴリーデータに変換した変数を追加できます。

data <- data.frame(Values = c(1,10, 100, 1000, 10000), ID = seq(1:5))
data <- transform(data, CategoryValues = cut(Values, breaks = 2, labels = c("low", "high"))