jnobuyukiのブログ

研究していて困ったことやその解決に関するメモ。同じように困ったあなたのために。twitter ID: @j_nobuyuki

read.table()によるテキストファイルの読み込み

R言語で、テキストファイルを読み込むときのコツをまとめます。

基本的にread.table()が便利です。通常用いるargumentは
header= TRUE: 一行目に変数名が含まれている場合にTRUEにします。
sep = "\t":一行の中のデータの区切り文字。"\t"はタブ記号です。
fill = TRUE: 一行の中に欠損値が含まれていて、読み込んだデータ数が異なるとエラーが出ます。
TRUEにしておくと、データ数が異なっていても読み込みを継続します。

その他、必須ではないが便利そうなargumentとして、

quote = "":文字列データについている引用符の設定。デフォルトが"\"'"です。つまり、""と''が引用符として認識されます。もし文字列データの中にこの記号が含まれていると読み込みが上手くいきません。そこで引用符をなしにしておきます。

データがきちんと読みこめていることを確認するのはsummary()が便利です。

ここまでをまとめるとこうなります。

dummydata <- read.table("dummydata.txt", header = TRUE, fill = TRUE, sep = "\t", quote = "")
summary(dummydata)