読者です 読者をやめる 読者になる 読者になる

jnobuyukiのブログ

JavaScriptとR言語を中心に研究活動に役立つwebアプリケーション技術について考えていきます。twitter ID: @j_nobuyuki

read.table()によるテキストファイルの読み込み

R言語で、テキストファイルを読み込むときのコツをまとめます。

基本的にread.table()が便利です。通常用いるargumentは
header= TRUE: 一行目に変数名が含まれている場合にTRUEにします。
sep = "\t":一行の中のデータの区切り文字。"\t"はタブ記号です。
fill = TRUE: 一行の中に欠損値が含まれていて、読み込んだデータ数が異なるとエラーが出ます。
TRUEにしておくと、データ数が異なっていても読み込みを継続します。

その他、必須ではないが便利そうなargumentとして、

quote = "":文字列データについている引用符の設定。デフォルトが"\"'"です。つまり、""と''が引用符として認識されます。もし文字列データの中にこの記号が含まれていると読み込みが上手くいきません。そこで引用符をなしにしておきます。

データがきちんと読みこめていることを確認するのはsummary()が便利です。

ここまでをまとめるとこうなります。

dummydata <- read.table("dummydata.txt", header = TRUE, fill = TRUE, sep = "\t", quote = "")
summary(dummydata)