忍者ブログ
やったことの記録 主にlinuxとかperlとか
プロフィール
HN:
隠居SE
性別:
非公開
カテゴリー
P R
ブログ内検索
忍者カウンター
[7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

Rでcsvデータを読むには、
data <- read.csv( fname, stringsAsFactors=F, encoding="UTF8" )
とする。
これで生成されるオブジェクトはdata.frame。

オプションについては、
stringsAsFactors オプションを付けないと、一部のカラムがファクター型になってしまう。
data.frameから他の型(例えばxtsなど)に変換する時に問題になることがあるので、
私は機械的にセットしている。
また、encodingについては、Windows版のRの文字コードがShiftJISに固定されているため、
UTF-8で書かれたデータを読む時に必要。
初期の文字コードを変更できるといいのですが、
現在のバージョンでは変更できない模様。

カラムへのアクセス方法は、
data$colname
とし、カラム名はcsvファイルの1行目の値になる。

csvから読み込んだデータは、Rが勝手に各カラムのデータ型を推定してくれるが、
時々間違える。
なので、それを修正するには、
mode( data$colname ) <- "numeric"
などとする。
現在のカラムの型を確認するには、
sapply( data, class )
とする。


#R言語 #csv #データ型
PR
Powerd by NINJAブログ / Designed by SUSH
Copyright © 隠居SEの備忘録 All Rights Reserved.
忍者ブログ/[PR]