忍者ブログ
やったことの記録 主にlinuxとかperlとか
プロフィール
HN:
隠居SE
性別:
非公開
カテゴリー
P R
ブログ内検索
忍者カウンター
[16] [15] [14] [13] [12] [11] [10] [8] [9] [7] [6]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

Rでcsvデータを読むには、
data <- read.csv( fname, stringsAsFactors=F, encoding="UTF8" )
とする。
これで生成されるオブジェクトはdata.frame。

オプションについては、
stringsAsFactors オプションを付けないと、一部のカラムがファクター型になってしまう。
data.frameから他の型(例えばxtsなど)に変換する時に問題になることがあるので、
私は機械的にセットしている。
また、encodingについては、Windows版のRの文字コードがShiftJISに固定されているため、
UTF-8で書かれたデータを読む時に必要。
初期の文字コードを変更できるといいのですが、
現在のバージョンでは変更できない模様。

カラムへのアクセス方法は、
data$colname
とし、カラム名はcsvファイルの1行目の値になる。

csvから読み込んだデータは、Rが勝手に各カラムのデータ型を推定してくれるが、
時々間違える。
なので、それを修正するには、
mode( data$colname ) <- "numeric"
などとする。
現在のカラムの型を確認するには、
sapply( data, class )
とする。


#R言語 #csv #データ型
PR
この記事にコメントする
お名前:
タイトル:
文字色:
メールアドレス:
URL:
コメント:
パスワード:   Vodafone絵文字 i-mode絵文字 Ezweb絵文字
Powerd by NINJAブログ / Designed by SUSH
Copyright © 隠居SEの備忘録 All Rights Reserved.
忍者ブログ/[PR]