やったことの記録
主にlinuxとかperlとか
プロフィール
HN:
隠居SE
性別:
非公開
最新記事
(12/12)
(09/28)
(09/26)
(09/25)
(09/21)
P R
ブログ内検索
忍者カウンター
2025/04/20 (Sun)
04:02:40
[PR]
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
2017/07/08 (Sat)
10:08:07
[R言語] csvファイルを読む
Rでcsvデータを読むには、
これで生成されるオブジェクトはdata.frame。
オプションについては、
stringsAsFactors オプションを付けないと、一部のカラムがファクター型になってしまう。
data.frameから他の型(例えばxtsなど)に変換する時に問題になることがあるので、
私は機械的にセットしている。
また、encodingについては、Windows版のRの文字コードがShiftJISに固定されているため、
UTF-8で書かれたデータを読む時に必要。
初期の文字コードを変更できるといいのですが、
現在のバージョンでは変更できない模様。
カラムへのアクセス方法は、
csvから読み込んだデータは、Rが勝手に各カラムのデータ型を推定してくれるが、
時々間違える。
なので、それを修正するには、
現在のカラムの型を確認するには、
#R言語 #csv #データ型
data <- read.csv( fname, stringsAsFactors=F, encoding="UTF8" )
とする。これで生成されるオブジェクトはdata.frame。
オプションについては、
stringsAsFactors オプションを付けないと、一部のカラムがファクター型になってしまう。
data.frameから他の型(例えばxtsなど)に変換する時に問題になることがあるので、
私は機械的にセットしている。
また、encodingについては、Windows版のRの文字コードがShiftJISに固定されているため、
UTF-8で書かれたデータを読む時に必要。
初期の文字コードを変更できるといいのですが、
現在のバージョンでは変更できない模様。
カラムへのアクセス方法は、
data$colname
とし、カラム名はcsvファイルの1行目の値になる。csvから読み込んだデータは、Rが勝手に各カラムのデータ型を推定してくれるが、
時々間違える。
なので、それを修正するには、
mode( data$colname ) <- "numeric"
などとする。現在のカラムの型を確認するには、
sapply( data, class )
とする。#R言語 #csv #データ型
PR