Rで解析:xls,xlsx,csvをまとめて読み込む「DataLoader」パッケージ

Rの解析に役に立つ記事

xls,xlsx,csvをRに読み込むには「readxl,xlsx,XLConnect」パッケージやread.tableコマンドの利用が考えられます。これらパッケージは単一ファイルの読み込みと加工出力に適していますが、大量のxls,xlsx,csvを読み込むには工夫が必要でした。

工夫の一つには、fotとlist,tcltkを組み合わせが考えられます。時間がある方は挑戦してみても良いと思いますが、時間がない方は「DataLoader」パッケージの利用を検討してはいかがでしょうか。

もしかすると、使用環境によりエラーが出るかもしれません。コマンドを確認した環境はMac OS Ver10.10.5,R version 3.2.2です。なお、パッケージのバージョンは1.2です。

スポンサーリンク
スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("DataLoader")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

DataLoader

なお、読み込むファイルは画像のようにデスクトップに保存されているとします。

#パッケージの読み込み
library("DataLoader")

#コンソールに表示されるリストから
#ファイル読み込み場所を選択
#読み込んだファイルデータはリストclassに格納されます
Data <- importAllMdf()

#作業フォルダがデスクトップの場合
=== Select the directory with the files to import ===
===Look in: /Users/  /Desktop ===
1:	../
Enter number(s) separated by spaces, or 0 to cancel
: 1

#階層を一段上がる
#メニューの中からDesktopを指定
=== Select the directory with the files to import ===
===Look in: /Users/  ===
1:	../
2:	./anRpackage
3:	./Applications
4:	./checkpoint_example_project_2015-09-16
5:	./Desktop
#以下略
Enter number(s) separated by spaces, or 0 to cancel
: 28

#データの確認
Data[1]
$`ブック1.xlsx`
1
1 2
2 3
3 4
Data[2]
$`ブック2.xlsx`
1
1 2
2 3
3 4

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました