Rで解析:大規模データのハンドリングを効率化!!「data.table」パッケージ

Rの解析に役に立つ記事

解析の際にdata.frameクラスを利用されていませんか。data.frameクラスに適応できるコマンドが使え、格段に処理が早い「data.table」クラスを作成する「data.table」パッケージの紹介です。大規模データのハンドリングが楽になります。

もちろん、data.tableクラスはdata.frameと同様にggplot2だけでなく多くのパッケージで利用が可能です。

実行コマンドの紹介では10,000,000行*5列のデータ例で処理しています。一部作業は、data.frameとの処理時間を比較しています。

パッケージのバージョンは1.9.4。R version 3.2.1でコマンドを確認しています。


スポンサーリンク

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("data.table")

実行コマンド

詳細はコマンド、パッケージヘルプを確認してください。

#パッケージの読み込み
library("data.table")

#データテーブル(DT)クラスの作成:data.tableコマンド
n

出力例

・ggplot2もいつも通りに使えます
ggplot


少しでも、あなたのウェブや実験の解析が楽になりますように!!

タイトルとURLをコピーしました