Rで解析:データの日付け表記を整える「datefixR」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

データの日付け表記を整えるパッケージの紹介です。すべての表記(例えば「.」区切り)に対応できるわけではありませんが、何かの役に立つかもしれませんので紹介します。

パッケージバージョンは0.1.4。実行コマンドはwindows 11のR version 4.1.2で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("datefixR")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("datefixR")

###データ例の作成#####
#tidyverseパッケージがなければインストール
if(!require("tidyverse", quietly = TRUE)){
  install.packages("tidyverse");require("tidyverse")
}
set.seed(1234)
TestData <- tibble(Group = sample(paste0("Group", 1:4), 5,
                                  replace = TRUE),
                   X_Data = c("2022-02-19",
                              "21-03-2022",
                              "2022/05/21",
                              "21/06/2022",
                              "Feb 08 2022"),
                   Y_Data = sample(c(51:100), 5, replace = TRUE),
                   Chr_Data = sample(c("&#12363;", "&#12425;", "&#12384;", "&#12395;",
                                       "&#12356;", "&#12356;", "&#12418;", "&#12398;"),
                                     5, replace = TRUE))
########

#&#26085;&#20184;&#12369;&#12487;&#12540;&#12479;&#12398;&#26360;&#24335;&#32113;&#19968;:fix_dates&#12467;&#12510;&#12531;&#12489;
#&#23550;&#35937;&#21015;:col.names&#12458;&#12503;&#12471;&#12519;&#12531;;c(X1, X2, ...)&#12392;&#35079;&#25968;&#25351;&#23450;&#21487;&#33021;
fix_dates(df = TestData, col.names = "X_Data")

# A tibble: 5 x 4
#  Group  X_Data     Y_Data Chr_Data
#  <chr>  <date>      <int> <chr>   
#1 Group4 2022-02-19     94 &#12398;      
#2 Group4 2022-03-21     97 &#12395;      
#3 Group2 2022-05-21     59 &#12425;      
#4 Group2 2022-06-21     55 &#12418;      
#5 Group1 2022-08-02     88 &#12356;   

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました