Rで解析:データ名の修正と作成に便利かも「strex」パッケージ

データ名で数字の桁数が揃っていないために、sortコマンド等で期待した通りに並ばなかった経験はないでしょうか。意外とデータ名の修正は面倒です。そんな手間を軽減するパッケージの紹介です。

パッケージバージョンは1.4.2。実行コマンドはwindows 11のR version 4.1.2で確認しています。

パッケージのインストール

下記コマンドを実行してください。

#&#12497;&#12483;&#12465;&#12540;&#12472;&#12398;&#12452;&#12531;&#12473;&#12488;&#12540;&#12523;
install.packages("strex")

コマンドの紹介

詳細はパッケージのヘルプを確認してください。

#&#12497;&#12483;&#12465;&#12540;&#12472;&#12398;&#35501;&#12415;&#36796;&#12415;
library("strex")

###&#12487;&#12540;&#12479;&#20363;&#12398;&#20316;&#25104;#####
set.seed(1234)
TestData <- sample(sample(paste0("Group", 1:300, "_NO", 1:50), 10, replace = TRUE))
#&#30906;&#35469;
TestData
[1] "Group3_NO3"    "Group259_NO9"  "Group183_NO33" "Group155_NO5"  "Group187_NO37" "Group200_NO50"
[7] "Group193_NO43" "Group35_NO35"  "Group70_NO20"  "Group188_NO38"
########

#&#22522;&#26412;&#12398;sort&#12467;&#12510;&#12531;&#12489;&#12391;&#20006;&#12403;&#26367;&#12360;
#&#26689;&#25968;&#12364;&#30064;&#12394;&#12427;&#12398;&#12391;&#23567;&#12373;&#12356;&#38918;&#12363;&#12425;&#20006;&#12400;&#12394;&#12356;
sort(TestData)
[1] "Group155_NO5"  "Group183_NO33" "Group187_NO37" "Group188_NO38" "Group193_NO43" "Group200_NO50"
[7] "Group259_NO9"  "Group3_NO3"    "Group35_NO35"  "Group70_NO20"

#&#26689;&#25968;&#12434;&#25539;&#12360;&#12427;:str_alphord_nums&#12467;&#12510;&#12531;&#12489;
ResultData <- str_alphord_nums(TestData)
sort(ResultData)
[1] "Group003_NO03" "Group035_NO35" "Group070_NO20" "Group155_NO05" "Group183_NO33" "Group187_NO37"
[7] "Group188_NO38" "Group193_NO43" "Group200_NO50" "Group259_NO09"

#&#25991;&#23383;&#21015;&#12395;&#21547;&#12414;&#12428;&#12427;&#25968;&#23383;&#12434;&#21462;&#24471;:str_extract_numbers&#12467;&#12510;&#12531;&#12489;
str_extract_numbers(TestData)
[[1]]
[1] 3 3

[[2]]
[1] 259 9
#&#20197;&#19979;&#30465;&#30053;

#&#25351;&#23450;&#25991;&#23383;&#12364;&#21021;&#20986;&#29694;&#12424;&#12426;&#21069;&#26041;&#25991;&#23383;&#21015;&#12434;&#21462;&#24471;:str_before_first&#12467;&#12510;&#12531;&#12489;
#&#24460;&#26041;&#12399;str_after_first&#12467;&#12510;&#12531;&#12489;
str_before_first(TestData, pattern = "3")
[1] "Group"       NA            "Group18"     NA            "Group187_NO" NA            "Group19"    
[8] "Group"       NA            "Group188_NO"

#&#25351;&#23450;&#25991;&#23383;&#12398;&#26368;&#24460;&#23614;&#12424;&#12426;&#21069;&#26041;&#25991;&#23383;&#21015;&#12434;&#21462;&#24471;:str_before_last&#12467;&#12510;&#12531;&#12489;
#&#24460;&#26041;&#12399;str_after_last&#12467;&#12510;&#12531;&#12489;
str_before_last(TestData, pattern = "3")
[1] "Group3_NO"    NA             "Group183_NO3" NA             "Group187_NO"  NA             "Group193_NO4"
[8] "Group35_NO"   NA             "Group188_NO" 
  
#&#25351;&#23450;&#20986;&#29694;&#25968;&#12424;&#12426;&#21069;&#26041;&#25991;&#23383;&#21015;&#12434;&#21462;&#24471;:str_before_nth&#12467;&#12510;&#12531;&#12489;
#&#24460;&#26041;&#12399;str_after_nth&#12467;&#12510;&#12531;&#12489;
str_before_nth(TestData, pattern = "5", n = 2)
[1] NA            NA            NA            "Group15"     NA            NA            NA           
[8] "Group35_NO3" NA            NA

少しでも、あなたの解析が楽になりますように！！