Rで解析：文字列データの傾向把握に「GrpString」パッケージ

文字列データの傾向把握に便利なパッケージの紹介です。収録されているコマンドからCommonPattコマンドを紹介します。

パッケージバージョンは0.3.2。windows 10のR version 4.2.2で動作を確認しています。

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("GrpString")

実行コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#&#12497;&#12483;&#12465;&#12540;&#12472;&#12398;&#35501;&#12415;&#36796;&#12415;
library("GrpString")

###&#12487;&#12540;&#12479;&#20363;&#12398;&#20316;&#25104;#####
TestVec <- c("R&#12399;&#12363;&#12425;&#12384;&#12395;&#12356;&#12356;&#12418;&#12398;",
             "&#12450;&#12491;&#12513;&#12418;&#12356;&#12356;&#12418;&#12398;", "&#12356;&#12356;&#12418;&#12398;&#12450;&#12491;&#12513;&#12418;&#12356;&#12356;&#12418;&#12398;")
#######

#&#25991;&#23383;&#21015;&#12487;&#12540;&#12479;&#12398;&#20986;&#29694;&#12497;&#12479;&#12540;&#12531;&#12434;&#35336;&#31639;:CommonPatt&#12467;&#12510;&#12531;&#12489;
#&#12487;&#12540;&#12479;&#12434;&#25351;&#23450;:strings.vec&#12458;&#12503;&#12471;&#12519;&#12531;
#&#20986;&#29694;&#29575;&#12434;&#25351;&#23450;:low&#12458;&#12503;&#12471;&#12519;&#12531;;0-100&#12398;&#31684;&#22258;
Data <- CommonPatt(strings.vec = TestVec, low = 60)

#&#30906;&#35469;
#Percent_total&#12398;&#19978;&#20301;5&#20301;
#Freq_total:&#32207;&#20986;&#29694;&#25968;
#Percent_total:&#20986;&#29694;&#21106;&#21512;;Freq_total/&#12487;&#12540;&#12479;&#25968;
#Length:&#25991;&#23383;&#21015;&#12398;&#38263;&#12373;
#Freq_str:&#21508;&#12487;&#12540;&#12479;&#12398;&#12497;&#12479;&#12540;&#12531;&#37325;&#35079;&#12434;&#38500;&#12367;
#Percent_str:&#12497;&#12479;&#12540;&#12531;&#37325;&#35079;&#12434;&#38500;&#12367;&#20986;&#29694;&#21106;&#21512;;Freq_str/&#12487;&#12540;&#12479;&#25968;
head(Data[order(Data[, 3]),])
#            Pattern Freq_total Percent_total Length Freq_str Percent_str
#16         &#12356;&#12356;&#12418;&#12398;          4       133.33%      4        3     100.00%
#15           &#12356;&#12356;&#12418;          4       133.33%      3        3     100.00%
#25           &#12356;&#12418;&#12398;          4       133.33%      3        3     100.00%
#14 &#12450;&#12491;&#12513;&#12418;&#12356;&#12356;&#12418;&#12398;          2        66.67%      8        2      66.67%
#13   &#12450;&#12491;&#12513;&#12418;&#12356;&#12356;&#12418;          2        66.67%      7        2      66.67%
#51   &#12491;&#12513;&#12418;&#12356;&#12356;&#12418;&#12398;          2        66.67%      7        2      66.67%

あなたの解析が少しでも楽になりますように！！