Rで解析:行名・列名の操作がラクラクです「colr」パッケージ


データ解析時に意外と面倒な行名・列名の操作がラクラクなパッケージの紹介です。文字列操作は正規表現を知っていると作業効率の改善になると考えます。

突然ですが、2017年に放送開始のアニメ「幼女戦記」が面白いです。原作もイイ感じです。

・幼女戦記公式サイト
 http://youjo-senki.jp/

パッケージバージョンは0.1.900。windows 10のR version 3.3.2で動作を確認しています。

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("colr")

実行コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("colr")

###データ例の作成#####
n <- 10
TestData <- data.frame("Group" = sample(paste0("Group", 1:5), n, replace = TRUE),
                       "Data1" = sample(1:50, n, replace = TRUE),
                       "Data2" = sample(1:35, n, replace = TRUE),
                       "Data3" = sample(1:10, n, replace = TRUE),
                       "Vol.1" = sample(1:50, n, replace = TRUE),
                       "Vol.2" = sample(1:35, n, replace = TRUE),
                       "Vol.3" = sample(1:10, n, replace = TRUE))
#行名を付与
rownames(TestData) <- paste0(c("Group", "Data", "Vol"), 1:n)
#内容確認
TestData
         Group Data1 Data2 Data3 Vol.1 Vol.2 Vol.3
Group1  Group2    17    20     1     8    26     7
Data2   Group4    27    32     2    20    27     3
Vol3    Group3     8    20     3    28    15     9
Group4  Group4    30    20     3    22    20     9
Data5   Group1    36    29     2    46    31     3
Vol6    Group4    15     2     4    20    15     2
Group7  Group2    18    30     1    47    29     2
Data8   Group3    14    13     9     2    32     4
Vol9    Group2    41     4     8    33    35     1
Group10 Group1    50    11     1    11     4     2
########

#指定した内容で行または列を抽出:cgrepコマンド
#データを指定:xオプション
#抽出内容を設定:patternオプション;正規表現の使用可能
#検索方向を指定:dimオプション:c;列方向,r;行方向
cgrep(x = TestData, pattern = "Vol", dim = "r")
      Group Data1 Data2 Data3 Vol.1 Vol.2 Vol.3
Vol3 Group3     8    20     3    28    15     9
Vol6 Group4    15     2     4    20    15     2
Vol9 Group2    41     4     8    33    35     1

#行または列名を置換:csubコマンド
#データを指定:xオプション
#対象内容を設定:patternオプション;正規表現の使用可能
#置換内容を設定:replacementオプション;正規表現の使用可能
#検索方向を指定:dimオプション:c;列方向,r;行方向
csub(x = TestData, pattern = "a",
     replacement = "A", dim = "c")
         Group DAtA1 DAtA2 DAtA3 Vol.1 Vol.2 Vol.3
Group1  Group2    17    20     1     8    26     7
Data2   Group4    27    32     2    20    27     3
Vol3    Group3     8    20     3    28    15     9
Group4  Group4    30    20     3    22    20     9
Data5   Group1    36    29     2    46    31     3
Vol6    Group4    15     2     4    20    15     2
Group7  Group2    18    30     1    47    29     2
Data8   Group3    14    13     9     2    32     4
Vol9    Group2    41     4     8    33    35     1
Group10 Group1    50    11     1    11     4     2

###正規表現の例#####
#[]で囲まれた文字のどれかと一致
cgrep(x = TestData, pattern = "[3a]", dim = "r")
       Group Data1 Data2 Data3 Vol.1 Vol.2 Vol.3
Data2 Group1    25    32     5    44     9     3
Vol3  Group3    34    11     8    50    15     4
Data5 Group1    43    22     7    22    12     7
Data8 Group4    28    15     9    47     5     8
#^で否定,Data数字を非選択
#[:digit:]数字を意味する
cgrep(x = TestData, pattern = "[^Data[:digit:]]", dim = "r")
      Group Data1 Data2 Data3 Vol.1 Vol.2 Vol.3
Group1  Group2    48    32     9    17    14     1
Vol3    Group3    34    11     8    50    15     4
Group4  Group2    42    32     6    24    12     4
Vol6    Group3    15    11     7    50    28     4
Group7  Group3     8    22     9    49     6     1
Vol9    Group4    26    30     8    19    13     9

あなたの解析がとっても楽になりますように!!

スポンサードリンク

おすすめコンテンツ


スポンサードリンク