Rで解析：データセットのクリーニングに便利です「janitor」パッケージ

データ内の欠損値を含むデータの削除、データ名の整形、指定値を欠損値に変換するコマンドが収録されているパッケージの紹介です。

「dplyr」パッケージと組み合わせると、とても便利だと思います。

・Rで解析：data.frameの操作が楽々な「tidyr」パッケージ
　https://www.karada-good.net/analyticsr/r-491/

パッケージバージョンは2.1.0.9000。実行コマンドはR version 4.2.2で確認しています。

パッケージのインストール

下記コマンドを実行してください。

#パッケージのインストール
install.packages("devtools")
devtools::install_github("sfirke/janitor")

実行コマンドの紹介

詳細はコマンド、パッケージのヘルプを確認してください。

#&#12497;&#12483;&#12465;&#12540;&#12472;&#12398;&#35501;&#12415;&#36796;&#12415;
library("janitor")

###&#12487;&#12540;&#12479;&#20363;&#12398;&#20316;&#25104;#####
n <- 100
TestData <- data.frame("Group" = sample(paste0("Group", 1:3), n, replace = TRUE),
                       "Data 1" = sample(rnorm(10), n, replace = TRUE),
                       "Data 2" = sample(LETTERS[1:10], n, replace = TRUE))
#&#27424;&#25613;&#20516;&#12434;&#36861;&#21152;
TestData[50:100,] <- NA
TestData <- cbind(TestData, NAData = NA)
#&#27083;&#36896;&#30906;&#35469;
summary(TestData)
   Group               Data.1            Data.2           NAData       
Length:100         Min.   :-1.36203   Length:100         Mode:logical  
Class :character   1st Qu.:-0.72351   Class :character   NA's:100      
Mode  :character   Median : 0.03051   Mode  :character                 
                   Mean   :-0.01202                                    
                   3rd Qu.: 0.63263                                    
                   Max.   : 1.21745                                    
                   NA's   :51      
########

#&#12487;&#12540;&#12479;&#21517;&#12398;&#37325;&#35079;&#12434;&#28961;&#12367;&#12375;,&#33521;&#23567;&#25991;&#23383;,&#25991;&#23383;&#38291;&#12399;&#12450;&#12531;&#12480;&#12540;&#12496;&#12540;&#12395;&#25972;&#24418;:clean_names&#12467;&#12510;&#12531;&#12489;
CleanNameData <- clean_names(TestData)
#&#30906;&#35469;
colnames(CleanNameData)
[1] "group"  "data_1" "data_2" "nadata"

#&#27424;&#25613;&#20516;&#12398;&#12415;&#12398;&#34892;&#12434;&#21066;&#38500;:remove_empty&#12467;&#12510;&#12531;&#12489;
#summary(remove_empty(ConvertNADAta))

少しでも、あなたの解析が楽になりますように！！