Rで解析:URL文字列の操作が大変便利です!!「urltools」パッケージ

Rの解析に役に立つ記事
スポンサーリンク

URLは”/”や”:”、”#”そして”?”などのメタ文字を含むので操作が非常に厄介です。そんな文字列を気にせずURLの操作が可能なパッケージの紹介です。

パッケージバージョンは1.7.3。実行コマンドはR version 4.2.2で確認しています。

スポンサーリンク

パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("urltools")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("urltools")

#URL例:からだにいいもの「Rの解析に役に立つ記事」一覧
ExURL <- "https://karada-good.net/category/analyticsr?GOOD=KIJI#TEST"

#&#12489;&#12513;&#12452;&#12531;&#21517;&#12398;&#34920;&#31034;:domain&#12467;&#12510;&#12531;&#12489;
domain(ExURL)
[1] "karada-good.net"

#&#12450;&#12531;&#12459;&#12540;&#21517;&#12434;&#34920;&#31034;:fragment&#12467;&#12510;&#12531;&#12489;
fragment(ExURL)
[1] "TEST"
#&#22793;&#26356;&#12418;&#21487;&#33021;
fragment(ExURL) <- "KARADAGOOD"
#&#30906;&#35469;
ExURL
[1] "https://karada-good.net/category/analyticsr?GOOD=KIJI#KARADAGOOD"

#&#12497;&#12521;&#12513;&#12540;&#12479;&#12540;&#12434;&#21462;&#24471;:parameters&#12467;&#12510;&#12531;&#12489;
parameters(ExURL)
[1] "GOOD=KIJI"
#&#22793;&#26356;&#12418;&#21487;&#33021;
parameters(ExURL) <- "KARADA=KIJI"
#&#30906;&#35469;
ExURL
[1] "https://karada-good.net/category/analyticsr?KARADA=KIJI#KARADAGOOD"

#&#12497;&#12521;&#12513;&#12540;&#12479;&#12540;&#12434;&#21066;&#38500;:param_remove&#12467;&#12510;&#12531;&#12489;
#&#35079;&#25968;&#12497;&#12521;&#12513;&#12540;&#12479;&#12398;&#22580;&#21512;&#12399;c("X1", "X2", ...)&#12392;&#25351;&#23450;&#12377;&#12427;
param_remove(ExURL, "KARADA")
[1] "https://karada-good.net/category/analyticsr"

#&#12497;&#12473;&#12398;&#21462;&#24471;:path&#12467;&#12510;&#12531;&#12489;
path(ExURL)
[1] "category/analyticsr"

#&#12509;&#12540;&#12488;&#30058;&#21495;&#12434;&#21462;&#24471;:port&#12467;&#12510;&#12531;&#12489;
ExPortURL <- "https://karada-good.net:80"
port(ExPortURL)
[1] "80"
#&#22793;&#26356;
port(ExPortURL) <- "36"
#&#30906;&#35469;
ExPortURL
[1] "https://karada-good.net:36"

#&#12473;&#12461;&#12540;&#12512;&#12398;&#21462;&#24471;:scheme&#12467;&#12510;&#12531;&#12489;
scheme(ExURL)
[1] "https"
#&#22793;&#26356;
scheme(ExURL) <- "ftp"
#&#30906;&#35469;
ExURL
[1] "ftp://karada-good.net/category/analyticsr?KARADA=KIJI#KARADAGOOD"

#URL&#27083;&#36896;&#12434;&#21462;&#24471;:url_parse&#12467;&#12510;&#12531;&#12489;
url_parse(ExURL)
scheme          domain port                path   parameter   fragment
1    ftp karada-good.net &lt;NA&gt; category/analyticsr KARADA=KIJI KARADAGOOD

少しでも、あなたの解析が楽になりますように!!

タイトルとURLをコピーしました