Rで解析:英単語・テキストのスペルチェックに便利です「hunspell」パッケージ


英単語・テキストのスペルチェックに便利なパッケージの紹介です。「hunspell_find」コマンドで検出されたスペルミスは「hunspell_suggest」コマンドを利用することで、単語の候補が表示されます。

なお、パッケージインストール時にsourcesを選択するとインストールエラーが出る場合があります。その場合はbinaryを選択してください。

パッケージバージョンは0.1.0。実行コマンドはwindows 7およびOS X 10.11.2のR version 3.2.3で確認しています。


パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("hunspell")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("hunspell")

#単語のスペルチェック:hunspell_checkコマンド
Word <- c("beer", "wiskey", "wine", "jopan")
print(hunspell_check(Word))
[1]  TRUE FALSE  TRUE FALSE

#テキストのスペルチェック:hunspell_findコマンド
Text <- hunspell_find("NISE to maet you")
print(Text)
[1] "NISE" "maet"

#hunspell_findコマンドの結果から単語候補を表示:hunspell_suggestコマンド
hunspell_suggest(Text)
[[1]]
[1] "NICHE" "SINE"  "NOSE"  "NISEI" "ANISE" "NOISE" "NINE"  "RISE"  "NICE"  "VISE"  "WISE" 
[12] "OISE"  "LISE"  "NISSE"
[[2]]
[1] "meat"   "mate"   "mart"   "mat"    "met"    "meta"   "meet"   "mast"   "malt"   "ma et" 
[11] "ma-et"  "Manet"  "Mae"    "Marget" "market"

少しでも、あなたのウェブや実験の解析が楽になりますように!!

スポンサードリンク

おすすめコンテンツ


スポンサードリンク