Rで解析:英単語・テキストのスペルチェックに便利です「hunspell」パッケージ


英単語・テキストのスペルチェックに便利なパッケージの紹介です。「hunspell_find」コマンドで検出されたスペルミスは「hunspell_suggest」コマンドを利用することで、単語の候補が表示されます。

なお、パッケージインストール時にsourcesを選択するとインストールエラーが出る場合があります。その場合はbinaryを選択してください。

パッケージバージョンは0.1.0。実行コマンドはwindows 7およびOS X 10.11.2のR version 3.2.3で確認しています。


パッケージのインストール

下記、コマンドを実行してください。

#パッケージのインストール
install.packages("hunspell")

実行コマンド

詳細はコメント、パッケージのヘルプを確認してください。

#パッケージの読み込み
library("hunspell")

#単語のスペルチェック:hunspell_checkコマンド
Word <- c("beer", "wiskey", "wine", "jopan") print(hunspell_check(Word)) [1] TRUE FALSE TRUE FALSE #テキストのスペルチェック:hunspell_findコマンド Text <- hunspell_find("NISE to maet you") print(Text) [1] "NISE" "maet" #hunspell_findコマンドの結果から単語候補を表示:hunspell_suggestコマンド hunspell_suggest(Text) [[1]] [1] "NICHE" "SINE" "NOSE" "NISEI" "ANISE" "NOISE" "NINE" "RISE" "NICE" "VISE" "WISE" [12] "OISE" "LISE" "NISSE" [[2]] [1] "meat" "mate" "mart" "mat" "met" "meta" "meet" "mast" "malt" "ma et" [11] "ma-et" "Manet" "Mae" "Marget" "market" [/code]


少しでも、あなたのウェブや実験の解析が楽になりますように!!

スポンサードリンク

スポンサードリンク