2007-07-14から1日間の記事一覧

CPANモジュールText::Similarity

http://search.cpan.org/~jasonm/2つのテキストファイルの類似度スコアを計算する。ソースをざっと読んでみた。 Overlaps.pmのgetSimilarity()でsanitizeString()を実行。Similarity.pmのsanitizeString()は英語前提(約物の除去、大文字小文字変換、引用符…