開発者に寄り添うとか自分で言っておいて忘れてる鳥頭企業が作った twitter-text とかいうライブラリの正規表現が遅いから、自分で解析コード書いたのでライブラリ化しました的なライブラリです。
Extractor と Validator のみを実装しました。他は使い道ないでしょ、ということで。
動作については、 twitter-text の Java 実装に準拠し、ほぼ同等の解析結果を出力することができます。
- とにかく速い(あんまり他のと比較できてないから誰かベンチマークコード書いてください)
- PCLだけどちゃんと Unicode 正規化もします(
String.Normalizeより高速な実装を用意しました)
前身の Azyobuzi.TwitterUrlExtractor では正規表現より 108 倍速く URL を検出することができました。 いくらか変更を加えているのでこの通りではないと思いますが、びっくりするくらい速いです。保証します。
URL 検出以外のベンチマークをする元気が今のところ起こっていないため、正確な数値を出していません。誰かやってください。お願いします。
NuGet から落としてください。
- ベンチマークする
- Java 版を作る
Unicode 正規化の実装で頑張りすぎて燃え尽きてしまったので、しばらくはやる気でないと思います。皆様のプルリクエストをお待ちしております。