ToriatamaText

開発者に寄り添うとか自分で言っておいて忘れてる鳥頭企業が作った twitter-text とかいうライブラリの正規表現が遅いから、自分で解析コード書いたのでライブラリ化しました的なライブラリです。

twitter-text との互換性

Extractor と Validator のみを実装しました。他は使い道ないでしょ、ということで。

動作については、 twitter-text の Java 実装に準拠し、ほぼ同等の解析結果を出力することができます。

前身の Azyobuzi.TwitterUrlExtractor では正規表現より 108 倍速く URL を検出することができました。いくらか変更を加えているのでこの通りではないと思いますが、びっくりするくらい速いです。保証します。

URL 検出以外のベンチマークをする元気が今のところ起こっていないため、正確な数値を出していません。誰かやってください。お願いします。

NuGet から落としてください。

Unicode 正規化の実装で頑張りすぎて燃え尽きてしまったので、しばらくはやる気でないと思います。皆様のプルリクエストをお待ちしております。