Skip to content

Latest commit

 

History

History
26 lines (18 loc) · 1.67 KB

File metadata and controls

26 lines (18 loc) · 1.67 KB

ToriatamaText

開発者に寄り添うとか自分で言っておいて忘れてる鳥頭企業が作った twitter-text とかいうライブラリの正規表現が遅いから、自分で解析コード書いたのでライブラリ化しました的なライブラリです。

twitter-text との互換性

ExtractorValidator のみを実装しました。他は使い道ないでしょ、ということで。

動作については、 twitter-text の Java 実装に準拠し、ほぼ同等の解析結果を出力することができます。

特徴

  • とにかく速い(あんまり他のと比較できてないから誰かベンチマークコード書いてください)
  • PCLだけどちゃんと Unicode 正規化もします(String.Normalizeより高速な実装を用意しました)

どのくらい速いの?

前身の Azyobuzi.TwitterUrlExtractor では正規表現より 108 倍速く URL を検出することができました。 いくらか変更を加えているのでこの通りではないと思いますが、びっくりするくらい速いです。保証します。

URL 検出以外のベンチマークをする元気が今のところ起こっていないため、正確な数値を出していません。誰かやってください。お願いします。

インストール

NuGet から落としてください。

今後の予定

  • ベンチマークする
  • Java 版を作る

Unicode 正規化の実装で頑張りすぎて燃え尽きてしまったので、しばらくはやる気でないと思います。皆様のプルリクエストをお待ちしております。