Windowsで開発したローカル実行ツールです。スキャンPDF(低解像度・背景ノイズ・傾き等)を「読みやすく」整え、必要に応じてOCR(検索・選択)も付与します。
※まだ発展途上のため、UI/挙動/依存関係は今後変更される可能性があります。
- 画質改善が主目的(二値化 / 傾き補正 / SR(超解像) など)
- 低解像度PDFも対象(小さい文字の可読性改善を狙う)
- OCRは第二のメリット(透明テキストを埋め込み、検索・選択・コピーを可能に)
- GUIが縦に長くなっても操作できるよう スクロール対応
- 依存が重い機能は 遅延import(起動時に落ちにくくする工夫)
- Windows 10/11 推奨(開発・検証はWindows中心)
- Python 3.x
- 依存関係:画像処理 / OCR / SR(超解像)系ライブラリを利用するため、環境構築がやや面倒です
※CPU/GPU(torch)や numpy バージョン差などで導入が難しい場合があります。
- このリポジトリ(またはReleaseのzip)を入手して展開
- 依存をインストール(下記参照)
- 起動
python run_app.py
基本は仮想環境の利用を推奨します。
PowerShell:
python -m venv .venv
.\.venv\Scripts\activate
python -m pip install -U pip
pip install -r requirements.txt
注意:
- SR(超解像)やOCRを使う場合、追加の依存やモデル取得が発生します。
- 環境によっては
torch(CPU/GPU)やnumpyの組み合わせで導入が難しいことがあります。- 初回起動時にモデル等のダウンロードが走る場合があります(ネットワーク環境が必要)。
- 処理設定:画質改善の各種パラメータ(主役)
- プレビュー:調整結果の確認(「テスト」ではなくプレビューです)
- ログ・診断:問題切り分け用のログ表示や診断
- 入力PDFと同じフォルダ(推奨)
入力PDFと同じフォルダに出力します。
※書き込み権限がない場合は、安全のため outputフォルダへ自動でフォールバックし、ログに警告が出ます。 - アプリ内(outputフォルダ)
アプリフォルダ内のoutputに出力します。 - 指定フォルダ
任意のフォルダを指定して出力します。
- 本ツールは ローカルで処理する想定です(入力PDFを勝手に外部送信する設計にはしていません)。
ただし、OCR/SRのモデル取得などで 初回にネットワークアクセスが必要になる場合があります。 - スキャンPDFには著作物・個人情報が含まれる可能性があります。取り扱いに注意してください。
- まだ完成度は高くありません。PDFの種類や環境により、うまく動作しないことがあります。
- まず ログ・診断 を開いて、警告や例外メッセージを確認してください。
- 出力先が期待と違う場合:
- 「入力PDFと同じフォルダ(推奨)」を選んでも、書き込み不可だと自動でフォールバックします(ログに出ます)。
- SR/OCRが動かない場合:
- 依存関係(torch / numpy 等)やモデル取得の失敗が原因になりがちです。
MIT License(LICENSE を参照)
本ソフトウェアの利用により生じたいかなる損害についても、作者は責任を負いません。自己責任でご利用ください。