mixiの過去の日記を取得するスクリプトです。
mixiのAPIのレスポンス(JSON)をファイルに保存します。
mixiは日本がメインのサービスなので、日本語で作成しています。
Python3.6
2つの作業が必要です。
サービス管理の手順でサービスを追加する必要があります。
注意としては、リダイレクトURLに*http://localhost:9999/redirect*を設定する必要があります。
日記の一覧を右クリックでダウンロードし、htmlを特定のディレクトリ配下においてください。
必要様なスクリプトは以下のコマンドでダウンロードできます。
また、依存ライブラリをインストールする必要があります。
git clone https://github.com/pyohei/extract-mixi-diary.git
cd extract-mixi-diary
pip install -r requirements.txt # virtualenv上の実行がオススメAPIにアクセスするために、アクセストークンを取得する必要があります。
以下のコマンドを実行し、
python server.py -c `Consumer Key` -s `Consumer Secret`http://localhost:9999にアクセスすればアクセストークンを取得できます。
- 次のスクリプトで自動的にアクセストークンを取得するので、メモする必要はありません
- アクセストークンは期限が切れても自動で再取得します
以下のコマンドで実行し、-dで渡したディレクトリに日記の作成日でファイルが作成されます。
python main.py -o `上記で取得したHTMLを保存しているディレクトリ` -d `保存先ディレクトリ`- MIT