Skip to content

ji6czd/ImageDescriber

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Gemini Image Describer

Web上の画像を右クリックして、Google Gemini APIで日本語で詳しく説明を生成するChrome拡張機能です。

ずっと作ろうと思っていたのですが、勢いで作ってみました。とにかく「議論するより見せる」の精神ということでしょうか。

機能

  • 画像を右クリックして「Geminiで画像を説明する」を選択
  • Gemini AI (gemini-2.5-flash) が画像を解析して日本語で詳細な説明を生成
  • 解析結果をポップアップウィンドウに表示
  • 結果をクリップボードにコピー可能
  • キーボードショートカット対応(ESCキーで閉じる)

セットアップ

1. Google AI Studio APIキーの取得

  1. Google AI Studio にアクセス
  2. APIキーを作成
  3. APIキーをコピー

2. Chrome拡張機能のインストール

  1. Chrome で chrome://extensions/ を開く
  2. 右上の「デベロッパーモード」を有効化
  3. 「パッケージ化されていない拡張機能を読み込む」をクリック
  4. このプロジェクトのフォルダを選択

3. APIキーの設定

  1. 拡張機能のアイコンを右クリック → 「オプション」を選択
  2. APIキーを入力して「保存」ボタンをクリック
  3. 音声で「保存しました」と読み上げられ、2秒後に自動的にページが閉じます

使い方

  1. Webページ上の任意の画像を右クリック
  2. 「Geminiで画像を説明する」を選択
  3. ポップアップウィンドウが開き、解析結果が表示されます
  4. 「クリップボードにコピー」ボタンで結果をコピー可能
  5. ESCキーまたは「閉じる」ボタンでウィンドウを閉じます

ファイル構成

image_describer/
├── manifest.json       # 拡張機能の設定ファイル
├── background.js       # バックグラウンドスクリプト(画像解析処理)
├── options.html        # オプション設定画面
├── options.js          # オプション設定のロジック
├── result.html         # 解析結果表示画面
├── result.js           # 解析結果表示のロジック
└── README.md          # このファイル

技術仕様

  • Manifest Version: 3
  • 使用API: Google Gemini API (gemini-2.5-flash)
  • 権限:
    • contextMenus: 右クリックメニューの追加
    • storage: APIキーと解析結果の保存
    • scripting: スクリプトの実行
    • activeTab: アクティブタブへのアクセス
    • <all_urls>: 画像の取得

注意事項

  • APIキーは安全に保管してください
  • Gemini APIの利用制限や料金体系を確認してください
  • 一部の画像(CORS制限のあるもの等)は解析できない場合があります

バージョン

1.0.11 - 現在のバージョン

今後

結果に対して続けて質問ができるようにすることをまず目指します。

最後に

このプロジェクトは、例によってその殆どを生成AIで作成しました。可能な限りレビューはしましたが、なにしろ作者はこれが最初のChrome拡張のリリースです!いろいろツッコミどころ満載だと思いますので、妙なところはぜひご連絡いただけるととっても嬉しいです!

このプロジェクトは個人利用・実験目的で作成されています。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors