AI 图片工具

一个基于 Next.js 15 和 React 19 构建的多供应商 AI 图片生成与编辑界面。项目当前内置 FAL、OpenAI、NewAPI、OpenRouter 与 Gemini 5 个渠道，提供批量上传、参数化生成、结果预览、历史存档等端到端能力，适合快速搭建内部图片生产或创意工具。

功能特性

多供应商支持：在同一界面切换 FAL、OpenAI、NewAPI、OpenRouter 与 Gemini，灵活配置鉴权信息。
双模式工作流：支持文本生图（txt2img）与图片驱动的编辑/增强（img2img），按需切换。
完整的生成参数：自定义提示词、尺寸、数量、随机种子、安全校验、同步策略，以及 FAL / OpenRouter / NewAPI 模型选择与能力适配。
便捷的图片上传体验：拖拽或点击上传，自动校验格式与大小，客户端压缩到最大边 2048 像素，最多保留 4 张图片。
结果与历史管理：最新结果即时预览、放大、下载，IndexedDB 自动保存最近 20 条历史记录，可清空或单独删除。
队列与进度反馈：内置任务队列限制并发生成次数，实时展示运行与排队状态。
本地安全存储：供应商密钥使用浏览器 crypto.subtle AES-GCM 加密后写入 localStorage，跨标签页自动同步。
诊断日志：所有关键请求会发送到 /api/log 记录服务端日志，便于排查错误。

技术栈

Next.js 15（App Router）与 React 19
TypeScript、Tailwind CSS 4、shadcn/ui 组件体系
Radix UI、Lucide 图标、react-hook-form、zod 校验
IndexedDB（浏览器端历史记录）、localStorage（加密供应商配置）
Vercel Analytics 与 API 路由

快速开始

环境要求

Node.js 18.18.0 以上（Next.js 15 官方要求）
pnpm 9 或兼容包管理器（仓库包含 pnpm-lock.yaml，推荐使用 pnpm）

安装依赖

pnpm install

如需使用 npm 或 yarn，请先删除 pnpm-lock.yaml 并重新生成锁定文件。

本地开发

pnpm dev

默认监听 http://localhost:3000。首次访问需在页面右上角打开“设置”对话框，填写并启用至少一个供应商的 API 信息。

生产构建与部署

pnpm build
pnpm start

构建产物位于 .next/。也可直接部署到 Vercel 或任何支持 Next.js 的平台，确保为无服务器函数启用外部网络访问，以便调用第三方模型服务。

供应商配置

所有配置均从页面右上角的“设置”对话框管理，并保存在本地浏览器：

FAL

API Key：FAL 平台生成的密钥。
模型：在生成表单中按 model_id 选择，不再手动配置队列端点。
调用方式：前端统一通过 @fal-ai/client 和 /api/fal/proxy 服务端代理访问 FAL。
启用：开启后即加入可选供应商列表。

OpenAI

API Key：OpenAI 账号的 API 密钥。
API 模式：支持 Images API 与 Responses API 两种模式，可按代理兼容性切换。
API 端点：默认支持 https://api.openai.com/v1/images/generations 与 https://api.openai.com/v1/responses，如需兼容代理可进行替换。
能力：支持文生图；在 Images API 下支持图片编辑，在 Responses API 下支持基于 image_generation 工具生成图片。
启用：勾选后可在生成表单中选择 OpenAI。

NewAPI

API Key 或 用户 Token：根据服务端要求填写，表单会同时支持 Authorization 与 New-Api-User 头。
API 端点：填写 NewAPI 服务的基础地址，例如 https://your-newapi-host；应用会自动拼接 /v1/images/generations 与 /v1/images/edits。
“获取模型列表”按钮会访问 {baseOrigin}/api/models，拉取渠道信息并通过通知提示数量。
当前已按 NewAPI 文档适配 OpenAI Images 兼容模型：gpt-image-1、dall-e-3、dall-e-2，同时兼容以 gemini 开头的图片模型。
其中 gpt-image-1 支持 background 与 moderation 参数；dall-e-3 仅支持文生图；OpenAI 兼容编辑模式建议使用单张方形 PNG 原图。
当所选模型为 Gemini 系时，可额外传入 thinking_level、media_resolution 与 aspect_ratio。

OpenRouter

API Key：OpenRouter 平台密钥。
API 端点：默认 https://openrouter.ai/api/v1，支持替换为兼容网关。
能力：当前按图片生成模型工作流调用 /chat/completions，默认模型为 google/gemini-2.5-flash-image。
“获取模型列表”按钮会读取 /models，并在生成表单中按模型 ID、名称与提供商信息搜索筛选。

Gemini

API Key：Google AI Studio / Gemini API 密钥。
API 端点：默认 https://generativelanguage.googleapis.com，通过服务端代理调用。
内置模型：当前预置 gemini-2.5-flash-image 与 gemini-3-pro-image-preview。
能力：支持图片生成；gemini-3-pro-image-preview 额外支持更高分辨率与思考等级参数。

存储与安全

所有供应商配置写入浏览器 localStorage，写入前使用 AES-GCM 加密并缓存密钥。
多标签页间会通过 storage 事件保持同步。
若需要重置，可在浏览器开发者工具中清除 ai-image-tool-providers 项。

使用指南

模式切换

“图片编辑”模式需要先上传图片，可选填提示词；系统会把图片数据转换为 Data URL 提交到供应商。
“文本生图”模式不需要图片，直接提供提示词即可。

上传与处理图片

拖拽或点击上传，支持 PNG/JPG/WEBP，单文件最大 10 MB。
客户端自动压缩至最大边 2048 像素，保证兼容性并减少上传体积。
可随时清空已选图片，缩略图角标显示顺序与尺寸。

生成参数

FAL 文生/图像编辑的 image_size 仅支持枚举值或 { width, height } 对象，不再接收任意字符串；推荐的枚举有 square、landscape_4_3（默认）、landscape_16_9、portrait_4_3、portrait_16_9，图片编辑模式额外提供“与原图相同”选项。如需自定义尺寸，可传入 {"width": 1280, "height": 720} 等 JSON 对象，宽高需为正整数。
支持设置输出数量、随机种子、安全校验开关、同步模式。
当供应商为 FAL、OpenRouter 或 NewAPI 时，可从可用模型列表中选择具体模型 ID。
Gemini 与部分 NewAPI Gemini 模型支持思考等级、分辨率与宽高比等额外参数。

结果与下载

最新任务的图片结果集中展示，可点击放大或一键下载。
未返回图片时，界面会提示相应状态或错误。

队列与历史记录

顶部状态栏实时展示排队与运行中的任务数量。
历史记录保存在 IndexedDB，只保留最近 20 条，可查看详情、清空或删除单条记录。

本地存储与日志

供应商配置：localStorage，键名 ai-image-tool-providers，内容加密。
历史记录：IndexedDB ai-image-tool 数据库的 history 表，按时间倒序读取。
日志上报：客户端通过 lib/logger.ts 调用 /api/log，服务端会写入控制台（info/warn/error）。

内置 API

GET /api/fal/models：代理调用 fal.ai 模型接口，按分类抓取并缓存 1 小时，可使用 ?category= 和 ?search= 查询。
GET/POST/PUT /api/fal/proxy：基于 @fal-ai/server-proxy 的官方代理路由，供 FAL SDK 调用。
POST /api/newapi/models：按填写的端点与密钥代理拉取 NewAPI 模型列表。
POST /api/newapi/generate：代理 NewAPI 文生图与图像编辑请求。
GET /api/openrouter/models：代理获取 OpenRouter 模型列表。
POST /api/openrouter/generate：代理 OpenRouter 图片生成请求。
POST /api/gemini/generate：代理 Gemini 图片生成请求。
POST /api/log：接收客户端日志并写入服务器 stdout，便于部署环境调试。

项目结构

app/                # Next.js App Router 页面与 API 路由
components/         # UI 组件、生成表单、历史记录、设置对话框等
hooks/              # 自定义 Hooks，如生成流程、供应商配置、任务队列
lib/                # API 客户端、队列、加密存储、IndexedDB 操作
public/             # 静态资源
styles/             # 全局样式与 Tailwind 定制

常见问题

生成卡住或无响应：检查供应商是否启用、密钥是否填写正确，以及浏览器控制台是否存在跨域或网络错误。
FAL 生成失败或无结果：检查 FAL API Key、所选 model_id 是否有效，以及图片输入是否符合该模型能力要求。
历史记录丢失：IndexedDB 升级或清理缓存会清空历史，请及时导出需要的图片。
NewAPI 拉取模型失败：确认端点返回 JSON 且包含 success 字段，必要时检查鉴权头是否符合服务端要求。
OpenRouter 无法返回图片：确认所选模型具备图像输出能力，并检查端点是否兼容 /chat/completions 图片返回格式。
Gemini 生成失败：检查 Gemini API Key、所选模型是否仍可用，以及部署环境是否允许服务端访问 Google Generative Language API。

许可

仓库未明确声明许可证，若需对外发布或商用，请先与仓库所有者确认。

Name		Name	Last commit message	Last commit date
Latest commit History 86 Commits
.vscode		.vscode
app		app
components		components
docs/superpowers/specs		docs/superpowers/specs
domains		domains
hooks		hooks
lib		lib
public		public
shared/lib		shared/lib
styles		styles
.DS_Store		.DS_Store
.gitignore		.gitignore
AGENTS.md		AGENTS.md
README.md		README.md
components.json		components.json
eslint.config.mjs		eslint.config.mjs
next.config.mjs		next.config.mjs
package.json		package.json
pnpm-lock.yaml		pnpm-lock.yaml
postcss.config.mjs		postcss.config.mjs
tsconfig.json		tsconfig.json
vercel.json		vercel.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI 图片工具

功能特性

技术栈

快速开始

环境要求

安装依赖

本地开发

生产构建与部署

供应商配置

FAL

OpenAI

NewAPI

OpenRouter

Gemini

存储与安全

使用指南

模式切换

上传与处理图片

生成参数

结果与下载

队列与历史记录

本地存储与日志

内置 API

项目结构

常见问题

许可

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AI 图片工具

功能特性

技术栈

快速开始

环境要求

安装依赖

本地开发

生产构建与部署

供应商配置

FAL

OpenAI

NewAPI

OpenRouter

Gemini

存储与安全

使用指南

模式切换

上传与处理图片

生成参数

结果与下载

队列与历史记录

本地存储与日志

内置 API

项目结构

常见问题

许可

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages