从零开始,循序渐进
本教程分为四部分:5 分钟上手带你生成第一张图;常用功能讲清提示词、参考图、模型选择和批量出图;进阶玩法覆盖图片持久化、图像理解、推理测试与 API 对接;最后是常见问题。按顺序读,或从下方目录直接跳转。
第一部分 · 5 分钟上手 新手必读
AI图片大师是一个纯前端的 AI 出图工具:所有数据(API Key、生成历史)都保存在你自己的浏览器里,不经过任何中间服务器。开始出图只需要一把 API Key。
获取 API Key
本工具通过 API易 平台调用各家模型,先去拿一把令牌:
- 打开 API易后台 - 令牌页面(没有账号先注册);
- 点击创建令牌,填写令牌名称(如:按量优先出图);
- 计费模式务必选择 「按量优先」;
- 创建后复制生成的 API Key(
sk-开头)。
在应用里配置
回到主页,点击右上角设置打开设置弹窗,在API令牌标签页粘贴你的 Key,点保存。导航栏的 API 状态变为已配置,就绪。
生成第一张图
停在默认的生成图片页即可:
- 在提示词框输入描述,例如:「一只橘猫趴在窗台上晒太阳,午后暖光,摄影风格」;
- 顶部导航栏的模型下拉框保持默认即可(新手推荐 Flux 2 Pro:出图快、效果稳、价格低);
- 选一个图片比例(默认 1:1 即可);
- 点击生成按钮,右侧会实时显示进度,几秒到一分钟后出图;
- 鼠标移到图片上即可下载保存。
找回你生成过的图
每次成功生成都会自动存入历史记录页(提示词、模型、参数、费用一并记录),刷新页面不会丢。
第二部分 · 常用功能 日常使用
能出图之后,这一部分帮你把图出得更好、更快、更省。
提示词怎么写
一条好提示词通常包含四要素:主体(画什么)+ 风格(摄影/插画/3D 渲染…)+ 光线氛围(暖光/霓虹/逆光…)+ 构图细节(特写/全景/俯拍…)。中英文均可,建议 50–200 字。提示词框右上角有三个帮手:
- 模板:打开提示词模板库,8 大分类(热门、电商、漫剧、娱乐、游戏、摄影、艺术插画、海报设计)各 12 个模板,点击即填入,可在此基础上修改;
- 优化:让 AI 帮你把简短描述扩写成专业提示词。注意每次优化会调用一次 API(产生少量费用);
- 全屏:展开全屏编辑器,写长提示词更舒服。
参考图改图(图生图)
在生成页上传参考图后,提示词就变成了「修改指令」:换背景、改风格、多图融合都靠它。三种上传方式:点击上传区选文件、直接拖拽进来、截图后在页面上 Ctrl/Cmd+V 粘贴。支持 JPG/PNG/WebP。
不同模型支持的参考图张数不同(界面会实时提示):Flux 2 系列最多 8 张融合,Nano Banana 系列、GPT Image 2 系列最多 12 张。
模型怎么选
模型下拉框里每个模型都标注了出图时间和单价,以界面实时标注为准。按需求速查:
| 需求 | 推荐模型 | 理由 |
|---|---|---|
| 新手起步 / 性价比 | Flux 2 Pro、Nano Banana 2 | 速度快、价格低、质量稳定,日常够用 |
| 极速试错 | Flux 2 Klein 9B | 秒级出图、单价最低,适合快速验证构图想法 |
| 追求质量 / 高分辨率 | Flux 2 Max、Nano Banana Pro | 细节更好,Nano Banana Pro 支持 4K |
| 图里要写字(海报/标语) | GPT Image 2 All、GPT Image 1.5 | 文字还原度高,GPT Image 1.5 还支持透明背景 |
| 超清生图编辑 | SeeDream 5.0 / 4.5 | 15 秒出图,支持 2K/3K/4K 分辨率 |
尺寸 · 分辨率 · 质量 · 输出格式
- 图片尺寸(比例):1:1、2:3、3:2 等,所有模型都有,选项因模型而异;
- 分辨率:部分模型可选 1K/2K/4K 档位,越高越清晰,部分模型价格随之变化;
- 质量 / 输出格式:个别模型支持质量档位(自动/低/中/高)和 PNG/JPEG/WebP 输出选择;
- 选了模型后界面只会显示该模型支持的选项,不用死记。
批量生成:抽卡 & 多提示词
切到批量生成页,有两种模式:
- 🎰 抽卡模式(推荐):同一条提示词一次生成 2–10 张(滑块调节),从中挑最满意的——AI 出图有随机性,「多抽几张」往往比反复改提示词更高效;
- 📋 多提示词模式:在输入框写多条提示词,用空行分隔,每条各生成一张,适合批量产出不同内容。
两种模式都会在生成前显示预估费用(单价 × 张数)并弹窗确认,不会悄悄扣费。
模型对比
拿不准用哪个模型?模型对比页可以选两个模型,用同一条提示词(和相同参考图)同时生成,结果左右并排展示,各自的耗时一目了然。选型一次,之后日常就固定用胜出的那个。
第三部分 · 进阶玩法 高阶用户
把工具用到极致:数据持久化、视觉分析、推理测试和 API 集成。
历史记录持久化(强烈推荐配置)
生成的图片有三层保存方式,可叠加使用:
- 浏览器本地(默认):历史元数据存 localStorage,图片缓存存 IndexedDB。清空浏览器数据会丢失,换设备不互通;
- 本地存储目录(推荐,仅 Chrome/Edge):打开设置 → 存储标签页,在「本地存储目录」点选择目录授权一个本地文件夹,再打开生成后自动保存到此目录开关——之后每张新图自动落盘到硬盘,清缓存也不丢。若提示「目录授权已失效」,点重新授权即可;
- 自定义云端存储:同在存储标签页,通过「云端存储配置」入口可接入自己的 Cloudflare R2 或阿里云 OSS。默认公共云端图片 30 天过期,自定义存储则无过期限制,生命周期完全由你管理。
识别图片(图像理解)
识别图片页是反向操作:上传图片让 AI「看图说话」。支持多图联合分析(对比多张图)。页面提供一排角色标签,点击即可快速应用对应的专业提示词,也可选自定义自己写问题,然后点开始分析。典型用法:为图片生成描述文案、提取图中文字、分析设计稿、反推一张参考图的提示词再去生成同款。
推理测试(面向开发者)
推理测试页是一个三平台推理模型试验场,同一把 API Key 即可测试:
- Anthropic · Claude:Opus 4.8 / Opus 4.7 / Sonnet 4.6;
- OpenAI · GPT:GPT-5.5 / GPT-5.4;
- Google · Gemini:Gemini 3.1 Pro / Gemini 3.5 Flash。
每个模型可切换推理档位(如低/中/高/超高),档位越高思考越深、耗时和费用越高。结果区会展示思考摘要、最终回答,以及完整的请求体和原始响应 JSON——调试自己的 API 集成时非常好用。
对接代码:把能力搬进你自己的程序
生成页底部有一个默认收起的对接代码 (cURL)面板,展开后实时显示「当前所选模型 + 参数」对应的 API 请求代码,一键复制就能在终端或自己的程序里直接调用——在界面上调好参数,再原样搬走,是最快的 API 上手路径。
实用细节
- 提示词优化模型:设置 → 提示词优化标签页可自定义「优化」按钮背后的模型,留空用默认轻量模型;
- 多语言:导航栏语言菜单支持简体中文 / 繁體中文 / English / Русский;
- 安装为应用:支持 PWA,Chrome/Edge 地址栏的安装图标可把它装成桌面应用;
- 版本更新:发现新版本时会弹窗提示,点「立即更新」只刷新代码,不会清除你的 API Key 和历史记录;页脚也有刷新缓存入口和更新日志。
第四部分 · 常见问题
生成失败了怎么办?
按顺序排查:① 看界面给出的错误提示;② 确认 API Key 已正确保存且是「按量优先」类型;③ 去 API易后台确认账户余额充足(余额不足是最常见原因);④ 个别模型偶发繁忙,换个模型或稍后重试。
我的 API Key 安全吗?
安全。这是纯前端应用,Key 加密后只存在你浏览器的本地存储里,所有 API 请求从你的浏览器直接发出,不经过本站任何服务器。不过请不要在公用电脑上保存 Key,离开前可在设置中清除。
历史记录里的图片显示过期 / 加载失败?
默认云端图片保留 30 天,超期链接失效属正常现象(历史记录的提示词等元数据仍在)。一劳永逸的办法:在设置 → 存储里配置「本地存储目录」自动落盘,或接入自己的 R2 / OSS(无过期限制)。
清空浏览器缓存会丢什么?
会丢:API Key、历史记录元数据(localStorage)和图片缓存(IndexedDB)。不会丢:已自动保存到本地存储目录的图片文件、你自己云存储里的图片。应用内的「立即更新」「刷新缓存」是安全的,不会清除这些数据。
换电脑 / 换浏览器后数据能同步吗?
不能自动同步——数据都在本地浏览器里。新环境需重新填 API Key;图片可通过「本地存储目录」或自定义云存储自行中转。
价格到底怎么算?
大多数模型按张计费(每张零点零几美元量级),少数(GPT Image 2 / 1.5)按 token 计费、随分辨率和质量浮动。以模型下拉框里的实时标注为准;批量生成前都会弹出预估费用确认;实际消费明细可在 API易后台日志中逐条查询。