使用 Invoke 创作你的第一张图片
Invoke 101 教程
范叶亮 / 2025-06-01
分类: Tech101, AI, 计算机视觉 / 标签: Invoke, 图片生成, SD, Stable Diffusion, SD1.X, SDXL, Flux, Juggernaut XL / 字数: 1781
本节将展示如何使用 Invoke 创作你的第一张图片。
安装 Invoke
从 Invoke 官网下载对应系统的安装包,根据如下步骤完成安装。
- 运行 Invoke 社区版本,单击 开始安装。
- 选择安装位置,单击 进行下一步。
- 选择安装版本,单击 进行下一步。
- 确认 GPU 情况,单击 进行下一步。
- 确认安装选项,单击 开始安装。
- 安装完成,单击 关闭安装向导。
- 安装完成后,单击 启动 Invoke。
用户界面
Invoke 启动后会打开主界面,从启动器的日志不难看出,Invoke 在后台启动了一个 HTTP 服务,用浏览器打开 http://127.0.0.1:9090
可以得到相同的界面:
主界面包含三个区域,分别是:
- 左侧:用于输入提示词、模型选择和参数设置等。
- 中间:用于显示生成的图片。
- 右侧:用于显示生成图片的所需的图层和历史生成的图片等。
左侧
提示词

提示词区域用于输入生成图片提示词。
- 在下拉菜单中可以选择预设的提示词模板。
- 在
Prompt
中输入正向提示词,在Negative Prompt
中输入负向提示词。 - 也可以将自定义的提示词添加为模板以方便后续使用。
图像

图像区域用于控制生成图片的比例和大小。
Aspect
用于设置生成图片的宽高比,Width
和Height
用于设置生成图片的宽高。Seed
用于设置生成图片的随机数种子,设置相同的随机数种子将在相同的条件下得到一致的图片,这在微调的时候会派上用场。
生成

中间

中间区域用于查看和调整生成的图片。在后续教程中将会深度介绍如何使用该区域来优化生成的图片。
在上方选项卡中单击 Canvas
可以打开画布,单击 Image Viewer
可打开图片浏览器。
右侧
图板和图片库

图板用于组织和管理用户生成的图像,它提供了一种结构化的方式来高效地分类和访问这些图像。
在图片库中,你可以将图片拖拽到画布中来使用。此外,你还可以在图库中共享、下载和删除图片。
图层

图层区域显示了工作区中用于修改图像的所有活动图层。单击右上角的 +
图标即可添加新图层。你可以创建多个图层并对其进行操作和变换,在生成图像之前进行组合使用。
模型
单击左侧面板的 图标打开模型页面。针对新手用户 Invoke 提供了新手模型包,单击 Starter Models
选项卡,可以看到系统提供了 Stable Diffusion 1.5
、SDXL
和 FLUX
三款模型包。根据官方系统环境要求和自己的设备性能选择合适的模型包。
- GPU:Nvidia 10xx 或更新,4GB+ 显存
- 内存:至少 8GB
- 磁盘:至少 30GB
- GPU:Nvidia 20xx 或更新,8GB+ 显存
- 内存:至少 18GB
- 磁盘:至少 100GB
- GPU:Nvidia 20xx 或更新,10GB+ 显存
- 内存:至少 32GB
- 磁盘:至少 200GB
在下载模型前,需在 HuggingFace 的设置页面创建 Token,并将其保存在 Invoke 模型页面的 HuggingFace 选项卡中。本教程选择 SDXL
作为模型包,单击模型包启动下载。模型下载完毕后可以在 Model Manager
中查看已下载的模型。
创作图片
在提示词模板中选择 Environment Art
,在 Prompt
中输入如下提示词:
futuristic urban park, neon lighting, raised highways, green spaces, modern architecture
单击模板中的 按钮会开启应用模板后的提示词预览,如下图所示:

可以看到,提示词模板在用户输入的提示词基础上添加了更多的正向和负向提示词。在 Generation
中选择 Juggernaut XL v9
作为生成模型。
在左上角 中输入生成图片的数量,单击 开始生成图片。单击左侧面板的 图标打开队列页面,等待中、执行中和已完成的所有任务都将显示在该页面中:
生成的 3 张图片如下所示:



中文测试
为了验证 Juggernaut XL v9
模型对于中文提示词的兼容性,对上述示例和 Environment Art
提示词模板中的提示词整理中英文对照版本如下:
提示词 | 英文 | 中文 |
---|---|---|
用户 - 正向 | futuristic urban park, neon lighting, raised highways, green spaces, modern architecture | 未来城市公园, 霓虹灯, 高架公路, 绿色空间, 现代建筑 |
模板 - 正向 | environment artwork, hyper-realistic digital painting style with cinematic composition, atmospheric, depth and detail, voluminous. textured dry brush 2d media | 环境艺术作品, 具有电影构图的超现实数字绘画风格, 大气, 深度和细节, 丰满, 纹理干笔画 2D 媒体 |
模板 - 负向 | photo, distorted, blurry, out of focus. sketch. | 照片, 扭曲, 模糊, 失焦, 草图 |
用户的正向提示词使用中文,选择 Environment Art
提示词模板(即提示词模板使用英文),生成的图片如下:



用户的正向提示词使用中文,不选择提示词模板,将 Environment Art
提示词模板的中文提示词补充到用户的正向和负向提示词后,生成的图片如下:



不难看出虽然图片生成的画质不错,但其并未遵循提示词的指令生成(看起来是将中文提示词作为了画风),因此可以判断 Juggernaut XL v9
模型不具备直接使用中文提示词的能力。