手中有刀,心里有佛

使用 Invoke 创作你的第一张图片

Invoke 101 教程


本节将展示如何使用 Invoke 创作你的第一张图片。

安装 Invoke

Invoke 官网下载对应系统的安装包,根据如下步骤完成安装。

  1. 运行 Invoke 社区版本,单击 开始安装。
  2. 选择安装位置,单击 进行下一步。
  3. 选择安装版本,单击 进行下一步。
  4. 确认 GPU 情况,单击 进行下一步。
  5. 确认安装选项,单击 开始安装。
  6. 安装完成,单击 关闭安装向导。
  7. 安装完成后,单击 启动 Invoke。

用户界面

Invoke 启动后会打开主界面,从启动器的日志不难看出,Invoke 在后台启动了一个 HTTP 服务,用浏览器打开 http://127.0.0.1:9090 可以得到相同的界面:

主界面包含三个区域,分别是:

  1. 左侧:用于输入提示词、模型选择和参数设置等。
  2. 中间:用于显示生成的图片。
  3. 右侧:用于显示生成图片的所需的图层和历史生成的图片等。

左侧

提示词

提示词
提示词

提示词区域用于输入生成图片提示词。

  1. 在下拉菜单中可以选择预设的提示词模板。
  2. Prompt 中输入正向提示词,在 Negative Prompt 中输入负向提示词。
  3. 也可以将自定义的提示词添加为模板以方便后续使用。

图像

图像
图像

图像区域用于控制生成图片的比例和大小。

  1. Aspect 用于设置生成图片的宽高比,WidthHeight 用于设置生成图片的宽高。
  2. Seed 用于设置生成图片的随机数种子,设置相同的随机数种子将在相同的条件下得到一致的图片,这在微调的时候会派上用场。

生成

生成
生成

生成区域用于设置模型和相关参数。

  1. Model 用于选择生成图片的模型。
  2. Concepts 用于选择进行微调的 LoRA 模型。
  3. 高级选项中可以设置图片生成使用的调度器(Scheduler)。调度器负责数据采样,包括采样的步骤数(Steps)和提示词相关性(CFG Scale)等。

中间

中间区域
中间区域

中间区域用于查看和调整生成的图片。在后续教程中将会深度介绍如何使用该区域来优化生成的图片。

在上方选项卡中单击 Canvas 可以打开画布,单击 Image Viewer 可打开图片浏览器。

右侧

图板和图片库

图板和图片库
图板和图片库

图板用于组织和管理用户生成的图像,它提供了一种结构化的方式来高效地分类和访问这些图像。

在图片库中,你可以将图片拖拽到画布中来使用。此外,你还可以在图库中共享、下载和删除图片。

图层

图层
图层

图层区域显示了工作区中用于修改图像的所有活动图层。单击右上角的 + 图标即可添加新图层。你可以创建多个图层并对其进行操作和变换,在生成图像之前进行组合使用。

模型

单击左侧面板的 图标打开模型页面。针对新手用户 Invoke 提供了新手模型包,单击 Starter Models 选项卡,可以看到系统提供了 Stable Diffusion 1.5SDXLFLUX 三款模型包。根据官方系统环境要求和自己的设备性能选择合适的模型包。

  • GPU:Nvidia 10xx 或更新,4GB+ 显存
  • 内存:至少 8GB
  • 磁盘:至少 30GB
  • GPU:Nvidia 20xx 或更新,8GB+ 显存
  • 内存:至少 18GB
  • 磁盘:至少 100GB
  • GPU:Nvidia 20xx 或更新,10GB+ 显存
  • 内存:至少 32GB
  • 磁盘:至少 200GB

在下载模型前,需在 HuggingFace 的设置页面创建 Token,并将其保存在 Invoke 模型页面的 HuggingFace 选项卡中。本教程选择 SDXL 作为模型包,单击模型包启动下载。模型下载完毕后可以在 Model Manager 中查看已下载的模型。

模型

创作图片

在提示词模板中选择 Environment Art,在 Prompt 中输入如下提示词:

futuristic urban park, neon lighting, raised highways, green spaces, modern architecture

单击模板中的 按钮会开启应用模板后的提示词预览,如下图所示:

模板提示词预览
模板提示词预览

可以看到,提示词模板在用户输入的提示词基础上添加了更多的正向和负向提示词。在 Generation 中选择 Juggernaut XL v9 作为生成模型。

在左上角 中输入生成图片的数量,单击 开始生成图片。单击左侧面板的 图标打开队列页面,等待中、执行中和已完成的所有任务都将显示在该页面中:

队列

生成的 3 张图片如下所示:

第 1 张
第 1 张
第 2 张
第 2 张
第 3 张
第 3 张

中文测试

为了验证 Juggernaut XL v9 模型对于中文提示词的兼容性,对上述示例和 Environment Art 提示词模板中的提示词整理中英文对照版本如下:

提示词 英文 中文
用户 - 正向 futuristic urban park, neon lighting, raised highways, green spaces, modern architecture 未来城市公园, 霓虹灯, 高架公路, 绿色空间, 现代建筑
模板 - 正向 environment artwork, hyper-realistic digital painting style with cinematic composition, atmospheric, depth and detail, voluminous. textured dry brush 2d media 环境艺术作品, 具有电影构图的超现实数字绘画风格, 大气, 深度和细节, 丰满, 纹理干笔画 2D 媒体
模板 - 负向 photo, distorted, blurry, out of focus. sketch. 照片, 扭曲, 模糊, 失焦, 草图

用户的正向提示词使用中文,选择 Environment Art 提示词模板(即提示词模板使用英文),生成的图片如下:

第 1 张
第 1 张
第 2 张
第 2 张
第 3 张
第 3 张

用户的正向提示词使用中文,不选择提示词模板,将 Environment Art 提示词模板的中文提示词补充到用户的正向和负向提示词后,生成的图片如下:

第 1 张
第 1 张
第 2 张
第 2 张
第 3 张
第 3 张

不难看出虽然图片生成的画质不错,但其并未遵循提示词的指令生成(看起来是将中文提示词作为了画风),因此可以判断 Juggernaut XL v9 模型不具备直接使用中文提示词的能力。