主流AI绘画工具

  • Stable Diffusion

  • MidJourney

  • Waifu Diffusion

  • PicUP.AI

  • 其他

    Stable Diffusion

    简称“ SD ”,Stable Diffusion 是一种基于潜在扩散模型的 AI 模型,它可以生成图像,也可以通过文本提示修改现有图像,类似于 MidJourney 或 DALL-E 2。它最初是由 Stability.ai 在 2022 年 8 月发布的。它可以理解数千个不同的单词,并且可以用几乎任何风格创建几乎任何形象.

    Stable Diffusion 是一种深度生成神经网络,其代码和模型权重已公开发布,可以在大多数配备至少 8 GB VRAM 的消费级硬件上运行。

    MidJourney

    MidJourney 是一种基于 GAN 技术的 AI 绘画工具,它可以生成高质量的图像和艺术作品。它可以通过输入一些简单的文本提示,生成各种不同的图像,包括人物、动物、风景等。MidJourney 的特点是生成的图像非常逼真,可以与真实的照片媲美。

    Waifu Diffusion

    Waifu Diffusion 是一种基于 StyleGAN 技术的 AI 绘画工具,它可以生成各种不同的动漫风格的图像。它的特点是生成的图像非常逼真,可以与真实的动漫人物媲美。Waifu Diffusion 可以通过输入一些简单的文本提示,生成各种不同的动漫人物图像,包括男性、女性、萝莉等。

    PicUP.AI

    PicUP.AI 是一种基于 GAN 技术的 AI 绘画工具,它可以生成各种不同的图像和艺术作品。它可以通过输入一些简单的文本提示,生成各种不同的图像,包括人物、动物、风景等。PicUP.AI 的特点是生成的图像非常逼真,可以与真实的照片媲美。

    其他

    除了上述几种主流的 AI 绘画工具之外,还有许多其他的工具,如 DALL-E2、Artbreeder、GANbreeder 等。这些工具都是基于 GAN 或其他 AI 技术的,可以生成各种不同的图像和艺术作品。它们的特点是生成的图像非常逼真,可以与真实的照片媲美。

工具使用说明

Stable Diffusion

下载和安装

操作界面说明

Alt text

  • Stable Duffusion 模型(ckpt)
    大模型是数据训练出来的结果,决定了生成图片的美术风格以及它擅长的绘画面。资源可以在网上下载,根据自己的喜好挑选模型。
    对应本地资源存放目录 .../models/Stable-diffusion

  • 模型的 VAE(SD VAE)
    VAE 的主要作用是滤镜,决定了生成图像的色彩饱和度;虽然也有局部修正的作用,但作用效果不明显。有些大模型不用 VAE 直出的图像是灰色的,有些模型则不用,如果模型有配套的VAE,则推荐使用配套的。这部分建议多去尝试与组合,寻找自己的喜欢的风格色彩。
    对应本地资源存放目录 .../models/VAE

  • 提示词(Prompt)
    输入自己想要画面元素的关键词(tags),这里用英文输入,中文输入效果不理想。
    () 抬升权重 一个 () 权重 * 1.1,多个 (()) 大量抬升
    [] 降低权重 一个 [] 权重 / 1.1
    (tag:1.2) 赋予权重 权重 * 1.2,还可以(sliver,pink:0.9)表示银色和粉色的比例是 9:1 ,这样可以表现为银色头发的发梢是粉色的
    [tagA:tagB:step] 分布描绘 到达指定步数前执行 tagA ,到达后,执行 tagB 。Step>1 时,表示步数;Step<1 时,表示占比
    tagA|tagB 融合描绘 例如 (whrite hair|blue hair)表示白色头发与蓝色头发的发色融合

  • 反向提示词(Negative prompt)
    输入自己不想要的画面元素关键词

  • 采样迭代步数(Steps)
    字面意思,理论上迭代次数越多效果越好

  • 采样方法(Sampler)
    不同采样方法出图的速度和效果不同,一般倾向于用 Euler a DPM++ 2M Karras DPM++SDE Karras 这三种,其他方法可自行尝试。

  • 面部修复
    推荐勾选,可以提升比较不错的面部效果出图率

  • 高清修复
    不推荐勾选,会影响出图效率。可以等出了自己满意的效果图后,再用自带的附加功能进行放大。

插件

  • Embedding (textual inversion)
    嵌入/文本反转,通俗理解:提示词打包,类似与提示词组的概念,可以使用别人已经打包好的tags,用于生成固定特征的人或事物。

  • Lora (Low-Rank Adaptation of Large Language Models)
    大语言模型的低阶适应,是微软的研究人员为了解决大语言模型微调而开发的一项技术。
    主要功能:对人物和物品的复刻。通过挂载lora,复刻图片上的指定细节特征,无论是动作还是画风。目前使用比较火热,最新的SD_WebUI已经内置。

  • Hypernetwork
    超网格,可以理解为低配版Lora,主要用来训练画风。

  • ControlNet
    是一种通过添加额外条件来控制扩散模型的神经网络结构,可以从线稿、姿态、深度、色彩等方面对参考图片进行预处理,从而更精确得到我们想要的图片特征。
    进阶教程
    Controlnet的安装与使用
    Controlnet+Lora 人设三视图

资源站点