AI绘画突然爆火？快速体验二次元画师NovelAI(diffusion)

NovelAI是基于人工智能的绘画创作辅助工具，这次其商业模型疑似流出，体验一下AI创作的乐趣！

Mr.Winter`

55713人浏览 · 2022-10-24 06:00:00

Mr.Winter` · 2022-10-24 06:00:00 发布

0 写在前面

机器学习强基计划聚焦深度和广度，加深对机器学习模型的理解与应用。“深”在详细推导算法模型背后的数学原理；“广”在分析多个机器学习模型：决策树、支持向量机、贝叶斯与马尔科夫决策、强化学习等。

🚀详情：机器学习强基计划(附几十种经典模型源码合集)

话不多说，先看看AI绘画的效果

在这里插入图片描述
接下来带大家体验一下二次元画师novelAI。最新进展——AI绘画进军三次元，有人用它打造赛博女友？(diffusion)

1 diffusion vs GAN

所谓扩散算法diffusion是指先将一幅画面逐步加入噪点，一直到整个画面都变成白噪声。记录这个过程，然后逆转过来给AI学习。

AI看到的是什么？一个全是噪点的画面如何一点点变清晰直到变成一幅画，AI通过学习这个逐步去噪点的过程来学会作画。

diffusion和之前大火的GAN模型相比，有什么优势呢？用OpenAI的一篇论文内容来讲，用diffusion生成的图像质量明显优于GAN模型；而且与GAN不同，diffusion不用在鞍点问题上纠结——涉及稳定性问题，只需要去最小化一个标准的凸交叉熵损失即可，这样就大大简化了模型训练过程中，数据处理的难度。

总结来说，目前的训练技术让diffusion直接跨越了GAN领域调模型的阶段，而是直接可以用来做下游任务，是一个新的数学范式在图像领域应用的实例。

2 NovelAI

NovelAI是基于人工智能的绘画创作辅助工具，单纯训练就使用了数千个网站的数十亿张图片。NovelAI是一个商业化的网站，绘画是需要付费的，然而这次其商业模型疑似流出，不管是小白还是画师都能体验一次AI创作的乐趣。这次流出的模型是stable-diffusion-webui，也就是第一节介绍的扩散算法。

在这里插入图片描述

3 AI绘画环境搭建

主要分为以下步骤：

创建Python3.10的虚拟环境
```
conda create -n ai_draw python=3.10
```
虚拟环境相关操作请参考：Anaconda安装与Python虚拟环境配置保姆级图文教程(附速查字典)
在虚拟环境中安装Pytorch
这步比较涉及显卡相关的配置，比较复杂，请参考：最新CUDA/cuDNN与Pytorch保姆级图文安装教程(速查字典版)

下载模型stable-diffusion-webui

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

安装依赖库
首先进入虚拟环境
```
conda activate ai_draw
```
接着进入stable-diffusion-webui根目录运行
```
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt
```
采用清华源可以更快完成安装
下载模型和权重文件
模型文件model.cpkt：model.cpkt，权重文件GFPGANv1.4.pth：GFPGANv1.4.pth，模型文件移动到这个目录stable-diffusion-webui-master\models\Stable-diffusion，权重文件留在根目录即可，最后的文件组织如图所示
根目录运行启动文件
```
python launch.py
```
期间会下载一些新的依赖，有可能超时报错，多启动几次即可

4 体验AI创作

通过第三节的配置，成功后即可在终端看到

在这里插入图片描述
开放了一个本地端口，在浏览器中输入即可

在这里插入图片描述
接下来测试最简单的文本生成图像功能：

输入正面标签：

NSFW,anime fine details portrait of a white haired girl ,black eyes,wearing hoodie on the city street background, close-up view, anime masterpiece，4k, sharp high quality anime, artstation Prhololive, uruha_rushia, 1girl, bangs, bare shoulders, red eyes, blue dress, blue green hair,blue sleeves, blush, bow, breasts, chick, collarbone, detached collar, detached sleeves, double bun, eyebrows visible through hair,frills, hair orhament, medium hair, off-shoulder dress 1girl looking_at_viewer upper_body, too many flowers,kyoto animation, bishojo, bare_shoulders black sleeves yellow_eyes emeraldblue_hair, sailor_collar and neckerchief, detached_sleeves frilled_shirt_collar frills grey_shirt headset heart long_hairsleeveless shirt twintails verv long hair wide sleeves highres 2girl, two bishojo snuggled up selfie, with white marble glowing skin and perfect symmetrical pretty face with blush cheeks and glaring eyes wearing a school uniform,golden hour lighting, strong rim light, intense shadowse , Ernst Thoms

输入反面标签：

lowres, bad anatomy, bad hands, text,error, missing fngers,extra digt ,fewer digits,cropped, wort quality ,low quality,normal quality, jpeg artifacts,signature,watermark, username, blurry, bad feet

设置采样步长sampling step为28
配置CFG Scale为12
点击Generate

在这里插入图片描述
当然这里还有img2img等丰富的功能，读者可自行测试

🔥 更多精彩专栏：

👇源码获取 · 技术交流 · 抱团学习 · 咨询分享请联系👇

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生