什么是Stable Diffusion?Stable Diffusion AI绘画初学者终极指南!

太空歌剧院—Midjourney创作


前言

2023年被称为AI元年,因为在这一年,AI技术已经全面提升到了能够产生实际应用的层面。不管是文本生成技术ChatGPT、图像生成技术Midjourney,都是在今年彻底大爆发,不仅引爆互联网,还我们见识到了人工智能巨大的潜能,甚至有很多人认为这是第三次工业革命的开端!

今年3月份,发布于2022年11月30日发布的ChatGPT突然爆火,让OpenAI这个公司声名鹊起,同时也让我们见识到了AI提升生产力的巨大潜力:文档与写作、知识查找与总结、数据分析报告、编程技术支持等方面都可以利用ChatGPT大幅度提升工作效率。

随后在2023年3月16日,Midjourney公司发布了基于文本生成图像的Midjourney V5版本模型,相较于之前版本,V5版在画质、细节、风格方面大幅度的提升,代表作有《太空歌剧院》(美国科罗拉多州博览会艺术比赛冠军作品)、《时尚教皇》系列、《川普入狱》系列等等,因其过于真实,震撼了无数网友,让Midjourney成功出圈。

Midjourney生成的时尚教皇
Midjourney生成的逮捕特朗普AI图像


ChatGPT与Midjourney的成功,让人们看到了AICG(生成式人工智能)时代的到来。正如上文所述,短期来看,AIGC改变了基础的生产力工具,中期来看会改变社会的生产关系,长期来看促使整个社会生产力发生质的突破!

从以往的经验来看,每一次革命性技术的诞生,都伴随着财富大洗牌,例如互联网的诞生催生了谷歌、百度,电商的兴起也诞生了亚马逊、阿里巴巴。随着人工智能时代的到来,作为普通人,这可能是我们在这个时代难得一遇的能够触及到的风口。借用雷军一句话:站在风口上,猪也能飞起来。这个比喻告诉我们,只要抓住了整体的机遇,同样可以取得成功。

事实上,这半年以来,已经有部分人通过ChatGPT技术实现了变现,这其中的途径很多,其中包括:ChatGPT账号注册与出售、ChatGPT付费教程、ChatGPT聊天公众号、聊天网站等方法。

我们可以发现,变现途径一般都是蹭ChatGPT热度和利用信息差,真正利用ChatGPT生产出实际应用进行变现的产品少之又少,这其中的原因主要是ChatGPT API的付费机制所限,还有ChatGPT本身内容过于宽泛,让企业难以创建个性化、针对性的智能应用,也是限制ChatGPT产品价值的原因之一。

时间来到2023年7月份,ChatGPT的风头渐渐过去,Midjourney也由于付费订阅的限制,热度也不及以往。但随着Stable Diffusion的开源推出,大大降低了AI绘画的创作门槛,我们每个人都可以在本地电脑上部署Stable Diffusion并免费创建AI图像。因此,很多人都嗅到了其中的商机,并开始探索其中的变现模式。

在这风口,大部分人都不清楚AI绘画的真正价值,也有很多人虽然意识到了AI绘画的巨大潜力,但苦恼于不知道如何入局。在接下来的篇幅中,我将为AI绘画新人提供一份初学者指南,带你了解AI绘画真正的价值以及变现渠道。

什么是AI生成图像?

AI图像生成指的是AI根据用户输入的文字在几秒到几十秒内自动生成原始图像的系统。

目前比较知名的AI生成图像的平台有“ Midjourney”和“Stable Diffusion”,它们的诞生彻底颠覆了图像设计界的生产力,并因此受到人们的关注。

对于那些无法自己创建图像的用户和每月付费从图像素材网站下载高质量图像的用户来说,图像生成人工智能往往被视为一个很大的优势。我有。然而,它被认为对创作图像和绘画的创作者以及拍摄风景和人物的摄影师构成威胁,并将对未来的数字创意产生重大影响。

此外,关于图像生成AI创作的图像,AI插画师“mimic”在提供服务仅一天后就被迫停止服务,围绕图像生成AI的版权问题也成为热门话题。 。基本上,图像生成AI所创建的图像的版权属于“生成图像的用户”,因此对于作为图像创作来源的插图的创作者来说,已经成为一种情况网络上大量创作,已经威胁到了创作者的领域。

AI有因创作者的批评而被迫停止服务的图像生成AI,例如插图制作者“mimic”,以及像本次推出的“Stable Diffusion”这样的开源AI。在世界范围内广泛传播的图像生成人工智能。虽然只是现阶段的考虑,但认为两者的区别在于“安装的训练好的AI模型的差异”和“图像生成AI读取的数据的差异”。事实上,广泛使用的Stable Diffusion和Midjourney都是使用文本(提示)生成图像,并且由于从用户输入的字符串生成广泛图像的性质,因此在上面指出了“模仿”可以说已经避免了版权问题。
而且不仅是Stable Diffusion,许多图像生成AI都以“输入字符串越长”和“单词数量越多”来生成更接近用户图像的图像。在这种情况下,出现了一种名为“提示工程”的工作,专门制作和研究“让图像生成AI创建高质量图像的提示(咒语)”,每天都会出现各种类型的图像。 。

什么是Stable Diffusion?

这次介绍的图像生成AI是“Stable Diffusion”。Stable Diffusion是一款图像生成AI,配备了“预先训练的AI模型(Diffusion Model)”,可根据“输入文本”生成图像。您可以通过输入以英文单词分隔的单词来创建各种图像,比如一座高楼林立的城市。

Stable Diffusion创建的图像是由系统中安装的称为“潜在扩散模型”的算法生成的。由于用户使用安装了潜在扩散模型作为训练模型的系统,因此他们只需通过文本输入操作即可执行各种任务,而无需了解算法或在 Google Colaboratory 等环境中编写程序代码,就可以生成图像。

用户执行的基本操作是“只需在提供Stable Diffusion的每个界面中输入文本”。每个界面都有除文本之外的详细自定义选项,但图像生成大部分依赖于“输入文本(提示)”。因此,“擅长写英文的用户”很可能能够生成更准确、高质量的图像,而Stable Diffusion将能够生成接近他们想象的图像。

Stable Diffusion简单使用

我们可以有多种方法体验Stable Diffusion AI绘画,比如你可以:

另外,我们也可以使用Stability AI 在 Google Colaboratory 提供的Demo进行了解。

本文转载自https://www.xzhihui.pro/134573.html,本文观点不代表Python技术站立场。

(5)
上一篇 2023年11月2日 下午8:54
下一篇 2023年7月15日 上午8:13

相关文章

  • 不要怂,就是GAN (生成式对抗网络) (六):Wasserstein GAN(WGAN) TensorFlow 代码

    先来梳理一下我们之前所写的代码,原始的生成对抗网络,所要优化的目标函数为:  此目标函数可以分为两部分来看: ①固定生成器 G,优化判别器 D, 则上式可以写成如下形式:    可以转化为最小化形式:  我们编写的代码中,d_loss_real = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(…

    2023年4月6日
    00
  • 卷积神经网络-Python、TensorFlow和Keras p.3的深度学习基础

    欢迎来到一个教程,在这里我们将讨论卷积神经网络(Convnet和CNN),使用其中的一个用我们在上一教程中构建的数据集对狗和猫进行分类。 卷积神经网络通过它在图像数据中的应用而获得了广泛的应用,并且是目前检测图像内容或包含在图像中的最先进的技术。 CNN的基本结构如下:Convolution -> Pooling -> Convolution -…

    2023年4月8日
    00
  • 目标检测评价标准(mAP, 精准度(Precision), 召回率(Recall), 准确率(Accuracy),交除并(IoU))

    1. TP , FP , TN , FN定义2. 评价标准   1. TP , FP , TN , FN定义 TP(True Positive)是正样本预测为正样本的数量,即与Ground truth区域的IoU>=threshold的预测框 FP(False Positive)是负样本预测为正样本的数量,误报;即与Ground truth区域IoU …

    目标检测 2023年4月8日
    00
  • 吴恩达机器学习笔记6-梯度下降II(Gradient descent intuition)–梯度下降的直观理解

      在之前的学习中,我们给出了一个数学上关于梯度下降的定义,本次视频我们更深入研究一下,更直观地感受一下这个算法是做什么的,以及梯度下降算法的更新过程有什么意义。梯度下降算法如下:  描述:对????赋值,使得????(????)按梯度下降最快方向进行,一直迭代下去,最终得到局部最小值。其中????是学习率(learning rate),它决定了我们沿着能让…

    机器学习 2023年4月10日
    00
  • Ubuntu 16.04 安装opencv3.4.5/cuda/caffe并使用jni笔记

      因操作失误,误卸开发机NVIDIA显卡驱动,先更新操作日志如下: 1.卸载系统里的Nvidia残余 sudo apt-get purge nvidia* 2.把显卡驱动加入PPA sudo add-apt-repository ppa:graphics-drivers sudo apt-get update 3.查找显卡驱动最新的版本号 sudo apt…

    2023年4月6日
    00
  • 《机器学习基石》—VC维

    VC维其实就是第一个break point的之前的样本容量。标准定义是:对一个假设空间,如果存在N个样本能够被假设空间中的h按所有可能的2的N次方种形式分开,则称该假设空间能够把N个样本打散;假设空间的VC维就是它能打散的最大样本数目N。若对任意N,总存在一组样本使得假设空间能将它们打散,则函数集的VC维是无穷大: 几种假设空间的VC维如下:   2 推导d…

    机器学习 2023年4月12日
    00
  • 高斯混合背景模型运动目标检测

    在运动目标的前景检测中,GMM的目标是实现对视频帧中的像素进行前景/背景的二分类。通过统计视频图像中各个点的像素值获取背景模型,最后利用背景减除的思想提取出运动目标。 GMM假设在摄像机固定的场景下,在一段足够长的时间区间内,背景目标出现的概率要远高于前景目标。利用监控视频的这一特点,对视频帧上的任意坐标的像素值进行时间方向的统计,为每个坐标分配若干个高斯概…

    2023年4月5日
    00
  • pytorch1.0神经网络保存、提取、加载

    pytorch1.0网络保存、提取、加载 import torch import torch.nn.functional as F # 包含激励函数 import matplotlib.pyplot as plt # 假数据 x = torch.unsqueeze(torch.linspace(-1,1,100),dim=1) # x data (tenso…

    PyTorch 2023年4月6日
    00
合作推广
合作推广
分享本页
返回顶部