什么是Stable Diffusion?Stable Diffusion AI绘画初学者终极指南!

太空歌剧院—Midjourney创作


前言

2023年被称为AI元年,因为在这一年,AI技术已经全面提升到了能够产生实际应用的层面。不管是文本生成技术ChatGPT、图像生成技术Midjourney,都是在今年彻底大爆发,不仅引爆互联网,还我们见识到了人工智能巨大的潜能,甚至有很多人认为这是第三次工业革命的开端!

今年3月份,发布于2022年11月30日发布的ChatGPT突然爆火,让OpenAI这个公司声名鹊起,同时也让我们见识到了AI提升生产力的巨大潜力:文档与写作、知识查找与总结、数据分析报告、编程技术支持等方面都可以利用ChatGPT大幅度提升工作效率。

随后在2023年3月16日,Midjourney公司发布了基于文本生成图像的Midjourney V5版本模型,相较于之前版本,V5版在画质、细节、风格方面大幅度的提升,代表作有《太空歌剧院》(美国科罗拉多州博览会艺术比赛冠军作品)、《时尚教皇》系列、《川普入狱》系列等等,因其过于真实,震撼了无数网友,让Midjourney成功出圈。

Midjourney生成的时尚教皇
Midjourney生成的逮捕特朗普AI图像


ChatGPT与Midjourney的成功,让人们看到了AICG(生成式人工智能)时代的到来。正如上文所述,短期来看,AIGC改变了基础的生产力工具,中期来看会改变社会的生产关系,长期来看促使整个社会生产力发生质的突破!

从以往的经验来看,每一次革命性技术的诞生,都伴随着财富大洗牌,例如互联网的诞生催生了谷歌、百度,电商的兴起也诞生了亚马逊、阿里巴巴。随着人工智能时代的到来,作为普通人,这可能是我们在这个时代难得一遇的能够触及到的风口。借用雷军一句话:站在风口上,猪也能飞起来。这个比喻告诉我们,只要抓住了整体的机遇,同样可以取得成功。

事实上,这半年以来,已经有部分人通过ChatGPT技术实现了变现,这其中的途径很多,其中包括:ChatGPT账号注册与出售、ChatGPT付费教程、ChatGPT聊天公众号、聊天网站等方法。

我们可以发现,变现途径一般都是蹭ChatGPT热度和利用信息差,真正利用ChatGPT生产出实际应用进行变现的产品少之又少,这其中的原因主要是ChatGPT API的付费机制所限,还有ChatGPT本身内容过于宽泛,让企业难以创建个性化、针对性的智能应用,也是限制ChatGPT产品价值的原因之一。

时间来到2023年7月份,ChatGPT的风头渐渐过去,Midjourney也由于付费订阅的限制,热度也不及以往。但随着Stable Diffusion的开源推出,大大降低了AI绘画的创作门槛,我们每个人都可以在本地电脑上部署Stable Diffusion并免费创建AI图像。因此,很多人都嗅到了其中的商机,并开始探索其中的变现模式。

在这风口,大部分人都不清楚AI绘画的真正价值,也有很多人虽然意识到了AI绘画的巨大潜力,但苦恼于不知道如何入局。在接下来的篇幅中,我将为AI绘画新人提供一份初学者指南,带你了解AI绘画真正的价值以及变现渠道。

什么是AI生成图像?

AI图像生成指的是AI根据用户输入的文字在几秒到几十秒内自动生成原始图像的系统。

目前比较知名的AI生成图像的平台有“ Midjourney”和“Stable Diffusion”,它们的诞生彻底颠覆了图像设计界的生产力,并因此受到人们的关注。

对于那些无法自己创建图像的用户和每月付费从图像素材网站下载高质量图像的用户来说,图像生成人工智能往往被视为一个很大的优势。我有。然而,它被认为对创作图像和绘画的创作者以及拍摄风景和人物的摄影师构成威胁,并将对未来的数字创意产生重大影响。

此外,关于图像生成AI创作的图像,AI插画师“mimic”在提供服务仅一天后就被迫停止服务,围绕图像生成AI的版权问题也成为热门话题。 。基本上,图像生成AI所创建的图像的版权属于“生成图像的用户”,因此对于作为图像创作来源的插图的创作者来说,已经成为一种情况网络上大量创作,已经威胁到了创作者的领域。

AI有因创作者的批评而被迫停止服务的图像生成AI,例如插图制作者“mimic”,以及像本次推出的“Stable Diffusion”这样的开源AI。在世界范围内广泛传播的图像生成人工智能。虽然只是现阶段的考虑,但认为两者的区别在于“安装的训练好的AI模型的差异”和“图像生成AI读取的数据的差异”。事实上,广泛使用的Stable Diffusion和Midjourney都是使用文本(提示)生成图像,并且由于从用户输入的字符串生成广泛图像的性质,因此在上面指出了“模仿”可以说已经避免了版权问题。
而且不仅是Stable Diffusion,许多图像生成AI都以“输入字符串越长”和“单词数量越多”来生成更接近用户图像的图像。在这种情况下,出现了一种名为“提示工程”的工作,专门制作和研究“让图像生成AI创建高质量图像的提示(咒语)”,每天都会出现各种类型的图像。 。

什么是Stable Diffusion?

这次介绍的图像生成AI是“Stable Diffusion”。Stable Diffusion是一款图像生成AI,配备了“预先训练的AI模型(Diffusion Model)”,可根据“输入文本”生成图像。您可以通过输入以英文单词分隔的单词来创建各种图像,比如一座高楼林立的城市。

Stable Diffusion创建的图像是由系统中安装的称为“潜在扩散模型”的算法生成的。由于用户使用安装了潜在扩散模型作为训练模型的系统,因此他们只需通过文本输入操作即可执行各种任务,而无需了解算法或在 Google Colaboratory 等环境中编写程序代码,就可以生成图像。

用户执行的基本操作是“只需在提供Stable Diffusion的每个界面中输入文本”。每个界面都有除文本之外的详细自定义选项,但图像生成大部分依赖于“输入文本(提示)”。因此,“擅长写英文的用户”很可能能够生成更准确、高质量的图像,而Stable Diffusion将能够生成接近他们想象的图像。

Stable Diffusion简单使用

我们可以有多种方法体验Stable Diffusion AI绘画,比如你可以:

另外,我们也可以使用Stability AI 在 Google Colaboratory 提供的Demo进行了解。

本文转载自https://www.xzhihui.pro/134573.html,本文观点不代表Python技术站立场。

(5)
上一篇 2023年11月2日 下午8:54
下一篇 2023年7月15日 上午8:13

相关文章

  • keras可视化pydot graphviz问题

    1. 安装 pip install graphviz pip install pydot pip install pydot-ng # 版本兼容需要 # 测试一下 from keras.utils.visualize_util import plot   2. 使用: #!/usr/bin/env python # coding=utf-8 “”” 利用ke…

    Keras 2023年4月6日
    00
  • caffe在 14.04安装

    同事安装遇到的问题,记录一下 需要把cuda里面带的opengl不安装才行,否则冲突。在安装时,首先和之前一样,切换到无图形界面,关掉lightdm,安装cuda时选择–no-opengl-lib,具体可以看help。 要不然会和系统的opengl冲突。

    Caffe 2023年4月6日
    00
  • Caffe 单独测试添加的layer

    之前那个博客记录了如何实现一个自己的层,这篇教你如何进行层的调试。 首先把你在caffe/src/caffe/layers中你自己层的cpp代码copy到caffe/src/caffe/test中 然后改名(因为我看那个目录里面命名都是这样命名的): 接着就按照这篇博客的做:http://www.cnblogs.com/louyihang-loves-bai…

    2023年4月8日
    00
  • openpose_caffe转rknn

    openpose_caffe_to_rknn.py from rknn.api import RKNN import cv2 import time import numpy as np if __name__ == ‘__main__’: # Create RKNN object rknn = RKNN() # pre-process config pri…

    2023年4月8日
    00
  • Windows10安装ubuntu & caffe GPU版

    1.Ubuntu https://www.cnblogs.com/EasonJim/p/7112413.html https://blog.csdn.net/jesse_mx/article/details/61425361   安装后启动不了,直接进入windows.解决方案: https://www.cnblogs.com/lymboy/p/778375…

    Caffe 2023年4月8日
    00
  • 【语义分割】Stacked Hourglass Networks 以及 PyTorch 实现

    Stacked Hourglass Networks(级联漏斗网络) 姿态估计(Pose Estimation)是 CV 领域一个非常重要的方向,而级联漏斗网络的提出就是为了提升姿态估计的效果,但是其中的经典思想可以扩展到其他方向,比如目标识别方向,代表网络是 CornerNet(预测目标的左上角和右下角点,再进行组合画框)。 CNN 之所以有效,是因为它能…

    2023年4月8日
    00
  • 目标检测之SSD

      一、目标检测之SSD SSD: Single Shot MultiBox Detector 论文链接:https://arxiv.org/abs/1512.02325 论文翻译:https://blog.csdn.net/denghecsdn/article/details/77429978 论文详解:https://blog.csdn.net/WZZ1…

    2023年4月8日
    00
  • windows安装keras(不带theano)

    安装完tensorflow后,很多人想在tensorflow中使用keras keras中封装了很多高级API使用起来很方便很简洁,在windows中安装keras教程很多。 大部分都要安装theano作为后端,theano在windows中安装有时候会产生很多问题。 这里介绍一种安装keras的方法,不用依赖theano而是直接用tensorflow做后端…

    2023年4月8日
    00
合作推广
合作推广
分享本页
返回顶部