什么是Stable Diffusion?Stable Diffusion AI绘画初学者终极指南!

yizhihongxing
太空歌剧院—Midjourney创作


前言

2023年被称为AI元年,因为在这一年,AI技术已经全面提升到了能够产生实际应用的层面。不管是文本生成技术ChatGPT、图像生成技术Midjourney,都是在今年彻底大爆发,不仅引爆互联网,还我们见识到了人工智能巨大的潜能,甚至有很多人认为这是第三次工业革命的开端!

今年3月份,发布于2022年11月30日发布的ChatGPT突然爆火,让OpenAI这个公司声名鹊起,同时也让我们见识到了AI提升生产力的巨大潜力:文档与写作、知识查找与总结、数据分析报告、编程技术支持等方面都可以利用ChatGPT大幅度提升工作效率。

随后在2023年3月16日,Midjourney公司发布了基于文本生成图像的Midjourney V5版本模型,相较于之前版本,V5版在画质、细节、风格方面大幅度的提升,代表作有《太空歌剧院》(美国科罗拉多州博览会艺术比赛冠军作品)、《时尚教皇》系列、《川普入狱》系列等等,因其过于真实,震撼了无数网友,让Midjourney成功出圈。

Midjourney生成的时尚教皇
Midjourney生成的逮捕特朗普AI图像


ChatGPT与Midjourney的成功,让人们看到了AICG(生成式人工智能)时代的到来。正如上文所述,短期来看,AIGC改变了基础的生产力工具,中期来看会改变社会的生产关系,长期来看促使整个社会生产力发生质的突破!

从以往的经验来看,每一次革命性技术的诞生,都伴随着财富大洗牌,例如互联网的诞生催生了谷歌、百度,电商的兴起也诞生了亚马逊、阿里巴巴。随着人工智能时代的到来,作为普通人,这可能是我们在这个时代难得一遇的能够触及到的风口。借用雷军一句话:站在风口上,猪也能飞起来。这个比喻告诉我们,只要抓住了整体的机遇,同样可以取得成功。

事实上,这半年以来,已经有部分人通过ChatGPT技术实现了变现,这其中的途径很多,其中包括:ChatGPT账号注册与出售、ChatGPT付费教程、ChatGPT聊天公众号、聊天网站等方法。

我们可以发现,变现途径一般都是蹭ChatGPT热度和利用信息差,真正利用ChatGPT生产出实际应用进行变现的产品少之又少,这其中的原因主要是ChatGPT API的付费机制所限,还有ChatGPT本身内容过于宽泛,让企业难以创建个性化、针对性的智能应用,也是限制ChatGPT产品价值的原因之一。

时间来到2023年7月份,ChatGPT的风头渐渐过去,Midjourney也由于付费订阅的限制,热度也不及以往。但随着Stable Diffusion的开源推出,大大降低了AI绘画的创作门槛,我们每个人都可以在本地电脑上部署Stable Diffusion并免费创建AI图像。因此,很多人都嗅到了其中的商机,并开始探索其中的变现模式。

在这风口,大部分人都不清楚AI绘画的真正价值,也有很多人虽然意识到了AI绘画的巨大潜力,但苦恼于不知道如何入局。在接下来的篇幅中,我将为AI绘画新人提供一份初学者指南,带你了解AI绘画真正的价值以及变现渠道。

什么是AI生成图像?

AI图像生成指的是AI根据用户输入的文字在几秒到几十秒内自动生成原始图像的系统。

目前比较知名的AI生成图像的平台有“ Midjourney”和“Stable Diffusion”,它们的诞生彻底颠覆了图像设计界的生产力,并因此受到人们的关注。

对于那些无法自己创建图像的用户和每月付费从图像素材网站下载高质量图像的用户来说,图像生成人工智能往往被视为一个很大的优势。我有。然而,它被认为对创作图像和绘画的创作者以及拍摄风景和人物的摄影师构成威胁,并将对未来的数字创意产生重大影响。

此外,关于图像生成AI创作的图像,AI插画师“mimic”在提供服务仅一天后就被迫停止服务,围绕图像生成AI的版权问题也成为热门话题。 。基本上,图像生成AI所创建的图像的版权属于“生成图像的用户”,因此对于作为图像创作来源的插图的创作者来说,已经成为一种情况网络上大量创作,已经威胁到了创作者的领域。

AI有因创作者的批评而被迫停止服务的图像生成AI,例如插图制作者“mimic”,以及像本次推出的“Stable Diffusion”这样的开源AI。在世界范围内广泛传播的图像生成人工智能。虽然只是现阶段的考虑,但认为两者的区别在于“安装的训练好的AI模型的差异”和“图像生成AI读取的数据的差异”。事实上,广泛使用的Stable Diffusion和Midjourney都是使用文本(提示)生成图像,并且由于从用户输入的字符串生成广泛图像的性质,因此在上面指出了“模仿”可以说已经避免了版权问题。
而且不仅是Stable Diffusion,许多图像生成AI都以“输入字符串越长”和“单词数量越多”来生成更接近用户图像的图像。在这种情况下,出现了一种名为“提示工程”的工作,专门制作和研究“让图像生成AI创建高质量图像的提示(咒语)”,每天都会出现各种类型的图像。 。

什么是Stable Diffusion?

这次介绍的图像生成AI是“Stable Diffusion”。Stable Diffusion是一款图像生成AI,配备了“预先训练的AI模型(Diffusion Model)”,可根据“输入文本”生成图像。您可以通过输入以英文单词分隔的单词来创建各种图像,比如一座高楼林立的城市。

Stable Diffusion创建的图像是由系统中安装的称为“潜在扩散模型”的算法生成的。由于用户使用安装了潜在扩散模型作为训练模型的系统,因此他们只需通过文本输入操作即可执行各种任务,而无需了解算法或在 Google Colaboratory 等环境中编写程序代码,就可以生成图像。

用户执行的基本操作是“只需在提供Stable Diffusion的每个界面中输入文本”。每个界面都有除文本之外的详细自定义选项,但图像生成大部分依赖于“输入文本(提示)”。因此,“擅长写英文的用户”很可能能够生成更准确、高质量的图像,而Stable Diffusion将能够生成接近他们想象的图像。

Stable Diffusion简单使用

我们可以有多种方法体验Stable Diffusion AI绘画,比如你可以:

另外,我们也可以使用Stability AI 在 Google Colaboratory 提供的Demo进行了解。

本文转载自https://www.xzhihui.pro/134573.html,本文观点不代表Python技术站立场。

(5)
上一篇 2023年11月27日 下午8:45
下一篇 2023年7月15日 上午8:13

相关文章

  • DeepLearning.ai笔记:(5-1)– 循环神经网络(Recurrent Neural Networks)

    title: ‘DeepLearning.ai笔记:(5-1)– 循环神经网络(Recurrent Neural Networks)’id: dl-ai-5-1tags: dl.ai categories: AI Deep Learning date: 2018-10-18 10:26:52 第五门课讲的是序列模型,主要是对RNN算法的应用,如GRU,LS…

    2023年4月7日
    00
  • 机器学习之Hash集合问题

        问题来源与七月学习之 (3.x线性代数与矩阵运算基础)

    机器学习 2023年4月13日
    00
  • 【机器学习】PCA

    目录 PCA 1. PCA最大可分性的思想 2. 基变换(线性变换) 3. 方差 4. 协方差 5. 协方差矩阵 6. 协方差矩阵对角化 7. PCA算法流程 8. PCA算法总结 PCA 就是找出数据最主要的方面,用数据里最主要的方面来代替原始数据。 PCA 是最重要的降维方法之一,在数据压缩、消除冗余和数据噪音消除等领域都有广泛的应用。 1. PCA最大…

    机器学习 2023年4月13日
    00
  • 横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow

    横向对比三大分布式机器学习平台:Spark、PMLS、TensorFlow2017-08-04 11:47 程序设计/谷歌/对比选自muratbuffalo 作者:Murat Demirbas 参与:Panda 分布式机器学习是机器学习领域的一大主要研究方向。近日纽约州立大学布法罗分校计算机科学与工程教授、Petuum Inc. 顾问 Murat Demir…

    tensorflow 2023年4月6日
    00
  • 十一,基于循环神经网络的时序数据聚类算法及其并行化

    论文名称基于循环神经网络的时序数据聚类算法及其并行化,王国瑞. 研究对象主要围绕时序数据聚类问题,不同于已有的时序数据聚类方法,本文献的研究是基于循环神经网络的时序数据聚类方法,研究成果可用于金融股票数据分析。 研究动机在时间序列数据挖掘领域,结合循环神经网络将其应用在时间序列数据预测及聚类任务上。 文献综述 基于时间临近度的时序聚类:主要在于序列相似性的衡…

    2023年4月6日
    00
  • Pytorch: torch.nn

    import torch as t from torch import nn class Linear(nn.Module): # 继承nn.Module def __init__(self, in_features, out_features): super(Linear, self).__init__() # 等价于nn.Module.__init__(…

    PyTorch 2023年4月6日
    00
  • Keras 中的 verbose 参数

    在 fit( ) 和 evaluate( ) 中 都有 verbose 这个参数,但都是表示日志显示的参数。 具体如下:  fit( ) 中 的 verbose 参数: verbose:日志显示verbose = 0 为不在标准输出流输出日志信息verbose = 1 为输出进度条记录verbose = 2 为每个epoch输出一行记录注意: 默认为 1  …

    Keras 2023年4月6日
    00
  • 2 李宏毅生成对抗网络学习———GAN原理

    1 引言 生成对抗网络由Goodfellow在2014年提出。GAN由生成器和判别器组成。生成器的功能是输入一个样本将其输出成一个逼真的样子,判别器来判断输入的样本是真的还是伪造的。 判别网络的目的:就是能判别出来属于的一张图它是来自真实样本集还是假样本集。例如输入的是真样本,网络输出就接近1,输出的是假样本,网络输出接近0。 生成网络的目的:生成网络是造样…

    2023年4月6日
    00
合作推广
合作推广
分享本页
返回顶部