什么是Stable Diffusion?Stable Diffusion AI绘画初学者终极指南!

yizhihongxing
太空歌剧院—Midjourney创作


前言

2023年被称为AI元年,因为在这一年,AI技术已经全面提升到了能够产生实际应用的层面。不管是文本生成技术ChatGPT、图像生成技术Midjourney,都是在今年彻底大爆发,不仅引爆互联网,还我们见识到了人工智能巨大的潜能,甚至有很多人认为这是第三次工业革命的开端!

今年3月份,发布于2022年11月30日发布的ChatGPT突然爆火,让OpenAI这个公司声名鹊起,同时也让我们见识到了AI提升生产力的巨大潜力:文档与写作、知识查找与总结、数据分析报告、编程技术支持等方面都可以利用ChatGPT大幅度提升工作效率。

随后在2023年3月16日,Midjourney公司发布了基于文本生成图像的Midjourney V5版本模型,相较于之前版本,V5版在画质、细节、风格方面大幅度的提升,代表作有《太空歌剧院》(美国科罗拉多州博览会艺术比赛冠军作品)、《时尚教皇》系列、《川普入狱》系列等等,因其过于真实,震撼了无数网友,让Midjourney成功出圈。

Midjourney生成的时尚教皇
Midjourney生成的逮捕特朗普AI图像


ChatGPT与Midjourney的成功,让人们看到了AICG(生成式人工智能)时代的到来。正如上文所述,短期来看,AIGC改变了基础的生产力工具,中期来看会改变社会的生产关系,长期来看促使整个社会生产力发生质的突破!

从以往的经验来看,每一次革命性技术的诞生,都伴随着财富大洗牌,例如互联网的诞生催生了谷歌、百度,电商的兴起也诞生了亚马逊、阿里巴巴。随着人工智能时代的到来,作为普通人,这可能是我们在这个时代难得一遇的能够触及到的风口。借用雷军一句话:站在风口上,猪也能飞起来。这个比喻告诉我们,只要抓住了整体的机遇,同样可以取得成功。

事实上,这半年以来,已经有部分人通过ChatGPT技术实现了变现,这其中的途径很多,其中包括:ChatGPT账号注册与出售、ChatGPT付费教程、ChatGPT聊天公众号、聊天网站等方法。

我们可以发现,变现途径一般都是蹭ChatGPT热度和利用信息差,真正利用ChatGPT生产出实际应用进行变现的产品少之又少,这其中的原因主要是ChatGPT API的付费机制所限,还有ChatGPT本身内容过于宽泛,让企业难以创建个性化、针对性的智能应用,也是限制ChatGPT产品价值的原因之一。

时间来到2023年7月份,ChatGPT的风头渐渐过去,Midjourney也由于付费订阅的限制,热度也不及以往。但随着Stable Diffusion的开源推出,大大降低了AI绘画的创作门槛,我们每个人都可以在本地电脑上部署Stable Diffusion并免费创建AI图像。因此,很多人都嗅到了其中的商机,并开始探索其中的变现模式。

在这风口,大部分人都不清楚AI绘画的真正价值,也有很多人虽然意识到了AI绘画的巨大潜力,但苦恼于不知道如何入局。在接下来的篇幅中,我将为AI绘画新人提供一份初学者指南,带你了解AI绘画真正的价值以及变现渠道。

什么是AI生成图像?

AI图像生成指的是AI根据用户输入的文字在几秒到几十秒内自动生成原始图像的系统。

目前比较知名的AI生成图像的平台有“ Midjourney”和“Stable Diffusion”,它们的诞生彻底颠覆了图像设计界的生产力,并因此受到人们的关注。

对于那些无法自己创建图像的用户和每月付费从图像素材网站下载高质量图像的用户来说,图像生成人工智能往往被视为一个很大的优势。我有。然而,它被认为对创作图像和绘画的创作者以及拍摄风景和人物的摄影师构成威胁,并将对未来的数字创意产生重大影响。

此外,关于图像生成AI创作的图像,AI插画师“mimic”在提供服务仅一天后就被迫停止服务,围绕图像生成AI的版权问题也成为热门话题。 。基本上,图像生成AI所创建的图像的版权属于“生成图像的用户”,因此对于作为图像创作来源的插图的创作者来说,已经成为一种情况网络上大量创作,已经威胁到了创作者的领域。

AI有因创作者的批评而被迫停止服务的图像生成AI,例如插图制作者“mimic”,以及像本次推出的“Stable Diffusion”这样的开源AI。在世界范围内广泛传播的图像生成人工智能。虽然只是现阶段的考虑,但认为两者的区别在于“安装的训练好的AI模型的差异”和“图像生成AI读取的数据的差异”。事实上,广泛使用的Stable Diffusion和Midjourney都是使用文本(提示)生成图像,并且由于从用户输入的字符串生成广泛图像的性质,因此在上面指出了“模仿”可以说已经避免了版权问题。
而且不仅是Stable Diffusion,许多图像生成AI都以“输入字符串越长”和“单词数量越多”来生成更接近用户图像的图像。在这种情况下,出现了一种名为“提示工程”的工作,专门制作和研究“让图像生成AI创建高质量图像的提示(咒语)”,每天都会出现各种类型的图像。 。

什么是Stable Diffusion?

这次介绍的图像生成AI是“Stable Diffusion”。Stable Diffusion是一款图像生成AI,配备了“预先训练的AI模型(Diffusion Model)”,可根据“输入文本”生成图像。您可以通过输入以英文单词分隔的单词来创建各种图像,比如一座高楼林立的城市。

Stable Diffusion创建的图像是由系统中安装的称为“潜在扩散模型”的算法生成的。由于用户使用安装了潜在扩散模型作为训练模型的系统,因此他们只需通过文本输入操作即可执行各种任务,而无需了解算法或在 Google Colaboratory 等环境中编写程序代码,就可以生成图像。

用户执行的基本操作是“只需在提供Stable Diffusion的每个界面中输入文本”。每个界面都有除文本之外的详细自定义选项,但图像生成大部分依赖于“输入文本(提示)”。因此,“擅长写英文的用户”很可能能够生成更准确、高质量的图像,而Stable Diffusion将能够生成接近他们想象的图像。

Stable Diffusion简单使用

我们可以有多种方法体验Stable Diffusion AI绘画,比如你可以:

另外,我们也可以使用Stability AI 在 Google Colaboratory 提供的Demo进行了解。

本文转载自https://www.xzhihui.pro/134573.html,本文观点不代表Python技术站立场。

(5)
上一篇 2023年7月15日 上午8:18
下一篇 2023年7月15日 上午8:13

相关文章

  • Pytorch官方教程:用RNN实现字符级的生成任务

    数据处理 传送门:官方教程 数据从上面下载。本次的任务用到的数据和第一次一样,还是18个不同国家的不同名字。 但这次需要根据这些数据训练一个模型,给定国家和名字的首字母时,模型可以自动生成名字。   首先还是对数据进行预处理,和第一个任务一样,利用Unicode将不同国家的名字采用相同的编码方式,因为要生成名字,所以需要加上一个终止符,具体作用后面会提到。 …

    2023年4月8日
    00
  • PyTorch安装及试用 基于Anaconda3

      设置Torch国内镜像 conda config –add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/   安装PyTorch和TorchVision conda install pytorch torchvision   测试pytorch版本 impor…

    PyTorch 2023年4月8日
    00
  • loj #161 子集卷积

    求不相交集合并卷积   sol: 集合并卷积?看我 FWT! 交一发,10 以上的全 T 了 然后经过参考别人代码认真比对后发现我代码里有这么一句话: rep(s, 0, MAXSTATE) rep(i, 0, n) rep(j, 0, n – i) h[i + j][s] = inc(h[i + j][s], mul(f[i][s], g[j][s]));…

    卷积神经网络 2023年4月7日
    00
  • 循环神经网络(LSTM和GRU)(2)

    1、tf.nn.dynamic_rnn()函数 参考:http://www.360doc.com/content/17/0321/10/10408243_638692495.shtml 参考:https://blog.csdn.net/u010089444/article/details/60963053 参考:https://blog.csdn.net/u…

    循环神经网络 2023年4月8日
    00
  • Nat. Mach. Intell. | 利用条件循环神经网络生成特定性质分子

    作者 | 陆丰庆 今天给大家介绍瑞士知名药企阿斯利康和伯尔尼大学的 Esben Jannik Bjerrum团队在Nature Machine Intelligence上的一篇论文。该研究提出基于分子SMILES表示的条件循环神经网络,输入目标性质,模型可直接生成具有对应性质的分子。 1 背景 机器学习对生物和化学领域有着深远影响,其可被用于生物活性预测,分…

    2023年4月5日
    00
  • 机器学习算法–聚类

        聚类试图将数据集中的样本划分为若干个通常不相交的子集,每个子集称为一个“簇”。通常为“无监督学习”,对无标记训练样本学习来揭示数据的内在规律和性质。     下面主要讲三种聚类模型: 1. 原型聚类     “原型”是指样本空间中具有代表性的点。通常是算法先对原型进行初始化,然后对原型进行迭代更新求解。介绍三种著名的原型聚类方法。       (1)…

    机器学习 2023年4月10日
    00
  • 昇腾实战丨DVPP媒体数据处理视频解码问题案例

    摘要:本期就分享几个关于DVPP视频解码问题的典型案例,并给出原因分析及解决方法 本文分享自华为云社区《DVPP媒体数据处理视频解码问题案例》,作者:昇腾CANN 。 DVPP(Digital Vision Pre-Processing)是昇腾AI处理器内置的图像处理单元,通过AscendCL媒体数据处理接口提供强大的媒体处理硬加速能力,主要功能包括图像编解…

    人工智能概论 2023年5月8日
    00
  • 第十讲–循环神经网络–课时21

    VGG和GoogleLeNet发明的时候,batch normalization还没有出现,因此难以使得这些网络收敛 VGG预训练了11层的网络,然后才得到16/19层的 GoogleLeNet添加了两个auxiliary classification part 有了batch norm以后,就不再需要那样做了 ———————–…

    2023年4月8日
    00
合作推广
合作推广
分享本页
返回顶部