什么是图像生成AI?
图像生成AI,通俗点也叫AI绘画,指的是AI根据用户输入的文字在几秒到几十秒内自动生成原始图像的系统。目前,全球最火爆的图像生成AI有“Stable Diffusion”和“ Midjourney ”,它们已经作为颠覆设计界常识的存在而受到广泛关注。
对于那些无法自己随意创建图像的用户和每月付费从图像素材网站下载高质量图像的用户来说,使用AI绘画是一个非常大的优势。另一面,它也被认为是对创作图像和绘画的创作者以及拍摄风景和人物的摄影师构成了威胁,并将对未来的数字创意产生重大影响。
此外,围绕图像生成AI的版权问题也成为热门话题。 一般来说,AI所创建的图像的版权属于“生成图像的用户本人”,但AI是否在其他创作人的作品上汲取“灵感”,导致侵犯原创者的版权的问题,也一直争论不休。此前AI插画师应用“mimic”在提供服务仅一天后就因版权声讨被迫停止服务,可以看到,AI绘画已经威胁到了创作者的领域。
但有一点可以确定的是,技术创新的步伐不会因此停止。事实上,广泛使用的Stable Diffusion和Midjourney都是使用提示文本(prompt)生成图像,并且由于从用户输入的字符串生成广泛图像的性质,因此在上面指出了“模仿”可以说已经避免了版权问题。
而且不仅是Stable Diffusion,许多图像生成AI都以“输入字符串越长”和“单词数量越多”来生成更接近用户图像的图像。在这种情况下,出现了一种名为“提示工程”的工作,专门制作和研究“让图像生成AI创建高质量图像的提示(戏称为咒语)”。
什么是“Stable Diffusion”?
Stable Diffusion是一款图像生成AI,配备了“预先训练的AI模型(Diffusion Model)”,可根据“输入文本”生成图像。您可以通过输入以英文单词分隔的单词来创建各种图像,比如一座高楼林立的城市。
Stable Diffusion创建的图像是由系统中安装的称为“潜在扩散模型”的算法生成的。由于用户使用安装了潜在扩散模型作为训练模型的系统,因此他们只需通过文本输入操作即可执行各种任务,而无需了解算法,甚至在 Google Colaboratory 等环境中编写程序代码,就可以生成图像。
用户执行的基本操作是“只需在提供Stable Diffusion的每个界面中输入文本”。每个界面都有除文本之外的详细自定义选项,但图像生成大部分依赖于“输入文本(提示)”。因此,“擅长写英文的用户”很可能能够生成更准确、高质量的图像,而Stable Diffusion将能够生成接近他们想象的图像。
使用Stable Diffusion的两种方法
正如前面提到的,Stable Diffusion 是一个配备了潜在扩散模型和开源 AI 的系统,因此它可以在构建在网络上的环境中运行,也可以在本地环境中独立运行:
- 借助一些免费的服务平台,在浏览器中直接使用Stable Diffusion生成图像
- 在您自己的电脑环境中安装Stable Diffusion生成图像(对电脑配置有一定要求)
本文主要演示借助服务平台运行Stable Diffusion生成图像,如果你想在本地电脑搭建Stable Diffusion可以参阅此文章。
提供Stable Diffusion的三个Web服务
如果你只是想先了解了解 Stable Diffusion 是什么,或者你电脑配置较低,想找免费的云端GPU生成AI图像,那么强烈推荐你使用 Web 应用程序上发布的三个服务进行部署和使用(可能需要科学上网,科学上网问题推荐阅读此文章),这三个网站是(以下内容给个评论一键解锁吧):
本文转载自https://civitai.online/134593.html,本文观点不代表Python技术站立场。