AI自动作画的前世今生
AI自动作画的前世今生

AI自动作画的前世今生

当代的艺术每天都在不断变化,即使是专业的艺术家也不知道未来的趋势在哪?

“太空歌剧院”杰森·艾伦

上个月,科罗拉多州博览会上的一项艺术奖颁给了一项由人工智能(AI)系统产生的作品,这项作品对评委来说并不陌生。社交媒体也看到了艾未未从文字描述中产生的怪异形象的爆炸式增长,“一只海獭,像约翰内斯·弗米尔的“戴珍珠耳环的女孩”:

约翰内斯·弗米尔的“珍珠耳环女孩”风格的海獭

你可能会想知道这里发生了什么。作为一个研究人类和人工智能之间创造性合作的人,我可以告诉你,在标题的背后,甚至是一场根本性的革命正在进行中——具有深远的社会、艺术、经济和技术影响。

故事的开始

你可以说,这场革命始于2020年6月,当时一家名为OpenAI的公司通过创建GPT-3在人工智能方面取得了重大突破,GPT-3是一个可以通过比以前更复杂的方式处理和生成语言的系统。你可以和它就任何主题进行对话,要求它写一篇研究论文或故事,总结文本,写笑话,并做几乎任何可以想象的语言任务。

2021年,一些GPT-3的开发者转向了图像。他们训练了一个数以亿计的图像和文本描述的模型,然后用它从新的描述中生成新的图像。他们称之为DALL-E系统,2022年7月,他们发布了一个非常改进的新版本,DALL-E 2。

和GPT-3一样,DALL-E 2是一个重大突破。它可以从自由形式的文本输入中生成高度详细的图像,包括样式信息和其他抽象概念。

竞争对手加入

自DALL-E 2推出以来,出现了一些竞争对手。一个是免费使用但质量较低的Dall-e迷你(独立开发,现在更名为Craiyon),这是相同内容的流行来源。

克雷恩在一个阳光明媚的日子里骑着三轮车的达斯·维德的照片。克雷恩

大约在同一时间,一家名为Midjourney的较小公司发布了一款更接近Dall-E 2能力的车型。尽管与Dall-e 2相比,Midjourney的能力还差一点,但它在有趣的艺术探索方面进展缓慢。正是在中途,杰森·艾伦创作了赢得科罗拉多州艺术博览会比赛的作品。

Google也有一个称为Imagen的文本到图像模型,它的结果应该比Dall-e和其他人要好得多。然而,Imagen尚未发布供更广泛使用,因此很难评估谷歌的索赔。

由图像文本到图像模型生成的图像,以及生成这些图像的文本。谷歌/图像

2022年7月,Openai开始利用Dall-e的权益,宣布将以付费方式向100万用户提供访问。

然而,2022年8月,一个新的故事发生了:稳定的广播。

稳定的广播不仅在能力上与Dall-e 2竞争,更重要的是它是开源的。任何人都可以使用、调整和调整代码。

自从稳定的广播发布以来的几个星期里,人们已经把代码推到了极限。

举一个例子:人们很快意识到,由于视频是图像的序列,他们可以用tweek稳定的广播代码从文本中生成视频。

使用稳定的广播代码构建的另一个有趣的工具是广播其余部分,它允许您绘制一个简单的草图,提供文本提示,并从中生成图像。在下面的视频中,我从一个非常粗糙的草图中生成了一张花的详细照片。

在下面一个更复杂的例子中,我开始构建软件,让你和你的身体一起画画,然后使用稳定的扩散将其转化为绘画或照片。

AI大作生成的创意作品

艺术的终结?

这意味着你可以通过几行文字和单击按钮来生成任何类型的视觉内容、图像或视频?当您可以使用GPT-3生成电影脚本和使用DALL-E 2生成电影动画时,会发生什么?

展望未来,当社交媒体算法不仅为你的饲料治愈内容,而且生成它时,它意味着什么?当这种趋势在几年内达到元平均值,虚拟现实世界是实时生成的,这对你有什么好处?

这些都是需要考虑的重要问题。

一些人猜测,在短期内,这意味着人类的创造力和艺术受到严重威胁。

也许在一个任何人都可以生成任何图像的世界里,我们今天所知道的图形设计师将是多余的。然而,历史表明,人类的创造力找到了一条出路。电子合成器没有杀死音乐,摄影也没有杀死绘画。相反,它们催化了新的艺术形式。

我相信AI一代也会发生类似的事情。人们正在尝试将稳定扩散等模型作为他们创作过程的一部分。

或者使用DALL-E 2生成时尚设计原型:

一种新的艺术家甚至出现在一些人所说的“提示学”或“提示工程”中。艺术不是用手画像素,而是用文字来提示计算机生成图像:一种人工耳语。

与AI合作

人工智能技术的影响将是多维的:我们不能在一个领域上分辨其好坏。

新的艺术形式将出现,创造性表达的新途径也将出现,就像当年照相机出现一样。

我们生活在一个资本主导的社会环境中,从用户那里提取屏幕时间;在一个利益驱动,艺术仅仅作为内容被广泛传播的经济体中;在一个越来越难以区分真实与虚假的社会背景下;在快节奏的社会分工体系中,AI很容易取代现有的很多行业。

我们如何将这些新的AI技术转向造福人民的方向?我相信有一种方法可以做到这一点,那就是设计一个与人类合作而不是取代人类的人工智能。