当AI把绘画艺术变成一门“语言艺术”

文/郝晓茹
“一名宇航员骑在一匹马上,超现实主义风格”——将这句话的英文原文输入最流行的AI绘画程序,几分钟后,就能得到几张宇航员在太空中骑马的图片。在我们普通人看来,AI生成的图片质量已经达到相当高的水平。
对于技术研究人员来说,人工智能技术这几年的发展是稳步向前的,一步一个脚印。但是对于普通人而言,体会AI技术的进展,主要是靠有冲击力的时刻或事件,比如近十年来最具冲击力的时刻必然是2016年人工智能围棋程序AlphaGo战胜人类顶尖棋手。而2022年最具冲击力的时刻,莫过于人们“突然”发现AI绘画生成的部分作品质量之高,似乎已经能够以假乱真了。更重要的是,人们可以自己亲自“操控”AI绘画程序,生成各种自己想要的作品。
为了方便普通人理解,我们可以大致认为AI绘画程序背后的工作原理是这样的:互联网上有无数张图片,大部分图片都带着描述性的说明文字,通过学习人们是怎么给每一张图片配说明文字的,AI绘画程序学会了用文字来反向生成图片。也就是从海量“给图片配的文字”数据中,学会了“给文字配图”。
这句轻描淡写的“无数张图片”实际上却是个新一代AI绘画程序成功的关键。专业人士从超大规模语言模型的发展上了解到,训练数据量的量变会产生质变,经过海量数据训练的模型,可以学到一些“通用的能力”。我们可以认为,AI绘画程序是把有史以来互联网上出现过的数亿张带文字描述的高质量图片作为训练数据(学习资料)进行学习。研究人员发现,AI绘画程序学到的能力包括组合两种不相关的概念,例如骑马的宇航员、创造动物或物体的拟人化版本,例如人形的白萝卜、把文字渲染成图片,例如做广告牌、转换一张已有图片的艺术风格、延伸一张画的原有边界或补画、修改一张画上的元素等等,更多能力仍在陆续解锁中。
仅仅在一年前,最具代表性的AI绘画程序还没有引发如此高的关注度,或者说没有“出圈”,只是在人工智能行业内受到了关注。那时候,AI绘画程序生成作品中的代表作是一把“牛油果样子的扶手椅”。虽然不足以冲击普通人的感官,但它生成图片的方式——“喂”给AI一句描述语即可,已经让很多人跃跃欲试。到了2022年,对技术敏感的先锋人士终于可以亲自上手,输入文字,用AI来作图,把想象力转化为绘画作品,进而引发了AI画画的热潮。
原则上讲,现在只要会写字甚至会说话的人都可以用AI来画画了。AI终于把绘画艺术变成了一门“语言艺术”。但当人们带着尝试的心态,找到一个AI绘画程序,通过输入文字进行绘画时,很快就会发现,把自己的想象力用语言描述出来,似乎并不容易,做不了几张图就词穷了,而且做出来的图往往都很普通,甚至还会有点儿吓人,这是因为现阶段的AI绘画程序还有很多缺陷,所以也不免会有些失落。
再看那些令人叫绝的精美二次元漫画女主角AI图片背后,它们所使用的“描述语”,可能包含数百个字符。首先,完整描述了从眉毛到袜子再到人物所处背景的每一个细节。其次,添加了很多正向“咒语”,类似“最佳质量”“大师级作品”“超高清分辨率”“细节丰富的壁纸”“某某平台的编辑之选”等等。最后,还使用了大量的反向“咒语”,要求AI绘画程序不要生成什么样的图,比如不要手指错乱的、不要低质量的、不要带签名的、不要带水印的、不要中等质量的图片、不要低质量的图片、不要长脖子的……甚至还需要标记出不同描述语的权重值。而那些精美的写实风格AI画作背后使用的描述语,可能添加了另一种类型的“咒语”,比如光圈值、快门值,包含了光线、视角等方面的描述,甚至包含了高端相机品牌的名字。现在,已经有专门的网站,反向从AI生成的画中推导出它是用了哪些描述语(prompt)进行描述的。
也就是说,虽然从那些精彩的AI绘画作品上,人们看到了AI绘画程序的潜力,但要挖掘这种潜力,则需要好好掌握一门新的语言,一种专门用来跟AI绘画程序打交道的方式。不仅要学会这门新的“外语”,而且要掌握各种不同的“方言”——不同的AI绘画程序,对描述语的辨别又各有特色。
站在技术与艺术交汇处的、懂技术又懂绘画的专业人士,只有真正掌握了这门新的“外语”,才能知道集合了全人类智慧的AI绘画程序的上限会在哪里、不足是什么。这时候,再来讨论AI绘画对普通人、对创作者、对艺术和设计从业者的影响,才会比较合理。
- 除《中国经营报》署名文章外,其他文章为作者独立观点,不代表中国经营网立场。
- 未经本网授权,任何单位及个人不得转载、摘编或以其他方式使用上述作品,违者将被追究法律责任。
- 凡本网注明“来源:中国经营网” 或 “来源:中国经营报-中国经营网”的所有作品,版权均属于中国经营网(本网另有声明的除外)。
- 如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行。
- 有关作品版权事宜请联系:15210887578 邮箱:banquan@cbnet.com.cn