用了7秒,人工智能给我画了一棵赛博朋克桂花树!火出圈的AI绘画你玩过吗?

橙柿互动
2022-09-20 19:10:06

如果最近你有朋友在社交媒体上狂炫各种画作,画风时而赛博朋克,时而莫奈、梵高,千万不要以为他是下了血本拜师学艺。

大概率他只是动了动手,输入了几个词。剩下的,都交由AI来完成。

没错,人工智能又整新活了:AI绘画,能将文字描述快速变成画作。

前阵子流行国外版本,像是Disco Diffusion、DALL·E 2、Midjourney等。最近,一批国内版本正在内测、公测或者赶来的路上,Tiamat、盗梦师、无界AI、文心·一格……

泰迪熊在月球上搞科研、山顶洞人集体玩自拍,无论你给的文本描述多脑洞大开,AI都能“使命必达”;而你抢的节日微信红包封面、公众号题图、网络小说封面,甚至是漫画本身,眼下也都可能是AI画作。

这个时候,《2021太空漫游》作者亚瑟·克拉克那句被后人反复提及的话,又可以隆重登场了:“任何足够先进的科技,都与魔法无异。” 

56.gif

各种AI画作

AI拿起了画笔

“这个有三体的味道了,漂亮!你用了什么关键词?”

“玩了三天,我感觉有点找到能和AI合作的语言了。膨胀了膨胀了。”

“我要生成图给家里搞点装饰,看能不能把家设计成赛博朋克风格。”

……

这是一个两周前建起来的AI绘画交流群,从早到晚,400多位群成员轮番往里扔图,俨然一个大型“斗图”现场。刘秋杉时不时现身,点评或者给点修改意见,也会分享自己的新作连带关键词。他是畅销书《元宇宙:通往无限游戏之路》的作者,也是数字版权登记和拍卖平台“无界版图”首席研究员。半个多月前,无界版图上线AI绘画工具“无界AI”。

在人工智能发展的时间线上,训练AI画画算不上一件新鲜事,早在2015年谷歌就曾推出Deep Dream,浅试了一下AI的艺术创作能力。不过今年,国内外最新这一批AI绘画工具的出圈,除了技术层面的飞跃突破,还有个重要原因:生成图片所带来的视觉冲击。

刘秋杉至今还记得3月初次使用国外AI绘画工具Disco Diffusion出图时的感觉:“色彩瑰丽,强有力的视觉冲击,有点震撼。”

4544.jpeg

刘秋杉的首张AI画作《Web3大写意——在黎明之前》

同样为AI绘画呈现效果感到兴奋和着迷的,还有西湖大学特聘研究员、计算机科学与技术深度学习实验室负责人蓝振忠博士。就在9月初,西湖心辰联合西湖大学发布AI绘画小程序“盗梦师”,已能达到六七秒钟出图的速度。

让AI画一张图,一般只需三个步骤:输入关键词,选择风格、尺寸,点击生成图片,几分钟甚至是几秒后就可以收图了。初次体验不知道用什么文字,可以参考输入框下方的关键词示例;高阶玩家则可以点开自定义选项,设置更多参数。

在盗梦师、无界AI以及百度前不久上线的“文心·一格”,我分别用关键词“一棵桂花树”进行尝试,风格、尺寸选择最为省心的“智能推荐”。AI立马送了我三棵画风迥异的桂花树,有赛博朋克风,也有写实画和水墨画。

微信图片_20220920165707.jpg

22.jpg

334.png

556.jpg

不同AI画的各种风格桂花树

玩多了你就会发现,同样的关键词输入,AI每次出的图都不会相同,且画作水平很大程度上取决于使用方式。通常来说,输入的文本,修饰词越准确、细节描述越多,生成的画作就越接近你的理想型。比如,输入“中国古代公主 蒸汽朋克面具 优雅 8K 蓝色配色方案 大头照 高度详细”,要比“古代公主”四个字,更能生成令人满意的画作。

但过多的词语组合,又可能让AI不知所措,甚至变成“人工智障”,所以还需要一个“度”的摸索。 

“新时代艺术的先进生产力”

不管是无界AI,还是盗梦师、文心·一格,从本质上讲,它们都是将文本处理成可视化信息的工具。人工智能当然不知道莫奈、梵高是谁,也不会清楚《蒙娜丽莎》《富春山居图》的意义和价值,更不会懂绘画中的透视规律,但它们都被提前“喂”了海量的图片。

其中的关键,是如何将文本和图像联系起来。“一块是训练AI,让它明白人类语言长什么样;另一块是通过大量学习,使得AI了解图像长什么样。然后,语言转化为图像。”蓝振忠尝试用浅显的语言,来解释背后的逻辑。

在AI眼中,每个画面上的点和每一个文字都被视作矢量数据。算法可以通过一轮轮比对,去掉不符合文字描述的点,以此打通文本和图像。

那么,新生成的图片,是不是由预存的训练数据简单拼凑而成?还真不是。AI会以多种维度记录并学习图像的特征。当你输入文本时,AI会从中提取所描述的各种维度,并在这些维度的交集中生成图像。

“它可以帮我们把想象的东西呈现出来。”蓝振忠在谈及AI绘画时,始终带着兴奋的语气。“发展速度非常快,年初生成一张画可能还要1小时左右,而现在已经可以缩短到几秒。几周就迭代若干次,或许不用多久就可以用于视频制作。”

66.jpg

“盗梦师”生成的画作

“从文本到图片,再到动画、视频、3D,最终到空间交互,估计未来几个月里会疯狂落地,并集成在海内外的产品中。”刘秋杉这样认为。他还将这些AI绘画工具称为“新时代艺术的先进生产力”,能辅助人类创作,成为素材、灵感、底稿,“人在此基础上进行二次创作。”

AI绘画也在普通人面前铺开了一张空白画纸,用文字的想象来获取图像成果。当“绘画”能像“自拍”一样,日常用于社交平台交流分享,它将同时带上社交性。网络写手和菜头,早两个月开始就拿各种AI绘画工具给自己的公众号做题图。百度的文心·一格,还在出图界面设置了一些应用场景举例,像是马克杯、T恤,一键就能生成预览。

99.png

此外,国内外一些科技公司正在尝试这样一种模式:不仅向用户提供AI绘画工具,而且给他们出售自己作品的机会。“有同事在小红书分享自己的一张AI画作,一位网文创作者想拿来当新书封面。画作在无界版图上架,网文作者花200元购买使用权,整个过程有区块链保驾护航。”在刘秋杉看来,如同前几年爆发的短视频,AI绘画很快能带来新一轮创作者经济。

会让人类画师失业吗?

随着技术越来越成熟,AI绘画出圈的同时,人们也越发认真地探讨由它带来的一些问题。AI画作是艺术作品吗?版权怎么算?它会跟人类画师抢饭碗吗?

上个月,在美国科罗拉多州博览会举办的美术比赛中,主办方将其中一个数字艺术奖项颁给了名为《太空歌剧院》的画作。它大部分由AI完成,艺术家做的是多次修改关键词,并用图像编辑软件进一步调整。

1122.jpg

上个月在美国,一项数字艺术奖颁给了这幅AI作品。

这个结果在网上引发巨大争议——反对者提出用AI创作的作品参赛对他人不公平,在国内还上了微博热搜。这是一个更为开放的讨论,关于AI画作到底是不是艺术作品,绘画、艺术又到底是什么。在可预见的未来,它仍将继续。

另一个重要问题就是版权,目前而言这似乎是一个灰色地带。

眼下,提供AI绘画工具的平台,一般会在服务协议中写明作品归属。有的规定输入关键词的人享有生成图片的版权,也有的是平台和用户共同拥有版权。盗梦师和无界AI都属于前者。

新的问题来了:AI背后的训练集是海量图片,其中不乏艺术大咖作品。如果有人把某位知名艺术家的画作全部“喂”给AI,生成的同类画作用来卖钱,这怎么算?

围绕“AI绘画是否会让人类艺术家、插画师失业”,“会”和“不会”的论战同样激烈。

在刘秋杉看来,对艺术家来说,AI绘画仅仅是另一种工具,可作为最初的灵感来源和视觉参考。“像是专业肖像画师,用工具反而更有优势。他可以用专业术语、参数,比如五官比例来设置关键词。这是普通人所没有掌握的。”

而蓝振忠的答案是:会。“工具都有两面性。AI能帮助人节约大量重复无意义的劳动,提高工作效率,只会重复性工作的‘工具人’将会被淘汰。未来,人类更需要用脑,跟AI协同工作,人智共创。

最后是AI面临的伦理问题。前车之鉴是已限制使用的Deepfakes,它能替换视频中视觉和音频内容,而被用于假新闻、伪造名人色情视频等。此外,在AI的图像学习阶段,不可避免会吸纳人对于性别、职业等的刻板印象和偏见,并体现在生成的画作中。

蓝振忠表示,现阶段,AI绘画工具开发者们的做法是:以更谨慎、更长的内测期,调试图像文本描述的过滤器等方式,来应对这些可能存在的负面影响。

↓↓↓

橙柿互动×无界版图AI绘画创作大赛,正在进行中,最高奖为1888元,还有获奖画作制成的艺术版画、AI创作礼包等丰富奖品。

发挥想象力,让人工智能为你画桂花!AI绘画创作大赛启动,1888元大奖等你拿

去参赛


橙柿互动记者 童蔚

热门评论

橙柿互动,互动城市

打开App