您的位置
主页 > 国内新闻 » 正文

AI单凭文字就可作画,谁最先受到冲击?

来源:www.e-wanjie.com 点击:754

更精彩,敬请关注硅谷洞察官方网站(

马云曾说:“三十年后,《时代》杂志报道年度首席执行官可能是机器人。”

机器人CEO可能仍需要等待,但机器人画家已经在路上。

当谷歌的人工智能涂鸦时,微软的绘画AI已经学会了如何绘制鸟类。最近,微软宣布计划推出一款新的人工智能技术绘图机器人。用户只需要命名他想要绘制的对象,机器人就可以匹配相关材料。也就是说,将来,这幅画可以通过听写来完成。

人工智能系统可以简单地通过文本描述来创建图像。该技术在文本描述中搜索关键词,然后使用它来创建高质量的图像。据了解,这种聚焦技术使图像质量比以前更好。时报。

随着人工智能时代的到来,艺术与技术的碰撞在热门话题列表中越来越受欢迎。人工智能“观看和绘画”的技术展示了艺术表现的潜力,可以预见到对艺术创作的影响。但微软的绘画人工智能,在煽动智能机构的想象力方面,绝对不仅仅是对“艺术助手”的总结。

因此,AI口腔绘画不是一件小事!

1.什么是AI口腔绘画

人工智能口腔绘画似乎是一台接受人类指令来拍照的机器,但它远不止那么简单。聪明的相对论(WeChat id:aixdlun)明白,正如微软负责研发的深度学习技术的首席研究员何晓东所说,图像是从零开始逐点创建的人工智能。他解释了由人工智能创建的黄色鸟的图像,表明人工智能分析文本,然后通过称为GI(生成对抗网络),人工智能的技术将文本转换为图像。创造的黄色小鸟不一定在现实世界中,只是计算机的想象力。

通过从高维分布中采样,GAN生成具有与训练样本类似输出的新样本。这意味着如果生成的模型的训练数据是鸟的图像集,则训练后获得的模型也可以输出类似于鸟的合成图像。

研究人员表示,人工智能系统可以创建任何类型的图像,例如浮动双层巴士,放牧牲畜等,以及文本中缺少的一些细节,系统将完成图像本身。

GAN结构使用两个神经网络:一个是生成器,它试图根据输入数据生成更多真实世界的结果;另一个是鉴别器,它被设计用于正确区分哪些数据是真的。简单地说,发电机总是试图“欺骗”鉴别器。

生成器必须用随机输入的噪声数据重复合成有意义的内容,直到鉴别器不能区分合成内容的真实性。这组框架正在扩展,以适用于许多数据模型和任务。如模拟时间序列的特征;超分辨率图像;从二维图像恢复三维结构;小规模注释数据集的推广;预测视频的下一帧;生成自然语言对话内容;艺术风格迁移;语音和音乐合成。

值得一提的是,微软研究人员创造了他们所谓的引起关注的对抗网络或AttnGAN。 AttnGAN生成的图像质量比最佳GAN更接近。三次。这种以人为本的注重型对抗网络对人工智能世界产生了巨大的影响,这表明人类智能的发展有了质的突破。

2. AI根据文字绘画,也许是漫画领域最具影响力的

“观看和绘画”的AI在现实生活中会有什么用处?

让我们想象一下,将来可能会发生这样的对话。

“绘制机器人,请为我画一个花园。”

然后,一个美丽的花园跳上了纸。花园里有各种各样的鲜花,飞翔的蝴蝶,还有两个孩子在玩耍。

从文本到图像生成技术,有许多实际应用可以用作漫画家和室内设计师的草图助理,或作为照片美化工具。如果有更多的计算能力,这项技术可以生成基于电影脚本的动画电影,并进行一些重复和繁琐的手绘,如动画背景中的树,草,从而改善动画的工作电影制片人。

人工智能可以模仿甲壳虫乐队写歌,当然也可以模仿各种名画。想象一个没有任何绘画基础的编剧,但可以在互联网上发布自己的漫画,他的作品与当代着名漫画家的风格非常相似。在动画方面,如果开发了微软的绘图智能,它可以完全降低创意门槛。当然,这种替代的“漫画创作”也可能面临物质版权问题。

目前,微软的绘图AI仍有相对较大的提升空间。经过不断的改进,未来可能对漫画领域产生很大影响,甚至影响到室内空间设计行业。当然,它的主要作用是节省画家和设计师的人力和时间。可以预期的是,未来的电视将有一个由AI自我指导的动画。

3.想象力让AI与死亡事物不同

除了知道绘画人工智能可以作为一个更好的人类帮助者,我们为什么要注意人工智能绘画?也许关键是我们应该知道AI世界中“想象力”的重要性和期望指数。

想象力是指一个人基于现有图像在头脑中创建新图像的能力。例如,当我谈到牛奶时,你想到的图片可能是杯中的白色牛奶。这种想象力基于你生活中的经验。也就是说,想象力通常基于某种知识。已完成。

绘画机器人可以想象标题中没有包含的细节,因为它具有一点常识和想象力。当然,这取决于其大量的培训数据。

在鸟的情况下,机器人绘制的鸟通常站在树枝上,但文中没有提到细节。这是因为在数据库中提供给它的图像通常具有相似的内容。这意味着AI在掌握了某些知识后可以用它来形成自己的想象力。

目前,人工智能仅以小细节进行补充,下一步应该是尝试在更自主的图像描绘中完成突破。如果取得这一突破,就意味着人工智能模型在“想象力”方面进一步升级。这种区分AI和死者的能力终于打开了表演的帷幕。

人工智能本质上具有执行模拟人类智能的智能模拟的计算能力。第二步是模仿人类的感知,如机器识别、语音识别、语义分析等,所有这些都是这样做的。第三步是让人工智能有自己的“想象”和“思考”。

如果简单的感知不能自动输出,那么人工智能只不过是一个更灵活的传感器。

从这个逻辑的角度来看,微软人工智能“观看与绘画”不仅是商业应用的技术福祉,也是艺术与技术的碰撞。更重要的是,它应该打开人工智能世界中人工智能的想象。新时代。

微软的Bird的深远意义在于,我们可能离摆脱机器人的纯粹“计算”更近了一步。

更令人兴奋的是,请关注硅谷洞察官方网站。(

http://www.sugys.com/bdsa/P9Jag