微软人工智能新技术；根据文本内容凭空绘制图像

文章来源：企鹅号 - 环球智能首页-人工智能

微软推出一款全新的人工智能技术，它是一种“自动绘图机器人”。这款机器人可以通过文本的文字来描述创建图像，同时也可以自动为那些不包含文本的图像添加细节。这表明人工智能技术本身也能拥有一定的想象力。

“如果你去必应搜索，你会看到鸟类的图片。但是在这里，所有图片都是通过电脑创建，是一个一个像素组成的。”微软在华盛顿雷德蒙德实验室深度学习技术首席研究员、研究经历Xiaodong He表示。“这些鸟儿可能并不存在于现实世界，它们只是电脑通过鸟类的特质，想象出来的画面。”

研究人员表示，这种绘图机器人能够产生各种各样的图像，包括普通的田园场景，从牲畜放牧到荒唐的“海面漂浮巴士”。

微软表示，这种机器人能够通过大量的图片和文字说明的数据基础上进行训练，它能够理解如何将文字与图像匹配起来。当它学会了画一只鸟，例如当标题是一只鸟的时候，就会自动学会如何绘制一张鸟的图片。

“这是我们相信机器学习具有真正学习能力的根本原因。”他说。

绘图机器人的技术通过两个机器学习模型组成，一个是通过文本描述生成图像，另外一个就是使用文本描述来判断所生成图像的真实性。前者试图从后者中获得虚假的图片，但后者负责确定真实性。两者结合在一起，创造出更高质量的图像。

特别，它还善于从更复杂的语句中提取图像。比如当其他技术可以从标题中画出“鸟”的标题时，例如如果你告诉它要画一只绿冠、黄翅膀和红腹的鸟，它的质量就会下降。在此之前，微软解释说，这种技术会生成一种模糊的“绿黄红鸟”。

特别有趣的是，当没有提到具体细节时，机器人如何能填补空白就非常有趣了。基本上，由于它的训练数据，它具有一些自己的常识和想象力。在鸟的例子中，机器人通常会在树枝上画一只鸟，即使它没有在文本中说明，因为最初喂食的图像通常也会显示出类似的画面。

微软还指出，与之前的技术相比，这款新机器人的图像质量提升了近三倍。当然，这并不是第一个将人工智能与艺术结合起来的例子。

两者的交集有时会带来惊人的结果，比如谷歌的人工智能画出了那些有自己艺术表现的机器生成的图像。谷歌也有一个神经网络，可以猜测你正在画的是什么，以及一个自动绘图机器人，并定期详细地描述机器学习在帮助绘画方面所做的研究。

其实Facebook一直也致力于研发神经网络，制作一些像飞机、汽车和动物这样的小图片，甚至在照片中创建你自己的图像化身。

英伟达的研究人员用人工智能创造了电脑生成的名人。从其他方面来说，这一领域最近也取得了一系列巨大的进步。

对于微软来说，教一个机器人从文本中提取图像，完成了它在计算机视觉和自然语言处理领域所做的其他工作的循环。

这包括CaptionBot公司的开发成果，它可以自动为照片标注说明，还有一种技术，可以回答人们关于图像的问题，比如物体的位置或属性，这对盲人来说有很大的帮助。

对于人工智能技术在现实世界中所能提供的服务，微软有独特一些想法。它表明，这款机器人可以充当画家或室内设计师的草图绘制助手，也可以作为语音激活照片优化的工具。

在未来的发展趋势上，随着计算能力的提高，这项技术可能会从电影剧本中生成动画电影，以减少动画师今天需要的体力劳动。

但这项技术暂时还尚未实现。

如果你仔细观察这些图像，它们几乎总会有一些瑕疵，表明它们是由机器创造的，而不是人类。比如带有蓝色喙的鸟，或者是带有奇怪形状的香蕉的水果。

不过微软表示，凭借其3倍的改进，这款机器人代表了某种程度上的人工智能技术发展里程碑。

相关快讯