微软AI人工智慧让设计师也失业用文字叙述就能凭空画出一张图
【科幻直通车】请关注本企鹅号,好玩的科学科技科幻消息随时从外星直接发过来!
若能让电脑更容易理解人类自然话语诠释内容,意味将可推动更自然的人机互动体验,例如让数位助理服务能进一步理解使用者需求,并且做出正确判断,或许就能让人工智慧能具体协助使用者实际所需服务。
微软稍早展示旗下人工智慧技术,显示已经能从纯粹的文字叙述「画」出实际图像内容。
“这些鸟可能不存在于现实世界中 - 它们只是我们计算机对鸟类想象力的一个方面。
人工智能训练使用数以千计的配对照片和文字说明的数据集,使其能够学习特定的单词如何与特定的图像匹配。
根据微软研究人员表示,目前所研发的人工智慧已经足以就单纯文字描述内容,从无到有地建构一组影像。从此次举例内容「具有黑色双翅与短喙的黄鸟(yellow bird with black wings and a short beak)」来看,电脑系统便藉由人工智慧理解语意,进而从一个画素、一个画素建构出符合文字描绘的影像内容。
在此之前,微软便曾利用电脑视觉与自然语意识别技术,让电脑能依据影像情境自动生成合适标语,接着则是透过SeeingAI技术,使得电脑能协助盲人「看见」眼前景象。而此次展示技术则是以反向模式运作,透过让人工智慧理解语意,进而建构电脑理解后所能呈现影像。
若能让电脑更容易理解人类自然话语诠释内容,意味将可推动更自然的人机互动体验,例如让数位助理服务能进一步理解使用者需求,并且做出正确判断,或许就能让人工智慧能具体协助使用者实际所需服务。例如此类应用将可套用在自动驾驶技术,让自动驾驶车辆能容易分析前方路况,以及可能发生事项,借此让电脑能进一步协助使用者避免意外发生。
微软声称,机器人为其图像添加了细节,但未包括在其说明中,显示人工智能具有“人造的想象力”。在这个生成的图像中(右上角),机器人被告知要用“香蕉和猕猴桃”画一个水果摊,但是他自己增加了额外的水果
人工智能训练使用数以千计的配对照片和文字说明的数据集,使其能够了解特定的单词如何与特定的图像相匹配。如果文本内容是“鸟嘴短小的红色和白色的鸟”(如图),软件会使用鸟类图片的知识来绘制图像。
在绘制鸟的图像时,即使没有在指令中指定,机器人通常也会添加一个分支。
这是因为许多训练图像中的鸟类栖息在树枝上。
根据最近的一篇尚未经过科学评论的研究报告,与微软以前的技术相比,机器人的图像质量提高了三倍。
领取专属 10元无门槛券
私享最新 技术干货