点击上方关注,AllinAI中国作者:KimberlyCook你是否在CloudNext'18会议主题演讲期间错过了AutoML公告和机器学习演示?在这篇文章中,我将概述所发布的AutoML产品以及在主题演讲中的演示。我还将分享关于构建演示过程的一些见解,以便你可以将它应用到自己的演示中。什么是AutoML?
AutoML目前有3种版本可供选择,所有这些版本都在下一个测试版中推出:愿景:构建根据数据集中的图像训练的图像分类模型,以便对图像中的云计算类型进行分类。自然语言:构建自定义文本分类模型,将句子和文本文档分类到自己的类别中。翻译:构建特定领域的翻译模型,以改进针对特定行业术语和语言细微差别的翻译。在主题演讲中,展示了AutoMLVision和NL的演示。
训练模型就像按下按钮一样简单:
评估模型并生成预测训练模型后,你可以查看一些常用的机器学习指标来评估其准确性。我最喜欢的是混淆矩阵,它显示了模型能够正确分类的测试集中的图像百分比。在理想情况下,可以在左上角看到一条强大的对角线,如下所示:
你可以单击任何方块以查看模型发现混淆的图像。接下来是最好的部分——对生成模型之前未见过的图像进行预测。你可能已经注意到LeafSnap数据集中的叶子图像非常均匀:它们都是在白色实验室背景下拍摄的。由于这是整个"世界"我们的模型都经过了训练,我们不应期望它能够很好地分类具有繁杂背景的树叶图像。
以下是你使用curl向自定义模型发出请求的方法:
AutoML自然语言演示来自Vision的相同数据集选择标准也适用于自然语言(NL)。我正在寻找一个特定于数据集,以至于你无法获取文本并通过CloudNLAPI的内容分类方法运行它(在很多情况下,这种方法非常好)。我还需要按数据集许可证进行过滤。
为了训练模型,你只需按一下按钮!请注意,训练自然语言(NL)模型的时间目前比演示要长得多。我发现自然语言(NL)模型大约需要3到4个小时的训练(完成后你会收到一封电子邮件)。评估模型并生成预测为了评估单标签自然语言(NL)模型的准确性,我们还可以查看混淆矩阵:
在这里,我们还看到左上角有一个醒目的对角线,这意味着我们的模型正确地对大部分测试数据进行了分类。现在是生成对文本输入预测的时候了,其模型以前没见过:在此示例中,我们的模型预测了正确的"实验室设备"类别,对此特定文本输入的置信度为98%:我的学生需要为我们的小丑鱼水产养殖项目提供水族馆照明。与AutoMLVision一样,我们可以访问自定义API端点以生成预测:
领取专属 10元无门槛券
私享最新 技术干货