我正在尝试使用伯克利深度驱动数据集进行自动驾驶汽车图像分割的代码,我训练了模型,并在其上测试了图像,得到了张量格式(分割图像)的输出,但我需要图像格式的输出,我尝试了Image.fromarray
函数,得到了以下输出:
实际图片如下图所示:
我使用的模型来自这个git repo。
发布于 2021-05-19 11:19:24
对于我使用的tensorflow模型:
from PIL import Image
prediction = np.squeeze(prediction)
r = prediction * 255
im = Image.fromarray(r.astype('uint8'), 'L')
im = im.resize(original.size)
发布于 2021-05-19 11:33:20
如果我理解正确的话,你的张量是模型预测的结果,下划线模型是U-net
。如果是这样的话,这些张量应该表示分段掩码。如果用于预测的图像的大小为512x512
(取决于模型架构),则U-net
预测的张量大小将是k x 512 x 512
,即每个图像的k个分割掩码。您必须用较浅的颜色将这些蒙版覆盖在图像上,以查看预测图像是如何被模型分割的。因此,您需要访问用于预测的图像才能做到这一点。
由于您正在使用fast.ai apis,因此我建议您检查learner
对象的show_results
方法的代码,看看它们是如何呈现输出的。这应该是一个很好的起点。
https://stackoverflow.com/questions/67602071
复制