每个边界框应该是(x0, y0, x1, y1)格式的归一化版本,其中(x0, y0)对应于边界框左上角的位置,(x1, y1)表示右下角的位置。有关归一化,请参阅概述。...每个边界框应该是(x0, y0, x1, y1)格式的归一化版本,其中(x0, y0)对应于边界框左上角的位置,(x1, y1)表示右下角的位置。有关归一化,请参阅概览。...每个边界框应该是(x0, y0, x1, y1)格式的归一化版本,其中(x0, y0)对应于边界框左上角的位置,(x1, y1)表示右下角的位置。有关归一化,请参阅概述。...它们是使用 faster-RCNN 模型从边界框中 ROI 池化的对象特征)
这些目前不是由 transformers 库提供的。...预训练的 LXMERT 模型期望这些空间特征是在 0 到 1 的范围内的归一化边界框
这些目前不是由 transformers 库提供的。