数据标注的注意事项(图片、语音、文本...)
图片
a.属性:拉框标注或语义分割时,其标注对象就是将图像中所需标注类别分别进行框选/分割标注,框选之后每个框都会有一个对应的类别
b.贴合度:在被遮挡的情况下,遮挡部分需要脑补,但是不要脑补到图像外
c.规则性:不遗漏框/打点数,不误标框/打点数,不多标框/打点数
d.勿漏标:若出现图像较模糊无法标注的则不标,也不漏标
文本
a.方式统一:同类标注属性,标注方式要保持一致
B.内容格式分类:在文字标注过程中,由于部分文字间隔近,若同页中有相同的元素,可以考虑隔行标注,避免标注都挤到一起
c.标签具体细节:标注标签的定义要细化到集体场景,前期主观性的标签要具象明确好详细的标签边界
d.避免漏标:同时标多个标签时,要避免漏标、错标、多标
语音
a.数据确认:确定是否包含有效语音;确定语音的噪声情况,确定说话人数量确定说话人性别、确定是否有口音、有效语音内容转写
b.无效数据:整句话无法分辨出内容的,标为无效,背景噪音过大的,标为无效
c.杂音辨析:在语音标注中,除了被采集者的声音外,还可能听到其他的背景音,在一般情况下,这些都可以被当作杂音进行处理
d.预留时间:要保证音频前后静音两秒,截取时间过长或过短都不符合标注规
e.工具使用:语音标注的过程中的最好是使用降噪耳机,如果耳机质量不高在标主过程中,会产生很多的杂音不利于标注,容易出错
3D
目标本身须全部被3D框包围,不漏点且不包含噪点若目标物体边界清晰,则3D框边界距离目标主体真实边界最多不能大于10cm
b.若行人若带有背包、雨伞等物件,行人的3D框需包含这些小物件
若行人距离过近时,行人框可能有一定程度的重叠可正常标注
若出现一些特殊辆时,如扫水车、水泥罐等,需要按照最大外接立方体的形状去标注出3D框:若出现一辆分成多个部分的情况,比如拖挂多节的卡、多截的公交等,需要将每一节体分别标注3D框
要注意三视图是否贴合;注意正前方方向是否正确所有地面上的目标物体其3D标注框底部须贴合地面,不能高于地面或低于地面
若目标物体距离过远导致目标所在区域点云稀少、没有地面点或者难以确定3D框下底面高度的情况时,可参考最近的地面点云线的高度和点云中距离最近的
e.3D框来确定大致高度点云框要按照车辆行驶方向标注且方向要正确
f.注意不遗漏框,不误标框,不多标框,残影和杂点不需要标注
g.注意框要求紧密贴合点云,不可漏标点,外围边界不然后呢超过清晰点云边界的10cm位置,标注准确率在99%以上
领取专属 10元无门槛券
私享最新 技术干货