0 引言
兜兜转转还是搞起了深度学习,图像处理。近来做了很多数据标注的工作,就像曾经面试的时候一个负责人说的那样,数据常常决定了学习结果的优劣,模型改进优化啥的,我们做工程的用的少。因此,标注了很多数据之后,有一些心得和感悟,还有一些小技巧和实验失败的地方,记录一下,希望以后不要再犯,因为我记忆力太差太差了。同时,希望与大家共勉。
1 数据采集部分
1)在数据采集的时候,一定要注意采集设备的稳定性,手持是非常不稳的。我们试过很多很多次,即使我们固定了手腕,也不能够避免人体本身的抖动。包括刚开始视角的调整。使用固定支架能够很好避免这些问题。
2)我们做的是红外采集,视频和图片同时写入本地时并不会影响整个采集过程的速度,再384*288大小图片背景下,我们写入视频和图片使用当前时间时分秒作为名称,结果显示,每100毫秒30帧频下,有两张图像采集偏差3毫秒。几乎无延迟。
3)采集对象一定要确定提前确定好,数据样本的偏差性,会导致目标检测的对象存在不同的识别精度。在采集的时候一定考虑特定对象的采集。我们采集的是运动过程中的车辆,前期由于为了数据量大,因此就一直采集,一直采集,没有考虑特定目标,比如摩托车数量很少,因此后期做了很多特定的采集工作,专门采集摩托车。
2. 数据标注部分
1)在数据标注部分,这是我们最需要注意的。遮挡对象是否要标注;
2)模糊对象是否要标注;
3)只有一半大小的对象是否要标注;
4)大目标包含小目标,大目标是否要标注;
5)标注时标签的确定;一定要提前确定好,不然会做很多重复功。
6)在自动标注部分,我们做了几个工作,首先使用YOLO V5做多目标检测的自动标注。(需要我们训练一部分之后,再用新weights去检测图像。这里出现最多的一个问题就是重复框问题,很奇怪的是我们已经在YOLO中使用了一定的IoU,然后使用NMS去掉了多余Anchors, 为什么同一个对象仍然有多个框,调节threshold也没有太多的用处,当然会有一定的效果,置信度变了之后框多框少异常。)
7)在单目标跟踪上面,我们使用了SiamRPN++做我们单目标跟踪的自动标注工具。
高铁上,写不动了,累了。祝大家晚安。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:目标检测–数据标注时的一些小技巧1(工作经验) - Python技术站