0%

yolo学习

yolo

  • 链接

    知识点

  • recall的意思是图中有多个物体的情况下,检测出来几个,是不是都检测到了,与单个物体的检测精度一定程度上是矛盾的
  • 如何计算map值?
    • picture 1
    • picture 2
    • TP是真阳,FP是假阳,FN是假阴,TN是真阴
    • precision是准确性,就是真阳性和假阳性中的真阳性比例
    • recall是召回率,就是真阳性和假阴性中的真阳性比重,就是所有目标中到底有多大比例是正确的找到了的
    • map值就是以精度和召回率为横纵坐标,取precision最大值之后画的图与坐标轴围成的面积
      • picture 3
    • 各种框(anchor box等)的介绍
    • 此处的anchor框是在最终13*13的特征图中的初始框的位置和大小,需要先调整成正确的框,然后按照比例换算回原来的图片中的框picture 4

      YOLO V3 针对不同大小的物体的改进

  • picture 5
    • 利用不同感受野的卷积分别预测不同大小的目标物体
    • 三种不同大小的特征图分别对应三种不同的框,做到九种不同的形状
  • 此处的2626的图的特征是1313的图进行插值得到26*26然后融合得到的
    • picture 6
  • 残差链接:
    • picture 7
    • 实际上就是对于中间的两层, 假如加上这两层的效果变好了,那么会使得这两层具有正常的参数。但是假如加上这两层效果反而变差了,那么这两层的参数会逐渐趋向于0,使得这两层失去价值,最终结果不可能比原来差
    • yolo V3不需要池化层,通过stride增加为2将其特征图缩小
  • 网络的输出类型
    • picture 8