1.YOLOv1详解
2.yolo5参数说明
YOLOv1详解
ä»ç®æ æ£æµä»»å¡ï¼Object Detection Taskï¼åå±æ¥çï¼ä¸»è¦æ两类æ¹æ³ãä¸ç±»æ¯R-CNNç³»ååå ¶ç±»ä¼¼ç®æ³ï¼ç§°ä¸ºtwo-stageï¼å°ç®æ æ£æµä»»å¡å为边çæ¡åå½åç©ä½å类两个模åãè½ç¶æ¨¡ååé¢å¤§éçæåç¹å¾ä»¥ååéæ¡çéåé½æ¯å个ç½ç»å®æï¼ä½åå½åå类任å¡æ¯ç«è¿æ¯åå¼çï¼åå¼è®ç»é æç½ç»è¾é¾æ¶æï¼ä¸é¢æµæ¶éåº¦æ ¢ï¼ä½å确度è¾é«ãå¦ä¸ç±»æ¯æ¬ææ述以ååé¢ä¼æ´æ°æ¢ä»£çYOLOç®æ³ï¼ç§°ä¸ºone-stageï¼å°ç®æ æ£æµä»»å¡å纯çååå½ä»»å¡ãYOLOv1使ç¨ç«¯å°ç«¯çç½ç»è®ç»æ¨¡åï¼é度快ï¼ä½å确度ç¸å¯¹ä½äºï¼ä¸»è¦ç¨äºå®æ¶æ£æµï¼ä¾å¦è§é¢ç®æ æ£æµã
ç±äºYOLOv1æ¯ç«¯å°ç«¯è¿è¡è®ç»ï¼å æ¤YOLOv1åªæä¸æ¡åä¸çç½ç»åæ¯ãYOLOv1è¾å ¥ä¸º çå¾åï¼ç»è¿ä¸ä¸ªä¿®æ¹çGoogLeNetç½ç»ï¼ç½ç»å°åºä»ä¹æ ·çå ¶å®ä¸ç¨ç®¡ï¼åªè¦ç¥éæ¯ä¸å å·ç§¯åæ± åçå å å³å¯ï¼ï¼åé¢æ¥ä¸äºå ¨è¿æ¥å±ï¼åæ ·æ æè°æ¥ä»ä¹å ¨è¿æ¥å±ï¼çä¸åæ°æè æºç å°±ç´æ¥æäºï¼ï¼æåæ¥å°ä¸ä¸ª çå ¨è¿æ¥å±ï¼ç´æ¥reshape为 ï¼è¿éreshapeæè¿æ ·æ¯ææå¾çï¼å ·ä½åè§ä¸é¢é¨åï¼ã
YOLOv1å°ä¸å¼ å¾åï¼ä¾å¦ ï¼åå为 个ç½æ ¼ï¼YOLOv1ä¸ ï¼å¦ä¸å¾æ示ï¼ï¼ä¸å ± 个ç½æ ¼ã
æ失å½æ°æå¤ä¸ªé¨åï¼æ们ç°å¨æå®ä»¬åå¼æ¥è¯´ï¼åé¢ç´æ¥æ¨ä¸ªå èµ·æ¥å³å¯ã
第ä¸é¨åå¦ä¸æ示ï¼è®¡ç®é¢æµè¾¹çæ¡åGTæ¡ä¸å¿ç¹ä¹é´çå·®è·ãå ¶ä¸ è¡¨ç¤ºç¬¬ 个ç½æ ¼ç第 个边çæ¡æ¯å¦è´è´£ä¸ä¸ªç©ä½ï¼æ¯ä¸º1ï¼ä¸æ¯ä¸º0ã
第äºé¨å类似第ä¸é¨åï¼ä¸»è¦è®¡ç®é¢æµå®½é«åGT宽é«æ失ãè¿éå ä¸æ ¹å·è¡¨ç¤ºå¤§è¾¹çæ¡å°åå·®åºè¯¥æ¯å°è¾¹çæ¡å°åå·®æ´éè¦ã
第ä¸é¨å计ç®å¯¹äºæ¯ä¸ªè¾¹çæ¡ç置信度åæ°ä¸é¢æµç置信度åæ°ä¹é´å·®è·ã 表示置信度åæ°ï¼ 表示é¢æµçè¾¹çæ¡å对åºGTæ¡çIoUã
æåä¸é¨å计ç®ç±»æ¦çæå¤±ï¼ è¡¨ç¤ºå½ç½æ ¼ä¸æ²¡æç©ä½æ¶ä¸æ©ç½ã
å ¶ä¸ï¼ ï¼ ã
论æåæï¼ /hackernoon/understanding-yolo-f5abbc
NMSåèï¼ /presentation/d/1aeRvtKGKHdD5lg6Hgyhx5rPq_ZOsGjG5rJ1HP7BbA/pub?start=false&loop=false&delayms=#slide=id.p
yolo5参数说明
在尝试使用yolo5进行图像识别时,我最初主要依赖GitHub上的hpc案例,但对加载模型时的某些参数感到困惑。为了解答疑问,我直接查看了yolo训练模型的cetrainer源码源代码,从而揭示了这些参数的加密解密算法源码含义。
首先,conf_thres,即置信度阈值,它决定推理结果的显示条件。当预测概率超过此阈值时,才会显示结果。这个阈值的杰齐小说源码设定直接影响了识别的精度和召回率。
其次,iou_thres是交并比阈值,用于衡量预测框与真实框的重叠程度。阈值增大时,c 系统框架源码可能导致对同一物体的多个预测被视为多个物体,反之,阈值减小时,可能会合并多个不同的如何导出网页源码物体预测为一个。这个参数影响了检测的精确性和完整性。
max_det则控制每个类别允许的最大检测数量,如果设置为1,意味着只保留预测概率最高的一个结果。这对于避免重复检测非常关键。
最后,agnostic_nms是关于类别无关NMS(Non-Maximum Suppression)的选择。默认情况下为false,即进行类别相关的NMS。如果设为true,会在不同类别间进行NMS,避免了如足球和排球这类相似物体的混淆,只保留最匹配的预测框。