top of page
學習
Weekend Market
YOLO
YOLO(You Only Look Once)
是一種物件偵測模型。
YOLO模型將輸入圖像分成一個固定數量的網格單元,並為每個為每個點標註邊界框(bounding box)與對應的類別機率。
右圖為YOLO模型架構圖
YOLOv7 /YOLOv9
YOLOv7改進特色
-
以CSPDarknet53作為主幹網絡:提升特徵提取能力和訓練速度。
-
採用ELAN和改進版的E-ELAN架構
-
深層的網絡能有效學習及收斂
-
YOLOv9改進特色
-
結合PGI和GELAN,解決深度學習中的資料丟失和資訊瓶頸問題。
左圖為YOLOv9模型實際標註出的圖片
CLAHE
(限制對比度自適應直方圖均衡化)
將影像分為小區域並獨立進行對比調整,增強亮度變化小區域的特徵
右圖為CLAHE算法原理
CBAM
注意力機制,能使模型選擇關注特定部分特徵
CBAM的兩大核心模塊:
Channel : 增強通道特徵表示
Spatial : 提取不同位置的關鍵訊息
左圖為CBAM架構圖
本研究模型
總架構圖
以yolov9-c模型架構為基底,加入七層CBAM做修改,如右圖
F-measure
F值(F-measure)是一種衡量算法精度的常用指標。
在辨識和偵測算法中,
綜合考量精確率(precision)
和召回率(recall),提供平衡的精度評估
右圖為
F-measure下的精確率、召回率、
F1 Score的計算公式
及本研究評估指標公式
bottom of page