top of page
女農民收割水稻

學習

Weekend Market
YOLO

YOLO(You Only Look Once)

是一種物件偵測模型。

YOLO模型將輸入圖像分成一個固定數量的網格單元,並為每個為每個點標註邊界框(bounding box)與對應的類別機率。

右圖為YOLO模型架構圖

螢幕擷取畫面 2024-06-05 144542.png
IMG_170406_040409_0253_RGB3.JPG
YOLOv7 /YOLOv9

YOLOv7改進特色

  • 以CSPDarknet53作為主幹網絡:提升特徵提取能力和訓練速度。

  • 採用ELAN和改進版的E-ELAN架構

    • 深層的網絡能有效學習及收斂


YOLOv9改進特色

  • 結合PGI和GELAN,解決深度學習中的資料丟失和資訊瓶頸問題。

左圖為YOLOv9模型實際標註出的圖片

 CLAHE
(限制對比度自適應直方圖均衡化)

將影像分為小區域並獨立進行對比調整,增強亮度變化小區域的特徵

​右圖為CLAHE算法原理

stepsCLAHE.png
螢幕擷取畫面 2024-11-26 143523.png
螢幕擷取畫面 2024-11-26 143523.png
CBAM

注意力機制,能使模型選擇關注特定部分特徵

CBAM的兩大核心模塊:

Channel : 增強通道特徵表示

Spatial : 提取不同位置的關鍵訊息

​左圖為CBAM架構圖

本研究模型
架構

以yolov9-c模型架構為基底,加入七層CBAM做修改,如右圖

S__41320468.jpg
image.png
image.png
F-measure

F值(F-measure)是一種衡量算法精度的常用指標。

 

在辨識和偵測算法中,

綜合考量精確率(precision)

和召回率(recall),提供平衡的精度評估

右圖為

F-measure下的精確率、召回率、

F1 Score的計算公式
及本研究評估指標公式

bottom of page