๐ ๊ณต๋ถํ๋ ์ง์ง์ํ์นด๋ ์ฒ์์ด์ง?
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_7_Object Detection 2 ๋ณธ๋ฌธ
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_7_Object Detection 2
์ง์ง์ํ์นด 2022. 1. 27. 15:18220127 ์์ฑ
<๋ณธ ๋ธ๋ก๊ทธ๋ DEEPNOID ์ํฌ์ธํธ๋ ์จ์ ์ฐธ๊ณ ํด์ ๊ณต๋ถํ๋ฉฐ ์์ฑํ์์ต๋๋ค>
์ธ๊ณต์ง๋ฅ | Deepnoid
DEEPNOID๋ ์ธ๊ณต์ง๋ฅ์ ํตํ ์ธ๋ฅ์ ๊ฑด๊ฐ๊ณผ ์ถ์ ์ง ํฅ์์ ๊ธฐ์ ์ด๋ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ๋ฅ๋ ธ์ด๋๊ฐ ๊ฟ๊พธ๋ ์ธ์์, ์๋ฃ ์ธ๊ณต์ง๋ฅ์ด ์ง๊ธ๋ณด๋ค ํจ์ฌ ๋์ ๋ฒ์์ ์งํ์ ์ฐ๊ตฌ, ์ง๋จ, ์น๋ฃ์ ๋์
www.deepnoid.com
1. Classification
1) Classification
: feature Extractor -> classifier
2) Object Detection
3) Instance Segmentation
: Semantic VS Instance Segmentation
: input -> pixelwise classification -> probability map -> threshold
2. One stage VS Multi Stage Detection
1) One stage
Feature Extraction -> Region proposal -> Classifiction -> Box Regression -> semantic, Instance Segmentation
2) YOLO, SSD
Feature Extraction -> Classifiction -> Box Regression
=> Yolo๋ 7x7 grid ํ๋
=> SSD๋ ์ ์ฒด ์ด๋ฏธ์ง๋ฅผ 38x38, 19x19, 10x10, 5x5, 3x3, 1x1์ ๊ทธ๋ฆฌ๋๋ก ๋๋๊ณ output๊ณผ ์ฐ๊ฒฐ
3. Comparision
- Multi Stage
: Backbone Network ๋ก ์ถ์ถํ Feature ๋ฅผ ๊ฐ๊ฐ์ ๋ชฉ์ ์ ๋ง๋ ์์ ์ ๊ฒฝ๋ง์ผ๋ก class scoring, box coordinate ๋ฐ๋ก ํ๋
: Object ๊ฒ์ถ ์ฑ๋ฅ, class ๋ถ๋ฅ ๋ฐ์ด๋จ
- One Stage
: Backbone Network ๋ก ์ถ์ถํ Feature ๋ฅผ ๊ฐ๊ฐ์ ๋ชฉ์ ์ ๋ง๋ ์์ ์ ๊ฒฝ๋ง์ผ๋ก class scoring, box coordinate ํ๋ฒ์ ํ๋
: Object ๊ฒ์ถ ์ฑ๋ฅ, class ๋ถ๋ฅ ์๋์ ์ผ๋ก ๋จ์ด์ง
4. YOLO, You Only Look Once
- yolo v1
: Localization, Classification ์ ํ๋์ Regression problem ์ผ๋ก ํด์
: MMS๋ก ๊ฐ ROI์ Box ๋ฅผ ์ค๋ณต ์ ๊ฑฐ ํ ํ์ฒ๋ฆฌ๋ฅผ ํตํ score ํ๋
: ๊ฐ Grid ๋ณ๋ก obejct class probablity ๋ฅผ ๊ณ์ฐ
: ์ฐพ์๋ธ Box ๋ค์ ์ค์ฌ์ ์ขํ, ๋๋ฎ์ด, class socre์ ํตํด ground truth์ prediction ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ๋๋ก ์์ค ํจ์ ๊ตฌ์ฑํ๊ณ ์ด๋ฅผ minimize
: ์์คํจ์๋ sum of squared error, ์ค์ฐจ ์ ๊ณฑํฉ(SSE) ์ด์ฉ
: BOX์ object ์์ผ๋ฉด confidence ๊ฐ 0์ด ๋๋๋ก penalty ๋ถ์ฌ!
- yolo v2
: Batch Normalization, ๋ชจ๋ conv layer ๋ค์ BN ๊ฒฐํฉ, ๋ณ๋์ Regularizer ๋ค ์ ๊ฑฐ
: High Resolution Classifier, feature mpa ์ grid ๋ก ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๊ณ ํด์๋ ํผ์ฒ๋งต ํ๋
: ์ ๋ ฅ ์ด๋ฏธ์ง๋ฅผ 416*416 ๋ก ํ๋ค
-> object ์ค์ฌ์ ์ gird ์์์ ์ ์ฐพ์๋ด๊ธฐ ์ฐํด
-> ๋๋ถ๋ถ ๋ฐ์ดํฐ๋ ์์์ ์ค์์ object ์์น
: Convolution with Anchor Box
: Dimension Clustering
: Object Detection Task ์์ Recall ์๋ฏธ
-> ์ค์ obejct์ ์์น๋ฅผ ์์ธกํ ๋น์จ์ด ๋์ ์๋ฏธ
: Fine-Grained Feature
-> ์ต์ข feature map ํฌ๊ธฐ 13*13์ ํฐ obejct ๊ฒ์ถ์ ์ถฉ๋ถํ์ง๋ง ์์ object ๊ฒ์ถ์ ๋ถ์ถฉ๋ถ
-> 26*26*512 => 13*13*2048 => stacking => 13*13*3072
: VGGNet ์ 3*3 filter ์ฌ์ฉ
- yolo v3
: feature pyramid Network
- yolo v4
: ๋์ ์ ํ๋์ ๋น ๋ฅธ Detectin ์๋ ํ๋ณด
5. Single-shot Detector
: ์์ object ์ ํํ๊ฒ ๊ฒ์ถ
: ๋ค์ํ scale์ feature map์ ํ๋ํ๊ธฐ ์ํด ๋ณด์กฐ ์ ๊ฒฝ๋ง ์ฌ์ฉ
: ์๋ก ๋ค๋ฅธ scale์ feature map ๋ณ๋ก ๊ฐ๊ฐ ๋ค๋ฅธ ํํ anchor box ์ฌ์ฉ
: YOLO v1 ๋จ์ ์ ์ต์ข feature map ๋ง์ผ๋ก grid ๊ตฌ์ฑํด์ ์ฌ์ฉ
'๐ฉโ๐ป ์ธ๊ณต์ง๋ฅ (ML & DL) > ML & DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Deep Learning]_1_๋จธ์ ๋ฌ๋ ์ํ (0) | 2022.01.28 |
---|---|
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_8_Reinforcement Learning (0) | 2022.01.27 |
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_6_Segmentation 1. U-Net, attention (0) | 2022.01.26 |
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_5_Detection 1. RCNN (0) | 2022.01.26 |
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_4_Classifcation 2. MobileNet & EfficientNet (0) | 2022.01.26 |