๐ ๊ณต๋ถํ๋ ์ง์ง์ํ์นด๋ ์ฒ์์ด์ง?
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_5_Detection 1. RCNN ๋ณธ๋ฌธ
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_5_Detection 1. RCNN
์ง์ง์ํ์นด 2022. 1. 26. 11:51220126 ์์ฑ
<๋ณธ ๋ธ๋ก๊ทธ๋ DEEPNOID ์ํฌ์ธํธ๋ ์จ์ ์ฐธ๊ณ ํด์ ๊ณต๋ถํ๋ฉฐ ์์ฑํ์์ต๋๋ค>
์ธ๊ณต์ง๋ฅ | Deepnoid
DEEPNOID๋ ์ธ๊ณต์ง๋ฅ์ ํตํ ์ธ๋ฅ์ ๊ฑด๊ฐ๊ณผ ์ถ์ ์ง ํฅ์์ ๊ธฐ์ ์ด๋ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ๋ฅ๋ ธ์ด๋๊ฐ ๊ฟ๊พธ๋ ์ธ์์, ์๋ฃ ์ธ๊ณต์ง๋ฅ์ด ์ง๊ธ๋ณด๋ค ํจ์ฌ ๋์ ๋ฒ์์ ์งํ์ ์ฐ๊ตฌ, ์ง๋จ, ์น๋ฃ์ ๋์
www.deepnoid.com
1. Image recognition
- Classification : ์ด๋ฏธ์ง๋ฅผ ํตํด ๋ฌผ์ฒด ํ๋ณ
- Detection : ๋ฌผ์ฒด๊ฐ ์๋ ์์น๋ฅผ ์ฐพ์ ๋ฌผ์ฒด์ ๋ํด boxing
- Segmentation : ์ด๋ฏธ์ง๋ฅผ ํฝ์ ๋จ์๋ก ๊ตฌ๋ถํ์ฌ ๊ฐ ํฝ์ ์ด ์ด๋ค ๋ฌผ์ฒด์ธ์ง ๊ตฌ๋ถ
2. Objection Detection
: ์์ ๋ด์ ์กด์ฌํ๋ ๋ชจ๋ ์นดํ ๊ณ ๋ฆฌ์ ๋ํด์ classification ๊ณผ localization
Objection Detection = Multi-Labeled Classification + Bounding Box Regression ( Localization )
3. Precision-Recall
: ๋ฌผ์ฒด๋ฅผ ๊ฒ์ถํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ ํ๊ฐ
- AP : ์ธ์ ์๊ณ ๋ฆฌ์ฆ์ ์ฑ๋ฅ์ ํ๋์ ๊ฐ์ผ๋ก ํํํ ํ๊ฐ ์งํ
- mAP : ๋ฌผ์ฒด ํด๋์ค๊ฐ ์ฌ๋ฌ ๊ฐ ์ธ๊ฒฝ์ฐ ๊ฐ ํด๋์ค๋น AP ๊ตฌํ ํ ๋ชจ๋ ํฉํด์ ๋ฌผ์ฒด ํด๋์ค์ ๊ฐ์๋ก ๋๋ ์ค
- Precision-Recall ๊ทธ๋ํ
- Precision : ๊ฒ์ถ ๊ฒฐ๊ณผ๋ค ์ค ์ณ๊ฒ ๊ฒ์ถํ ๋น์จ
- Recall : ์ค์ ์ณ๊ฒ ๊ฒ์ถ๋ ๊ฒฐ๊ณผ๋ฌผ ์ค์์ ์ณ๋ค๊ณ ์์ธกํ ๋น์จ
: ๋ฐ๋น๋ก
1) 1-Stage Detector
: ๋ฌธ์ ๋ฅผ ๋์์ ํํจ (์๋)
ex) YOLO, SSD
2) 2-Stage Detector
: ๋ฌธ์ ๋ฅผ ์์ฐจ์ ์ผ๋ก ํํ๋ ๋ฐฉ๋ฒ (์ ํ๋)
ex) R-CNN -> Fast R-CNN -> Faster R-CNN
4. R-CNN
1) Region Proposal
- Feature extraction
- Navive approach
sliding window approach : ์ด๋ฏธ์ง๋ฅผ ๋ชจ๋ ํ์ํ๋ฉด์ classification
- Selective Search
: ์ธ์ ํ ์์ญ๋ผ๋ฆฌ ์ ์ฌ์ฑ์ ์ธก์ ํด ํฐ ์์ญ์ผ๋ก ํตํฉํด ๋๊ฐ
: ์ปฌ๋ฌ, ๋ฌด๋ฌ ,๋ช ์ ๋ฑ์ผ๋ก ๋ค์ํ ๊ทธ๋ฃนํ
- Image Classiciatinon
: Regional Proposal ์ ํตํด ๋ฝ์๋ธ 2์ฒ๊ฐ์ ๋ ๋ฆฝ์ ์ธ region ์ ์ผ์ ํ ํฌ๊ธฐ๋ก wapping
: ๊ฐ๊ฐ์ ๋ชจ๋ region ์ convNet์ผ๋ก feature ์ถ์ถ
2) Classification & Regression
- linear SVM + Bounding Box Regression
: CNN ๋ง์ง๋ง์ softmax layer ์ ๊ฑฐ, svm ๋์ฒดํ์ฌ ํ์ต
: feature vector ๋ก ์ป์ proposed box ์ ์ค์ box์ ์ฐจ์ด ์ ์
: CNN ํต๊ณผํ์ฌ ์ถ์ถ๋ ๋ฒกํฐ์ x, y, w, h๋ฅผ ์กฐ์ ํ๋ ํจ์์ ์จ์ดํธ ๊ณฑํด์ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์กฐ์ ํ์ฌ ์ ํํ๊ท ํ์ต
3) Metrics
- IoU (Intersection over Union)
- non-Maximum Suppression
: ๋์ผํ object ํ๋จํ๋ Bbox ์ ๊ฑฐ
5. R-CNN ๋จ์
- ์๋
- ๋ณต์กํ ๊ตฌ์กฐ : Regrion proposal / ConvNet / SVM, Bbox regressor
- Back propagation ๋ถ๊ฐ๋ฅ : Multi-stage Training
6. Fast R-CNN
: Multi-task Loss Function ๋์ ํด end-to-end ๋ชจ๋ธ
: Region Proposal ๋จ๊ณ๋ฅผ NN ์์ผ๋ก ๋์ด์ด
: Fast R-CNN + Region Proposal Network (RPN)
- ํ๋์ ConvNet ์ฌ์ฉ
- Region Proposal Network
- ROI Pooling
- Classifier & Regressor
- Multi-Task Loss
1) Feature Extraction
- Regional Proposals
: ์ ์ฒด ์ด๋ฏธ์ง๋ฅผ ์ด๋ฏธ ํ์ต๋ CNN ์ ํต๊ณผ์์ผ ํผ์ณ๋งต ์ถ์ถ
: Selective Search๋ฅผ ํตํด์ ์ฐพ์ ๊ฐ๊ฐ์ RoI ์ ๋ํด RoI Pooling ์งํ
: GPU ํตํ RoI ๊ณ์ฐ
: Feature map ์์์ nxn conv fliter ๋ฅผ sliding window
- anchor box
: sliding window ๊ฐ ์ฐ์ ์ง์ ๋ง๋ค ์ฌ๋ฌ ๊ฐ์ region proposal ์์ธก
- Roi Pooling
: ์ด๋ ํ RoI ํฌ๊ธฐ๊ฐ ๋์ค๋๋ผ๋ ์ ๋นํ ์กฐ์ ํด์ ๊ณ ์ ๋ ์์ํ ๋ง๋ค๊ธฐ
: ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ regions ๊ฐ์ ๋์ผํ ํฌ๊ธฐ๋ก ๋ณํ
2) Classifier & Regressor
- Multi-task Loss
: classification loss + bounding box regression
'๐ฉโ๐ป ์ธ๊ณต์ง๋ฅ (ML & DL) > ML & DL' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_7_Object Detection 2 (0) | 2022.01.27 |
---|---|
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_6_Segmentation 1. U-Net, attention (0) | 2022.01.26 |
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_4_Classifcation 2. MobileNet & EfficientNet (0) | 2022.01.26 |
[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_3_Classifcation 1. ResNet/DenseNet (0) | 2022.01.25 |
[์์ฑ]์์ฑ ์ฒ๋ฆฌ ๋ถ์ผ์์์ Deep Learning (0) | 2022.01.24 |