[DEEPNOID ์ํฌ์ธํธ๋ ์จ]_1_๋จธ์ ๋ฌ๋์ ์ดํด
220124 ์์ฑ
<๋ณธ ๋ธ๋ก๊ทธ๋ DEEPNOID ์ํฌ์ธํธ๋ ์จ์ ์ฐธ๊ณ ํด์ ๊ณต๋ถํ๋ฉฐ ์์ฑํ์์ต๋๋ค>
์ธ๊ณต์ง๋ฅ | Deepnoid
DEEPNOID๋ ์ธ๊ณต์ง๋ฅ์ ํตํ ์ธ๋ฅ์ ๊ฑด๊ฐ๊ณผ ์ถ์ ์ง ํฅ์์ ๊ธฐ์ ์ด๋ ์ผ๋ก ํ๊ณ ์์ต๋๋ค. ๋ฅ๋ ธ์ด๋๊ฐ ๊ฟ๊พธ๋ ์ธ์์, ์๋ฃ ์ธ๊ณต์ง๋ฅ์ด ์ง๊ธ๋ณด๋ค ํจ์ฌ ๋์ ๋ฒ์์ ์งํ์ ์ฐ๊ตฌ, ์ง๋จ, ์น๋ฃ์ ๋์
www.deepnoid.com
1. AI (Artificial Intelligence)
์ธ๊ณต์ง๋ฅ : ๊ธฐ๊ณ๊ฐ ์ฌ๋์ ํ๋์ ๋ชจ๋ฐฉํ๊ฒ ํ๋ ๊ธฐ์
๊ธฐ๊ณํ์ต : ๊ธฐ๊ณ๊ฐ ์ผ์ผ์ด ์ฝ๋๋ก ๋ช ์ํ์ง ์์ ๋์์ ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ์ฌ ์คํํ ์ ์๋๋ก ํ๋ ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ๋ ์ฐ๊ตฌ ๋ถ์ผ
๋ฅ๋ฌ๋ : ์ธ๊ณต ์ ๊ฒฝ๋ง์ ๊ธฐ๋ฐํ์ฌ, ๋ง์ ์์ ๋ฐ์ดํฐ๋ฅผ ํ์ตํด ๋ฐ์ด๋ ์ฑ๋ฅ์ ์ด๋์ด๋ด๋ ์ฐ๊ตฌ ๋ถ์ผ
(๋ฅ๋ฌ๋๋ถํฐ ๋น์ ํ(์ ์์ ๋ค์ํ ์ด๋ฏธ์ง, ์์ฑ ๋ฑ์ด ๋ค์ด๊ฐ๋ ๋ฐ์ดํฐ) ๋ฐ์ดํฐ ์ฐ๊ตฌ ์์!!)
=> ํ์์ , ์ํ์ ์ธ ๊ท์น์ ์์ ํ๋ ๋ฌธ์ ํด๊ฒฐ -> ์ธ๊ฐ์๊ฒ ์ง๊ด์ ์ธ ๋ฌธ์ ํด๊ฒฐ
๋น ๋ฐ์ดํฐ : ๊ธฐ์กด์ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ก๋ ์์ง, ์ ์ฅ, ๋ถ์ ๋ฑ์ ์ํํ๊ธฐ ์ด๋ ค์ธ ๋งํผ์ ๋ฐฉ๋ํ๊ณ ๋ค์ํ๊ณ ์ค์๊ฐ์ผ๋ก ๊ฐ๋ ๋ฐ์ดํฐ
=> ๋น ๋ฐ์ดํฐ์ AI ๋ ์ํธ๋ณด์์ ์ธ ๊ด๊ณ
2. ๋จธ์ ๋ฌ๋
: ๋๋์ ๋ฐ์ดํฐ, ํ๋ จ
: ์ปดํจํฐ๊ฐ ์๊ณ ๋ฆฌ์ฆ ์์์ ๋ฐ์ดํฐ์ ๊ฒฐ๊ณผ ๊ฐ์ ๋ณด๊ณ ์ค์ค๋ก ํ๋ จํ์ฌ ๊ท์น ์ฐพ์๋
๊ธฐ์กด์๋ ๋ฐ์ดํฐ, ๊ท์น ๊ฐ์ => ๊ฐ์ค ๊ฒ์ฆ (ํด์!)
๋จธ์ ๋ฌ๋์ ๋ฐ์ดํฐ, ์ ๋ต => ํจํด ํ์ (์์ธก!)
+) Linear Regression
: ์๋ก์ด ๋ ๋ฆฝ๋ณ์์ ๋ค์ด์์ ๋, ์ข ์ ๋ณ์ ๊ฐ ์์ธก
( ๊ฒฝ์ฌํ๊ฐ๋ฒ์ ํตํด cost ๋ฅผ ๋ฎ์ถ๋ ํ๋ผ๋ฏธํฐ๋ก ๊ณ์ ์ ๋ฐ์ดํธ )
+) ์ต์์ ๊ณฑ๋ฒ
( ํต๊ณ ๋ถ์์, x ์ y ๊ฐ์ ์ธ๊ณผ๊ด๊ณ ํ์ )
: ๊ฐ ๊ด์ธก์ง๋ก๋ถํฐ ์ง์ ๊น์ง์ ์์ง ๊ฑฐ๋ฆฌ์ ์ ๊ณฑํฉ์ด ๊ฐ์ฅ ๋ฎ์ ์ง์ ์ด ์ต์ A์ ์ง์
3. ์ง๋ & ๋น์ง๋ ํ์ต
์ง๋ ํ์ต : ์ ๋ต์ ์๋ ค์ฃผ๋ฉฐ ๋ชจ๋ธ์ ํ์ตํ๋ ๋ฐฉ์
- Classification (Discrete Target), Regression (Continuous Target)
๋น์ง๋ ํ์ต : ์ ๋ต์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ํตํด ์ง์ ๊ท์น์ ๋ฐ๊ฒฌํ๋๋ก ํ๋ ๋ฐฉ์
- Clustering (Finding Similarity), Association Rules (Finding Rules)
1) ์ง๋ ํ์ต (Supervised Learning)
- Naive Bayes Classifier
- ๋ฒ ์ด์ฆ ์ ๋ฆฌ (Bayes' Theorem)
์กฐ๊ฑด๋ถ ํ๋ฅ
: P(A)์ P(B)๊ฐ ์๋ก ์ํฅ์ ๋ผ์น์ง ์์ ๋ (๋ ๋ฆฝ)
: P(A)์ P(B)๊ฐ ์๋ก ์ํฅ ๋ผ์น ๋
์ฌํํ๋ฅ = (๊ฐ๋ฅ์ฑ * ์ฌ์ ํ๋ฅ / ์ฆ๊ฑฐ)
- ๋ฒ ์ด์ฆ ๊ณต์
: ์ฌํํ๋ฅ P( y = kx1 ... xp(feature)) oc ์ฌ์ ํ๋ฅ P( y = k ) P (x1 ... xp)
: ๊ฐ์ : y=k ๋ด์์ x1 ... xp ์ด ํ๋ฅ ์ ์ผ๋ก ๋ ๋ฆฝ
EX) ์คํธ๋ฉ์ผ ๋ถ๋ฅ
: p ์ ๊ฐ์๊ฐ ๋ง์ ๊ฒฝ์ฐ์๋ j์ ๋ํ์ฌ P(xj) ๊ฐ ์ฝ๊ฒ ์ถ์ ๋จ
: ์ฌ์ฉํ๋ feature ๋ค์ด ์๋ก ๋ ๋ฆฝ์ด๋ผ๋ ๊ฐ์ ํ์
- K-nearest neighbor (k-์ต๊ทผ์ ์ด์๋ฒ)
: ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ ๋ฐ์์ ๋, ๊ฐ์ฅ ๊ฐ๊น์ด ์๋ ํด๋์ค์ ๊ฐ์๋ก ๋ถ๋ฅํ๋ ์๊ณ ๋ฅด์ง๋ฏ
: k ๋ ๊ฑฐ์ ํ์๋ก ์ ํจ
(์ ํด๋ฆฌ๋ ๊ฑฐ๋ฆฌ : ๋ ์ ์ฌ์ด์ ๊ฑฐ๋ฆฌ ๊ณ์ฐ)
- Decision Tree (์์ฌ๊ฒฐ์ ๋๋ฌด)
: ํ๋ฒ์ ํ๋์ ์ค๋ช ๋ณ์๋ฅผ ํตํด ์์ธก ๊ฐ๋ฅํ ๊ท์น๋ค์ ์งํฉ ์์ฑํ๋ ์๊ณ ๋ฆฌ์ฆ
( ์ง๋ฌธ์ ๋์ง๋ฉด์ ๋์์ ์ขํ๊ฐ๋ ์ค๋ฌด๊ณ ๊ฐ ๊ฐ๋ )
: ์๊ฐํ๊ฐ ์ฌ์์ ์ฝ๊ฒ ํด์ ๊ฐ๋ฅ
: ๋ถ๋ฅ ์ค๋ฅ์จ์ด ๊ฐ์ฅ ๋ฎ์ ์ง์ ์ผ๋ก 0์ด ๋ ๋๊น์ง ๊ณ์ ๋ถ๋ฅ
( ๋ถ๋ฅ ์ค๋ฅ ์ธก์ ์งํ : ์ง๋๊ณ์ 0.5 ๊ธฐ์ค, ๊ต์ฐจ ์ํธ๋กํผ 1 ๊ธฐ์ค )
- Ensemble Method
: ์ ํ๋๊ฐ ๋ฎ๋ค
: ์ ์ ํ pruning (๊ฐ์ง์น๊ธฐ) ์ง์ ์ ํ ๋ชปํ๋ฉด overfitting -> ์ฌ๋ฌ ์์ฌ๊ฒฐ์ ๋๋ฌด ๋ชจ๋ธ ๋ง๋ค๊ธฐ
- Bagging
: ์์ฌ๊ฒฐ์ ๋๋ฌด ๊ฐ์ , Boostrap (๋ณต์ ์ถ์ถํ random sampling) ํ์ฉํ์ฌ ๋ค์์ ์์ฌ๊ฒฐ์ ๋๋ฌด ์์ฑ
( input ์์ ์ฌ๋ฌ๋ฒ ๋๋ค ์ํ๋งํ์ฌ ๋ง๋ ๋ชจ๋ธ ์ง๊ณ )
- Random Forest
: ์ค๋ช ๋ณ์ ๋ํ ๋๋ค ์ํ๋งํ์ฌ ๊ฐ ์์ฌ๊ฒฐ์ ๋๋ฌด๋ค ๊ฐ์ ์๊ด์ฑ ์ ๊ฑฐ
: ๊ฐ ๋ชจ๋ธ์๋ ์ ์ฒด ์ค๋ช ๋ณ์ ์ค sqrt(์ ์ฒด์ค๋ช ๋ณ์ ๊ฐ์)๋งํผ์ ๋ณ์๋ง ๋๋ค์ผ๋ก ์ฌ์ฉ
- Boosting
: ๋ฐ์ดํฐ์ ํ๋์ ํธ๋ฆฌ ๋ชจ๋ธ์ ํ์ต์ํจ ๊ฒฐ๊ณผ๋ฅผ ํตํด ๋ค์ ํธ๋ฆฌ ๋ชจ๋ธ์ ์ ์ฉ
: ๋ค์์ ํธ๋ฆฌ ๋ชจ๋ธ์ด ์์ฐจ์ ์ผ๋ก ํ์ต
: ๋ฐฐ๊น , ๋๋คํฌ๋ ์คํธ -> ๊ฐ๊ฐ์ ํธ๋ฆฌ ๋ ๋ฆฝ
: ๋ถ์คํ -> ๊ฐ๊ฐ์ ํธ๋ฆฌ ์ํ์ค ๊ฐ์ง
: ์๊ทผ ์ฑ๋ฅ ์ข๋ค
- Neural Network
: ์ ๊ฒฝ๋ง -> ์ฌ๋ฌ ์๊ทน๋ค์ด ์ ๊ฒฝ์ธํฌ๋ก ๋ค์ด์ค๊ณ ์ด๋์ ๋ ์ด์์ ์๊ทน์ด ๋ค์ด์ค๋ฉด ์ด๋ฅผ ์ถ์ญ์ ํตํด ๋ค๋ฅธ ์ธํฌ๋ก ์ ๋ฌ
=> ๋ชจ๋ฐฉํ ์ธ๊ณต์ ๊ฒฝ๋ง ๋ชจ๋ธ
: ์ ๋ ฅ๊ฐ => ์ ๋ ฅ -> ์ค๊ฐ์ธต -> ์ถ๋ ฅ์ธต => ์ถ๋ ฅ๊ฐ (๋ค์คํ๊ท์ ์ฐ์ ๋น์ท,, ๋น์ ํ ์ ์ฉ)
+ ๊ฐ์ค์น, ํ์ฑํ ํจ์
- ํ์ฑํ ํจ์
: ์ ๋ ฅ์ ํธ์ ์ดํฉ์ ์ถ๋ ฅ์ ํธ๋ก ๋ณํํ๋ ํจ์
( Step function, linear Function, non-linear Funcion )
- Support Vector Machine
: ๊ฒฐ์ ๊ฒฝ๊ณ ( Decision Boundary )๋ฅผ ํตํด ๋ถ๋ฅ๋ฅผ ์ํ ๊ธฐ์ค ์ ์ ์ํ๋ ๋ชจ๋ธ
: ๋ถ๋ฅ๋์ง ์์ ์๋ก์ด ์ ์ด ๋ํ๋๋ฉด ๊ฒฝ๊ณ์ ์ด๋ ์ชฝ์ ์ํ๋์ง ํ์ธ
=> ์ต์ ์ ๋ถ๋ฆฌ ์ดํ๋ฉด ์ ํ
: ๋น์ ํ ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ๊ทธ๋ ค ๋ถ๋ฅ
: kernel Trick ์ ํตํด ๋ ๋์ ์ฐจ์์ผ๋ก์ mapping function
- ์ต๋ ๋ง์ง ๋ถ๋ฅ๊ธฐ
: ํ๋ จ ๊ด์ธก์น๋ก๋ถํฐ ๊ฐ์ฅ ๋ฉ๋ฆฌ ๋จ์ด์ง ๋ถ๋ฆฌ ์ดํ๋ฉด ์ ํ ( ๋ถ๋ฆฌ ์ดํ๋ฉด์ผ๋ก๋ถํฐ ๋ง์ง์ด ๊ฐ์ฅ ํฐ ์์น ์ฐพ๊ธฐ )
( ์ดํ๋ฉด : p์ฐจ์ ๊ณต๊ฐ์์ p-1 ์ธ ํํํ ์ํ ๋ถ๋ถ ๊ณต๊ฐ )
( ๋ง์ง : ๊ณ์ฐ๋๋ ๊ด์ธก์ง๋ค์์ ์ดํ๋ฉด๊น์ง์ ๊ฐ์ฅ ์งง์ ๊ฑฐ๋ฆฌ )
EX) 3D -> 2D ์ ํ๋ฉด์ผ๋ก ๋๋๊ธฐ, 2D -> 1D ์ ์ผ๋ก ๋๋๊ธฐ
( ์ํํธ ๋ง์ง : ๋ง์ง ํ๋ฉด์ ๋์ด๊ฐ๋ ์ธ์คํด์ค๋ฅผ ์ผ์ ํ์ฉํ๋ ๋ถ๋ฅ๊ธฐ )
2) ๋น์ง๋ ํ์ต ( Unsupervised Learning )
- Clustering
- Hierarchical Clustering ๊ณ์ธต ๋ถ์
: ๋น์ทํ ๊ตฐ์ง๋ผ๋ฆฌ ๋ฌถ์ด ๊ฐ๋ฉด์ ์ต์ข ์ ์ผ๋ก ํ๋์ ์ผ์ด์ค๊ฐ ๋ ๋๊น์ง ๊ตฐ์ง์ ๋ฌถ๋ ์๊ณ ๋ฆฌ์ฆ
: ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ฅ ๊ฐ๊น์ด ๊ฑฐ๋ฆฌ์ ์๋ ๋ฐ์ดํฐ ์๋ก ๋ฌถ๊ธฐ
- k-means Clustering
: ์ธก์ ๊ฐ๋ค์ด ๊ฐ๋ฅํ ํ ๋์ง์ ์ด๋๋ก ๋ฏธ๋ฆฌ ์ ํด ๋์ k ๊ฐ์ ๊ตฐ์ง์ด ์ค์ฒฉ๋์ง ์๋๋ก ํ๋ณธ์ ๋๋๋ ๊ตฐ์ง๋ฒ
: k๊ฐ ์ด๊ธฐ ํด๋ฌ์คํฐ -> ๊ฐ ๋ ์ฝ๋๋ ๊ฐ๊น์ด ์ค์ฌ์ด ์ํ ํด๋ฌ์คํฐ์ ํ ๋น
-> ๊ด์ธก์น๊ฐ ๋น ์ง๊ฑฐ๋ ์ถ๊ฐ๋๋ฉด, ๊ตฐ์ง๋ค์ ์ค์ฌ ๋ค์ ๊ณ์ฐ, ๋ฐ๋ณต -> ๊ฐ ๊ด์ธก์น์ ๋ํ ํด๋ฌ์คํฐ ๋ณํ ์์ผ๋ฉด ์ค์ง
: ์ต์ ์ ํด๋ฌ์คํฐ ๊ฐ์ (k) ๊ตฌํ๋ ๋ฐฉ๋ฒ
( ํ๊ฟ์น ๋ฐฉ๋ฒ : ํ๊ท ๊ฑฐ๋ฆฌ๊ฐ ๊ฐ์๊ธฐ ๋จ์ด์ง๋ k ์ ํ )
( ์ค๋ฃจ์ฃ ๋ฐฉ๋ฒ : ์ค๋ฃจ์ฃ ํ๊ท ๊ฐ ๋ณด๊ณ k ์ ํ )
- ์ฐ๊ด๊ท์น
: "A" ๊ฐ ๋ฐ์ํ๋ฉด "B" ๋ ๋ฐ์ํ๋ค
EX) ๋จํธ๋ค์ด ์ ๊ธฐ ๊ธฐ์ ๊ท๋ฅผ ์ฌ๋ฌ๊ฐ ๋ ๋งฅ์ฃผ๋ ์ผ
( ์ง์ง๋ : ์ ์ฒด ๊ฑฐ๋ ๊ฑด์ ์ค X, Y ๋ชจ๋ ํฌํจํ๋ ๊ฑฐ๋ ๊ฑด์ )
( ์ ๋ขฐ๋ : X๋ฅผ ํฌํจํ๋ ๊ฑฐ๋ Y๋ ํฌํจํ๋ ๊ฑฐ๋ ๋น์จ )
( ํฅ์๋ : X๊ฐ ์ฃผ์ด์ง์ง ์์์ ๋์ Y์ ํ๋ฅ ๋๋น X ๊ฐ ์ฃผ์ด์ก์ ๋ Y ํ๋ฅ ์ฆ๊ฐ ๋น์จ )