๐Ÿ˜Ž ๊ณต๋ถ€ํ•˜๋Š” ์ง•์ง•์•ŒํŒŒ์นด๋Š” ์ฒ˜์Œ์ด์ง€?

[v0.1]๋จธ์‹ ๋Ÿฌ๋‹_Machine Learning ๋ฌด์—‡์ผ๊นŒ? [ํ•ธ์ฆˆ์˜จ ๋จธ์‹ ๋Ÿฌ๋‹2ํŒ] ๋ณธ๋ฌธ

๐Ÿ‘ฉ‍๐Ÿ’ป ์ธ๊ณต์ง€๋Šฅ (ML & DL)/ML & DL

[v0.1]๋จธ์‹ ๋Ÿฌ๋‹_Machine Learning ๋ฌด์—‡์ผ๊นŒ? [ํ•ธ์ฆˆ์˜จ ๋จธ์‹ ๋Ÿฌ๋‹2ํŒ]

์ง•์ง•์•ŒํŒŒ์นด 2021. 11. 3. 17:35
728x90
๋ฐ˜์‘ํ˜•

211103์ž‘์„ฑ

<๋ณธ ๋ธ”๋กœ๊ทธ๋Š” ํ•ธ์ฆˆ์˜จ ๋จธ์‹ ๋Ÿฌ๋‹ 2ํŒ์„ ์ฐธ๊ณ ํ•˜์—ฌ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค>

 

๋จธ์‹ ๋Ÿฌ๋‹์ด๋ž€ ?

๋ฐ์ดํ„ฐ์—์„œ๋ถ€ํ„ฐ ํ•™์Šตํ•˜๋„๋ก ์ปดํ“จํ„ฐ๋ฅผ ํ”„๋กœ๊ทธ๋ž˜๋ฐํ•˜๋Š” ๊ณผํ•™

 

- ์ผ๋ฐ˜์ ์ธ ์ •์˜

๋ช…์‹œ์ ์ธ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์—†์ด ์ปดํ“จํ„ฐ๊ฐ€ ํ•™์Šตํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ”๊ฒŒ ํ•˜๋Š” ์—ฐ๊ตฌ๋ถ„์•ผ

- ๊ณตํ•™์ ์ธ ์ •์˜

์–ด๋–ค ์ž‘์—… T(Task)์— ๋Œ€ํ•œ ์ปดํ“จํ„ฐ ํ”„๋กœ๊ทธ๋žจ์˜ ์„ฑ๋Šฅ์„ P( ์ •ํ™•๋„, Performance) ๋กœ ์ธก์ •ํ–ˆ์„ ๋•Œ ๊ฒฝํ—˜ E(ํ›ˆ๋ จ๋ฐ์ดํ„ฐ, train data) ๋กœ ์ธํ•ด ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋๋‹ค๋ฉด, ์ด ์ปดํ“จํ„ฐ ํ”„๋กœ๊ทธ๋žจ์€ ์ž‘์—… T์™€ ์„ฑ๋Šฅ์ธก์ • P์— ๋Œ€ํ•ด ๊ฒฝํ—˜ E๋กœ ํ•™์Šตํ•œ ๊ฒƒ

 

๋จธ์‹ ๋Ÿฌ๋‹์„ ์™œ ์‚ฌ์šฉํ•˜๋Š”๊ฐ€ ?

๋„ˆ๋ฌด ๋ณต์žกํ•˜๊ฑฐ๋‚˜ ๋งŽ์€ ์–‘์˜ ๋ฐ์ดํ„ฐ๋“ค์„ ๋ถ„์„ํ•˜์—ฌ ๋ณด์ด์ง€ ์•Š์€ ํŒจํ„ด์„ ๋ฐœ๊ฒฌํ•˜๊ณ , ๋น ๋ฅด๊ฒŒ ์œ ์ง€๋ณด์ˆ˜ ๋ฐ ์ •ํ™•๋„๊ฐ€ ๋†’์•„์ง

์ „ํ†ต์ ์ธ ๋ฐฉ์‹๊ณผ ๋จธ์‹ ๋Ÿฌ๋‹, ๋”ฅ๋Ÿฌ๋‹

 

๋จธ์‹ ๋Ÿฌ๋‹ ์‹œ์Šคํ…œ์˜ ์ข…๋ฅ˜

์ง€๋„์˜ ์œ ๋ฌด & ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์— ์˜ํ•ด ๋‚˜๋ˆ ์ง

 

1_1 ์ง€๋„์˜ ์œ ๋ฌด

: ํ•™์Šตํ•˜๋Š” ๋™์•ˆ์˜ ๊ฐ๋… ํ˜•ํƒœ๋‚˜ ์ •๋ณด๋Ÿ‰

- ์‚ฌ๋žŒ์˜ ๊ฐ๋… ํ•˜์— ํ›ˆ๋ จํ•˜๋Š” ๊ฒƒ์ธ๊ฐ€

 

1) ์ง€๋„ ํ•™์Šต (Supervised learning)

: ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์ฃผ์ž…ํ•˜๋Š” ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ” label ์ด๋ผ๋Š” ์›ํ•˜๋Š” ๋‹ต์ด ํฌํ•จ

์ง€๋„ ํ•™์Šต

๋”๋ณด๊ธฐ

์†์„ฑ (attribute) : ๋ฐ์ดํ„ฐ ํƒ€์ž…

ํŠน์„ฑ : ์†์„ฑ๊ณผ ๊ฐ™์ด ํ•ฉ์ณ์ง„ ๊ฒƒ

ํด๋ž˜์Šค : ๋ ˆ์ด๋ธ”์˜ ๋ฒ”์ฃผ

  • ๋ถ„๋ฅ˜ (Classification)

: ์ „ํ˜•์ ์ธ ์ง€๋„ ํ•™์Šต ํ•„ํ„ฐ

: Discreate

ex) ํ•™์ 

  • ํšŒ๊ท€ (Regression)    
    • k-์ตœ๊ทผ์ ‘ ์ด์›ƒ (KNN)
    • ์„ ํ˜• ํšŒ๊ท€ (linear regression)
    • ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€ (logistic regression)
    • ์„œํฌํŠธ ๋ฒกํ„ฐ ๋จธ์‹  (support vector machine, SVM) 
    • ๊ฒฐ์ •ํŠธ๋ฆฌ (Decision tree), ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ (Random forest)
    • ์‹ ๊ฒฝ๋ง (Neural networks)

: ์˜ˆ์ธก ๋ณ€์ˆ˜๋ผ ๋ถ€๋ฅด๋Š” ํŠน์„ฑ์„ ์‚ฌ์šฉํ•ด ํƒ€๊นƒ ์ˆ˜์น™์„ ์˜ˆ์ธก

: Concreate, ์—ฐ์†์  ํ•จ์ˆ˜, ๋…๋ฆฝ๋ณ€์ˆ˜

ex) ์ง‘ ๊ฐ€๊ฒฉ ์˜ˆ์ธก

 

2) ๋น„์ง€๋„ ํ•™์Šต (Unsupervised learning)

: ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋ ˆ์ด๋ธ”์ด ์—†๋‹ค, ์•„๋ฌด๋Ÿฐ ๋„์›€์—†์ด ํ•™์Šต

๋น„์ง€๋„ ํ•™์Šต

  • ๊ตฐ์ง‘ (Clustering)
    • k-ํ‰๊ท 
    • DBSCAN
    • ๊ณ„์ธต ๊ตฐ์ง‘ ๋ถ„์„
    • ์ด์ƒ์น˜ ํƒ์ง€, ํŠน์ด์น˜ ํƒ์ง€
    • ์› - ํด๋ž˜์Šค
    • ์•„์ด์†”๋ ˆ์ด์…˜ ํฌ๋ ˆ์ŠคํŠธ
  • ์‹œ๊ฐํ™”์™€ ์ฐจ์› ์ถ•์†Œ
    • ์ฃผ์„ฑ๋ถ„ ๋ถ„์„ (PCA)
    • ์ปค๋„ (PCA)
    • ์ง€์—ญ์  ์„ ํ˜• ์ž„๋ฒ ๋”ฉ
    • t-SNE
  • ์—ฐ๊ด€ ๊ทœ์น™ ํ•™์Šต
    • ์–ดํ”„๋ผ์ด์–ด๋ฆฌ
    • ์ดํด๋ ›

 

3) ์ค€์ง€๋„ ํ•™์Šต (Semisupervised learning)

: ์–ด๋–ค ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ผ๋ถ€๋งŒ ๋ ˆ์ด๋ธ”์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃธ

: ์ง€๋„ ํ•™์Šต๊ณผ ๋น„์ง€๋„ ํ•™์Šต์˜ ์กฐํ•ฉ์œผ๋กœ ์ฃผ๋กœ ์ด๋ฃจ์–ด์ง

: ๊ฐ’ ์œ ๋ฌด ๋ฐ์ดํ„ฐ -> ๋ถ„์„

์ค€์ง€๋„ ํ•™์Šต

4) ๊ฐ•ํ™” ํ•™์Šต (Reinforcement learning)

: ํ•™์Šตํ•˜๋Š” ์‹œ์Šคํ…œ (์—์ด์ „ํŠธ) ๋Š” ํ™˜๊ฒฝ์„ ๊ด€์ฐฐํ•ด์„œ ํ–‰๋™์„ ์‹คํ–‰ํ•˜๊ณ  ๊ทธ ๊ฒฐ๊ณผ๋กœ ๋ณด์ƒ (๋ถ€์ •์ ์ธ ๋ณด์ƒ์€ ๋ฒŒ์ ) ๋ฐ›์Œ

: ๊ฐ€์žฅ ํฐ ๋ณด์ƒ์„ ์–ป๊ธฐ ์œ„ํ•ด ์ •์ฑ… ์ด๋ผ๊ณ  ๋ถ€๋ฅด๋Š” ์ตœ์ƒ์˜ ์ „๋žต ์Šค์Šค๋กœ ํ•™์Šต

๊ฐ•ํ™” ํ•™์Šต

 

1_2 ์ ์ง„์  ํ•™์Šต์˜ ์œ ๋ฌด

: ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ์ŠคํŠธ๋ฆผ์œผ๋กœ๋ถ€ํ„ฐ ์ ์ง„์ ์œผ๋กœ ํ•™์Šตํ•˜๋Š”๊ฐ€

- ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ ์ง„์ ์ธ ํ•™์Šต์„ ํ•˜๋Š”๊ฑด๊ฐ€

 

1) ๋ฐฐ์น˜ ํ•™์Šต (batch learning)

: ์‹œ์Šคํ…œ์ด ์ ์ง„์ ์œผ๋กœ ํ•™์Šตํ•  ์ˆ˜ ์—†์Œ

: ๊ฐ€์šฉํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋‘ ์‚ฌ์šฉํ•ด ํ›ˆ๋ จ

  • ์˜คํ”„๋ผ์ธ ํ•™์Šต (Offline learning)
    • ๋จผ์ € ์‹œ์Šคํ…œ์„ ํ›ˆ๋ จ, ์ œํ’ˆ ์‹œ์Šคํ…œ์— ์ ์šฉํ•˜๋ฉด ๋” ์ด์ƒ์˜ ํ•™์Šต์—†์ด ์‹คํ–‰
    • ํ•™์Šตํ•œ ๊ฒƒ์„ ๋‹จ์ง€ ์ ์šฉ
    • ํ•˜์ง€๋งŒ, ์ž์›์ด ์ œํ•œ๋œ ์‹œ์Šคํ…œ์ด ์Šค์Šค๋กœ ํ•™์Šตํ•ด์•ผ ํ•  ๋•Œ, ๋งŽ์€ ์–‘์˜ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋ฅผ ๋‚˜๋ฅด๊ณ  ํ•™์Šต์„ ์œ„ํ•ด ๋ช‡ ์‹œ๊ฐ„์”ฉ ๋งŽ์€ ์ž์›์„ ์‚ฌ์šฉํ•˜๋ฉด ์‹ฌ๊ฐํ•œ ๋ฌธ์ œ ์ผ์œผํ‚ด
      • + ์™ธ๋ถ€ ๋ฉ”๋ชจ๋ฆฌ (out-of-core) : ์•„์ฃผ ํฐ ๋ฐ์ดํ„ฐ์…‹์„ ํ•™์Šตํ•˜๋Š” ์‹œ์Šคํ…œ 
      • ๋ฐ์ดํ„ฐ ์ผ๋ถ€๋ฅผ ์ฝ์–ด ๋“ค์ด๊ณ  ํ›ˆ๋ จ๋‹จ๊ณ„ ์ˆ˜ํ–‰, ๋ชจ๋‘ ์ ์šฉํ•  ๋•Œ๊นŒ์ง€ ๊ณผ์ • ๋ฐ˜๋ณต
      • ๋ณดํ†ต ์˜คํ”„๋ผ์ธ์œผ๋กœ ํ•™์Šต, (์‹ค์‹œ๊ฐ„ ์ˆ˜ํ–‰ X)
  • ์˜จ๋ผ์ธ ํ•™์Šต (Online learning)
    • ๋ฐ์ดํ„ฐ๋ฅผ ์ˆœ์ฐจ์ ์œผ๋กœ ํ•œ ๊ฐœ์”ฉ ๋˜๋Š” ๋ฏธ๋‹ˆ๋ฐฐ์น˜ ๋ผ ๋ถ€๋ฅด๋Š” ์ž‘์€ ๋ฌถ์Œ ๋‹จ์œ„๋กœ ์ฃผ์ž…ํ•˜์—ฌ ์‹œ์Šคํ…œ ํ›ˆ๋ จ
    • ๋งค ํ•™์Šต ๋‹จ๊ณ„๊ฐ€ ๋น ๋ฅด๊ณ  ๋น„์šฉ์ด ์ ๊ฒŒ ๋“ค์–ด, ๋ฐ์ดํ„ฐ๊ฐ€ ๋„์ฐฉํ•˜๋Š” ๋Œ€๋กœ ์ฆ‰์‹œ ํ•™์Šต
    • ์—ฐ์†์ ์œผ๋กœ ๋ฐ์ดํ„ฐ ๋ฐ›๊ณ , ๋น ๋ฅธ ๋ณ€ํ™”์— ์Šค์Šค๋กœ ์ ์‘ํ•˜๋Š” ์‹œ์Šคํ…œ์— ์ ํ•ฉ (ex) ์ฃผ์‹ )
    • ์ค‘์š”ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๋ณ€ํ™”ํ•˜๋Š” ๋ฐ์ดํ„ฐ์— ์–ผ๋งˆ๋‚˜ ๋น ๋ฅด๊ฒŒ ์ ์‘ํ•˜๋Š”๊ฐ€
      • ํ•™์Šต๋ฅ  (Learning rate) : ๋†’์„์ˆ˜๋ก ๋ฐ์ดํ„ฐ ๋น ๋ฅด๊ฒŒ ์ ์‘, ์˜ˆ์ „ ๋ฐ์ดํ„ฐ ์‰ฝ๊ฒŒ ์žŠ์Œ
      • : ๋‚ฎ์„์ˆ˜๋ก ์‹œ์Šคํ…œ์˜ ๊ด€์„ฑ ์ปค์ ธ์„œ ๋” ๋Š๋ฆฌ๊ฒŒ ํ•™์Šต
    • ์‹œ์Šคํ…œ์— ๋‚˜์œ ๋ฐ์ดํ„ฐ ์ฃผ์ž…๋˜๋ฉด ์„ฑ๋Šฅ ์ ์ง„์ ์œผ๋กœ ๊ฐ์†Œ
    • ์„ฑ๋Šฅ ๊ฐ์†Œ๊ฐ€ ๊ฐ์ง€๋˜๋ฉด ์ฆ‰๊ฐ ํ•™์Šต ์ค‘์ง€

 

2. ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ

: ์–ด๋–ป๊ฒŒ ์ผ๋ฐ˜ํ™” (generalize) ๋˜๋Š”๊ฐ€์— ๋”ฐ๋ผ ๋ถ„๋ฅ˜

 

1) ์‚ฌ๋ก€ ๊ธฐ๋ฐ˜ ํ•™์Šต (Instance-based learning)

: ๊ฐ€์žฅ ๊ฐ„๋‹จํ•œ ํ˜•ํƒœ์˜ ํ•™์Šต์€ ๋‹จ์ˆœํžˆ ๊ธฐ์–ต

: ์‹œ์Šคํ…œ์ด ํ›ˆ๋ จ ์ƒ˜ํ”Œ์„ ๊ธฐ์–ตํ•จ์œผ๋กœ์จ ํ•™์Šต -> ์œ ์‚ฌ๋„ ์ธก์ • ์‚ฌ์šฉ -> ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์™€ ํ•™์Šตํ•œ ์ƒ˜ํ”Œ์„ ๋น„๊ต -> ๋ถ„๋ฅ˜

 

2) ๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ•™์Šต (model-based learning)

: ์ƒ˜ํ”Œ๋“ค์˜ ๋ชจ๋ธ์„ ๋งŒ๋“ค์–ด ์˜ˆ์ธก์— ์‚ฌ์šฉ

: ๋ชจ๋ธ ํ›ˆ๋ จ์ด๋ž€

-> ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๊ฐ€์žฅ ์ž˜ ๋งž๋Š” (์ข‹์€ ์˜ˆ์ธก์„ ๋งŒ๋“œ๋Š”) ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•ด ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‹คํ–‰ํ•˜๋Š” ๊ฒƒ

๋ชจ๋ธ ๊ธฐ๋ฐ˜ ํ•™์Šต

๋”๋ณด๊ธฐ

ํšจ์šฉํ•จ์ˆ˜ (utility function or ์ ํ•ฉ๋„ ํ•จ์ˆ˜ (fitness function) ) : ๋ชจ๋ธ์ด ์–ผ๋งˆ๋‚˜ ์ข‹์€์ง€ ์ธก์ •

๋น„์šฉํ•จ์ˆ˜ (cost function) : ์–ผ๋งˆ๋‚˜ ๋‚˜์œ์ง€ ์ธก์ •

  • ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„
  • ๋ชจ๋ธ์„ ์„ ํƒ
  • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ๋กœ ๋ชจ๋ธ ํ›ˆ๋ จ (ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด ๋น„์šฉ ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ ์ฐพ๊ธฐ)
    • ๋” ์ข‹์€ ๋ชจ๋ธ -> ๋” ๋งŽ์€ ํŠน์„ฑ ์‚ฌ์šฉ, ์ข‹์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ ๋ชจ์œผ๊ธฐ, ๋” ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ ์„ ํƒ
  • ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋ชจ๋ธ ์ ์šฉํ•ด ์˜ˆ์ธก, ์ผ๋ฐ˜ํ™”๋˜๊ธธ ๊ธฐ๋Œ€

 

 

 

์ฒซ ํฌ์ŠคํŒ… ๋~

728x90
๋ฐ˜์‘ํ˜•
Comments