๐Ÿ˜Ž ๊ณต๋ถ€ํ•˜๋Š” ์ง•์ง•์•ŒํŒŒ์นด๋Š” ์ฒ˜์Œ์ด์ง€?

์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ž€(Time Serial) ๋ณธ๋ฌธ

๐Ÿ‘ฉ‍๐Ÿ’ป ์ธ๊ณต์ง€๋Šฅ (ML & DL)/Serial Data

์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ž€(Time Serial)

์ง•์ง•์•ŒํŒŒ์นด 2022. 9. 26. 15:39
728x90
๋ฐ˜์‘ํ˜•

220926 ์ž‘์„ฑ

<๋ณธ ๋ธ”๋กœ๊ทธ๋Š” ๊น€์„ฑ๋ฒ”[ ์†Œ์žฅ / ์ธ๊ณต์ง€๋Šฅ๊ณตํ•™์—ฐ๊ตฌ์†Œ ] ๋‹˜์˜ ์œ ํŠœ๋ธŒ ๊ฐ•์˜๋ฅผ ์ฐธ๊ณ ํ•ด์„œ ๊ณต๋ถ€ํ•˜๋ฉฐ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค :-) >

https://www.youtube.com/watch?v=Zzt4Ept-zYs 

 

 

 

 

 

1๏ธโƒฃ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ 

: ๊ด€์ธก์น˜๊ฐ€ ์‹œ๊ฐ„์  ์ˆœ์„œ๋ฅผ ๊ฐ€์ง„ ๋ฐ์ดํ„ฐ ์…‹์˜ ์ง‘ํ•ฉ

https://www.youtube.com/watch?v=Zzt4Ept-zYs

  • ๋‹จ๋ณ€๋Ÿ‰ ์‹œ๊ณ„์—ด(Univariate) : ๋™์ผํ•œ ๊ฐ„๊ฒฉ์˜ ์‹œ๊ฐ„ ์ฆ๊ฐ€์— ๋Œ€ํ•ด ์ˆœ์ฐจ์ ์œผ๋กœ ๊ธฐ๋ก๋œ ํ•œ ๊ฐœ์˜ ๋ณ€์ˆ˜ ๊ด€์ธก์น˜๋กœ ๊ตฌ์„ฑ๋œ ์‹œ๊ณ„์—ด
  • ๋‹ค๋ณ€๋Ÿ‰ ์‹œ๊ณ„์—ด(Multivariate) : ๋™์ผํ•œ ๊ฐ„๊ฒฉ์˜ ์‹œ๊ฐ„ ์ฆ๊ฐ€์— ๋Œ€ํ•ด ์ˆœ์ฐจ์ ์œผ๋กœ ๊ธฐ๋ก๋œ ๋‘ ๊ฐœ ์ด์ƒ์˜ ๋ณ€์ˆ˜ ๊ด€์ธก์น˜๋กœ ๊ตฌ์„ฑ๋œ ์‹œ๊ณ„์—ด

 

2๏ธโƒฃ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ์ด์ƒ ํƒ์ง€ ์–ด๋ ค์›€

  • ์ด์ƒ ์œ ํ˜•์ด ๋‹ค์–‘
  • ์ •์ƒ๊ณผ ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ๋ฅผ ์ •ํ™•ํžˆ ๊ตฌ๋ถ„ํ•˜์—ฌ ๋ผ๋ฒจ๋งํ•˜๊ธฐ ์–ด๋ ค์›€
    • ์‹œ๊ฐ„๊ณผ ๋น„์šฉ ๋งŽ์ด ์†Œ์š”
    • ์ •์ƒ๊ณผ ์ด์ƒ์˜ ๊ฒฝ๊ณ„ ๋ถˆ๋ช…ํ™•
  • ์ •์ƒ ๋ฐ์ดํ„ฐ์— ๋น„ํ•ด ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ ๋น„์œจ์ด ํ›จ์”ฌ ์ ์Œ -> ๋ฐ์ดํ„ฐ ๋ถˆ๊ท ํ˜• -> ๋ถ„๋ฅ˜ ๋ฌธ์ œ์˜ ์žฅ์• ๋ฌผ

 

 

3๏ธโƒฃ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ์ด์ƒ ํƒ์ง€

 

4๏ธโƒฃ ์ฃผ์š” ๋ชจ๋ธ

๐Ÿงก Autoencoder

  • ์ž…๋ ฅ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์žฌ๋ณต์›ํ•˜๋Š” ๋น„์ง€๋„ํ•™์Šต
  • ์ž…๋ ฅ๋œ ๊ฐ‘๊ณผ ์ตœ๋Œ€ํ•œ ๋น„์Šทํ•˜๊ฒŒ ์ถœ๋ ฅ
    • encoder : ๋ฐ์ดํ„ฐ๋ฅผ ์••์ถ•ํ•˜์—ฌ ์ค‘์š”ํ•œ ์ •๋ณด๋ฉด ์‚ด๋ฆฌ๋Š” feature ๋กœ ๋ณ€ํ™˜
    • decoder : ์••์ถ•๋œ feature ๋ฅผ ์ด์šฉํ•˜์—ฌ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์ตœ๋Œ€ํ•œ ์›๋ณธ๊ณผ ๊ฐ€๊น๊ฒŒ ๋ณต์›

Autoencoder

๐Ÿ‘€ ์ด์ƒํƒ์ง€

  • ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋กœ ์ •์ƒ ๋ฐ์ดํ„ฐ๋งŒ ์‚ฌ์šฉ
  • encoder ์˜ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ decoder ์˜ ๊ฒฐ๊ณผ์ธ ๋ณต์› ๋ฐ์ดํ„ฐ์˜ ์ฐจ์ด ์ค„์ด๋ฉฐ, Autoencoder๋Š” ์ •์ƒ ๋ฐ์ดํ„ฐ ํŠน์ง• ํ•™์Šต
  • ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ๋Š” ํ•™์Šต X -> ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋ธ์— ์ž…๋ ฅ๋˜๋ฉด, ๋ณต์›๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ž…๋ ฅ๊ณผ ๋งŽ์€ ์ฐจ์ด ๋ฐœ์ƒ
  • ๋ณต์› ์—๋Ÿฌ = ์ž…๋ ฅ ๋ฐ์ดํ„ฐ - ๋ณต์› ๋ฐ์ดํ„ฐ
  • ์ž„๊ณ„์น˜ ์ •ํ•˜๊ณ , ๋ณต์› ์—๋Ÿฌ๊ฐ€ ์ž„๊ณ„์น˜ ๋„˜๊ฒŒ ๋˜๋ฉด ์ด์ƒ ํƒ์ง€

 

  • ํ•œ๊ณ„์ 
    • ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ๊ฐ€ ์ •์ƒ ๋ฐ์ดํ„ฐ์™€ ๋น„์Šทํ•˜๋ฉด, reconstruction error ๊ฐ€ ์ž‘์•„์„œ ์ด์ƒ ๊ฐ์ง€ ์–ด๋ ค์›€
  • ํ•œ๊ณ„ ๊ทน๋ณต
    • Autoencoder ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์— ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ๊ฐ€ ํฌํ•จ ์—ฌ๋ถ€๋ฅผ ์‹๋ณ„ํ•˜์—ฌ ์šฐ์ˆ˜ํ•œ reconstruction ์ˆ˜ํ–‰

 

 

 

๐Ÿงก LSTM - Autoencoder

  • sequence ๋ฐ์ดํ„ฐ๋ฅผ ์œ„ํ•œ LSTM ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” Autoencoder
  • ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ Anomaly Detection ์€ ์‹œ๊ฐ„์ ์ธ ํŠน์„ฑ์„ ๊ณ ๋ ค
  • ์ด์ „์˜ ์ •๋ณด๋ฅผ ํ˜„์žฌ์˜ ๋ฌธ์ œ ํ•ด๊ฒฐ์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” LSTM ๋„คํŠธ์›Œํฌ ์ด์šฉ
    • encoder
      • ์ •์ƒ ๋ฐ์ดํ„ฐ๋งŒ ์‚ฌ์šฉ
      • Hidden vector๋Š” ์ด์ „ ๋‹จ๊ณ„์˜ Hidden vector๊ณผ ์ž…๋ ฅ๊ฐ’ ํ™œ์šฉํ•˜์—ฌ ๊ตฌํ•จ
      • ๋งˆ์ง€๋ง‰ Hidden vector ๊ฐ€ Latent vector๊ฐ€ ๋˜์–ด Decoder ๋‹จ๊ณ„์˜ ์ตœ์ดˆ Hidden vector๋กœ ์‚ฌ์šฉ
    • decoder
      • encoder์˜ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์—ญ์ˆœ์œผ๋กœ Reconstruction
      • Hidden vector๋Š” ์ด์ „ ๋‹จ๊ณ„์˜ Hidden vector๊ณผ ์ž…๋ ฅ๊ฐ’ ํ™œ์šฉํ•˜์—ฌ ๊ตฌํ•จ
    • Objective Function
      • encoder์˜ ์•ฑ๋ ฅ๊ฐ’๊ณผ decoder์˜ ์ถœ๋ ฅ๊ฐ’์˜ ์ฐจ์ด์— ๋Œ€ํ•œ MSE ๋ฅผ ์ตœ์†Œํ™” ํ•˜๋„๋ก ํ•™์Šต
    • Inference
      • Hidden vector๋Š” ์ด์ „ ๋‹จ๊ณ„์˜ Hidden vector๊ณผ decoder ์˜ ์ถœ๋ ฅ๊ฐ’์„ ํ™œ์šฉํ•˜์—ฌ ๊ตฌํ•จ

 

๐Ÿ‘€ ์ด์ƒํƒ์ง€

  • Reconstruction Error
    • Early Stopping ๋ฐ์ดํ„ฐ ์ด์šฉํ•˜์—ฌ error vector ๊ตฌํ•จ
    • Error vector ์‚ฌ์šฉํ•˜์—ฌ ์ •๊ทœ๋ถ„ํฌ N(µ, ∑) ์˜ µ, ∑ ์ถ”๋ก 
  • Anomaly Score
    • e(i)์—์„œ ์ •๊ทœ๋ถ„ํฌ N(µ, ∑) ๊นŒ์ง€์˜ ๊ฑฐ๋ฆฌ (๊ฑฐ๋ฆฌ๊ฐ€ ๋ฉ€์–ด์งˆ์ˆ˜๋ก ์ด์ƒ๊ฐ’์ด๋ผ ํŒ๋‹จ)
    • ์ž„๊ณ„์น˜(r) ์ •ํ•˜๊ณ , ๊ทธ ๊ฐ’๋ณด๋‹ค Anomaly score๊ฐ€ ํฌ๋ฉด ์ด์ƒ์น˜๋กœ ํŒ๋‹จ

 

  • ํ•œ๊ณ„์ 
    • ์ •์ƒ ๋ฐ์ดํ„ฐ๋งŒ์œผ๋กœ ํ•™์Šตํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์™€๋„ train set ๊ณผ ๋น„์Šทํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๊ณผ์ ํ•ฉ ๋ฐœ์ƒ
      • ๊ณผ์ ํ•ฉ : ํ•™์Šต ๋ชจ๋ธ์ด ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ์— ๋งค์šฐ ๊ณผํ•˜๊ฒŒ ๋งž์ถฐ์ ธ์„œ ๋‹ค๋ฅธ ๋ฐ์ดํ„ฐ๊ฐ€ ๋“ค์–ด์™€๋„ ๋‹ค๋ฅธ ๊ฒฐ๊ณผ๋กœ ์˜ˆ์ธกํ•˜์—ฌ ๊ฒฐ๊ณผ์ ์œผ๋กœ ์ •ํ™•๋„๊ฐ€ ๋‚ฎ์•„์ง„๋‹ค
  • ์ œ์•ˆ ๋ชจ๋ธ
    • Single Autoencoder ์ด ์•„๋‹Œ ์„œ๋กœ ๋‹ค๋ฅธ ๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ ์—ฌ๋Ÿฌ๊ฐœ์˜ Autoencoder ๊ฒฐํ•ฉ
    • ์„œ๋กœ ๋‹ค๋ฅธ ๋„คํŠธ์›Œํฌ ๊ตฌ์กฐ๋ฅผ Autoencoder๋ฅผ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด Sparely-connected Autoencoder ์ ์šฉ
      • Sparely-connected Autoencoder
        • ์„œ๋กœ ๋‹ค๋ฅธ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง„ Autoencoder ๋ฅผ ์—ฌ๋Ÿฌ ๊ฐœ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด RNN ๊ตฌ์กฐ ๋ณ€๊ฒฝ
          • RNN unit ์‚ฌ์ด์˜ ์—ฐ๊ฒฐ์„ ์ž„์˜ ์ œ๊ฑฐ
          • RNN unit ์‚ฌ์ด์˜ ์—ฐ๊ฒฐ์„ ์ž„์˜ ์ถ”๊ฐ€

 

 

๐Ÿงก Generative Adeversarial Networks(GANs)

  • ๊ธฐ๋ณธ ๊ตฌ์กฐ : ์ƒ์„ฑ๊ธฐ(Generator) + ํŒ๋ณ„๊ธฐ(Discriminator)
    • ์ƒ์„ฑ๊ธฐ : ์›๋ณธ ๋ฐ์ดํ„ฐ (Real data)์™€ ์œ ์‚ฌํ•œ ๊ฐ€์งœ ๋ฐ์ดํ„ฐ(Fake data) ์ƒ์„ฑ
    • ํŒ๋ณ„๊ธฐ : ์›๋ณธ ๋ฐ์ดํ„ฐ์™€ ๊ฐ€์งœ ๋ฐ์ดํ„ฐ ๊ตฌ๋ณ„
  • ๋‘ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฒฝ์Ÿํ•˜๋ฉฐ ์„œ๋กœ์˜ ์—ญํ•  ๋ฐœ์ „์‹œํ‚ด

 

 

๐Ÿ‘€ ์ด์ƒํƒ์ง€

  • ํ•œ๊ณ„์ 
    • ์ƒ์„ฑ๊ธฐ์™€ ๋ถ„๋ฅ˜๊ธฐ์˜ ๋ถˆ๊ท ํ˜•. ์•ˆ์ •์ ์ธ ํ•™์Šต ์–ด๋ ค์›€
    • Mode-Collapse : ์ƒ์„ฑ๊ธฐ๊ฐ€ ์ œํ•œ๋œ ์ข…๋ฅ˜์˜ ์ƒ˜ํ”Œ ์ƒ์„ฑ
    • Non-Convergence : Model์˜ parameter ๊ฐ€ ์ˆ˜๋ ดํ•˜์ง€ ์•Š๊ณ , ๋ถˆ์•ˆ์ •
  • ํ•œ๊ณ„ ๊ทน๋ณต
    • Autoencoder ์•„ํ‚คํ…์ฒ˜์˜ ๋„์›€์œผ๋กœ Adversarial Training์˜ ์•ˆ์ •์„ฑ ํ™•๋ณด

 

 

5๏ธโƒฃ ๊ฒฐ๊ณผ

  • ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์˜ ์ด์ƒํƒ์ง€ ๋ฌธ์ œ๋Š” ๋„๋ฉ”์ธ ์˜์กด์„ฑ, ๋‹ค์–‘ํ•œ ์ด์ƒ ์œ ํ˜•, ๋ผ๋ฒจ๋ง ๋ฐ์ดํ„ฐ ๋ถ€์กฑ, ๋ฐ์ดํ„ฐ ๋ถˆ๊ท ํ˜• ๋“ฑ์œผ๋กœ ์–ด๋ ค์›€
  • ๋น„์ง€๋„ ํ•™์Šต ๋ชจ๋ธ์ธ Autoencoder ์€ ์ด์ƒ ํƒ์ง€ ๋ฌธ์ œ์— ๋„์›€์ด ๋จ
    • but, ๊ณผ์ ํ•ฉ, ์ •์ƒ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌํ•œ ๋น„์ •์ƒ ๋ฐ์ดํ„ฐ ํŒ๋ณ„ ๋“ฑ ๋ฌธ์ œ์  ์žˆ์Œ

 

728x90
๋ฐ˜์‘ํ˜•
Comments