๐Ÿ˜Ž ๊ณต๋ถ€ํ•˜๋Š” ์ง•์ง•์•ŒํŒŒ์นด๋Š” ์ฒ˜์Œ์ด์ง€?

[๋…ผ๋ฌธ๋ฆฌ๋ทฐ] Comparison between ARIMA and Deep Learning Modelsfor Temperature Forecasting ๋ณธ๋ฌธ

๐Ÿ‘ฉ‍๐Ÿ’ป ์ธ๊ณต์ง€๋Šฅ (ML & DL)/Serial Data

[๋…ผ๋ฌธ๋ฆฌ๋ทฐ] Comparison between ARIMA and Deep Learning Modelsfor Temperature Forecasting

์ง•์ง•์•ŒํŒŒ์นด 2022. 9. 15. 15:47
728x90
๋ฐ˜์‘ํ˜•

220915 ์ž‘์„ฑ

<๋ณธ ๋ธ”๋กœ๊ทธ๋Š” Eranga De SaaLochandaka Ranathunga ๋‹˜์˜ ๋…ผ๋ฌธ์„ ์ฐธ๊ณ ํ•ด์„œ ๊ณต๋ถ€ํ•˜๋ฉฐ ์ž‘์„ฑํ•˜์˜€์Šต๋‹ˆ๋‹ค :-) >

https://arxiv.org/abs/2011.04452

 

Comparison between ARIMA and Deep Learning Models for Temperature Forecasting

Weather forecasting benefits us in various ways from farmers in cultivation and harvesting their crops to airlines to schedule their flights. Weather forecasting is a challenging task due to the chaotic nature of the atmosphere. Therefore lot of research a

arxiv.org

 

 

๐ŸŸฃ Abstract

  • ARIMA (์ž๋™ ํšŒ๊ท€ ํ†ตํ•ฉ ์ด๋™ ํ‰๊ท ) ๋ชจ๋ธ ๋ฐ ์‹ฌ์ธต ์˜จ๋„๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ํ•™์Šต ๋ชจ๋ธ
  • ๊นŠ์€ ํ•™์Šต ๋ชจ๋ธ์€ 1์ฐจ์› ์ปจ๋ณผ๋ฃจ์…˜์œผ๋กœ ๊ตฌ์„ฑ
  • ๊ณต๊ฐ„์  ํŠน์ง•์„ ์ถ”์ถœํ•˜๋Š” ๋ ˆ์ด์–ด์™€ LSTM ๋ ˆ์ด์–ด๋ฅผ ์ถ”์ถœํ•˜์—ฌ ์‹œ๊ฐ„์  ํŠน์ง•์„ ์ถ”์ถœ

 

 

 

1๏ธโƒฃ INTRODUCTION

  • ๋ถˆํ™•์‹คํ•˜๊ณ  ํ˜ผ๋ž€์Šค๋Ÿฌ์šด ๋Œ€๊ธฐ ์กฐ๊ฑด๊ณผ ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ์ดํ•ด ๋ถ€์กฑ
  • ํ‰๊ท ์„ ๊ตฌํ•˜์—ฌ ์ ์šฉํ•œ ๊ธฐํ›„ํ•™, ๋ช‡ ๋…„์— ๊ฑธ์ณ ์ˆ˜์ง‘๋œ ๊ธฐ์ƒ ํ†ต๊ณ„
  • ํ˜„์žฌ ์ˆ˜์น˜ ๋‚ ์”จ ๋ฐฉ๋ฒ•
    • ๋‚ ์”จ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ
      • Support vector machine [1] , regression [2], Naïve bayes ๊ธฐ๋ฐ˜ ๋จธ์‹  ๋Ÿฌ๋‹ ์ ‘๊ทผ ๋ฐฉ์‹ [3]
    • ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๋ฐ˜
      • ์ธ๊ณต์‹ ๊ฒฝ๋ง[4], ARMA[5], ARIMA[6]์˜ ํ™œ์šฉ 
      • ์˜ˆ์ธก์„ ๊ตฌ์ถ•ํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ

 

2๏ธโƒฃ RELATED WORK

โ–ถ Mark Hallstrom์ด ์ˆ˜ํ–‰ํ•œ ์—ฐ๊ตฌ

  • ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ
    • 2011๋…„๋ถ€ํ„ฐ 2015๋…„๊นŒ์ง€  ์ตœ์†Œ ์˜จ๋„, ์ตœ๋Œ€ ์˜จ๋„ ๋ฐ 2011~2015๋…„ ์Šคํƒ ํฌ๋“œ์—์„œ์˜ ํ‰๊ท  ๋Œ€๊ธฐ์••, ํ‰๊ท  ์Šต๋„ ๋ฐ ์ผ์ผ ๊ธฐ์ƒ ์กฐ๊ฑด
  • ์ด ์—ฐ๊ตฌ๋Š” ์ง€๋‚œ ์ดํ‹€๊ฐ„์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ 7์ผ ๋™์•ˆ์˜ ์ตœ์†Œ ๋ฐ ์ตœ๋Œ€ ์˜จ๋„๋ฅผ ์˜ˆ์ธก
  • ๋น„, ๊ฐ•์ˆ˜๋Ÿ‰, ํ๋ฆผ, ๊ทธ๋ฆฌ๊ณ  ๋งค์šฐ ํ๋ฆผ ๋“ฑ 4๊ฐ€์ง€ ๋‚ ์”จ ๋ถ„๋ฅ˜
  • ์„ ํ˜• ํšŒ๊ท€ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ์ตœ๋Œ€ ์˜จ๋„์™€ ์ตœ์†Œ ์˜จ๋„๋ฅผ ์„ ํ˜• ์กฐํ•ฉ์œผ๋กœ ์˜ˆ์ธก
    • + ๊ธฐ๋Šฅ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜์˜ ๋ณ€ํ˜•์ด ์ด์ „์˜ ๊ธฐ์ƒ ์กฐ๊ฑด์„ ์‹๋ณ„ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ
  • ๊ฐœ์„ ์‚ฌํ•ญ์€ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋” ๋งŽ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•  ๊ฒƒ์„ ์ œ์•ˆ

 

โ–ถ Tarun Rao์ด ์ˆ˜ํ–‰ํ•œ ์—ฐ๊ตฌ

  • support vector machines ์„ ์ง€๋žต์ ์ธ ์ ‘๊ทผ๋ฒ•์œผ๋กœ ์‚ฌ์šฉํ•˜์—ฌ ๋‚ ์”จ๋ฅผ ์˜ˆ์ธก
  • ์ง€๋„ ํ•™์Šต์— ์†ํ•˜๋ฉฐ ๋ถ„๋ฅ˜ ๋ฐ ํšŒ๊ท€ ๋ถ„์„ ๋ฌธ์ œ์— ๋„๋ฆฌ ์‚ฌ์šฉ
  • ํ•˜๋ฃจ์˜ ์ตœ๋Œ€ ์˜จ๋„๋ฅผ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•ด linear support vector regression ์„ ์‚ฌ์šฉ
    • back propagation ์•Œ๊ณ ๋ฆฌ์ฆ˜์œผ๋กœ ํ›ˆ๋ จ๋œ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์„ ์‚ฌ์šฉ
    • Neural networks๋กœ ๋„๋ฆฌ ์•Œ๋ ค์ง„ Perceptrons ๋„คํŠธ์›Œํฌ๋Š” ๋Œ€๋ถ€๋ถ„ ์ง€๋„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์†ํ•จ
    • Neural networks์€ ํ•™์Šต ๋ชจ๋ธ์„ ๊ฐœ๋ฐœํ•˜๊ธฐ ์œ„ํ•ด ๋™๋ฌผ๊ณผ ์ธ๊ฐ„์ด ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์„ ๋ชจ๋ฐฉ
    • ์—ญ์ „ํŒŒ๋Š” ์˜ค๋ฅ˜๋ฅผ ๋„คํŠธ์›Œํฌ์˜ ๋‚ด๋ถ€ ๋ ˆ์ด์–ด๋กœ ์—ญ์ „ํŒŒํ•˜์—ฌ ๋„คํŠธ์›Œํฌ์—์„œ ๊ฐ ๋‰ด๋Ÿฐ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ๋˜๋Š” ๋ฐฉ๋ฒ•
  • ๊ฒฐ๊ณผ, support vector machines์€ back propagation์— ์˜ํ•ด ํ›ˆ๋ จ ๋ฐ›๋Š” ๋‹ค์ธต ํผ์…‰ํŠธ๋ก  Neural networks ๋Šฅ๊ฐ€

 

โ–ถ Lai et al์ด ์ˆ˜ํ–‰ํ•œ ์—ฐ๊ตฌ

  • ๊ธฐ์ƒ ์˜ˆ์ธก์€ ๋™์ชฝ ์ค‘๊ตญ์—์„œ ๋™์ ์œผ๋กœ weighted time delay neural network ์‚ฌ์šฉ
    • Dynamic weighted time delay neural network (๋™์  ๊ฐ€์ค‘ ์‹œ๊ฐ„ ์ง€์—ฐ ์‹ ๊ฒฝ๋ง)์€ ํ•˜์œ„ ๋ฒ”์ฃผ ์‹œ๊ฐ„ ์ง€์—ฐ 
    • ์‹œ๊ฐ„ ์ง€์—ฐ ์‹ ๊ฒฝ๋ง์€ ๋ฒˆ์—ญ ๋ถˆ๋ณ€ ๋ชจ์–‘์„ ์‹๋ณ„ํ•˜๊ณ  ๋ชจ๋“  ๊ณ„์ธต์—์„œ contest๋ฅผ ๋ชจ๋ธ๋งํ•œ๋‹ค

๋™์  ๊ฐ€์ค‘ ์‹œ๊ฐ„ ์ง€์—ฐ ๋‰ด๋Ÿฐ์˜ ๊ตฌ์กฐ

  • ์ˆจ๊ฒจ์ง„ ๋‹จ์ผ ์ธต์„ ๊ฐ€์ง„ ๊ณ ๋ฅธ ์‹ ๊ฒฝ๋ง์ด ๊ฐ•์šฐ๋Ÿ‰๊ณผ ์˜จ๋„๋ฅผ ๋Œ€๋žต์ ์œผ๋กœ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒฐ๋ก  ๋„๋‹ฌ
  • ์‹ ๊ฒฝ๋ง์€ fireworks ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ํ›ˆ๋ จ
    • fireworks ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ง‘๋‹จ ํ–‰๋™์„ ๋ชจ๋ฐฉํ•œ ๊ตฐ์ง‘ ์ง€๋Šฅ ์•Œ๊ณ ๋ฆฌ์ฆ˜
    • ์ฃผ๋กœ ์ตœ์ ํ™”์— ์‚ฌ์šฉ
  • ์—ฐ๊ตฌ ๋ชฉ์ ์€ ํ•˜๋ฃจ ํ‰๊ท  ๊ธฐ์˜จ์„ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ
  • ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ
    • Chaloemprakiet ๊ธฐ์ƒ ๊ด€์ธก์†Œ์˜ 2012๋…„๊ณผ 2015๋…„ ์‚ฌ์ด์˜ ๊ณผ๊ฑฐ ์ผ์ƒ์„ ๋ฐ์ดํ„ฐ ์„ธํŠธ๋กœ ์‚ฌ์šฉ
  • ๋ชจ๋ธ์€ 81.48%์˜ ํ›ˆ๋ จ ์ •ํ™•๋„, ํ…Œ์ŠคํŠธ ์ •ํ™•๋„๋Š” 73.79%

 

 

3๏ธโƒฃ DATASET AND PREPROCESSING

  • ์ˆ˜์ง‘๋œ ๋ฐ์ดํ„ฐ
    •  Szeged, Hungry์˜ ๋‚ ์”จ ๋ฐ์ดํ„ฐ๊ฐ€ ์‚ฌ์šฉ (kaggle)
    • ์˜จ๋„, ์Šต๋„ ๋ฐ ํ’์†๊ณผ ๊ฐ™์€ ์‹œ๊ฐ„๋‹น ๊ธฐ์ƒ ๋ฐ์ดํ„ฐ๊ฐ€ ํฌํ•จ ( ์ด ์—ฐ๊ตฌ์—์„œ๋Š” ์˜จ๋„ ๊ฐ’๋งŒ ์‚ฌ์šฉ )
    • 2006๋…„๊ณผ 2016๋…„ ์‚ฌ์ด์˜ ๊ธฐ๊ฐ„์„ ํฌํ•จ

์ผ๊ต์ฐจ ์‹œ๊ณ„์—ด

  • ๋ถ„์„์„ ๋‹จ์ˆœํ™”ํ•˜๊ธฐ ์œ„ํ•ด ์›”ํ‰๊ท  ์˜จ๋„ ๊ฐ’๋งŒ ๊ณ ๋ ค

์›”๋ณ„ ์˜จ๋„ ์‹œ๊ณ„์—ด

  • ๋ฐ์ดํ„ฐ ์„ธํŠธ๋Š” ๊ธฐ๊ณ„ ํ•™์Šต ์•Œ๊ณ ๋ฆฌ์ฆ˜์— ์˜ํ•ด ํ›ˆ๋ จ๋˜๊ธฐ ์œ„ํ•ด ์ •๊ทœํ™”๋œ ๋ฐ์ดํ„ฐ์ด์–ด์•ผ ํ•จ
    • ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ์„ธํŠธ์˜ ์˜จ๋„ ๊ฐ’์€ z-score ์ •๊ทœํ™” ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ ์ •๊ทœํ™”
    • z score ๋Š” ์˜จ๋„ ํ‘œ๋ณธ ํ‰๊ท ( ) ๋ฐ ํ‘œ๋ณธ ํ‘œ์ค€ ํŽธ์ฐจ( )๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๊ณ„์‚ฐ
    • ๋ฐฉ์ •์‹์„ ํ†ตํ•ด ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด ์ •๊ทœํ™”๋œ ๊ฐ’ z ์–ป์Œ

 

 

4๏ธโƒฃ FORECASTING MODELS

A. ARIMA

โ–ถ Box์™€ Jenkins๊ฐ€ ์ˆ˜ํ–‰ํ•œ ์—ฐ๊ตฌ

  • ARIMA ((p, d, q) Auto regressive integrated moving average model)๊ฐ€ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ
  • ๊ด‘๋ฒ”์œ„ํ•œ ์‹œ๊ณ„์—ด ๋ถ„์„ ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์— ์ ์šฉ๋จ

 

โ–ถ Ring Chen๊ณผ Xu Lai[6]๊ฐ€ ์ˆ˜ํ–‰ํ•œ ์—ฐ๊ตฌ

  • 1๋‹จ๊ณ„ : ๋ชจ๋ธ ์ธ์‹
    • ์˜จ๋„ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ x
    • (t-i)๋ฒˆ ์งธ ์˜จ๋„ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ x(t-i)
    • ๋ฌด์ž‘์œ„ ๋ฐฑ์ƒ‰ ์†Œ์Œ ์‹œ๊ณ„์—ด a(t)
    • ์ž๋™ ํšŒ๊ท€ ๋งค๊ฐœ๋ณ€์ˆ˜ φ(i)
    • ์ด๋™ ํ‰๊ท  ๋งค๊ฐœ๋ณ€์ˆ˜ θ(j)
    • ์ž๊ธฐ ํšŒ๊ท€ ๋ชจ๋ธ์˜ ์ˆœ์„œ p
    • ์ด๋™ ํ‰๊ท  ๋งค๊ฐœ๋ณ€์ˆ˜ d
  • Dickey-Fuller test ์„ ์‚ฌ์šฉํ•˜์—ฌ ์ง€์ •๋œ ์‹œ๊ณ„์—ด์ด ์ •์ง€ ์ƒํƒœ์ธ์ง€ ์—ฌ๋ถ€๋ฅผ ํ™•์ธ
  • ์ฆ๊ฐ•๋œ dickey fuller tests ๋Š” ARIMA ๋ชจ๋ธ์„ ์ˆ˜์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ผ๋ฐ˜ํ™”๋œ dickey fuller tests
  • ์‹œ๊ณ„์—ด์ด ๋น„์ •์ƒ์ธ ๊ฒฝ์šฐ ์‹œ๊ณ„์—ด์„ ๊ณ ์ • ๋ชจ๋ธ๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•ด ์ฐจ๋ถ„์„ ์ˆ˜ํ–‰

1์ฐจ ์ฐจ์•ก

  • ๊ณ ์ •์ ์ด์ง€ ์•Š์€ ๊ฒฝ์šฐ, d=1์ผ ๋•Œ ์ •์ง€๋  ๋•Œ๊นŒ์ง€ d-1์„ ์‚ฌ์šฉํ•˜์—ฌ ์ฐจ์ด๋ฅผ ๋‘๊ธฐ

 

  • 2๋‹จ๊ณ„ : ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ถ”์ •
  • Parameter estimation ์—๋Š” ๊ฐ€์žฅ ๋†’์€ ์ •ํ™•๋„๋กœ ์‹œ๊ณ„์—ด์„ ์„ค๋ช…ํ•  ์ˆ˜ ์žˆ๋Š” ์˜ฌ๋ฐ”๋ฅธ p์™€ q๋ฅผ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ํฌํ•จ
  • ์ž๋™ ์ƒ๊ด€ ํ•จ์ˆ˜(ACF)์™€ ํŽธ ์ž๊ธฐ ์ƒ๊ด€ ํ•จ์ˆ˜(PACF)๋ฅผ ๋ถ„์„ํ•˜์—ฌ ๋Œ€๋žต์ ์œผ๋กœ ์ถ”์ •
    • ACF ํ•จ์ˆ˜๋Š” ์ด๋™ ํ‰๊ท  q์˜ ์ˆœ์„œ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๋ฐ ๋„์›€
    • PACF ํ•จ์ˆ˜๋Š” ์ž๊ธฐ ํšŒ๊ท€ ๋ชจ๋ธ์˜ ์ˆœ์„œ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๋ฐ ์‚ฌ
    • P ๊ฐ’์€ PACF ๊ทธ๋ž˜ํ”„๊ฐ€ ์‹ ๋ขฐ ์ƒ๊ณต์„ ์ง€๋‚˜๋Š” ์‹œ์ฐจ ๊ฐ’
    • Q ๊ฐ’์€ ACF ๊ทธ๋ž˜ํ”„๊ฐ€ ์‹ ๋ขฐ ์ƒ๋‹จ์˜ ๊ฐ„๊ฒฉ๊ณผ ๊ต์ฐจํ•˜๋Š” ์‹œ์ฐจ ๊ฐ’

 

  • 3๋‹จ๊ณ„ : Residual ์ง„๋‹จ ๋ฐ ์˜ˆ์ธก ํ™•์ธ
  • Residual ์€ ์ ์ ˆํ•œ ๋ชจํ˜•์„ ์žฅ์ฐฉํ•œ ํ›„ ๋‚จ์€ ๊ฒƒ 
    • ์ž”์ฐจ๋Š” ์‹ค์ œ ๊ฐ’๊ณผ ์˜ˆ์ธก ๊ฐ’ ์‚ฌ์ด์˜ ์ฐจ์ด๋กœ ๊ฐ„์ฃผ
    • ๋ชจ๋ธ์ด ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ์—์„œ ์ ์ ˆํ•œ ์ •๋ณด๋ฅผ ์บก์ฒ˜ํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜ํ–‰

  • ์ ์ ˆํ•œ ์˜ˆ์ธก ๋ชจํ˜•์˜ ๊ฒฝ์šฐ ์ž”์ฐจ๋Š” ์ƒ๊ด€ ๊ด€๊ณ„๊ฐ€ ์—†๊ณ  ํ‰๊ท ์ด 0์ด์–ด์•ผ ํ•จ

 

B. Deep learning
  • ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ 2๊ฐœ์˜ 1์ฐจ์› ์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด์™€ 2๊ฐœ์˜ LSTM ๋ ˆ์ด์–ด๋กœ ๊ตฌ์„ฑ
    • 1์ฐจ์› ์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด๋Š” ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ lateral features์„ ์–ป๋Š” ๋ฐ ์‚ฌ์šฉ
    • LSTM ๋ ˆ์ด์–ด๋Š” ์˜จ๋„ ์‹œ๊ณ„์—ด์—์„œ temporal features์„ ์ถ”์ถœํ•˜๋Š” ๋ฐ ์‚ฌ์šฉ

๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ๋†’์€ ์ˆ˜์ค€์˜ ์•„ํ‚คํ…์ฒ˜

 

 

  • 1๋‹จ๊ณ„ : 1์ฐจ์› ์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด
  • ์ปจ๋ณผ๋ฃจ์…˜ ์—ฐ์‚ฐ(convolution operation)์€ ํ•œ ํ•จ์ˆ˜์˜ ๋ชจ์–‘์ด ๋‹ค๋ฅธ ํ•จ์ˆ˜์— ์˜ํ•ด ์–ด๋–ป๊ฒŒ ์ˆ˜์ •๋  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ๋‘ ๊ฐœ์˜ ์ฃผ์–ด์ง„ ํ•จ์ˆ˜์—์„œ ํŒŒ์ƒ๋œ ํ•จ์ˆ˜
  • CNNS๋Š” ์—ญ ์ „ํŒŒ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ํ›ˆ๋ จ
  • CNN์€ ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ ๊ด€๋ จ ์ž‘์—…์— ์ผ๋ฐ˜์ ์œผ๋กœ ์‚ฌ์šฉ
    • CNN์€ ์ฐจ์›์„ ๊ณ ๋ คํ•˜์ง€ ์•Š๊ณ  ์œ ์‚ฌํ•œ ํŠน์„ฑ๊ณผ ์œ ์‚ฌํ•œ ์ ‘๊ทผ ๋ฐฉ์‹์„ ๊ณต์œ 
    • ์ฃผ์š” ์ฐจ์ด์ ์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ ์ฐจ์› ๋ฐ ํ•„ํ„ฐ๊ฐ€ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฐ€๋กœ์งˆ๋Ÿฌ ๋ฏธ๋„๋Ÿฌ์ง€๋Š” ๋ฐฉ์‹
      • 1์ฐจ์› ์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด ํ•„ํ„ฐ๋Š” ๋‹จ์ผ ์ฐจ์›๋งŒ ์Šฌ๋ผ์ด๋”ฉ
      • ์˜จ๋„ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ์„ธํŠธ์—๋Š” ์‹œ๊ฐ„ ๋‹จ๊ณ„์™€ ์˜จ๋„ ๊ฐ’์ด๋ผ๋Š” ๋‘ ๊ฐ€์ง€ ์ฐจ์›์ด ์žˆ์Œ
    • ํ•„ํ„ฐ๋‚˜ ์ปค๋„์€ ์‹œ๊ฐ„ ์ฐจ์›์„ ๋”ฐ๋ผ์„œ๋งŒ ์ด๋™

์ปค๋„ ์Šฌ๋ผ์ด๋”ฉ ์˜จ๋„ ๋ฐ์ดํ„ฐ

 

  • ์ผ๋ฐ˜์ ์œผ๋กœ ํ•„ํ„ฐ๋ง๋œ ๊ฒฐ๊ณผ ์˜์ƒ์— ํ’€๋ง์ด ์ ์šฉ
    • ํ’€๋ง์˜ ๋ชฉ์ ์€ ๋กœ์ปฌ ๋ฒˆ์—ญ ๋ถˆ๋ณ€์„ฑ(local translation invariance) ์„ ๋‹ฌ์„ฑํ•˜๋Š” ๊ฒƒ
    • ํ’€๋ง์€ ๊ธฐ๋Šฅ ๋งต์„ ๋‹ค์šด ์ƒ˜ํ”Œ๋งํ•˜์—ฌ ์ด ๋ชฉ์ ์„ ๋‹ฌ์„ฑ
      • ๋‘ ๊ฐ€์ง€ ํ’€๋ง ๋ฐฉ๋ฒ•
        • ์ฒ˜์Œ์—๋Š” ํ”ผ์ณ ๋งต์ด chunks๋กœ ๋‚˜๋‰จ
        • ์ตœ๋Œ€ ํ’€๋ง์—์„œ ๊ทธ๋ฃน์˜ ์ตœ๋Œ€๊ฐ’์ด ์‚ฌ์šฉ
        • ํ‰๊ท  ํ’€๋ง์—์„œ ๊ทธ๋ฃน์˜ ํ‰๊ท  ๊ฐ’์ด ์‚ฌ์šฉ
      • ๊ฒฐ๊ณผ ์ด๋ฏธ์ง€๋Š” ์›๋ณธ์˜ ์ถ•์†Œ ๋ฒ„์ „

 

  • 2๋‹จ๊ณ„ : LSTM ๋ ˆ์ด์–ด
  • ์žฅ๊ธฐ ๋‹จ๊ธฐ ๋ฉ”๋ชจ๋ฆฌ ๋„คํŠธ์›Œํฌ๋Š” RNN(Recurrent Neural Networks)์˜ ํŠน๋ณ„ํ•œ ์œ ํ˜•
  • LSTMS๋Š” ์žฅ๊ธฐ์ ์ธ ์˜์กด์„ฑ์œผ๋กœ๋ถ€ํ„ฐ ๋ฐฐ์šธ ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Œ
  • RNN์€ ํ›ˆ๋ จ์„ ์œ„ํ•ด ์‹œ๊ฐ„ ๋™์•ˆ ์ž˜๋ฆฐ ํ›„๋ฐฉ ์ „ํŒŒ๋ฅผ ์‚ฌ์šฉ
    • RNN์€ ์‹œ๊ฐ„ ๋‹จ๊ณ„๊ฐ€ ๋„ˆ๋ฌด ๋งŽ์œผ๋ฉด ๊ธฐ์šธ๊ธฐ ๋ฌธ์ œ๊ฐ€ ์‚ฌ๋ผ์ง
    • LSTMS๋Š” ์‚ฌ๋ผ์ง€๋Š” ๊ฒฝ์‚ฌ ๋ฌธ์ œ๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ์„ค๊ณ„
  • LSTM์€ ์…€ ์ƒํƒœ์™€ ๋‹ค์–‘ํ•œ ๊ฒŒ์ดํŠธ๋ฅผ ์—…๋ฐ์ดํŠธ

  • Forget gate
    • ๋ง๊ฐ์˜ ๋ชฉ์ ์€ ์–ด๋–ค ์ •๋ณด๋ฅผ ๊ธฐ์–ต์—์„œ ์žŠ์–ด์•ผ ํ•˜๋Š”์ง€ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ
    • sigmoid function ๋Š” ํ˜„์žฌ ์ž…๋ ฅ ๋ฐ ์ด์ „ ์ˆจ๊ฒจ์ง„ ์ƒํƒœ์˜ ์ •๋ณด์— ์ ์šฉ
      • ๊ฐ’์ด 0์— ๊ฐ€๊นŒ์šฐ๋ฉด ๋ฒ„๋ฆผ
      • 1์— ๊ฐ€๊นŒ์šฐ๋ฉด ๋ณด์กด
  • Input Gate
    • ์…€ ์ƒํƒœ ์—…๋ฐ์ดํŠธ์™€ ๊ด€๋ จ๋œ ์ž…๋ ฅ ๊ฒŒ์ดํŠธ
    • ํ˜„์žฌ ์ž…๋ ฅ๊ณผ ์ด์ „ ์ˆจ๊ฒจ์ง„ ์ƒํƒœ์— sigmoid function๋ฅผ ์ ์šฉํ•˜์—ฌ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•  ๊ฐ’์„ ๊ฒฐ์ •
      • 0์€ ์—…๋ฐ์ดํŠธ ํ•„์š”ํ•˜์ง€ ์•Š์Œ
      • 1์€ ์—…๋ฐ์ดํŠธ ํ•„์š”
    • tanh ๊ฒŒ์ดํŠธ๋ฅผ ์ ์šฉํ•˜์—ฌ -1๊ณผ +1 ์‚ฌ์ด์˜ ๊ฐ’์„ ๋ณ€ํ™˜
    • ์ด ๋‘ ๊ฒŒ์ดํŠธ์˜ ๋‹ค์Œ ์ถœ๋ ฅ์€ ์…€ ์ƒํƒœ์— ๊ณฑํ•˜์—ฌ ์ถ”๊ฐ€
  • Output gate
    • ๋‹ค์Œ ์ˆจ๊ฒจ์ง„ ์ƒํƒœ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์„ ํฌํ•จ
    • ํ˜„์žฌ ์ž…๋ ฅ๊ณผ ์ด์ „ ์ˆจ๊น€ ์ƒํƒœ์— sigmoid function๋ฅผ ์ ์šฉํ•˜์—ฌ ๋‹ค์Œ ์ˆจ๊น€ ์ƒํƒœ์—์„œ ์–ด๋–ค ์ •๋ณด๋ฅผ ํฌํ•จํ•ด์•ผ ํ• ์ง€ ๊ฒฐ์ •
    • tanh ๊ฒŒ์ดํŠธ๋Š” ์ƒˆ๋กœ์šด ์…€ ์ƒํƒœ์— ์ ์šฉ
    • ๋‹ค์Œ ์ˆจ๊ฒจ์ง„ ์ƒํƒœ๋Š” ์ด ๋‘ ๊ฒŒ์ดํŠธ ๊ฐ’์„ ๊ณฑํ•˜์—ฌ ๊ณ„์‚ฐ

 

 

5๏ธโƒฃ EVALUATION

  • ์ œ์•ˆ๋œ ARIMA(p,d,q) ๋ฐ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ๋™์ผํ•œ ์›”๋ณ„ ์˜จ๋„ ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ARIMA ๋ชจ๋ธ์„ ์‹๋ณ„ํ•˜๊ณ  ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๊ณ  ์ด ๋‘ ๋ชจ๋ธ์„ ๋ชจ๋‘ ํ…Œ์ŠคํŠธ
  • MSE(ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ)๋Š” ๊ฐ ๋ชจ๋ธ๊ณผ ๊ด€๋ จ๋œ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ ์ธก๋ฉด์—์„œ ๋ชจ๋ธ์˜ ์ •ํ™•๋„๋ฅผ ๊ฒ€์ฆ (MSE ๋‚ฎ์ถœ์ˆ˜๋ก ๋ชจํ˜•์ด ๋” ์šฐ์ˆ˜)

  • Y : ์‹ค์ œ ์˜จ๋„
  • ^Y : ํ•ด๋‹น ์˜จ๋„

 

 

6๏ธโƒฃ RESULTS

12๊ฐœ์›” ๋™์•ˆ์˜ ๊ธฐ์˜จ ์˜ˆ์ธก ๊ฒฐ๊ณผ

  • 2016๋…„ 1์›”๋ถ€ํ„ฐ 2017๋…„ 1์›”๊นŒ์ง€์˜ ์ตœ๊ทผ 12๊ฐœ์›” ๋™์•ˆ์˜ ๊ธฐ์˜จ ์˜ˆ์ธก ๊ฒฐ๊ณผ
    • ํŒŒ๋ž€์ƒ‰ ์„ ์€ ํŠน์ • ์›”์˜ ์‹ค์ธก ์˜จ๋„ ๊ฐ’
    • ๋นจ๊ฐ„์ƒ‰ ์„ ์€ ํ•ด๋‹น ์›”์˜ ์˜ˆ์ธก ๊ฒฐ๊ณผ
  • 2016๋…„ 3์›”์˜ ์˜จ๋„๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ ์–ด๋ ค์›€์„ ๊ฒช๊ณ  ์žˆ์Œ
  • 2016๋…„ 4์›” ์ดํ›„ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ํ•ด๋‹น ๊ธฐ๊ฐ„์˜ ARIMA ๋ชจ๋ธ๊ณผ ๋น„๊ตํ•  ๋•Œ ์‹ค์ œ์— ๋” ๊ฐ€๊น๊ฒŒ ์˜ˆ์ธก
    • ์˜ˆ์ธก ์„ฑ๋Šฅ ์ธก๋ฉด์—์„œ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ์šฐ์ˆ˜์„ฑ์„ ๋ณด์—ฌ์คŒ

ARIMA์™€ ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ MSE ๋น„๊ต ๋ถ„์„

  • ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ๊ฐ€์žฅ ๋‚ฎ์€ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ ๊ฐ’์„ ์–ป์„ ์ˆ˜ ์žˆ์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ARIMA ๋ชจ๋ธ๋ณด๋‹ค ์ •ํ™•๋„ ๋ฉด์—์„œ ์šฐ์ˆ˜ํ•จ

 

 

7๏ธโƒฃ CONCLUSION

  • ์ด ์—ฐ๊ตฌ๋Š” 12๊ฐœ์›” ์ „ ์˜จ๋„๋ฅผ ์˜ˆ์ธกํ•˜๊ธฐ ์œ„ํ•ด ๋”ฅ ๋Ÿฌ๋‹๊ณผ ARIMA ๋ชจ๋ธ์„ ๋„์ž…
  • ๋‘ ๋ชจ๋ธ ๋ชจ๋‘ ์ •ํ™•๋„ ์ธก๋ฉด์—์„œ ์„ฑ๋Šฅ์„ ๊ธฐ์ค€์œผ๋กœ ๋น„๊ต ๋ถ„์„
  • ๋ชจ๋ธ ์‹๋ณ„ ๋ฐ ๊ฒ€์ฆ์„ ์œ„ํ•ด Hungry, Szeged์— ์„ค์ •๋œ ์‹ค์ œ ๋‚ ์”จ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉ
  • ์‹คํ—˜ ๊ฒฐ๊ณผ์— ๋”ฐ๋ฅด๋ฉด ์ปจ๋ณผ๋ฃจ์…˜ ๋ฐ LSTM ๋ ˆ์ด์–ด๋กœ ๊ตฌ์„ฑ๋œ ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ์˜จ๋„๋ฅผ ์˜ˆ์ธกํ•  ๋•Œ ARIMA ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€
  • ๊ฒฐ๋ก ์ ์œผ๋กœ ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ์˜จ๋„์™€ ๊ฐ™์€ ๊ธฐ์ƒ ๋งค๊ฐœ ๋ณ€์ˆ˜ ์˜ˆ์ธก ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์œ„ํ•œ ์ „ํ†ต์ ์ธ ARIMA ๋ชจ๋ธ์„ ํšจ๊ณผ์ ์œผ๋กœ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์Œ

 

 

 

 

728x90
๋ฐ˜์‘ํ˜•
Comments