😎 κ³΅λΆ€ν•˜λŠ” μ§•μ§•μ•ŒνŒŒμΉ΄λŠ” μ²˜μŒμ΄μ§€?

[κ΅κ³Όμ„œ 리뷰] Forecasting: Principles and Practice λ³Έλ¬Έ

πŸ‘©‍πŸ’» 인곡지λŠ₯ (ML & DL)/Serial Data

[κ΅κ³Όμ„œ 리뷰] Forecasting: Principles and Practice

μ§•μ§•μ•ŒνŒŒμΉ΄ 2022. 10. 5. 16:20
728x90
λ°˜μ‘ν˜•

221005 μž‘μ„±

<λ³Έ λΈ”λ‘œκ·ΈλŠ” George Athanasopoulos λ‹˜μ˜ μ„œμ λ₯Ό μ°Έκ³ ν•΄μ„œ κ³΅λΆ€ν•˜λ©° μž‘μ„±ν•˜μ˜€μŠ΅λ‹ˆλ‹€>

https://otexts.com/fppkr/

 

Forecasting: Principles and Practice

2nd edition

otexts.com

 

🟣 μ‹œκ³„μ—΄ 예츑

  • IBM 일별 μ£Όκ°€
  • 월별 κ°•μš°λŸ‰
  • Amazon의 뢄기별 판맀 κ²°κ³Ό
  • Google의 μ—°κ°„ 수읡

호주 뢄기별 λ§₯μ£Ό 생산: 1992λ…„ 1λΆ„κΈ° - 2010λ…„ 2λΆ„κΈ° 2λ…„ μ˜ˆμΈ‘κ°’κ³Ό ν•¨κ»˜ ν‘œμ‹œ

 

 

🟣 μ˜ˆμΈ‘ λ³€μˆ˜μ™€ μ‹œκ³„μ—΄ 예츑

예츑 λ³€μˆ˜(predictor variable) : μ˜ˆμΈ‘ν•˜λ €λŠ” λ³€μˆ˜μ˜ κ³Όκ±° κ°’λ§Œ 닀루지 μ•Šκ³  λ‹€λ₯Έ λ³€μˆ˜μ— κ΄€ν•œ 정보도 포함

μ‹œκ³„μ—΄ λͺ¨λΈμ„ 선택 이유 

: μ‹œμŠ€ν…œμ„ 잘 μ΄ν•΄ν•˜μ§€ λͺ»ν•˜κ±°λ‚˜, μ΄ν•΄ν•˜λ”λΌλ„ λ³€μˆ˜μ˜ 행동에 영ν–₯을 μ£ΌλŠ” 관계λ₯Ό μΈ‘μ •ν•˜κΈ°κ°€ μ•„μ£Ό μ–΄λ €μš΄ 경우

: λ‹€μŒ, 관심 μžˆλŠ” λ³€μˆ˜λ₯Ό μ˜ˆμΈ‘ν•  수 있으렀면 λ‹€μ–‘ν•œ 예츑 λ³€μˆ˜μ˜ λ―Έλž˜κ°’μ„ μ•Œ ν•„μš”κ°€ μžˆκ±°λ‚˜ μ˜ˆμΈ‘ν•  ν•„μš”κ°€ μžˆλŠ” 경우

: 주된 관심이 μ™œ μΌμ–΄λ‚˜λŠ”μ§€κ°€ μ•„λ‹ˆλΌ 무엇이 μΌμ–΄λ‚˜λŠ”μ§€λ§Œ μ˜ˆμΈ‘ν•˜λŠ”λ° μžˆλŠ” 경우

: μ‹œκ³„μ—΄ λͺ¨λΈμ΄ μ„€λͺ… λͺ¨λΈμ΄λ‚˜ ν˜Όν•© λͺ¨λΈλ³΄λ‹€ 더 μ •ν™•ν•œ μ˜ˆμΈ‘κ°’μ„ λ‚΄λŠ” 경우

 

🟣 예츑 κΈ°λ³Έ 단계

1단계: 문제 μ •μ˜

2단계: 정보 μˆ˜μ§‘

: (1) 톡계 데이터, (2) 데이터λ₯Ό λͺ¨μœΌκ³  μ˜ˆμΈ‘κ°’μ„ μ‚¬μš©ν•˜λŠ” μ‚¬λžŒλ“€μ—κ²Œ μΆ•μ λœ 전문지식

3단계: μ˜ˆλΉ„(νƒν—˜μ ; exploratory) 뢄석

: μΌκ΄€λœ νŒ¨ν„΄μ΄ 쑴재? 의미 μžˆλŠ” μΆ”μ„Έ(trend) 쑴재? κ³„μ ˆμ„±(seasonality)이 μ€‘μš”? κ²½κΈ° μˆœν™˜(business cycle)이 쑴재?

4단계: λͺ¨λΈμ„ μ„ νƒν•˜κ³  λ§žμΆ”κΈ°

: κ³Όκ±° 데이터λ₯Ό μ΄μš©ν•  수 μžˆλŠ” 정도, 예츑 λ³€μˆ˜(forecast variable)와 μ„€λͺ… λ³€μˆ˜(explanatory variable) 사이 κ΄€κ³„μ˜ 강도, 그리고 μ˜ˆμΈ‘κ°’μ΄ μ‚¬μš©λ  방식에 따라 μ‚¬μš©ν•  κ°€μž₯ 쒋은 λͺ¨λΈμ΄ 달라짐

5단계: 예츑 λͺ¨λΈμ„ μ‚¬μš©ν•˜κ³  ν‰κ°€ν•˜κΈ°

: λͺ¨λΈμ„ μ„ νƒν•˜κ³ , λͺ¨λΈμ˜ λ§€κ°œλ³€μˆ˜λ₯Ό μΆ”μ •ν•œ λ‹€μŒμ—λŠ”, μ˜ˆμΈ‘κ°’μ„ λ‚΄λŠ” μš©λ„λ‘œ λͺ¨λΈμ„ μ‚¬μš©

 

 

🟣  ts 객체

: μ‹œκ³„μ—΄μ΄λž€ 각 μˆ«μžκ°€ 기둝된 μ‹œκ°„μ— κ΄€ν•œ 정보가 μžˆλŠ” μˆ«μžλ“€μ˜ λͺ©λ‘μœΌλ‘œ 생각 (R 에선 이런 정보λ₯Ό ts 객체둜 μ €μž₯)

 

🟣 μ‹œκ³„μ—΄μ˜ λΉˆλ„

: λΉˆλ„(frequency) : κ³„μ ˆμ„± νŒ¨ν„΄μ΄ 반볡되기 μ „κΉŒμ§€μ˜ κ΄€μΈ‘κ°’μ˜ 수

 

🟣 μ‹œκ°„ κ·Έλž˜ν”„

: 관츑값을 κ΄€μΈ‘ μ‹œκ°„μ— 따라 μΈμ ‘ν•œ 관츑값을 μ§μ„ μœΌλ‘œ μ—°κ²°ν•˜μ—¬ κ·Έλ¦¬λŠ” 것

Ansett 항곡 주별 이코노미석 νƒ‘μŠΉκ°.

 

🟣 μ‹œκ³„μ—΄ νŒ¨ν„΄

μΆ”μ„Έ(trend) : 데이터가 μž₯기적으둜 μ¦κ°€ν•˜κ±°λ‚˜ κ°μ†Œν•  λ•Œ, μΆ”μ„Έ(trend)κ°€ 쑴재

κ³„μ ˆμ„±(seasonality) : ν•΄λ§ˆλ‹€ μ–΄λ–€ νŠΉμ •ν•œ λ•Œλ‚˜ 1μ£ΌμΌλ§ˆλ‹€ νŠΉμ • μš”μΌμ— λ‚˜νƒ€λ‚˜λŠ” 것 같은 κ³„μ ˆμ„± μš”μΈμ΄ μ‹œκ³„μ—΄μ— 영ν–₯ 쀌

μ£ΌκΈ°μ„±(cycle) : κ³ μ •λœ λΉˆλ„κ°€ μ•„λ‹Œ ν˜•νƒœλ‘œ μ¦κ°€λ‚˜ κ°μ†Œν•˜λŠ” λͺ¨μŠ΅μ„ 보일 λ•Œ λ‚˜νƒ€λ‚¨

μ„œλ‘œ λ‹€λ₯Έ νŒ¨ν„΄μ„ λ‚˜νƒ€λ‚΄λŠ” 4가지 μ‹œκ³„μ—΄ 예제.

βž• κ³„μ ˆμ„± λΆ€μ‹œκ³„μ—΄ κ·Έλž˜ν”„

: κ³„μ ˆμ„± νŒ¨ν„΄μ„ κ°•μ‘°ν•˜μ—¬ λ‚˜νƒ€λ‚΄λŠ” 또 λ‹€λ₯Έ 방법은 각 κ³„μ ˆμ— λŒ€ν•œ 데이터λ₯Ό λͺ¨μ•„μ„œ λΆ„λ¦¬λœ μž‘μ€ μ‹œκ°„ κ·Έλž˜ν”„λ‘œ λ‚˜νƒ€λ‚΄λŠ” 것

: μˆ˜ν‰μ„ μ€ 각 월에 λŒ€ν•œ 평균값을 의미

: μ€‘μš”ν•œ κ³„μ ˆμ„± νŒ¨ν„΄μ„ λΆ„λͺ…ν•˜κ²Œ μ‚΄νŽ΄λ³Ό 수 있고, κ³„μ ˆμ„±μ΄ μ‹œκ°„μ— 따라 μ–΄λ–»κ²Œ λ³€ν•˜λŠ”μ§€λ„ λ³Ό 수 있음

: νŠΉμ •ν•œ μ² μ—μ„œ λ‚˜νƒ€λ‚˜λŠ” λ³€ν™”λ₯Ό 확인할 λ•Œ νŠΉλ³„νžˆ μ“Έλͺ¨μžˆμŒ

호주 당뇨병 μ•½ μ›”λ³„μ˜ κ³„μ ˆμ„± λΆ€μ‹œκ³„μ—΄ κ·Έλž˜ν”„.

🟣 산점도(Scatterplots; λ˜λŠ” 산포도, 흩뿌림 κ·Έλž˜ν”„)

: λ³€μˆ˜ μ‚¬μ΄μ˜ 관계λ₯Ό μ‹œκ°ν™”ν•˜λŠ”λ° 도움

2014λ…„ 호주 빅토리아 주의 30λΆ„ λ‹¨μœ„ μ „λ ₯ μˆ˜μš”λ₯Ό κΈ°μ˜¨μ— 따라 λ‚˜νƒ€λ‚Έ κ·Έλž˜ν”„

 

🟣 μƒκ΄€

: μƒκ΄€κ³„μˆ˜(correlation coefficient) : 두 λ³€μˆ˜ μ‚¬μ΄μ˜ κ΄€κ³„μ˜ 강도λ₯Ό μΈ‘μ •ν•  λ•Œ ν”νžˆ κ³„μ‚°ν•˜λŠ” μ–‘

: r은 항상 −1κ³Ό 1 μ‚¬μ΄μ˜ 값을 κ°–κ³ , μŒμˆ˜λŠ” 음의 관계λ₯Ό μ–‘μˆ˜λŠ” μ–‘μ˜ 관계λ₯Ό 의미

μƒκ΄€κ³„μˆ˜κ°€ λ‹€λ₯Έ 데이터λ₯Ό λ‚˜νƒ€λ‚΄λŠ” 예제

 

βž• 산점도 ν–‰λ ¬

: λͺ‡ 가지 후보가 될 λ§Œν•œ μ˜ˆμΈ‘λ³€μˆ˜(predictor variable)κ°€ μžˆμ„ λ•Œ, 각 λ³€μˆ˜λ₯Ό λ‹€λ₯Έ λ³€μˆ˜μ— λŒ€ν•΄ λ‚˜νƒ€λƒ„

: 였λ₯Έμͺ½ κ·Έλž˜ν”„μ˜ 반μͺ½μΈ μœ„μͺ½ 였λ₯ΈνŽΈμ—λŠ” 상관관계(correlation)λ₯Ό λ‚˜νƒ€λ‚΄κ³ , λ‚˜λ¨Έμ§€ 반μͺ½μΈ μ•„λž˜μͺ½ μ™ΌνŽΈμ—λŠ” 산점도(scatterplot), λŒ€κ° μ„±λΆ„μ—λŠ” νžˆμŠ€ν† κ·Έλž¨(histogram) λ˜λŠ” 밀도 κ·Έλž˜ν”„(density plot)λ₯Ό λ‚˜νƒ€λƒ„

호주 NSW의 μ—¬λŸ¬ μ§€μ—­μ—μ„œ 뢄기별 μ—¬ν–‰μž μˆ™λ°•μΌ 수

 

728x90
λ°˜μ‘ν˜•
Comments