π 곡λΆνλ μ§μ§μνμΉ΄λ μ²μμ΄μ§?
μ΄μ νμ§μ μκ³ λ¦¬μ¦ (Anomaly Detection Algorithm) λ³Έλ¬Έ
μ΄μ νμ§μ μκ³ λ¦¬μ¦ (Anomaly Detection Algorithm)
μ§μ§μνμΉ΄ 2022. 9. 27. 11:09220927 μμ±
<λ³Έ λΈλ‘κ·Έλ coding-nurseλκ³Ό today-1, diging-developer λμ λΈλ‘κ·Έλ₯Ό μ°Έκ³ ν΄μ 곡λΆνλ©° μμ±νμμ΅λλ€ :-) >
https://coding-nurse.tistory.com/294?category=991286
[ML μκ³ λ¦¬μ¦] μ΄μ νμ§(Anomaly Detection) μκ³ λ¦¬μ¦
μ΄μνμ§ μκ³ λ¦¬μ¦μ λν λ΄μ©μ΄ λ무 λ°©λνκΈ°λ νκ³ , λ€ κ³΅λΆνκΈ°μ λ°μλ€λ°λΉ νλμ¬νμ μ΄κ³ μλ λμ΄κΈ°μ μ μ 리μ€λͺ μ νλ μ νλΈκ°μλ₯Ό μ ννμλ€! μμλ μ’μ κ°μ ! π₯ μ ν
coding-nurse.tistory.com
https://today-1.tistory.com/27?category=886697
μκ³μ΄ λ° ν΅κ³ μ©μ΄
μκ³μ΄ λ° ν΅κ³μ μ©μ΄ : λΆμ μ§νμ μμ κΈ°μ΄μ μΈ μ©μ΄λ₯Ό λ¨Όμ νμ΅ν΄λ³΄μ 1. λ°μ΄ν° κ΄μ μ λ°λ₯Έ λΆλ₯ : μκ³μ΄ λΆμ Target data 1) μκ³μ΄μ’ λ¨λ©΄ : λ€μμμ + νΉμ λ 립λ³μ 2) μκ³μ΄ν‘λ¨λ©΄ : λ€
today-1.tistory.com
https://dining-developer.tistory.com/29
μκ³μ΄ μμΈ‘μ μ§λ νμ΅μΌλ‘ λ°κΎΈλ λ°©λ² - Time Series to Supervised Learning with Sliding window
μ¬λΌμ΄λ© μλμ°λ₯Ό ν΅ν΄ μκ³μ΄ λ°μ΄ν°λ₯Ό μ§λνμ΅μΌλ‘ λ³ννκΈ° μκ³μ΄ λ°μ΄ν° μμΈ‘(Time series forecasting)μ μ§λ νμ΅(Supervised learning)μΌλ‘ λ³νμν¬ μ μλ€. μ΄λ² κΈμμλ μκ³μ΄ λ¬Έμ λ₯Ό μκ³
dining-developer.tistory.com
1οΈβ£ μ΄μ νμ§(anomaly detection)
: μΌλ°μ μΈ κ°κ³Ό λ€λ₯Έ νΉμ΄ν κ°(outlier)λ λλ¬Έ μ¬κ±΄μ νμ§νλ κΈ°λ²
2οΈβ£ μ΄μ νμ§ μ’ λ₯
- 1. Point Anomaly Detection
- νΉμ pointμ μ΄μμΉλ₯Ό κ°μ§νλ€.
- μΌλ°μ μΌλ‘ λ°μ΄ν° λ΄μ outlier μ΄μμΉλ₯Ό κ°μ§
- μΆμ λ μκ°λμ μ μ μΈ μ λΆν¬μ μ΄μ μ λλ€
- 2. Contextual anomaly detection
- μ°μμ μΈ λ³ν ν¨ν΄μ μ½μ΄μ μ΄μμΉλ₯Ό κ°μ§
- λ§₯λ½μ κ³ λ €ν΄μ μμλ³νμ λλ¨μ΄μ§ κ²°κ³Όλ₯Ό νμ§
- μ£Όμμ : λ―Όκ°νλ©΄ μ μμΈλ°λ μ΄μνμ§κ° λκ³ , λκ°νλ©΄ λΉμ μμΈλ°λ μ΄μνμ§λ₯Ό λμΉ¨
- μκ³μ΄κ³Ό κ°μ λμ μΈ νΉμ±μ μ΄μ μ λ
- 3. Collective anomaly detection
- μ°κ΄μλ 2κ° μ΄μμ λ°μ΄ν°μ λ³νλ₯Ό νμ§
- 2κ°μ΄μμ νΉμ§μ λΉκ΅ν΄μ, 1κ°μ νΉμ§ λ³νμ λ°λΌ λ€λ₯Έ νλ νΉμ§μ΄ μμνλ ν¨ν΄μ΄ μλ λΉμ μμ ν¨ν΄μ κ°μ§ λ νμ§
3οΈβ£ μκ³μ΄ λ° ν΅κ³μ μ©μ΄
μ€μ¬ ν΅κ³λ : λ°μ΄ν°μ μ€μ¬ κ²½ν₯μ λνλ΄λ μμΉ
1) νκ· (μ°μ /κΈ°ν/μ‘°ν/κ°μ€) : νλ³Έλ°μ΄ν°μ μ€μ¬ 무κ²
2) μ€μκ° : μμλ₯Ό κ°μ§ νλ³Έλ°μ΄ν°μ κ°μ΄λ°(50%)μ μμΉν κ°
3) μ΅λΉκ° : νλ³Έλ°μ΄ν° μ€ κ°μ₯ λΉλ²ν κ°
λ³λ ν΅κ³λ : λ°μ΄ν°μ λ³λμ±μ λνλ΄λ μμΉ
1) λ²μ(RANGE) : μ΅λκ°κ³Ό μ΅μκ°μ μ°¨μ΄
2) νΈμ°¨(DEV) : κ΄μΈ‘κ°κ³Ό νκ· μ μ°¨μ΄
3) λΆμ°(VAR) : νΈμ°¨ μ κ³±μ ν©μ λ°μ΄ν°μ μλ‘ λλ κ°
4) νμ€νΈμ°¨(STD) : SQRT(λΆμ°)
νν ν΅κ³λ : λ°μ΄ν°μ λΆν¬ννμ μ곑μ λνλ΄λ μμΉ
1) μλ(Skewness) : νκ· μ μ€μ¬μΌλ‘ μ’μ°λ‘ λ°μ΄ν°κ° νΈν₯λμ΄ μλ μ λ
2) 첨λ(Kurtosis) : λΎ°μ‘±ν¨ μ λ (첨λκ° ν¬λ©΄ μ΄μμΉκ° ν¬λ€)
3) μ΄μμΉ(Outlier) : μ€λ₯λ‘ νλ¨νλ κ°μ΄μ§λ§ κΈ°μ€μ΄ λΆλͺ ν
4οΈβ£ μκ³μ΄ λ°μ΄ν° μμΈ‘(Time series forecasting)μ μ§λ νμ΅(Supervised learning)μΌλ‘ λ³ν
y = f(X)
- μ§λ νμ΅ (Supervised Machine Learning)
- μ λ ₯(X)κ³Ό μΆλ ₯(y) μμ
- νμ΅λ λͺ¨λΈμ λ°νμΌλ‘ νμ΅μ μ°μ΄μ§ μμ μλ‘μ΄ μ λ ₯ λ°μ΄ν°(X)μ λν΄μ μΆλ ₯(y)μ μ μμΈ‘ν μ μλλ‘ νλ κ²
- training λ°μ΄ν°μ μ ν΅ν΄ μ λ΅μ μκ³ κ·Έ λ°©ν₯μΌλ‘ μ§λλλ λ°©μμΌλ‘ νμ΅λκΈ° λλ¬Έμ μ§λ νμ΅
- Classification(λΆλ₯) : μμΈ‘ν κ°μ΄ μΉ΄ν κ³ λ¦¬μΈ κ²½μ°
- Regression(νκ·) : μμΈ‘ν κ°μ΄ μ€μ κ°μΈ κ²½μ°
- μ¬λΌμ΄λ© μλμ° (Sliding Window)
- μκ³μ΄ λ°μ΄ν°λ μ§λ νμ΅μΌλ‘ νν κ°λ₯
- μ΄μ μκ°μ λ°μ΄ν°λ₯Ό μ λ ₯(X)μΌλ‘ μ¬μ©νκ³ λ€μ μκ° λ°μ΄ν°λ₯Ό μΆλ ₯(y)μΌλ‘ μ¬μ©νλ©΄ λ¨
- λ€λ¨κ³ μμΈ‘μμμ μ¬λΌμ΄λ© μλμ° (Sliding Window with Multi-Step Forecasting)
- μμΈ‘ν λ―Έλ λ¨κ³μλ μ€μνλ€.
- One-Step Forecast (1λ¨κ³ μμΈ‘) : λ¨μν λ€μ μκ° (t+1) λ§ μμΈ‘
- Multi-Step Forecast (λ€λ¨κ³ μμΈ‘) : μ¬κΈ°μ λ λ¨κ³ μ΄μμ λ―Έλ μκ° (t+1 ~ t+N) μ μμΈ‘
5οΈβ£ μκ° λ°μ΄ν° λΆμμ μν μ¬λΌμ΄λ© μλμ° κΈ°λ²
: μκ³μ΄ λ°μ΄ν°κ° λ§μ§ μμλ λ°μ΄ν°μ μ λ리기 μν΄ μ¬μ©νλ©° window sizeλ μκ³μ΄ λ°μ΄ν°μ νΉμ±μ κ³ λ €νμ¬ μ€μ ν¨
: y = f (x) λ‘ μ€λͺ ν μ μλ μκ³μ΄ λ°μ΄ν° μΈνΈκ° μ£Όμ΄μ§λ©΄ μ¬λΌμ΄λ© μλμ°λ₯Ό μ¬μ©νμ¬ λ°μ΄ν°κ° μ¬κ΅¬μ±λμ΄ μ΄μ μΆλ ₯ λλ κ³Όκ±° λ°μ΄ν°λ₯Ό μ¬μ©νμ¬ λ€μ μΆλ ₯μ μμΈ‘
- μ¬λΌμ΄λ© μλμ°λ₯Ό κ΄λ¦¬νκΈ° μν λ³μ
- window_start : μ¬λΌμ΄λ© μλμ° μμ μΈλ±μ€
- window_end : μ¬λΌμ΄λ© μλμ° λ μΈλ±μ€
- window_sum : μ¬λΌμ΄λ© μλμ° ν©κ³
- νμ μλμ°μ λ²μ k μ λμΌνκ² μ μ§νλ©° λ²μ λ΄μ μμλ λͺ¨λ ν©μ°νκ³ λ²μ λ°μΌλ‘ λ²μ΄λ μμλ€μ λΉΌμ€
- μ¬λΌμ΄λ© μλμ°μ λ²μκ° k λ³΄λ€ μ»€μ§λκΉμ§ (window_end>=k-1)λ μμλ€μ ν©μ°νκΈ°λ§ νκ³ μ΄νλΆν°λ λ²μ λ°μ μμλ€μ μ°¨κ°
- κΈ°μ‘΄μ²λΌ λ§€λ² μλΈλ°°μ΄μ ν©κ³λ₯Ό ꡬν νμ μμ΄ λͺ¨λ μμλ₯Ό 1λ²λ§ μννλ©΄μ μ΅λκ°μ ꡬνκ² λλ―λ‘ λΉ λ₯΄κ³ ν¨μ¨μ μΌλ‘ μ²λ¦¬
'π©βπ» μΈκ³΅μ§λ₯ (ML & DL) > Serial Data' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
μκ³μ΄ λ°μ΄ν°(Serial data) μ μ²λ¦¬ νκΈ° (2) (0) | 2022.09.27 |
---|---|
μκ³μ΄ λ°μ΄ν°(Serial data) μ μ²λ¦¬ νκΈ° (1) (0) | 2022.09.27 |
VSCode μ Dash μ€ννκΈ° (0) | 2022.09.27 |
μκ³μ΄ λ°μ΄ν°λ(Time Serial) (2) | 2022.09.26 |
Prophetμ μ΄μ©ν κΈ°μ μλμ°¨ μ£Όκ° μμΈ‘νκΈ° (1) | 2022.09.26 |