๐ ๊ณต๋ถํ๋ ์ง์ง์ํ์นด๋ ์ฒ์์ด์ง?
์๊ณ์ด ๋ฐ์ดํฐ(Serial data) ์ ์ฒ๋ฆฌ ํ๊ธฐ (2) ๋ณธ๋ฌธ
์๊ณ์ด ๋ฐ์ดํฐ(Serial data) ์ ์ฒ๋ฆฌ ํ๊ธฐ (2)
์ง์ง์ํ์นด 2022. 9. 27. 13:36220927 ์์ฑ
<๋ณธ ๋ธ๋ก๊ทธ๋ today-1๋์ ๋ธ๋ก๊ทธ๋ฅผ ์ฐธ๊ณ ํด์ ๊ณต๋ถํ๋ฉฐ ์์ฑํ์์ต๋๋ค :-) >
https://today-1.tistory.com/31?category=886697
https://today-1.tistory.com/32?category=886697
์๊ณ์ด ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ2
์๊ณ์ด ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ์ ์ ์์ฌํญ : ์๊ณ์ด ๋ฐ์ดํฐ ๋ถ์์ ์์ ๋ฐ์ดํฐ๋ฅผ ์ ์ ํ ๋ ์์งํด์ผ ํ๋ ์ ์ ์ ๋ฆฌํ๊ณ ์ ํจ 1. ์๊ฐ์์ญ(ํด์๋) ์ ํ : ์๊ณ์ด์ด ๋ถ์ํจ๊ณผ์ ๋์์ด ๋ ์๊ฐ์์ญ(ํด
today-1.tistory.com
1๏ธโฃ ์๊ฐ์์ญ(ํด์๋) ์ ํ
: ์๊ณ์ด์ด ๋ถ์ํจ๊ณผ์ ๋์์ด ๋ ์๊ฐ์์ญ(ํด์๋)์ ๋ถ์๊ฐ์ ๊ฒฝํ๊ณผ ์ง์์ ๊ธฐ๋ฐ์ผ๋ก ์ ํํด์ผ ํจ
: ์ผ๋ฐ์ ์ผ๋ก ์์ธก ์ ํ์ฑ์ด ๋์ ์๊ฐ์์ญ์ ์ ํํ๊ฑฐ๋ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ค์ ํ์ต์ผ๋ก ์ฌ์ฉํ์ฌ ์ฐ์์ ์ผ๋ก ์ฌ์ฉํจ
: ์ฐ๊ฐ ๋จ์ ๋น์ฆ๋์ค ๋ชฉํ ์์ธก์ ์์๋ก
- ์๋ณ ๋๋ ๋ถ๊ธฐ๋ณ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ฉด ์ฐ๊ฐ ๋ฐ์ดํฐ๋ณด๋ค ๋์ ์์ธก์ด ๊ฐ๋ฅํ ๊ฒ
- ์/๋ถ๊ธฐ๋ณ ์์ธก์น๋ฅผ ์ฐ๊ฐ์ผ๋ก ํ์ฐ์ ์ค๋ฅ๊ฐ ๋์ด๋ ๊ฒ ๊ฐ์ง๋ง ์ค์ ๋ก๋ ๋ฐ๋์ ๊ฒฝ์ฐ๊ฐ ๋ง์
- ๋๋ฌด ์ธ๋ถํ๋ ์๊ฐ์์ญ์ ์ฌ์ฉํ ์ ์ค๋ฅ๊ฐ ์ฆ๊ฐ๋ ์ ์์
2๏ธโฃ ๋์ ์ ํ๋์ ๋์ ์๋ฌ
: ์๊ณ์ด ๋ฐ์ดํฐ/๋ถ์์ ๋์ ์ ํ๋๋ฅผ ๋ณ๊ฑฐ๋ ๋์ ์๋ฌ๋ฅผ ๋ฐ์์ํด
: ๋์ ์ ํ๋(High Accuracy)๋ ๊ณผ๊ฑฐ ํจํด์ด ๋ฏธ๋์๋ ๊ทธ๋๋ก ์ ์ง๊ฐ ๋๋ค๋ฉด ์์ธก ์ ํ๋๊ฐ ๋์์ง
: ๋์ ์๋ฌ(High Error)๋ ํจํด์ด ์ ์ฐจ์ ์ผ๋ก ๋๋ ๊ฐ์๊ธฐ ๋ณ๊ฒฝ๋๋ฉด ์์ธก๊ฐ์ ์ค์ ๊ฐ์์ ํฌ๊ฒ ๋ฒ์ด๋ ์ ์์
- Black Swan : ์ผ์ด๋ ๊ฒ ๊ฐ์ง ์์ ์ผ์ด ์ผ์ด๋๋ ํ์
- White Swan : ๊ณผ๊ฑฐ ๊ฒฝํ๋ค๋ก ์ถฉ๋ถํ ์์๋๋ ์๊ธฐ์ง๋ง ๋์์ฑ ์ด ์๊ณ ๋ฐ๋ณต๋ ํ์
- Gray Swan : ๊ณผ๊ฑฐ ๊ฒฝํ๋ค๋ก ์ถฉ๋ถํ ์์๋์ง๋ง ๋ฐ์๋๋ฉด ์ถฉ๊ฒฉ์ด ์ง์๋๋ ํ์
3๏ธโฃ ์๊ฐํ์ค ๋ฐ์
: ๋ฏธ๋์ ์๊ฐํจํด์ ๋ฏธ๋ฆฌ ๋ฐ์ํ๋๊ฒ์ ๋นํ์ค์ ์ด๋ฉฐ ์ด๋ ๊ณผ์ ํฉ(Overfitting)์ ์ ๋ฐ
: ๊ธฐ๊ณํ์ต์์ Test Set์ ์ ๋ ์ฌ์ฉํ๋ฉด ์๋๋ ์ด์ ์ด๋ฉฐ, ์ผ๋ฐํ ์ฑ๋ฅ์ ํ๋ฝ์ํค๋ ์ฃผ๋ ์์ธ
4๏ธโฃ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ
: ๋ถ์ ๊ฒฐ๊ณผ ์์ ์ฑ์ ํ๋ณดํ๊ธฐ ์ํด์ ์กฐ๊ฑด์๋ฅผ ๊ฐ์์์ผ์ผ ํจ
- ์ค์ผ์ผ๋ง(Scaling) : pc๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ณ ๋ คํ์ฌ ์ค๋ฒํ๋ก์ฐ๋ ์ธ๋ํ๋ก์ฐ๋ฅผ ๋ฐฉ์ง, ๋
๋ฆฝ ๋ณ์์ ๊ณต๋ถ์ฐ ํ๋ ฌ ์กฐ๊ฑด์๋ฅผ ๊ฐ์
- Standard Scaler : ํ๊ท ์ ์ ์ธํ๊ณ ํ์คํธ์ฐจ๋ก ๋๋์ด ๋ณํ (์ ๊ท ๋ถํฌ๋ฅผ ๊ฐ์ ์ ์ฌ์ฉ)
- Min-Max Scaler : ๊ฐ์ฅ ๋ง์ด ํ์๋๋ฉฐ ์ต์~์ต๋ ๊ฐ์ด 0~1 ๋๋ -1~1 ์ฌ์ด๋ก ๋ณํ (์ ๊ท ๋ถํฌ ๊ฐ์ ์ ์ํจ)
- Robust Scaler : ์ต์-์ต๋ ์ค์ผ์ผ๋ฌ์ ์ ์ฌํ์ง๋ง ์ต์/์ต๋ ๋์ IQR์ค 1๋ถ์์์ 3๋ถ์์๋ฅผ ์ฌ์ฉํ์ฌ ๋ณํ
- Normakuzer : ๊ฐ ๋ณ์๋ค ์ ์ฒด n๊ฐ ๋ชจ๋ ๋ณ์๋ค์ ํฌ๊ธฐ๋ค๋ก ๋๋์ด์ ๋ณํ, ๋ชจ๋ ๋ณ์๋ค์ ๊ฐ์ ์์ ์ผ๋ก ๋ถํฐ ๋ฐ์ง๋ฆ 1 ์ด๋ด
- ๋ค์ค๊ณต์ ์ฑ(Multicollinearity) ์ ๊ฑฐ : ๋
๋ฆฝ๋ณ์์ ์ผ๋ถ๊ฐ ๋ค๋ฅธ ๋
๋ฆฝ๋ณ์๋ค์ ์กฐํฉ์ผ๋ก ํํ๋ ์ ์๋ ๊ฒฝ์ฐ ๋ฑ ๋ฐ์
- Variance Inflation Factor(VIF) ๋ณ์ ์ ํ : ์์กด์ฑ์ด ๋ฎ์ ๋ณ์ ์ ํ ํน์ ๋์ ๋ ๋ฆฝ๋ณ์๋ฅผ ์ ๊ฑฐ
- Principal Component Analysis(PCA) ๋ณ์ ์ ํ : ์๋ก ๋ ๋ฆฝ์ธ ์ฐจ์์ ๋ ๋ฆฝ๋ณ์ ํ๋ ฌ๋ก ๋ณํ์ํค๋ ์๊ณ ๋ฆฌ์ฆ
'๐ฉโ๐ป ์ธ๊ณต์ง๋ฅ (ML & DL) > Serial Data' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์๊ณ์ด ๋ฐ์ดํฐ ๋ถ์ ์์ (Time Series Analysis Order) (0) | 2022.09.28 |
---|---|
๋ค๋ณ๋ ์๊ณ์ด ๋ฐ์ดํฐ 1 (Multivariate Time Series Data) (0) | 2022.09.28 |
์๊ณ์ด ๋ฐ์ดํฐ(Serial data) ์ ์ฒ๋ฆฌ ํ๊ธฐ (1) (0) | 2022.09.27 |
์ด์ ํ์ง์ ์๊ณ ๋ฆฌ์ฆ (Anomaly Detection Algorithm) (0) | 2022.09.27 |
VSCode ์ Dash ์คํํ๊ธฐ (0) | 2022.09.27 |