๐ ๊ณต๋ถํ๋ ์ง์ง์ํ์นด๋ ์ฒ์์ด์ง?
Serial Data ์ฅ์ ์์ธก/๊ฐ์ง LSTM & Conv ๋ชจ๋ธ ๋ณธ๋ฌธ
Serial Data ์ฅ์ ์์ธก/๊ฐ์ง LSTM & Conv ๋ชจ๋ธ
์ง์ง์ํ์นด 2022. 10. 28. 14:09๐ข LSTM (Long Short term Memory)
: ์ด์ ์๊ฐ ์คํ ์ ์ ๋ ฅ๊ฐ์ผ๋ก ์ฌ์ฉํด์ ์๊ณ์ด ๋๋ ์ํ์ค์ ํ์ ๊ฐ์ ์์ธก
1) Forget : ๊ณผ๊ฑฐ ์ ๋ณด๋ฅผ ์ผ๋ง๋ ์ ์งํ ์ง
2) Input : ์๋ก ์ ๋ ฅ๋ ์ ๋ณด๋ฅผ ์ผ๋ง๋ ํ์ฉํ ์ง
+) ('๊ณผ๊ฑฐ์์ ์ ์งํ ์ ๋ณด' + 'ํ์ฌ์์ ์ ์งํ ์ ๋ณด')๋ฅผ ํตํด ํ์ฌ ์์ ์ cell state๋ฅผ update
3) Output : ๋ ์ ๋ณด๋ฅผ ๊ณ์ฐํด ๋์จ ์ถ๋ ฅ ์ ๋ณด๋ฅผ ์ผ๋ง๋งํผ ๋๊ฒจ์ค ๊ฒ์ธ์ง
๐ขConvolution
: ์ปค๋์ ์ฌ์ฉํด ์๋ณธ ์ด๋ฏธ์ง์ ์ปจ๋ณผ๋ฃจ์ (convolution)์ ์ทจํ๋ฉด ํํฐ์ ํน์ฑ์ ๋ง๊ฒ ๊ฐ์กฐ๋ ์ด๋ฏธ์ง๋ฅผ ์ป์
๐ต ๋ชจ๋ธ ๋์ ์๋ฆฌ
1. epoch
: ํ์ต ๋ฐ๋ณต ํ์
: ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ , ๋ฐ๋ณต์ ํ๋ฉฐ loss๋ฅผ ์ค์ฌ๋๊ฐ๋ ๊ฒ์ด ๋ฅ๋ฌ๋์ ํ์ต
2. loss
: ์ค์ฐจ๋ ์๊ณ ๋ฆฌ์ฆ์ด ์์ธกํ ๊ฐ๊ณผ ์ค์ ์ ๋ต๊ณผ์ ์ฐจ์ด๋ฅผ ์๋ฏธ
: ์ด ๊ฐ์ ์ค์ด๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐฑ์ ํ์ฌ ํ์ต์ ์งํ
: ๊ฐ์ด ์ค์ด๋ค์๋ก ์ข์ ๊ฒ
3. ๊ณผ์์ ํฉ Underfitting
: ํ๋ จ ์ธํธ์ ๊ฒ์ฆ ์ธํธ ๋ชจ๋์์ ๋์ ์์ค
โ ๊ณผ์ ์ ํฉ์ ์์ธ
- ๋ชจ๋ธ์ ๋ณต์ก๋๊ฐ ๋ฎ์ ๊ฒฝ์ฐ
- ๋ชจ๋ธ์ ๋๋ฌด ๋ง์ ๊ท์ ๊ฐ ์ ์ฉ๋ ๊ฒฝ์ฐ
- ์ถฉ๋ถํ์ง ๋ชปํ epoch๋ก ํ์ตํ๋ ๊ฒฝ์ฐ
โ ํด๊ฒฐ ๋ฐฉ๋ฒ
- ๋ ๋ณต์กํ ๋ชจ๋ธ์ ์ ์ฉํ์ฌ ํ๋ จ ์ธํธ์ ๊ท์น์ ์ ์ฐพ์๋
- ๋ชจ๋ธ์ ๋๋ฌด ๋ง์ ๊ท์ ๊ฐ ๊ฑธ๋ฆฐ ๊ฒฝ์ฐ ๊ท์ ๋ฅผ ์ค์
- ๋ ๋ง์ epoch๋ฅผ ํตํด ๋ชจ๋ธ์ด ์ถฉ๋ถํ ํ์ตํ์ฌ ํ๋ จ ์ธํธ์ ๊ท์น์ ์ฐพ๊ฒ ํจ
4. ๊ณผ๋์ ํฉ Overfitting
: ํ๋ จ ์ธํธ์์๋ ๋ฎ์ ์์ค, ๊ฒ์ฆ ์ธํธ์์๋ ๋์ ์์ค
โ ๊ณผ๋ ์ ํฉ์ ์์ธ
- ๋ฐ์ดํฐ ์ธํธ ๋ด ๋ฐ์ดํฐ๊ฐ ์ถฉ๋ถํ์ง ๋ชปํ ๊ฒฝ์ฐ
- ๋ชจ๋ธ์ ๋ณต์ก๋๊ฐ ํฐ ๊ฒฝ์ฐ
- ๊ณผ๋ํ๊ฒ ํฐ epoch๋ก ํ์ตํ๋ ๊ฒฝ์ฐ
โ ํด๊ฒฐ ๋ฐฉ๋ฒ
- ํ๋ จ ์ธํธ์ ๋ฐ์ดํฐ๋ฅผ ์ถ๊ฐ
- ๊ฐ์ค์น๋ฅผ ์ ํํ๋ ๊ท์ (Regularization)๋ฅผ ์ ์ฉํ์ฌ ๋ชจ๋ธ์ ๋ณต์ก๋๋ฅผ ๋ฎ์ถค
- ๋ชจ๋ธ์ ํ์ต ๊ณก์ (learning curve)์ ๋ณด๊ณ ์ ๋นํ epoch๋ฅผ ์ฐพ์๋ด์ด ๊ทธ epoch๊น์ง๋ง ํ๋ จ ํจ -> ์กฐ๊ธฐ์ข ๋ฃ(early-stopping)