[Deep Learning]_1_λ¨Έμ λ¬λ μν
220128 μμ±
<λ³Έ λΈλ‘κ·Έλ λμ°μ°λΆλμ λ₯λ¬λ μ λ¬Έ λΈλ‘κ·Έλ₯Ό μ°Έκ³ ν΄μ 곡λΆνλ©° μμ±νμμ΅λλ€>
https://doooob.tistory.com/189
[λ₯λ¬λ μ λ¬Έ - 2] λ¨Έμ λ¬λμ μ¬μ©λλ μν
λ€μ μ₯λΆν° 3νμ κ±Έμ³ λ₯λ¬λμ ν¬ν¨ν λ¨Έμ λ¬λμ νμν μνμ κΈ°μ΄λ‘ 'λ―ΈλΆ', 'μ ν λμν', 'νλ₯ ν΅κ³'μ 3κ°μ§μ λν μμ μ μ§§κ² μκ°νκ² μ΅λλ€. κ·Έ μ μ, μ΄ μ₯μμλ κΈ°κ³ νμ΅(mach
doooob.tistory.com
1. κΈ°κ³ νμ΅μ΄λ?
: μ£Όμ΄μ§ λ°μ΄ν°μμ μ μ μλ λ°μ΄ν°μ λνμ¬ νΉμ κ·μΉμ΄λ ν¨ν΄μ μΆμΆνκ³ , μ΄λ₯Ό λ°νμΌλ‘ λ―Έμ§μ λ°
μ΄ν°λ₯Ό λΆλ₯νκ±°λ μμΈ‘
2. μ§λ νμ΅
: λ¬Έμ μ λν λ΅μ΄ μκ³ , μμλ μλ΅κ³Ό μ€μ μλ΅μ κ°κ·Ήμ΄ μμμ§λ€
AI ·
μΈκ³΅μ§λ₯/λ₯λ¬λ Tutorial
: μ£Όμ΄μ§ λ°μ΄ν°μμ κ΄κ³λ₯Ό μμνλ©° λ―Έμ§μ λ°μ΄ν°μ λν΄ μ’μ μ λ§ μΈμ°κΈ°
2.1 μ§μ μ μν κ·Όμ¬
: input x κ° μ£Όμ΄μ§λ©΄ νλμ μΆλ ₯μ λ°ν
: κΈ°μΈκΈ° w μ μ νΈ b μ λκ° νλΌλ―Έν°λ‘ μ΄λ€μ§
: κ²Ήμ³ λ³΄λ©΄ μ λ³λ‘ κ΄κ³κ° μ΄λ»λ³΄μ΄μ§ μλλ€
: wκ³Ό bλ₯Ό μ κ²°μ νμ¬ λΉ¨κ° μ μ μ΅λν κ·Όμ ν μ§μ μ μ°Ύμ μ μλ€λ©΄ μλ‘μ΄ x κ° μ£Όμ΄μ§ λ t κ° μμΈ‘ κ°λ₯
=> λ―Έμ§μ λ°μ΄ν°μ λν΄μ μ λ°νκ² μμΈ‘μ΄ κ°λ₯ν κ²μ μΌλ°ν μ±λ₯(generalizability)μ΄ λλ€
: 맀κ°λ³μλ₯Ό μ¬μ©νμ¬ μ΄λ€ κ³μ°μ μ€μ, μ¦ μ£Όμ΄μ§ λ°μ΄ν°μ νΉμ§κ³Ό κ΄κ³μ±μ λνλ΄λ κ²μ λͺ¨λΈ(model)μ΄λΌ λΆλ₯΄μ
2.2 λͺ©μ ν¨μ
: μ’μ νλΌλ―Έν°λ₯Ό μλμΌλ‘ μ°Ύμλ΄κΈ° μν΄μλ 무μμ΄ μ’μ λ§€κ° λ³μμΈκ° ! μ§νλ₯Ό μ μ
: μ§νλ₯Ό λνλ΄λ ν¨μλ₯Ό λͺ©μ ν¨μ(objective function)
f(x) = wx + b
: x λ₯Ό μ λ ₯ λ³μ (input variable)
: y λ₯Ό μΆλ ₯ λ³μ (output variable)
: μμ μ£Όμ΄μ§ ꡬ체μ μΈ x κ°μ μ λ ₯κ° (input value)
: λ§€κ° λ³μ x, b λ₯Ό μ΄μ©ν κ³μ° κ²°κ³Όλ‘ μ»μ΄μ§λ ꡬ체μ μΈ y κ°μ μμΈ‘κ° (predicted value)
: λΉ¨κ° μ μ΄ κ°λ t, μμΈ‘νκ³ μνλ λͺ©νκ° (target value)
=> λͺ©μ ν¨μλ λͺ¨λΈμ μμΈ‘κ°κ³Ό λͺ©νκ°μ λ°κ³ κ·Έ μ¬μ΄μ μ°¨λ₯Ό μΈ‘μ νμ¬ λ°ν
=> μ°¨μ΄κ° μμ μλ‘ λͺ¨λΈμ μμΈ‘μ΄ λ§λ€ ( μ΅μννλ νλΌλ―Έν° μ°ΎκΈ° )
2.3 μ κ³± μ€μ°¨ ν¨μ
ex) μ’νκ° (x, t) λ₯Ό 200 κ° μλ€
x1, x2, --- x200 (μ λ ₯κ°) μμ t1, t2, --- t200 (λͺ©νκ°) μ μμΈ‘ν΄μΌν¨
: f(x) = wx + bμ μν μμΈ‘μΉ yλ₯Ό κ³μ°ν κ²°κ³Ό, y1, y2, ---, y200 μ»μ
: μμΈ‘μΉμ μ νλλ₯Ό, ν΄λΉ λͺ©νκ° μ¬μ΄μ μ°¨μ΄μ μν΄ μΈ‘μ => μ κ³± μ€μ°¨ ν¨μ (squared error function)
: n κ°μ μμΈ‘κ°μ yn, λͺ©νμΉλ₯Ό tn μ΄λΌ νλ©΄
: λ§μ λ°μ΄ν°μ λν΄ μμΈ‘μ νκΈ° μν΄μλ μ κ³± μ€μ°¨λ₯Ό ν©νκ³ νκ· μΌλ‘ νλ¨
=> νκ· μ κ³± μ€μ°¨ (mean squared error) : μ°μ κ°μ μμΈ‘ (νκ·μμ λ§μ΄ μ°μ)
: μμΈ‘ κ°κ³Ό λͺ©ν κ°μ΄ λͺ¨λ nμμ μμ ν μΌμΉν λ 0, κ·ΈμΈ λ°λμ μμ
2.4 λͺ©μ ν¨μ μ΅μ ν
: ν¨μλ₯Ό μ΅μννλ μ λ ₯ λ³μκ°μ ꡬνλ κ²μ μ΅μ ν
2.5 κΈ°κ³ νμ΅μ μ¬μ©λλ μν
: μ΅μ νλ₯Ό μννλλ° νμν κ²μ λ―ΈλΆ (differential)
: μ λ ₯κ°μ μΌλ§λ μμ§μ΄λ©΄ μΆλ ₯κ°μ΄ μμμ§κΉ~~~??