๋ชฉ์ฐจ
Backpropagation (์ญ์ ํ)
- ์ต์ ์ parameter ๊ฐ์ ์ฐพ๊ธฐ ์ํด cost์ ๋ํ ์ ๋ ฅ์ธต์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ณ์ฐํ๋ ๊ฒ
- ์ถ๋ ฅ์ธต์ ๊ธฐ์ธ๊ธฐ๋ถํฐ ๊ณ์ฐํ์ฌ ์ญ์ผ๋ก ์ ํํ๊ธฐ ๋๋ฌธ์ Backpropagation;์ญ์ ํ ๋ผ๊ณ ํจ
- Chain Rule (ํฉ์ฑํจ์์ ๋ฏธ๋ถ๋ฒ) ์ฌ์ฉ
Backpropagation in a Single Layer

1. forward pass โ weighted sum, activation function(sigmoid)

2. cost function โ MSE

3. backpropagation

โ Chain Rule

- $\frac{\partial C}{\partial w_i}$ : 3๊ฐ์ ํจ์๋ก ์ด๋ฃจ์ด์ง ํฉ์ฑํจ์
- ํด๋น ํจ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๊ธฐ ์ํด ํฉ์ฑํจ์์ ๋ฏธ๋ถ๋ฒ์ธ Chain Rule ์ ์ฉ
- ์ ์์ ์ด๋ฃจ๊ณ ์๋ ๊ฐ๋ค์ $x_i^n$(input), $\hat{y}^n$(output), $y^n$(target) ์ผ๋ก forward pass ๋ ๊ณ์ฐ๋ ๊ฐ
Why Backpropagation Is an Efficient Way to Calculate Gradients
- Matrix ์ฐ์ฐ์ ์ํํ๊ธฐ ๋๋ฌธ์ parameter ๊ฐ๋ค์ ๋์์ update
- Backpropagation์ forward pass ๋ ๊ตฌํ ๊ฐ๋ค์ ์ฌ์น์ฐ์ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ด, ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅ๋ ๊ฐ๋ค์ ๋ํ๊ณ ๊ณฑํ๋ ์์ ์ฐ์ฐ๋ง ์ํ
'๐ Jero's Wiki > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Weight Initialization (0) | 2024.05.11 |
---|---|
Regularization (1) | 2024.04.26 |
Likelihood & MLE (2) | 2024.04.21 |
Gradient Descent (0) | 2024.04.17 |
Backpropagation (์ญ์ ํ)
- ์ต์ ์ parameter ๊ฐ์ ์ฐพ๊ธฐ ์ํด cost์ ๋ํ ์ ๋ ฅ์ธต์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ณ์ฐํ๋ ๊ฒ
- ์ถ๋ ฅ์ธต์ ๊ธฐ์ธ๊ธฐ๋ถํฐ ๊ณ์ฐํ์ฌ ์ญ์ผ๋ก ์ ํํ๊ธฐ ๋๋ฌธ์ Backpropagation;์ญ์ ํ ๋ผ๊ณ ํจ
- Chain Rule (ํฉ์ฑํจ์์ ๋ฏธ๋ถ๋ฒ) ์ฌ์ฉ
Backpropagation in a Single Layer

1. forward pass โ weighted sum, activation function(sigmoid)

2. cost function โ MSE

3. backpropagation

โ Chain Rule

- $\frac{\partial C}{\partial w_i}$ : 3๊ฐ์ ํจ์๋ก ์ด๋ฃจ์ด์ง ํฉ์ฑํจ์
- ํด๋น ํจ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๊ธฐ ์ํด ํฉ์ฑํจ์์ ๋ฏธ๋ถ๋ฒ์ธ Chain Rule ์ ์ฉ
- ์ ์์ ์ด๋ฃจ๊ณ ์๋ ๊ฐ๋ค์ $x_i^n$(input), $\hat{y}^n$(output), $y^n$(target) ์ผ๋ก forward pass ๋ ๊ณ์ฐ๋ ๊ฐ
Why Backpropagation Is an Efficient Way to Calculate Gradients
- Matrix ์ฐ์ฐ์ ์ํํ๊ธฐ ๋๋ฌธ์ parameter ๊ฐ๋ค์ ๋์์ update
- Backpropagation์ forward pass ๋ ๊ตฌํ ๊ฐ๋ค์ ์ฌ์น์ฐ์ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ด, ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฅ๋ ๊ฐ๋ค์ ๋ํ๊ณ ๊ณฑํ๋ ์์ ์ฐ์ฐ๋ง ์ํ
'๐ Jero's Wiki > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Weight Initialization (0) | 2024.05.11 |
---|---|
Regularization (1) | 2024.04.26 |
Likelihood & MLE (2) | 2024.04.21 |
Gradient Descent (0) | 2024.04.17 |