์ด๋ฒ์ ๋ฆฌ๋ทฐํ ๋ ผ๋ฌธ์ Three Scenarios for Continual Learning ์ด๋ค. ํด๋น ๋ ผ๋ฌธ์ Continual Learning์ผ๋ก ํ์ตํ ๋ชจ๋ธ์ ํ๊ฐํ๊ธฐ ์ํ ํ๊ฐ ์งํ 3๊ฐ์ง๋ฅผ ์ ์ํ๊ณ ์๋ค. ํ์ต ๊ณผ์ ์ด ๋์ผํ ๋ชจ๋ธ 3๊ฐ๊ฐ ์๊ณ (๋ชจ๋ธ ๊ฒฐ๊ณผ๋ ๋์ผํ๋ค) ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ฅผ ํ ์คํธํ ๋ ์ด๋ค ๊ฑธ ๋ฌผ์ด๋ณด๋๋์ ๋ฐ๋ผ ์ฌ์ฉํ๋ ํ๊ฐ ์งํ๊ฐ ๋ฌ๋ผ์ง๊ฒ ๋๋ค. ์ง๊ธ๋ถํฐ 3๊ฐ์ ํ๊ฐ ์งํ๋ ๋ฌด์์ด๊ณ , ์ด๋ป๊ฒ ์ฌ์ฉ๋๋์ง ์์๋ณด๋๋ก ํ์.
Continual Learning
Continual Learning์ด๋ ๋ชจ๋ธ์ด ์ด์ ์ ํ์ตํ ์ ๋ณด๋ฅผ ๊ทธ๋๋ก ๊ฐ์งํ ์ฑ ์๋ก์ด ๋ฐ์ดํฐ ํน์ง์ ํ์ตํ๋ ๋ฐฉ๋ฒ๋ก ์ด๋ค. ์ด๋ ๊ฐ์ฅ ์ค์ํ ๋ถ๋ถ์ด '์ด์ ์ ํ์ตํ ์ ๋ณด๋ฅผ ๊ทธ๋๋ก ๊ฐ์ง'ํ๋ค๋ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ ๋น์ฐํ๊ฒ๋ Continual Learning์์ ๊ฐ์ฅ ๋ฌธ์ ๋๋ ๋ถ๋ถ์ด ๊ธฐ์กด์ ํ์ตํ ์ ๋ณด๋ฅผ ์์ด๋ฒ๋ฆฌ๋ ๊ฒ์ด๋ค. ์ด๊ฒ์ Catastrophic Forgetting ์ด๋ผ ํ๋ค. '์ฌ์์ ์ธ ๋ง๊ฐ' ์ด๋ผ ๋ฒ์ญ๋๋ ์ด ๋จ์ด๋ Continual Learning์์ ์์ด๋ฒ๋ฆผ์ด ์ผ๋ง๋ ํฐ ๋ฌธ์ ์ธ์ง๋ฅผ ์ฟ๋ณผ ์ ์๋ค.
๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ 3๊ฐ์ง Scenario ํ๊ฐ ๋ฐฉ๋ฒ์ ์ฌ์ฉํด ๋ชจ๋ธ์ด Catastrophic Forgetting ๋ฌธ์ ๋ฅผ ์ผ๋ง๋ ์ ํด๊ฒฐํ๊ณ ์๋์ง ํ๊ฐํ ์ ์์ด, ๋ชจ๋ธ ํ์ต ๋ฐฉํฅ์ฑ์ ์ ์ํ ๋ฟ๋ง ์๋๋ผ Catastrophic Forgetting๋ฅผ ์ํํ ์ ์๋ค.
Three Continual Learning Scenarios
Task Boundaries
๋ณธ๊ฒฉ์ ์ผ๋ก 3๊ฐ์ง Scenario๋ฅผ ์ค๋ช ํ๊ธฐ ์ , ๋ชจ๋ธ ์คํ ๋ฐ ํ ์คํธ ๊ฒฐ๊ณผ๋ฅผ ์ํํ ๋น๊ตํ ์ ์๋๋ก ๊ท์น ๋ช ๊ฐ๋ฅผ ์ ์ํ๊ณ ์๋ค.
- ์ฑ๋ฅ ๋น๊ต๋ฅผ ์ํ ๋ชจ๋ธ์ Single Neural Network๋ก ์ ์ํ๋ค.
- Continual Learning์ ์ํด ํ์ต๋ ๊ฐ task๋ ์์ฐจ์ ์ผ๋ก ์ผ๋ จ์ ๊ณผ์ ์ ๊ฑฐ์ณ ํ์ต๋์ด์ผ ํ๋ค.
- ๊ณผ๊ฑฐ task์์ ์ฌ์ฉํ data๋ ํ์ฌ ๋๋ ๋ฏธ๋์ task์์ ์ฌ์ฉํ ์ ์๋ค.
- ๊ฐ task๋ ๋ช ํํ๊ฒ ๊ตฌ๋ถ๋์ด์ผ ํ๋ค.
Three Scenarios
3๊ฐ์ Scenarios๋ Task-IL, Domail-IL, Class-IL ๋ก ๊ตฌ๋ถ๋๋ค. ๊ฐ scenario๋ ํฌ๊ฒ 2๊ฐ์ง ์ง๋ฌธ์ ํตํด ์ ์๋๋ค.
์ฒซ ๋ฒ์งธ ์ง๋ฌธ์ "At test time, is context identity know?" ์ด๋ค. ์ฆ, ๋ชจ๋ธ ์ฑ๋ฅ์ ํ๊ฐํ ๋ ๋ชจ๋ธ ์ฑ๋ฅ์ ํ๋จํ๋ ์ง๋ฌธ ์์ task์ ๋ด์ฉ์ ๋ดํฌํ๊ณ ์๋์ง๋ฅผ ๋ฌผ์ด๋ณด๋ ๊ฒ์ด๋ค. ์ด๋ "์" ๋ผ๋ ๋๋ต์ด ๋์ค๋ฉด Task-IL ๋ฐฉ์์ด ๋๋ค. ์ด์ด ๋ ๋ฒ์งธ ์ง๋ฌธ์ "Must context identity be infferd?"๋ก, ์ฒซ ๋ฒ์งธ ์ง๋ฌธ์์ "์๋์ค" ๋ผ๋ ๋๋ต์ด ๋์จ๋ค๋ฉด ์ถ๊ฐ๋ก ๋์ง๋ ์ง๋ฌธ์ด๋ค. ์ด๊ฒ์ ๋ชจ๋ธ ์ฑ๋ฅ ํ๊ฐ ์, ์ฑ๋ฅ ํ๋จ ์ง๋ฌธ์ task ๋ด์ฉ์ด ํฌํจ๋์ด ์์ง ์๋ค๋ฉด ์ด๋ฅผ ์ถ๋ก ํด์ผ ํ๋์ง ๋ฌผ์ด๋ณด๋ ๊ฒ์ด๋ค. "์๋์ค" ๋ผ๋ ๋๋ต์ด ๋์จ๋ค๋ฉด Domail-IL์ด, "์" ๋ผ๋ ๋๋ต์ด ๋์จ๋ค๋ฉด Class-IL์ด ๋๋ค.
์ด๋ ๊ฒ๋ง ์ค๋ช ํ๋ฉด ๋๋ฌด ์ถ์์ ์ด๋ Continual Learning ์์ ํ๋์ ํจ๊ป ์ข ๋ ์์ธํ ์ค๋ช ํด๋ณด๊ฒ ๋ค.
์ ์์๋ MNIST ๋ฐ์ดํฐ์ ์ 10๊ฐ ํด๋์ค๋ฅผ ์ด 2๊ฐ ํด๋์ค์ฉ ๋๋์ด 5๊ฐ์ task๋ฅผ ๋ง๋ ๊ฒ์ด๋ค. ๋ชจ๋ธ์ task 1๋ถํฐ task 5๊น์ง ์ฐจ๋ก๋๋ก ํ์ตํ๊ฒ ๋๊ณ ์ฌ๊ธฐ์ ์ค์ํ ๊ฑด task 5๋ฅผ ํ์ตํ ๋ task 1~4 ๋ด์ฉ์ ๋ชจ๋ ๊ธฐ์ตํ๊ณ ์์ด์ผ ํ๋ค๋ ๊ฒ์ด๋ค.
task 1๋ถํฐ task 5๊น์ง ํ์ตํ ๋ชจ๋ธ 3๊ฐ๊ฐ ์๋ค๊ณ ๊ฐ์ ํด๋ณด์. ์ด๋ ๊ฐ ๋ชจ๋ธ์ ๋ชจ๋ ๊ฐ์ ํ์ต ๋ฐฉ๋ฒ์ผ๋ก ํ์ต๋์ด ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅํ๋ค. ์ฒซ ๋ฒ์งธ ๋ชจ๋ธ ๊ฒฐ๊ณผ๋ฅผ ํ๊ฐํ๋ ๋ฐฉ์์ ํน์ task์์ ๋์จ test image๊ฐ ๋ช ๋ฒ ํด๋์ค์ ์ํ๋์ง ์์๋ณด๋ ๊ฒ์ด๋ค. ์ฆ, ์ด๋ค test image๊ฐ task 3์์ ๋์จ ์ด๋ฏธ์ง๋ผ๋ฉด ํด๋น ๋ฐ์ดํฐ์ ํด๋์ค๋ 1(์ซ์ 4)๊ณผ 2(์ซ์ 5) ์ค ์ด๋์ ์ํ๋์ง ์์๋ด๋ ๊ฒ์ด๋ค. ์ด๊ฒ Task-IL์ด ๋๋ค.
๋ ๋ฒ์งธ ๋ชจ๋ธ ํ๊ฐ ๋ฐฉ์์ ์ด๋ค test image๊ฐ ์์ ๋ ์ด๋ค ํด๋์ค์ ์ํ๋์ง ๋ฌผ์ด๋ณด๋ ๊ฒ์ด๋ค. ์ด๋ ์ค์ํ ๊ฒ์ ํด๋น ๋ฐ์ดํฐ๊ฐ ์ด๋ค task์ ํด๋นํ๋์ง ์ ์ ์์ผ๋ฉฐ ๋ํ ํ๊ฐํ ๋์๋ ๊ตณ์ด ์ ํ์๊ฐ ์๋ค๋ ๊ฒ์ด๋ค. ๋ค์ ๋งํด ์ ์์์์ ํด๋น ์ด๋ฏธ์ง๊ฐ ์ง์์ธ์ง, ํ์์ธ์ง ํ๋จํ๋ ๊ฒ ๋ชจ๋ธ ํ๊ฐ ๋ฐฉ์์ด ๋๋ ๊ฒ์ด๋ค. ์ด๋ฅผ Domail-IL ์ด๋ผ ํ๋ค.
๋ง์ง๋ง Class-IL์ test image๊ฐ ์ด๋ค task์ ์ํ๋ ์ด๋ค class ์ธ์ง ๋ง์ถฐ์ผ ํ๋ ๊ฒ์ด๋ค. ์ฆ, [5] ๋ผ๋ ์ด๋ฏธ์ง๊ฐ ์ฃผ์ด์ก๋ค๋ฉด ๋ชจ๋ธ์ "task 3์ ์ํ๋ 2๋ฒ class ์ด๋ค." ๋ผ๊ณ ๋ตํด์ผ ํ๋ค๋ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ Class-IL์์ ๋์ ์ฑ๋ฅ์ ๊ฐ์ง๋ ๊ฒ ๊ฐ์ฅ ์ด๋ ค์ด ๋ฐฉ๋ฒ์ด ๋๋ ๊ฒ์ด๋ค.
Example Task Protocols
3๊ฐ์ง Scenario๋ฅผ ์ค๋ช ํ๋ฉด์ ๋ค์ ์์๋ ๋ ผ๋ฌธ์์ ์ด 3๊ฐ์ง ๋ฐฉ๋ฒ์ ๊ฐ์ง๊ณ ๋ชจ๋ธ์ ํ๊ฐํ๊ธฐ ์ํด ๋ง๋ ์์ task protocol์ด๋ค. ์ด 2๊ฐ์ง protocol์ ์๊ฐํ๋๋ฐ, ํ๋๋ ์์ ์ธ๊ธํ Classify MNIST-digist ์ด๊ณ ๋๋จธ์ง ํ๋๋ Classify 'Permuted MNIST' ์ด๋ค.
Classify MNIST-digist
๋จผ์ , MNIST-digist Classification์ด๋ค. ์์์ ์ค๋ช ํ ์์๋ก 0~9๊น์ง์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ 2๊ฐ์ฉ ๋ฌถ์ด ๊ตฌ๋ถํ๋ task 5๊ฐ๋ก ๋๋์๋ค. ์์๋๋ก Continual Learning์ผ๋ก ํ์ต์ ์งํํด์ค๋ค. ํด๋น protocol์์ ๊ฐ scenario๋ ๋ค์๊ณผ ๊ฐ๋ค.
- Task-IL : n๋ฒ์งธ task์ image I๊ฐ ์ฃผ์ด์ก์ ๋, I์ class๋ ๋ช ๋ฒ์งธ class์ธ๊ฐ?
- Domain-IL : test image I์ class๋ ๋ฌด์์ธ๊ฐ? (๋ช ๋ฒ์งธ task์ธ์ง๋ ์ค์ํ์ง ์๋ค)
- Class-IL : test image I๋ ๋ช ๋ฒ์งธ task์ ๋ช ๋ฒ์งธ class์ธ๊ฐ?
Classify Permuted MNIST
๋ค์ protocol์ Permuted MNIST Classification์ผ๋ก, task ํ๋ ๋น 0~9๊น์ง ์ด 10๊ฐ class๋ก ์ด๋ฃจ์ด์ ธ ์์ผ๋ฉฐ ๊ฐ task๋ง๋ค pixel์ ๋ค๋ฅธ permutation์ด ์ ์ฉ๋์๋ค. ํด๋น protocol์์ ๊ฐ scenario๋ ๋ค์๊ณผ ๊ฐ๋ค.
- Task-IL : test image I์ permutation X๊ฐ ์ฃผ์ด์ก์ ๋, ์ด ์ด๋ฏธ์ง์ class๋ ๋ฌด์์ธ๊ฐ?
- Domain-IL : test image I์ class๋ ๋ฌด์์ธ๊ฐ? (permutation ์ ๋ณด๋ ์ค์ํ์ง ์๋ค)
- Class-IL : test image I์ permutation๊ณผ class๋ ๋ฌด์์ธ๊ฐ?
Strategies for Continual Learning
๋ณธ ๋ ผ๋ฌธ์์ ์ ์ํ๊ณ ์๋ 3๊ฐ์ง ๋ฐฉ๋ฒ์ ๋ชจ๋ Continual Learning์ ํ๊ฐํ๋ ๋ฐฉ๋ฒ๋ค์ด๋ค. ์ด ๋ฐฉ๋ฒ๋ค์ด ์ ์ ์ฉ๋๋์ง ์คํํ๊ธฐ ์ํด ์์์ ๋ณธ 2๊ฐ์ง protocol์ ์ด 6๊ฐ์ง Continual Learning ํ์ต ์ ๋ต์ ์ ์ฉํ๋ค. ๊ทธ๋ ๊ฒ ๋์จ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ง๊ณ Scenario๋ฅผ ์ ์ฉํด ๋ชจ๋ธ ์คํ์ ์งํํ์๋ค. ์ด ๋ถ๋ถ์ 6๊ฐ์ง Continual Learning ํ์ต ์ ๋ต์ด ๋ฌด์์ธ์ง ์๊ฐํ๋ ๊ธ์ด๋ค.
Task-specific Components
Catastrophic Forgetting์ด ๋ฐ์ํ๋ ์ด์ ์ ๋ํด ์๊ฐํด๋ณด๋ฉด ์๋ก์ด task๋ฅผ ํ์ตํด network์ parameter๊ฐ ์๋ก์ด task์๋ง ์ต์ ํ๋์ด ์ด์ task ์ ๋ณด๋ฅผ ์์ด๋ฒ๋ฆฐ ๊ฒฝ์ฐ๋ฅผ ์ฝ๊ฒ ๋ ์ฌ๋ฆด ์ ์๋ค. ์ด๋ ๋ค์ ๋งํ๋ฉด ์๋ก์ด task๋ฅผ ํ์ตํ ๋ parameter๋ฅผ ๋ชจ์กฐ๋ฆฌ ๋ค ์ต์ ํ์ํค๋ ๊ฒ์ด ์๋ ์ผ๋ถ ๋ด๋ฐ์ ๋ํด์๋ง ์ต์ ํํ๋ ๊ฒ์ด๋ค. ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก XdG(Context-dependent Gating)์ด ์๋ค.
XdG๋ task ๋ณ๋ก network์ ์ผ๋ถ neuron์ ์ฐจ๋จ(gating)ํด ๊ฐ task๋ฅผ ํ์ตํ ๋ ๋ชจ๋ธ์ ๋ค๋ฅธ ๋ถ๋ถ์ ์ฌ์ฉํด ํ์ตํ๋๋ก ํ๋ ๊ฒ์ด๋ค. ์๋ฅผ ๋ค์ด, task 1์์ network์ ์ ์ฒด neuron์ 70%๋ฅผ ์ฌ์ฉํ๊ณ task 2์์ ์ด์ ์ ์ฌ์ฉํ์ง ์์ neuron์ ํฌํจํ ์๋ก์ด 70%๋ฅผ ์ฌ์ฉํ์ฌ ํ์ตํ๋ ๊ฒ์ด๋ค.
Regularized Optimization
Task-specific Components์ ๋น์ทํ ๋ฐฉ๋ฒ์ผ๋ก Regularized Optimization์ด ์๋ค. ์ด๋ network parmeter๋ฅผ ์ฐจ๋จํ๋ ๊ฒ ์๋ ๊ฐ task ๋ง๋ค network์ parameter๋ฅผ ๋ค๋ฅด๊ฒ ์ ๊ทํํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ํ์ ์ผ๋ก EWC(Elastic Weight Consolidation)๊ณผ SI(Synaptic Intelligence)๊ฐ ์๋ค.
EWC์ SI๋ ๋ชจ๋ task ํ์ต์ด ์๋ฃ๋ ํ ์ด๋ค parameter๊ฐ ์ค์ํ์ง ์ธก์ ํ๊ณ ์ค์ํ๋ค๊ณ ํ๋จ๋ parameter๊ฐ ๋ค์ task ํ์ต ์ ํฌ๊ฒ ๋ณ๊ฒฝ๋์ง ์๋๋ก panelty๋ฅผ ๋ถ์ฌํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋จ, EWC์ SI๋ parameter ์ค์๋๋ฅผ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ์์ ์ฐจ์ด์ ์ ๊ฐ์ง๋ค.
Modifying Training Data
๋ค์์ ์ด์ task์์ ํ์ตํ data์ ์ ์ฌํ psedo-data๋ฅผ ๋ง๋ค์ด ํ์ฌ task์์ ์ฌ์ฉ๋๋ ๊ธฐ์กด data์ ํจ๊ป ํ์ต์ ํ๋ ๋ฐฉ๋ฒ์ผ๋ก Replay๋ผ ๋ถ๋ฆฌ์ด๋ค. ๋ํ์ ์ผ๋ก LwF(Learning without Forgetting)์ DGR(Deep Generative Replay) ๋ฐฉ๋ฒ์ด ์๋ค.
LwF๋ ์๋ก์ด task๋ฅผ ํ์ตํ ๋, ์ด์ task๋ฅผ ๋ํํ๋ pseudo-data๋ฅผ ์์ฑํ๋๋ฐ ์ด์ task model์ ์์ธก๊ฐ์ ์ฐธ์กฐํด ๋ง๋ค์ด๋ด๊ฒ ๋๋ค. ์ด๋ฅผ ํตํด ์ด์ task ์ ๋ณด๋ฅผ ์ ์งํ ์ ์๋๋ก ๋๋๋ค.
DGR๋ ๋ง์ฐฌ๊ฐ์ง๋ก ์ด์ task๋ฅผ ๋ํํ๋ pseudo-data๋ฅผ ์์ฑํ๋๋ฐ ์ด๋ VAE๋ GAN๊ณผ ๊ฐ์ ์์ฑ ๋ชจ๋ธ์ ์ฌ์ฉํด ๋ง๋ค์ด๋ด๋ ๋ฐฉ๋ฒ์ด๋ค.
Using Exemplars
์ด ๋ฐฉ๋ฒ์ ์ด์ task์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ ์ ์์ ๋ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ฅผ Exemplars(์์ )๋ก ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ํ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก iCaRL(Incremental Classifier and Representation Learning)์ด ์กด์ฌํ๋ค.
iCaRL์ ๊ฐ task๋ง๋ค ๋ฐ์ดํฐ ์ผ๋ถ๋ฅผ ์ ์ฅํ๊ณ ์๋ก์ด task๋ฅผ ํ์ตํ ๋ ์ ์ฅ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ด๋ฉฐ, ์ ์ฅ๋ ๋ฐ์ดํฐ๋ feature space์์ ๊ฐ์ฅ ๊ฐ๊น์ด class๋ฅผ ์ฐพ๋๋ฐ ์ฌ์ฉ๋๋ค.
Experiments & Result
๊ฐ protocol์ ๋ํ ์คํ ๊ฒฐ๊ณผ๋ ๋ค์๊ณผ ๊ฐ๋ค.
๋จผ์ , Classify split MNIST task๋ก ์คํ ๊ฒฐ๊ณผ๋ฅผ ํตํด ๊ฐ Scenario ๋ณ ๋์ด๋ ์ฐจ์ด๊ฐ ๋ถ๋ช ํ๊ฒ ๋ํ๋๋ ๊ฑธ ํ์ธํ ์ ์๋ค. Task-IL์ ๋ชจ๋ ๋ฐฉ๋ฒ์ ๋ํด์ ๋์ ์ฑ๋ฅ์ ๊ฐ์ง์ง๋ง LwF์ Regularization(EWC, SI)์ Domain-IL์์ ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ Class-IL์์ ์์ ํ ์คํจํ๋ค๋ ๊ฑธ ์ ์ ์๋ค. ๋ฐ๋ฉด, Replay(DGR, iCaRL) ๋ฐฉ๋ฒ์ Domain-IL, Class-IL์์ 90% ์ด์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์๋ค. ์ฆ, Replay ๊ธฐ๋ฒ์ด Regularization ๊ธฐ๋ฒ๋ณด๋ค Continual Learning์ ํจ๊ณผ์ ์ด์๋ค๋ ๊ฑธ ์ ์ ์๋ค.
๋ค์ protocol์ธ Classify permuted MNIST๋ LwF๋ฅผ ์ ์ธํ ๋ชจ๋ ๋ฐฉ๋ฒ์ด Task-IL๊ณผ Domain-IL์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๋ ๊ฑธ ํ์ธํ ์ ์๋ค. Class-IL์ ๊ฒฝ์ฐ, Regularization์์ ๋ฎ์ ์ฑ๋ฅ์ Replay ๊ธฐ๋ฒ์์ ๋์ ์ฑ๋ฅ์ ๋ณด์ด๊ณ ์๋ค. ๋ํ LwF ๊ธฐ๋ฒ์ด ํด๋น task์์ ๋ชจ๋ ๋ค ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฑธ ํ์ธํ ์ ์๋๋ฐ ์ด๋ ๋ฌด์์ ์์ด๋ก ์ธํด ๋ค๋ฅธ task์ ์ ๋ ฅ๊ณผ ์๊ด๊ด๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ ๋ฎ์ ์ฑ๋ฅ์ ๋ณด์ธ๋ค๊ณ ํ ์ ์๋ค.
Conclusion
์ด๋ฒ ๋ ผ๋ฌธ์ Continual Learning์ ๋ํด ์ดํด๋ณผ ์ ์์๋ค. ๋์ถฉ ์ด์ ์ ๋ณด๋ฅผ ๊ธฐ์ตํ๋ฉฐ ํ์ต์ ์ด์ด๋๊ฐ๋ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ง ์๊ณ ์์๊ณ ์ฌ๊ธฐ์ ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ๋ก ์ด๋ ํ๊ฐ ๋ฐฉ์์ ๋ํด์ ์ ๋ชฐ๋๋๋ฐ ์ด๋ฒ ๊ธฐํ์ ๊ณต๋ถํ ์ ์์ด ๋ง์ ๋์์ด ๋์๋ค. ๋ค์ ๋ ผ๋ฌธ์ ๋ณธ ๋ ผ๋ฌธ์์ ์ธ๊ธ๋ Continual Learning์ ์ฌ๋ฌ ๋ฐฉ๋ฒ๋ค์ ๋ํด ์ข ๋ ์์ธํ ๊ณต๋ถํ๊ธฐ ์ํ ๋ ผ๋ฌธ๋ค๋ก ๋ฆฌ๋ทฐ๋ฅผ ์งํํ๋ ค ํ๋ค.
'๐ Jero's Review > Paper' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Attention Is All You Need (0) | 2024.05.25 |
---|---|
Show and Tell: A Neural Image Caption Generator (1) | 2024.05.10 |
Sequence to Sequence Learning with Neural Network (0) | 2024.05.04 |