Model Performance Comparison Experiment using ELMo
ELMo(Embeddings from Language Model)๋ 2018๋ ์ ๋ฐํ๋ Deep Contextualized Word Embeddings(Matthew, 2018)์์ ๊ณ ์๋ ์๋ฒ ๋ฉ ๊ธฐ๋ฒ์ด๋ค. ๊ธฐ์กด์ ์ฌ์ฉ๋๋ ์๋ ์๋ฒ ๋ฉ๊ณผ๋ ๋ฌ๋ฆฌ, ๋ฌธ๋งฅ ์ ๋ณด๋ฅผ ๋ฐ์ํ word representation์ ์ ๊ณตํ๋ค. ์ด๋ ๋์์ด์์ด๋ฟ๋ง ์๋ ๋ฌธ์ฅ์ ๋ฐ๋ผ ๋ฏธ๋ฌํ๊ฒ ๋ฌ๋ผ์ง๋ ๋จ์ด์ ๋ป๊น์ง ๊ตฌ๋ถํ ์ ์๋ค๋ ์ ์์ ๋ค๋ฅธ ์๋ฒ ๋ฉ ๊ธฐ๋ฒ๋ณด๋ค ๋์ ์ ํ๋๋ฅผ ๋ณด์ธ๋ค. ์ด๋ฆ์์ ์ ์ ์๋ฏ, ELMo๋ Language Model, ์ฆ ์ธ์ด ๋ชจ๋ธ๋ก๋ถํฐ ์๋ฒ ๋ฉ์ ์ป๋ ๋ฐฉ์์ผ๋ก ์งํ๋๋ค. ์ด๋ฅผ ์ํด ์ฌ์ ํ์ตํ biLM์ ์ฌ์ฉํ๋ค.
-
biLM ELMo์ bi-LSTM์ Forward LM๊ณผ Backward LM์ผ๋ก ์ด๋ฃจ์ด์ง๋ค. ๋ค๋ง, ๊ธฐ์กด์ ์๋ฐฉํฅ RNN๊ณผ๋ ๋ค๋ฅธ ์ ์ ๋ณด์ด๋๋ฐ, ์๋ฐฉํฅ RNN์ด ์๋ฐฉํฅ RNN๊ณผ ์ญ๋ฐฉํฅ RNN์ hidden state๋ฅผ ์ฐ๊ฒฐํ๋ค๋ฉด ELMo์ bi-LSTM์ Forward LM, Backward LM์ ๋ณ๊ฐ๋ก ํ์ตํ๋ค๋ ์ ์์ ์ฐจ์ด๋ฅผ ๋ณด์ธ๋ค.
๊ฐ๊ฐ์ LM์ ๋ค์๊ณผ ๊ฐ์ด ์ด๋ฃจ์ด์ ธ์๋ค.
-
CharCNN
CharCNN์ CNN์ ํ์ฉํ ์๋ฒ ๋ฉ ๊ธฐ๋ฒ์ผ๋ก ํํฐ๋ฅผ ๊ตฌ์ฑํ์ฌ ์ฃผ๋ณ ๋จ์ด๋ฅผ ๋ณผ ์ ์๋ค๋ ์ ์ Word Embedding๊ณผ ๋น์ทํ์ง๋ง, CNN์ด๊ธฐ์ ์ฐ์ฐ ์๋๊ฐ ๋น ๋ฅด๋ค. ๋ํ CharCNN์ ๋จ์ด ๋์ ๋ฌธ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ค์ํ ํฌ๊ธฐ์ Convolution filter๋ฅผ ์ ์ฉํ๋ค. Max Pooling์ด ์๋ฃ๋ ํ์ Highway Network๋ฅผ ๊ฑฐ์ณ ๋ถํ์ํ ์ฐ์ฐ์ ์ค์ธ๋ค. Highway Network๋ ๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ ์ด์ด๋ฅผ ์ง๋๊ฐ ๋ ์ํ๋ ์ฐ์ฐ์ ๊ฑฐ์น์ง ์๊ณ ์ง๋๊ฐ๋ ๊ฒฝ๋ก๊ฐ ์๋ ๊ตฌ์กฐ๋ก, ํ์ต์ด ์ด๋ฏธ ๋ค ์ด๋ฃจ์ด์ก์ผ๋ฉด ์ฐ์ฐ์ ๊ฑฐ์น์ง ์๊ณ ์ง๋๊ฐ ์ ์์ด ์ฐ์ฐ๋์ ์ค์ผ ์ ์๋ค.
-
Bidirectional LSTM
N๊ฐ์ sequential token (t1, t2, โฆ ,tn)์ด ์์ ๋ Forward LM์ด ๊ณ์ฐํ๋ ํ๋ฅ ์ ๋ค์๊ณผ ๊ฐ๋ค. ์ฆ, ํน์ ์์ ์์์ ํ ํฐ tk๊ฐ ๋ฑ์ฅํ ํ๋ฅ ์ t1๋ถํฐ tk-1๊น์ง์ ํ๋ฅ ์ ๊ณฑ๊ณผ๋ ๊ฐ๋ค๋ ๋ป์ด๋ค.
์ ๋ ฅ ์์น๋ฅผ k, ํ์ฌ ์ธต์ ๋์ด๋ฅผ j๋ผ ํ ๋, Forward LM์์ ๋์จ context-dependent representation ์
๊ณผ ๊ฐ์ด ํํํ๋ค.biLSTM์ LSTM ์ธต๊ณผ ์ธต ์ฌ์ด์ Skip connection์ ์ ์ฉํ๋ค. Skip connection์ด๋ ์ด์ ์ธต์ ์ ๋ ฅ ์ ๋ณด๋ฅผ ์ฐ๊ฒฐํ์ฌ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ์ผ๋ก ๊ธฐ์ธ๊ธฐ ์์ค ๋ฌธ์ ๋ฅผ ๋ณด์ํ ์ ์๋ค.
Backward LM์ Forward LM๊ณผ ๋์ผํ์ง๋ง ์ญ๋ฐฉํฅ์ผ๋ก ํ ํฐ์ ํ๋ฅ ์ ๊ณ์ฐํ๋ค.
๋ง์ฐฌ๊ฐ์ง๋ก Backward LM์์ ๋์จ context-dependent representation์
๊ณผ ๊ฐ์ด ํํํ๋ค. ์ต์ข
์ ์ผ๋ก biLM์ ํ์ต์ Forward LM๊ณผ Backward LM์ ํฉ์น ๊ฒ์ log likelihood๋ฅผ ์ต๋ํํ๋ ๋ฐฉํฅ์ผ๋ก ์งํ๋๋ค.
-
-
ELMo
ELMo๋ ์ค๊ฐ ๋ ์ด์ด์ representation๋ค์ task์ ๋ง๊ฒ ๊ฒฐํฉํ ๊ฒ์ ๋งํ๋ค. ๋ ์ด์ด ์๋ฅผ L์ด๋ผ ํ ๋, ์ ๋ ฅ ๋ฒกํฐ
์ ํฌํจํ์ฌ 2L + 1๊ฐ์ representation๋ค์ ๊ฐ์ค์น๋ฅผ ๊ณฑํ ํ ๊ฐ์คํฉํ์ฌ ๊ณ์ฐํ๋ค.
์ ๊ฒฝ์ฐ๋ ๋ชจ๋ ๋ ์ด์ด๋ฅผ representation์ผ๋ก ์์ถํ ๊ฒ์ด๊ณ , task์ ๋ฐ๋ผ ํน์ ๋ ์ด์ด๋ง ์ ํํ๊ฑฐ๋ ๋ณํ๋ ์ ์๋ค.ํน์ task์ ๋ฐ๋ผ ๊ณ์ฐ๋ elmo representation์ ๊ธฐ์กด ์๋ฒ ๋ฉ ๊ฐ์ ์ฐ๊ฒฐ(concat)๋์ด ๋ฌธ๋งฅ ์ ๋ณด๋ฅผ ํจ๊ป ๋๊ฒจ์ค๋ค.
์ด์ฒ๋ผ ELMo๋ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ํตํด ๋ฌธ๋งฅ ์ ๋ณด๋ฅผ ๋ฐ์ํ์๋ค๋ ์ ์์ ๊ฐํ ์ฑ๋ฅ์ ๋ณด์ผ ์ ์๋ค. ์ด์ ๋ณธ ์ฐ๊ตฌ์์๋ ๊ฐ๋จํ ์ฑ๋ฅ ๋น๊ต ์คํ์ ํตํด ELMo๊ฐ ์ด๋ ์ ๋์ ์ฑ๋ฅ ํฅ์์ ๋ณด์ด๋์ง ํ์ธํด๋ณด๊ธฐ๋ก ํ์๋ค.
์คํ์ ELMo๋ฅผ ํตํด ์์ฑ๋ elmo representaton์ด ๊ธฐ์กด ์๋ฒ ๋ฉ ๊ธฐ๋ฒ๊ณผ ๊ฒฐํฉํ์์ ๋์ ์ฑ๋ฅ ํฅ์์ ์ธก์ ํ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ค. ๊ธฐ์กด ์๋ฒ ๋ฉ ๊ธฐ๋ฒ๋ง ์ฌ์ฉํ์ ๋์ ํ๊ฐ ์ฒ๋, ์๋ชจ์ ๊ฒฐํฉํ์ฌ ์ฌ์ฉํ์ ๋์ ํ๊ฐ ์ฒ๋๋ฅผ ๋น๊ตํ๋ ๋ฐฉ์์ผ๋ก ์คํ์ ์งํํ์๋ค. ํ ๊ฐ์ง ๊ธฐ๋ฒ๋ง์ผ๋ก ์คํ์ ์งํํ๊ฒ ๋๋ค๋ฉด ์ผ๋ฐ์ ์ธ ํฅ์์ ๊ฒฐ๊ณผ๋ผ ๋ณด์ฅํ ์ ์๊ธฐ์, ๋ค์ ๋ ๊ฐ์ง์ ์๋ฒ ๋ฉ ๊ธฐ๋ฒ๋ค์ ๋น๊ตํ๋ฉฐ ํ์ธํด๋ณด๊ธฐ๋ก ํ์๋ค.
-
nn.Embedding
nn.Embedding์ ํ ํฐํํ ๋จ์ด๋ค์ ์ ์ ์ธ์ฝ๋ฉํ๋ค. ๊ทธ ํ, ์ ์ ์ธ์ฝ๋ฉ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก lookup table์ ์์ฑํ๋ค. ๋ชจ๋ธ์ด ์์ค ํจ์์ ๋ฐ๋ผ ํ์ตํ๋ ๊ณผ์ ์์ lookup table์ ๊ฐ์ค์น๋ค๋ ๊ฐ์ด ํ์ต๋๋ค.
-
GloVe
GloVe๋ ๊ธฐ์กด ์นด์ดํธ ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ๋ก ๊ณผ ์์ธก ๊ธฐ๋ฐ์ ๋ฐฉ๋ฒ๋ก ์ ์ ์ถฉํ ๊ธฐ๋ฒ์ด๋ค. ๊ธ๋ก๋ธ์์ ์๋ฒ ๋ฉ ๋ ์ค์ฌ ๋จ์ด์ ์ฃผ๋ณ ๋จ์ด ๋ฒกํฐ์ ๋ด์ ๊ฐ์ด ์ ์ฒด ์ฝํผ์ค์์์ ๋์ ๋ฑ์ฅ ํ๋ฅ ๋ก ์ด์ด์ ธ ์นด์ดํธ ๊ธฐ๋ฐ ์๋ฒ ๋ฉ๊ณผ ๊ธฐ์กด ์๋ ์๋ฒ ๋ฉ์ ์์ธก ๊ธฐ๋ฐ ์๋ฒ ๋ฉ์ ํน์ง ๋ชจ๋๋ฅผ ๊ฐ๋๋ค.
์ฑ๋ฅ ํฅ์ ์ธก์ ์ ์ํด ELMo๊ฐ ํด๋น ์๋ฒ ๋ฉ๋ค๊ณผ ๊ฒฐํฉํ์์ ๋ ๊ฒฐ๊ณผ๋ฅผ ELMo๋ฅผ ์ฌ์ฉํ์ง ์์์ ๋ ๊ฒฐ๊ณผ์ ๋น๊ตํ๊ณ ์ ํ๋ค. ์คํ์์ ๋ค๋ฃฐ ๊ฒฝ์ฐ๋ ์๋์ ๊ฐ์ด ์ด 4๊ฐ์ง์ด๋ค.
- nn.Embedding
- GloVe
- nn.Embedding + ELMo
- GloVe + ELMo
๋ํ ELMo๋ฅผ ํตํ ๊ฐ ์๋ฒ ๋ฉ ๊ธฐ๋ฒ๋ค์ ์ฑ๋ฅ ํฅ์๋ง ์ธก์ ํ๋ ๊ฒ์ด ์๋, nn.Embedding + ELMo, GloVe + ELMo๋ฅผ ๋น๊ตํ๋ฉด์ ์๋ฒ ๋ฉ ๊ธฐ๋ฒ ๋ณ๋ก ELMo ์ฑ๋ฅ์ ์ํฅ์ด ์๋์ง ํ์ธํด๋ณด๊ธฐ๋ก ํ์๋ค.
์คํ์ ์ํ task๋ ๋ค์ค ํ ์คํธ ๋ถ๋ฅ๋ก ์ ์ ํ์๋ค. ํ ์คํธ๋ฅผ ์ฌ๋ฌ ๋ถ๋ฅ๋ก ๊ตฌ๋ถํ๊ธฐ ์ํด์ ํ ์คํธ ๋ด ์ฌ์ฉ๋ ๋จ์ด์ ๋ฌธ๋งฅ์ ์๋ฏธ๊ฐ ์ค์ํ๊ฒ ์ ์ฉํ ๊ฒ์ด๋ค. ๋ฐ์ดํฐ๋ AG News Classification Dataset์ ์ฌ์ฉํ์ผ๋ฉฐ, Description ์ด์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๊ฐ ์ผ๊ด์ ์ผ๋ก ๋์ง ์์ Title ์ด์ ์ฌ์ฉํ์๋ค. ์ ๋ฆฌํ์๋ฉด, ์ ๋ ฅ๋ฐ์ Title ๋ฐ์ดํฐ๋ฅผ World, Sports, Business, Sci/Tech ์ค ํ๋์ ์ฃผ์ ๋ก ๊ตฌ๋ถํ๋ ๊ฒ์ด ์คํ์ task์ด๋ค.
-
ํ์ต ๋ฐ์ดํฐ์
๋ฐ์ดํฐ์ ์ ์ฝ 120,000๊ฐ์ ๋ด์ค ๋ถ๋ฅ ๋ฐ์ดํฐ๊ฐ ์๋ AG News Classification์ ์ฌ์ฉํ์๋ค. ๊ทธ์ค์์๋ Title ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ํ์ต์ ์งํํ์๊ณ , ๊ฐ๊ฐ ๋ชจ๋ธ์ ๋ง๋ Encoder ํด๋์ค์ ๋ฐ๋ผ ์ธ์ฝ๋ฉ๋์๋ค.
-
๋ชจ๋ธ ์ค๊ณ
๋ชจ๋ธ์ ์คํ์์ ๋ค๋ฃจ๋ ๊ฒฝ์ฐ๋ค ๋ชจ๋ LSTM layer๋ ๊ณตํต๋๊ธฐ ๋๋ฌธ์ Embedding Layer, LSTM Layer๋ฅผ ๋๋์ด ๊ฐ๊ฐ ๊ตฌํํ์๋ค. Embedding Layer์๋ elmo_mode๋ผ๋ boolean argument๋ฅผ ์ถ๊ฐํ์ฌ ๊ทธ ๊ฐ์ ๋ฐ๋ผ ELMo์ ๊ธฐ์กด์ ์๋ฒ ๋ฉ์ด ๊ฒฐํฉ๋๋ค. ๋๋ถ์ด Embedding Layer์ LSTM layer๋ฅผ ์ฐ๊ฒฐํ๋ Classifier ํด๋์ค๋ฅผ ๋ง๋ค์ด ์๋ฒ ๋ฉ ๊ฒฐ๊ณผ๊ฐ LSTM layer๋ก ์ด์ด์ง๊ณ , ์นดํ ๊ณ ๋ฆฌ๋ฅผ ๋ถ๋ฅํ๋ค.
-
ํ์ต ์ค๊ณ
ํ์ต์ Trainer ํด๋์ค๋ฅผ ํตํด ๋ฐ์ดํฐ์ , ๋ชจ๋ธ, ์ตํฐ๋ง์ด์ , ์์ค ํจ์, learning rate ๋ฑ์ ์ ๋ ฅ๋ฐ์ ์ด๋ฃจ์ด์ง๋ค. ์์ค ํจ์๋ก๋ ๋ค์ค ๋ถ๋ฅ์ ์ ํฉํ Cross Entropy ํจ์๋ฅผ ์ฌ์ฉํ์๊ณ , ์ตํฐ๋ง์ด์ ์๋ Adam์ ์ฌ์ฉํ์๋ค. ๋ํ, ReduceLROnPlateau๋ฅผ scheduler๋ก ์ค์ ํ์ฌ ์ฑ๋ฅ ํฅ์์ด ์์ ๋ learning rate๋ฅผ ๊ฐ์ํ๊ฒ ํ๋ค.
์คํ์ ์ฌ์ฉํ hyperparameter๋ ๋ค์๊ณผ ๊ฐ๋ค.
| Hyperparam | Value |
|---|---|
| batch_size | 16 |
| epoch | 10 |
| embedding_dim | 300 |
| hidden_dim | 512 |
| output_dim | 4 |
| learning_rate | 0.01 |
| num_layers | 2 |
์ ์ฒด์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ์ดํด๋ณด์๋ฉด, Base ๋ชจ๋ธ์ ์ฌ์ฉํ์ ๋๋ณด๋ค ELMo์ ํจ๊ป ๊ฒฐํฉํ์ ๋๊ฐ Accuracy, F1-Score ๋ ํ๊ฐ์งํ ๋ชจ๋์์ ๋์ ์ฑ๋ฅ์ ๋ณด์๋ค. ๋ค๋ง nn.Embedding์ ๊ฒฝ์ฐ Accuracy๊ฐ 0.73%p ์ฆ๊ฐํ์๊ณ , GloVe์ ๊ฒฝ์ฐ 1.1%p ์ฆ๊ฐํ ๊ฒ์ผ๋ก ๋ณด์ ํฐ ์ฑ๋ฅ ๋ณํ๋ ์๋ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค. F1-Score์์๋ ๋ง์ฐฌ๊ฐ์ง๋ก ์ฆ๊ฐ ํญ์ด ํฌ์ง ์์ ๊ฒ์ผ๋ก ๋ณด์ ELMo ๊ฒฐํฉ์ ๋ฐ๋ฅธ ์ฑ๋ฅ ํฅ์์ ์กด์ฌํ๋, ๋ ๋ค ์๋ฏธ์๋ ์ ๋์ ํฅ์์ ์๋๋ผ ๋ณผ ์ ์๋ค. nn.Embedding, GloVe๋ฅผ ๋น๊ตํ ๊ฒฐ๊ณผ, GloVe์ ๊ฒฐํฉํ์ ๋๊ฐ ์ฑ๋ฅ ํฅ์์ด ๋ ๋๊ฒ ๋์๋๋ฐ ์ด๋ nn.Embedding์ด ์์คํจ์์ ๋ฐ๋ผ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ๋ ๊ณผ์ ์์ ๋ฌธ๋งฅ์ด ๊ณ ๋ ค๋์๊ธฐ์ ELMo๋ก ์ธํ ์ฑ๋ฅ ํฅ์์ด ํฌ๊ฒ ์ผ์ด๋์ง ์์ ๊ฑธ๋ก ์๊ฐํ๋ค.
๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ฉด nn.Embedding์ด GloVe๋ณด๋ค ์ ๋ฐ์ ์ธ ์ฑ๋ฅ์ด ์ข๊ฒ ๋์๋๋ฐ, ์ด๋ ์คํ์ ์ฌ์ฉํ ๋ด์ค ๋ฐ์ดํฐ์ ํน์ฑ ๋๋ฌธ์ธ ๊ฒ์ผ๋ก ๋ณด์ธ๋ค. ๋ด์ค ๋ฐ์ดํฐ์๋ ๊ณ ์ ๋ช ์ฌ, ๋ด์ง๋ ํน์ํ ๋จ์ด๋ค์ด ์ฃผ๋ก ์ฌ์ฉ๋๋๋ฐ, ํด๋น ๋จ์ด๋ค์ ์ ์ ์ธ์ฝ๋ฉํ์ฌ ๋จ์ด ์ฌ์ ์ ์ถ๊ฐํ๋ nn.Embedding๊ณผ ๋ฌ๋ฆฌ, GloVe์ ๊ฒฝ์ฐ ์ฌ์ ์ ๋ง๋ค์ด์ง ๋จ์ด ์ฌ์ ์ ์ฌ์ฉํ๋ค. ์ด๋ก ์ธํด GloVe๋ ํด๋น ๋จ์ด๋ค์ ํ ํฐ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ์์ธก ์ ํ๋์ ์ฐจ์ง์ด ์๊ธฐ๋ ๊ฒ์ด๋ค. ์ค์ ๋ก GloVe๋ฅผ ์ฌ์ฉํ ์๋ฒ ๋ฉ ๋ ์ด์ด ํ์ต ์ freeze๋ฅผ False๋ก ํ์ฌ ๊ฐ์ค์น ์ ๋ฐ์ดํธ๋ฅผ ์งํํ์ ๋, Accuracy 86.47%, F1-Score 0.86์ผ๋ก nn.Embedding ๋ชจ๋ธ๊ณผ ์ ์ฌํ๊ฒ ๋์จ ๊ฒ์ ํ์ธํ ์ ์๋ค.
์คํ ๊ฒฐ๊ณผ๋ ๊ธฐ์กด์ ๋ ผ๋ฌธ๊ณผ๋ ๋ค๋ฅด๊ฒ ํฐ ์ฑ๋ฅ ํฅ์์ ๋ณด์ด๊ณ ์์ง๋ ์๋ค. ์ด๋ ์คํ ์์ฒด์ ํ๊ณ์์ ๊ธฐ์ธํ ๊ฒ์ผ๋ก ๋ณด์ด๋๋ฐ, ์ด๋ ๋ค์๊ณผ ๊ฐ๋ค.
-
์ฌ์ ํ์ต ๋ชจ๋ธ์ ํ๊ณ
ELMo ์ญ์ ์ฌ์ ์ ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒ์ผ๋ก, GloVe์ ๊ฐ์ด ๊ณ ์ ๋ช ์ฌ, ํน์ํ ๋จ์ด๋ฅผ ์ฒ๋ฆฌํ๊ธฐ์ ์ ํฉํ์ง ์์ ์๋ ์๋ค. ํ์ต์ ์งํํ๊ธฐ ์ , ELMo์ Title ๋ฌธ์ฅ๋ค์ ํ์ตํ๋ค๋ฉด ๋ ๋์ ์ฑ๋ฅ ํฅ์์ด ์ด๋ฃจ์ด์ ธ ์์ ์ง๋ ๋ชจ๋ฅธ๋ค.
-
๋ถ์กฑํ ๋ฐ์ดํฐ์
ELMo๋ ๋ฌธ์ฅ์ด ์ ๋ ฅ๋์์ ๋, ๋ฌธ๋งฅ์ ์๋ฏธ๋ฅผ ํ์ ํ ์ ์๋๋ก ๋์์ฃผ๋ ๋ชจ๋ธ์ด๋ค. ๊ทธ๋ฐ ์ ์์ ๋ด์ค ๋ฐ์ดํฐ ์ค Title ๋ฐ์ดํฐ๋ฅผ ์ ํํ ๊ฒ์ ELMo์ ์ฑ๋ฅ์ ์ต๋ํ์ผ๋ก ๋ฐํํ๊ธฐ ํ๋ ์ ํ์ด์์ ์ ์๋ค. Title ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ ์์ ํ ๋ฌธ์ฅ์ผ๋ก ์ด๋ฃจ์ด์ง์ง ์์๊ณ , ์ค๊ฐ์ค๊ฐ ์ ์ฒ๋ฆฌ๋์ง ๋ชปํ ๋ฐ์ดํฐ๋ค๋ ์์ ์ ์๊ธฐ์ ์ข์ ์ฑ๋ฅ์ ๋ด๊ธฐ์ ์ ํฉํ์ง ์์์ ์ ์๋ค.
-
ํ์ดํผํ๋ผ๋ฏธํฐ, ๋ชจ๋ธ ์ค๊ณ์ ๋ฌธ์
์ ํํ ๋น๊ต๋ฅผ ์ํด ๋ค ๊ฐ์ง ๊ฒฝ์ฐ์ ๋ชจ๋ธ๋ค์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ๋ชจ๋ ๋์ผํ ์กฐ๊ฑด์์ ์งํํ์๋ค. embedding dimension์ ๊ฒฝ์ฐ GloVe ๋ชจ๋ธ ๋ก๋๋ฅผ ์ํด GloVe ๋ชจ๋ธ์ ๋ฐ๋ฅธ ์ฐจ์ ๊ฐ์ผ๋ก ์ค์ ์ด ๋์ด์๊ธฐ ๋๋ฌธ์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค์๊ฒ๋ ์ต์ ํ๋ ๊ฒฐ๊ณผ๊ฐ ์๋์ง๋ ๋ชจ๋ฅธ๋ค. ๋ํ, Hidden layer์ ์ค๊ณ, ๊ธฐ์กด Embedding layer์ elmo representaion์ ๊ฒฐํฉ ์๊ณ ๋ฆฌ์ฆ ๋ฑ์ ๋ฐ๊พธ๋ ๊ฒ์ ํตํด ์ฑ๋ฅ ํฅ์์ ๋๋ชจํด๋ณผ ์๋ ์๊ฒ ๋ค.
๋น๋ก, ํด๋น ์คํ์์๋ ๋์ ์ฑ๋ฅ ํฅ์์ ๋ณด์ด์ง ๋ชปํ์ง๋ง, ELMo๋ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ๋ก ๋ฌธ๋งฅ ์ ๋ณด๋ฅผ ํ์ ํ๋ค๋ ํจ๋ฌ๋ค์์ ์ ์ํ๋ค๋ ์ ์์ ํ๋์ ๋ฑ์ฅํ Seq2Seq, Transformer์ ์ง๋ํ ์ํฅ์ ๋ผ์ณค๋ค.










