์ ๊ฒฝ๊ณ์์์ ๋ด๋ฐ๋ค์ ๊ทธ ์๊ฐ ์์ฒญ๋๊ฒ ๋ง์ผ๋ฉฐ, ์๋ก ๊ฐ์ ๋งค์ฐ ๋ณต์กํ ๊ตฌ์กฐ๋ก ์ฝํ๊ณ ์ค์ผ ํ๋์ ๊ฑฐ๋ํ ๋ง์ ๊ตฌ์ฑํ๋๋ฐ, ์ด๋ฅผ ์ ๊ฒฝ๋ง(neural network)์ด๋ผ๊ณ ํฉ๋๋ค. ๋จธ์ ๋ฌ๋ ๊ณผํ์๋ค์ ์ ๊ฒฝ๊ณ์ ์ด๋ฌํ ์ ๊ฒฝ๋ง ๊ตฌ์กฐ์ ์ฐฉ์ํ์ฌ, ํผ์ ํธ๋ก ์ ํ๋์ ๋น๋ฉ ๋ธ๋ก(building block)์ด๋ผ๊ณ ์๊ฐํ๊ณ , ์ฌ๋ฌ ๊ฐ์ ํผ์ ํธ๋ก ์ ์๋ ์์์ ๊ฐ์ด ์ฐ๊ฒฐํ **์ธ๊ณต์ ๊ฒฝ๋ง(artificial neural network)**์ ๊ณ ์ํ์์ต๋๋ค.
์ ๋ ฅ ๋ฒกํฐ๊ฐ ์๋ฆฌ์ก๋ ์ธต์ ์ ๋ ฅ์ธต(input layer), ์ต์ข ์ถ๋ ฅ๊ฐ์ด ์๋ฆฌ์ก๋ ์ธต์ ์ถ๋ ฅ์ธต(output layer), ์ ๋ ฅ์ธต๊ณผ ์ถ๋ ฅ์ธต ์ฌ์ด์ ์์นํ๋ ๋ชจ๋ ์ธต์ **์๋์ธต(hidden layer)**์ด๋ผ๊ณ ํฉ๋๋ค. ๊ทธ๋ฆผ์ผ๋ก ํํํ ๋๋ 3๊ฐ์ ์ธต์ ๊ทธ๋ฆฌ๋, ์ค์ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ธต ๊ฐ์๋ฅผ ์ ๋ ์ ๋ ฅ์ธต์ ์๋ตํ๋ ๊ฒ์ ์ฃผ์ํด์ผ ํฉ๋๋ค. ๋ฐ๋ผ์ ์ ๊ตฌ์กฐ์์๋ โ์ด 2๊ฐ์ ์ธต์ด ์กด์ฌํฉ๋๋ค.โ๊ณ ๋ถ๋ฆ ๋๋ค. ํผ์ ํธ๋ก ์ ๊ธฐ๋ณธ ๋น๋ฉ ๋ธ๋ก์ผ๋ก ํ์ฌ, ์ด๋ฐ ํจํด์ ๋ฐ๋ผ 2์ฐจ์์ ์ผ๋ก ์ฐ๊ฒฐ๋์ด ๊ตฌ์ฑ๋๋ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ผ์ข ์ ํน๋ณํ ๋ค์ธต **ํผ์ ํธ๋ก (MLP: multi-layer perceptron)**์ด๋ผ๊ณ ํฉ๋๋ค.
์ด๋ฐ ์ ๋ ฅ์ธต-์๋์ธต-์ถ๋ ฅ์ธต์ ๊ฒฝ์ฐ, ๋ค์ธต ํผ์ ํธ๋ก ๋ฟ๋ง ์๋๋ผ, ์ข ์๋ค ์ค๋ช ํ ๋ค์ํ ์ธ๊ณต์ ๊ฒฝ๋ง ๊ตฌ์กฐ์์ ๊ณตํต์ ์ผ๋ก ์กด์ฌํ๋ ์ธต์ ๋๋ค. ์๋์ธต์ ๊ฐ์๊ฐ ๋ง์์ง์๋ก ์ธ๊ณต์ ๊ฒฝ๋ง์ด โ๊น์ด์ก๋ค(deep)โ๊ณ ๋ถ๋ฅด๋ฉฐ, ์ด๋ ๊ฒ ์ถฉ๋ถํ ๊น์ด์ง ์ธ๊ณต์ ๊ฒฝ๋ง์ ๋ฌ๋ ๋ชจ๋ธ๋ก ์ฌ์ฉํ๋ ๋จธ์ ๋ฌ๋ ํจ๋ฌ๋ค์์ ๋ฐ๋ก **๋ฅ๋ฌ๋(Deep Learning)**์ด๋ผ๊ณ ํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ , ๋ฅ๋ฌ๋์ ์ํด ์ฌ์ฉํ๋ ์ถฉ๋ถํ ๊น์ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ฌ์ธต **์ ๊ฒฝ๋ง(DNN: Deep neural network)**์ด๋ผ๊ณ ํต์นญํฉ๋๋ค.
โ๊ทธ๋ผ ์๋์ธต ๋ฐ ์ถ๋ ฅ์ธต์ด ๋ช ๊ฐ ์ด์์ด ์์ด์ผ ์ฌ์ธต ์ ๊ฒฝ๋ง์ด๋?โ๋ ์๋ฌธ์ด ์๊ธธ ์ ์๋๋ฐ, ์ผ๋ฐ์ ์ผ๋ก๋ ์๋์ธต+์ถ๋ ฅ์ธต์ด 2๊ฐ ์ด์์ด ๋๋ฉด ์ฌ์ธต ์ ๊ฒฝ๋ง์ด๋ผ๊ณ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์๋์ ๊ฐ์ด 8๊ฐ ์๋์ธต+์ถ๋ ฅ์ธต์ผ๋ก ๊ตฌ์ฑ๋ ๋ค์ธต ํผ์ ํธ๋ก ์ ์ฌ์ธต ์ ๊ฒฝ๋ง์ ๋๋ค.
์ด์ ์ฌ๋ฌ๋ถ๋ค์, ๋ฅ๋ฌ๋์ ๋จธ์ ๋ฌ๋์ ์ธ๋ถ ๋ฐฉ๋ฒ๋ก ๋ค์ ๋ถ๊ณผํ๋ค๋ ๋ง์ ์๋ฏธ๋ฅผ ์ดํดํ์ จ์ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค. ๋จธ์ ๋ฌ๋์ ํฐ ํ์ ๊ทธ๋๋ก ๊ฐ์ ธ๊ฐ๋, ๋ฌ๋ ๋ชจ๋ธ๋ก โ์ถฉ๋ถํ ๊น์โ ์ธ๊ณต์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๊ณ , ์ด์ ๋ง๋ ๋ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ฌ๋ ๋ชจ๋ธ์ ํ์ตํ ๊ฒฝ์ฐ โ๋ฅ๋ฌ๋์ ํ๋คโ๊ณ ํํํด๋ ํฌ๊ฒ ๋ฌด๋ฆฌ๊ฐ ์์ต๋๋ค.
์ด๋ฐ ์ ๊ฒฝ๋ง ๊ตฌ์กฐ์ ์ฃผ์ ์ ํ์ ์ดํด ๋ณด๋ฉด ๋ค์๊ณผ ๊ฐ์ ๊ฒ๋ค์ด ์์ต๋๋ค.
Feed-forward neural network
๊ฐ์ฅ ๊ฐ๋จํ ํํ์ ์ฑ๊ฒฝ๋ง์ ํํ๋ฅผ ๋งํฉ๋ค. ๊ฐ์ฅ ์ผ๋ฐ์ ์ผ๋ก ์ฐ์ด๊ณ ์ค์ ์ดํ๋ฆฌ์ผ์ด์ ์ ์ ์ฉ๋๋ neural network๋ค๋ ๋๋ถ๋ถ์ด feed-forward๋ผ๊ณ ํฉ๋๋ค. ์ด ๋คํธ์ํฌ๋ ์๋นํ ๊ฐ๋จํ ๊ตฌ์กฐ์ธ๋ฐ, ์ฒซ ๋ฒ์งธ layer๋ input์ด๋ฉฐ ๊ฐ์ฅ ๋ง์ง๋ง layer๋ output์ ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ค๊ฐ์ input๊ณผ output์ผ๋ก ๊ด์ฐฐ๋์ง ์๋ ์์ญ์ โhiddenโ layer๋ผ๊ณ ํ๋๋ฐ, ์ฐ๋ฆฌ๊ฐ ์ง์ ๊ด์ธกํ๋ ์์ญ์ด ์๋ ๋ณผ ์ ์๋ layer์ด๋ฏ๋ก hidden์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ ๊ฒ์ ๋๋ค. ๋ง์ฝ hidden layer๊ฐ ํ๋๋ณด๋ค ๋ง์ด ์กด์ฌํ๋ค๋ฉด ์ด network๋ โdeepโ neural network๋ผ๊ณ ๋ถ๋ฆฝ๋๋ค.
โ ์์ ๊ทธ๋ฆผ์ด Feed-forward neural network์ ๊ฐ๋จํ ์์์ด๋ค.
Recurrent network
์ด๋ณด๋ค ์กฐ๊ธ ๋ ๋ณต์กํ network๋ก๋ Recurrent network๋ผ๋ ๊ฒ์ด ์กด์ฌํฉ๋๋ค. โRecurrentโ๋ผ๋ ์ด๋ฆ์ด ๋ถ์ ์ด์ ๋ graph์ cycle์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ์ธ๋ฐ, ์ด network์์๋ ํ์ดํ๋ฅผ ๊ณ์ ๋ฐ๋ผ๊ฐ๋ค๋ณด๋ฉด ์ด๋ ์๊ฐ ๊ฐ์ ์ฅ์๋ฅผ ๊ณ์ ๋๊ณ ์์ ์๋ ์๋ค๋ ์๋ฏธ์ ๋๋ค. ๋น์ฐํ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ผ๋ก ์ด๊ฒ์ ํ์ตํ๋ ๊ฒ์ ๋งค์ฐ ๋ณต์กํ ์ผ์ด๊ณ ์ด๋ ค์ด ์ผ์ ๋๋ค. ๊ทธ๋ผ์๋ ์ผ๋จ ์ด ๋คํธ์ํฌ๋ ์๋ฌผํ์ ์ผ๋ก ๊ฐ์ฅ ํ์ค์ ์ธ ๋คํธ์ํฌ๋ผ๊ณ ํฉ๋๋ค.
์์ ๊ฐ์ด directed cycle์ด ์กด์ฌํ๋ ๊ฒฝ์ฐ recurrent network๋ผ๊ณ ํ๋๋ฐ, ์ด ๋ฐฉ๋ฒ์ ์ฌ์ฉํด์ sequential data๋ฅผ modelingํ ์ ์๋ค๊ณ ํฉ๋๋ค. ๊ทธ๋ฐ ๋ชจ๋ธ๋ง์ด ๊ฐ๋ฅํ ๊ทผ๋ณธ์ ์ธ ์ด์ ๋ ์ด ๋ฐฉ๋ฒ ์์ฒด๊ฐ ์ผ์ข ์ ์๊ฐ์ ์ถ์ผ๋กํ ์์ฃผ deepํ network๋ก ๋ณ๊ฒฝ์ด ๊ฐ๋ฅํ๊ธฐ ๋๋ฌธ์ ๋๋ค. ๊ทธ๋ฆผ์ผ๋ก ๋ณด๋ฉด ์๋์ ๊ฐ์ ํํ๊ฐ ๋ฉ๋๋ค.
์์ ๊ทธ๋ฆผ์ ๋งค์๊ฐ๋ง๋ค ํ๋์ hidden layer๋ฅผ ๊ฐ์ง๋ ๋คํธ์ํฌ์ด๋ฉฐ, ๊ฐ hidden layer๋ ๊ทธ ๋ค์ hidden layer์ ๋ฌด์ธ๊ฐ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ํํ์ ๋๋ค. ์ฆ, ์๊ธฐ ์์ ์ด ์๊ธฐ ์์ ์๊ฒ ์ ๋ณด๋ฅผ ์ฃผ๋ cycle์ด ์กด์ฌํ๋ ํํ์ด๋ฉฐ, ๋งค์๊ฐ๋ง๋ค input๊ณผ output์ด ์กด์ฌํ๋ค๊ณ ์๊ฐํ ์ ์์ต๋๋ค. ์ด๋ฐ ์ด์ ๋ก recurrent network๋ฅผ ์ด๋ฐ ํํ์ network๋ก ์นํํ์ฌ ์๊ฐํ ์ ์๋ ๊ฒ์ ๋๋ค.
Reference : http://sanghyukchun.github.io/40/





