์๊ธฐ๊ณ ํ์ฐฎ์ ๋๋ด์ด ๊ฐ๋ฅํ LLM ์ฐ๊ตฌ๋ฅผ ๊ฒ์ํ๊ณ ์ถ์๋ค. ๊ตฌ๊ธ์ '๊ฐ๋๋ฆฝ llm'์ ๊ฒ์ํ๋ค.
...๊ฐ๋๋ฆฝ ์ปค๋ฎค๋ํฐ์ ๊ธ์ ์ ํ๊ณ , ๊ทธ๋ ๊ฒ ์ ๋ฅด์ฟค(Yann Lecun) ๋ด์๋ ๊ต์๋์ LLM ํ์๋ก ๊ณผ ๋ถ๋ถํ ์๊ฒฌ์ ๋๋ผ๋ก ๋ ๋๊ฒ ๋์๋ค.
์ฌ์ค ์ด๋ฏธ 1๋ ์ ๋๋ ๋ ์ค๋๋ ์ด์์ด์ง๋ง, ์ ๋ชจ๋ฅด๊ณ ์์์ด์ ์๋กญ๊ฒ ๋๊ปด์ก๋ค.
๊น์ด ์๊ฒ ์ดํดํ๊ณ , ๊ธ์ ์ฐ๊ณ ์ถ์ง๋ง, ๋ด ๊ธ์ด ํผ์์ ์ธ ์์ค์ ๊ทธ์น์ง ์์ผ๋ฉด ๋๊ฐ ๊ณผ๋ถํ๋ ๊ฒ ๊ฐ๋ค. ๐ญ
1. ํ๋ถ์์ด ์คํดํ๊ธฐ ์ฌ์ด LLM๊ณผ Transformer์ ๊ตฌ๋ถ
Yann Lacun ๊ต์์ ๋ํ ๊น์ธ์ค ๊ต์๋์ ํ์ด์ค๋ถ ๊ฒ์๋ฌผ, ๊ฐ๋๋ฆฝ ์ปค๋ฎค๋ํฐ
LLM๊ณผ Transformer๋ ๋ค๋ฅด๋ค.
Transformer๋ MHSA, FFN, LN, skip connection, PE๋ฑ์ผ๋ก ๊ตฌ์ฑ๋ building block, ๋๋ architecture์ด๊ณ LLM์ AR๋ฐฉ์์ ์ํด ๊ณผ๊ฑฐ์ context๋ก๋ถํฐ ๋ค์ token์ ์์ธกํ๋ AI๋ชจ๋ธ์ด๋ค.
์ผ๋ฐ์ ์ผ๋ก ๋๊ท๋ชจ SSL์ ์ํด pretrainingํ๊ณ SL์ด๋ RL์ ์ํด fine-tuningํ๋ค. LLM์ด Transformer decoder, ๋๋ encoder-decoder ์กฐํฉ์ ์ํด ๊ตฌํ๋๊ธฐ ๋๋ฌธ์ ๋์ ํผ๋ํ๋ ์ฌ๋๋ค์ด ๋ง๋ค. LLM์ CNN์ด๋ RNN์ผ๋ก ๊ตฌํํ ์๋ ์๋ค. ๋จ, ์ฑ๋ฅ์ Transformer๊ธฐ๋ฐ LLM๋ณด๋ค ๋ชปํ๋ค.
์ฌ๊ธฐ์ ๊ต์๋์ด ์ง์ ํ ๋ถ๋ถ์ ๋๋ ์ ์ดํดํ์ง ๋ชปํ๋ ๊ฒ ๊ฐ๋ค. ์๋, ๊ทธ๋ณด๋ค ์ฌ๊ธฐ์ ์ธ๊ธ๋ ๋ชจ๋ ๊ตฌ์ฑ๋ค์ ์ํ์ ์ผ๋ก๋ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด๋ก ์ดํดํ์ง ๋ชปํ๊ณ ์๋ค๋ ์ ์ ํฐ ๋ฌธ์ ๋ค.
์ฐ์ G ์ ์๋์ ์ค๋ช ์ ์ฒจ๋ถํ๋ฉฐ ์ฐจ์ฐจ ๊ฐ ๊ฐ๋ ์ ์ํ์ , ์ปดํจํฐ ๊ณตํ์ ์ดํด๋ฅผ ๋ค๋ฃฌ ํฌ์คํ ์ ์์ฑํด์ผ๊ฒ ๋ค.
1. MHSA (Multi-Head Self-Attention):
์ด๋ฆ์ด ์ข ์ด๋ ค์ ๋ณด์ด์ง๋ง, ํต์ฌ ์์ด๋์ด๋ ๊ฐ๋จํฉ๋๋ค.
- Self-Attention: ์
๋ ฅ ๋ฐ์ดํฐ์ ๊ฐ ๋ถ๋ถ(์: ๋ฌธ์ฅ์ ๋จ์ด๋ค)์ด ์๋ก๋ฅผ ์ผ๋ง๋ "์ฐธ์กฐ"ํด์ผ ํ ์ง ๊ณ์ฐํ๋ ๋ฉ์ปค๋์ฆ์
๋๋ค.
์๋ฅผ ๋ค์ด, "๋๋ ์ฌ๊ณผ๋ฅผ ๋จน์๋ค"๋ผ๋ ๋ฌธ์ฅ์์ "์ฌ๊ณผ"์ "๋จน์๋ค"๋ ์๋ก ๊ธด๋ฐํ ์ฐ๊ฒฐ๋์ด์ผ ํฉ๋๋ค. Self-Attention์ ์ด๋ฐ ๊ด๊ณ๋ฅผ ํ์ตํฉ๋๋ค. - Multi-Head: ์ด ๊ณผ์ ์ ์ฌ๋ฌ ๋ฒ(์ฆ, ์ฌ๋ฌ ๊ด์ ์์) ์ํํฉ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ๋ชจ๋ธ์ด ๋ฐ์ดํฐ๋ฅผ ๋ ์ ์ดํดํ ์ ์์ต๋๋ค.
๋น์ ํ์๋ฉด, ์ฌ๋๋ค๋ ๋ฌธ์ ๋ฅผ ๋ค์ํ ์๊ฐ์์ ๋ฐ๋ผ๋ณด๋ฉด ๋ ์ ํํ ์ดํดํ ์ ์๋ ๊ฒ๊ณผ ๋น์ทํฉ๋๋ค.
2. FFN (Feed-Forward Network):
- Self-Attention์ผ๋ก ์ ๋ณด๋ฅผ "์ด๋๋ฅผ ๋ด์ผ ํ๋์ง" ์ดํดํ๋ค๋ฉด, ์ด์ FFN์ ์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ ๋ง์ ์ ๋ณด๋ฅผ ํ์ตํฉ๋๋ค.
- ์ด๋ ๊ฐ๋จํ ๋งํด "์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ๊ณ ๋ณํํ๋ ์์ ์ ๊ฒฝ๋ง"์
๋๋ค.
Transformer์ ๊ฐ ์ธต์์ FFN์ด ๋ฐ์ดํฐ๋ฅผ ๋ ์ ์ฉํ ํํ๋ก ๋ฐ๊ฟ์ค๋๋ค.
3. LN (Layer Normalization):
- ๋ชจ๋ธ์ ๊ฐ ์ธต์์ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ฉด์ ๊ฐ๋ค์ด ์ง๋์น๊ฒ ํฌ๊ฑฐ๋ ์์์ง๋ ์ผ์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
Layer Normalization์ ์ด๋ฅผ ๋ฐฉ์งํ๊ณ , ๋ฐ์ดํฐ ํ๋ฆ์ด ์์ ์ ์ด๊ฒ ๋ง๋ญ๋๋ค.
๋น์ ํ์๋ฉด, ์ฌ๋ฌ ๋จ๊ณ์ ๊ณต์ ์ ๊ฑฐ์น๋ ์์ฐ๋ผ์ธ์์, ๊ฐ ๋จ๊ณ๋ง๋ค ํ์ง์ ๊ฒ์ฌํด ์ผ์ ํ๊ฒ ์ ์งํ๋ ๊ฒ๊ณผ ๋น์ทํฉ๋๋ค.
4. Skip Connection (์์ฐจ ์ฐ๊ฒฐ):
- Transformer๋ ์ฌ๋ฌ ์ธต์ ์์ ์ฌ๋ ค ๋ฐ์ดํฐ๋ฅผ ์ ์ ๋ ๋ณต์กํ๊ฒ ์ฒ๋ฆฌํฉ๋๋ค.
ํ์ง๋ง ์ด๋ ๊ฒ ํ๋ฉด ์ ๋ณด๊ฐ ํ๋ฅด๋ ๋์ ์๋์ ์ค์ํ ์ ๋ณด๊ฐ ์ฌ๋ผ์ง ์ํ์ด ์์ต๋๋ค. - Skip Connection์ ์ด๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด, ์ด์ ์ธต์ ์ถ๋ ฅ์ ๋ค์ ์ธต์ผ๋ก ์ง์ ์ฐ๊ฒฐํฉ๋๋ค.
์ฆ, ์ด์ ์ ๋ณด๊ฐ ์ฌ๋ผ์ง์ง ์๊ฒ "์ง๋ฆ๊ธธ"์ ๋ง๋ค์ด์ฃผ๋ ์ญํ ์ ํฉ๋๋ค.
5. PE (Positional Encoding):
- Self-Attention์ ๋ฌธ์ฅ ๋ด ๋จ์ด๋ค์ ์์ ์ ๋ณด๋ฅผ ์์ฐ์ค๋ฝ๊ฒ ๋ค๋ฃจ์ง ๋ชปํ๋ ๋ฌธ์ ๊ฐ ์์ต๋๋ค.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, Positional Encoding์ด ๋จ์ด์ ์์น ์ ๋ณด๋ฅผ ์ถ๊ฐ๋ก ์ ๊ณตํฉ๋๋ค.
์๋ฅผ ๋ค์ด, "๋๋ ์ฌ๊ณผ๋ฅผ ๋จน์๋ค"์ "์ฌ๊ณผ๋ฅผ ๋๋ ๋จน์๋ค"๋ ๋จ์ด๋ ๊ฐ์๋ ์์๊ฐ ๋ค๋ฆ ๋๋ค. PE๋ ์ด๋ฐ ์ฐจ์ด๋ฅผ ๋ชจ๋ธ์ด ์ธ์ํ ์ ์๊ฒ ํฉ๋๋ค.
6. SSL (Self-Supervised Learning)
- ๋ฐ์ดํฐ์ ๋ผ๋ฒจ(์ ๋ต) ์์ด, ๋ฐ์ดํฐ๋ฅผ ์ค์ค๋ก ํ์ตํ์ฌ ํํ(Representation)์ ํ์ตํ๋ ๋ฐฉ์์ ๋๋ค.
- ๋ฐ์ดํฐ์ ์ผ๋ถ๋ฅผ ์จ๊ธฐ๊ณ (๋ง์คํน), ๊ทธ ์จ๊ธด ๋ถ๋ถ์ ์์ธกํ๊ฒ ํ๊ฑฐ๋, ๋ฐ์ดํฐ ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ตํ๊ฒ ํ๋ ๋ฐฉ๋ฒ์ด ์์ฃผ ์ฌ์ฉ๋ฉ๋๋ค.
์: ํ ์คํธ์์ ์ผ๋ถ ๋จ์ด๋ฅผ ๊ฐ๋ฆฌ๊ณ , ๋ชจ๋ธ์ด ๊ทธ ๋จ์ด๋ฅผ ์์ธกํ๋๋ก ํ๋ จ. - SSL์ LLM์ Pretraining ๋จ๊ณ์์ ์์ฃผ ์ฌ์ฉ๋ฉ๋๋ค.
7. SL (Supervised Learning)
- ๋ผ๋ฒจ(์ ๋ต)์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ตํ๋ ๋ฐฉ์์ ๋๋ค.
- ๋ฐ์ดํฐ์ ํด๋น ๋ฐ์ดํฐ์ ์ ๋ต(์ถ๋ ฅ)์ ์์ผ๋ก ์ ๊ณตํ์ฌ, ์
๋ ฅ์ ๋ํ ์ถ๋ ฅ์ ๊ด๊ณ๋ฅผ ํ์ตํฉ๋๋ค.
์: ์ฌ์ง(์ ๋ ฅ)๊ณผ ๊ณ ์์ด/๊ฐ ๋ผ๋ฒจ(์ ๋ต)์ด ์๋ ๋ฐ์ดํฐ๋ก ํ์ต.
LLM์์ ์ฌ์ฉ๋๋ ๋งฅ๋ฝ:
Fine-Tuning ๋จ๊ณ์์ ์์ฃผ ์ฌ์ฉ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๋๊ท๋ชจ๋ก ํ์ต๋ ๋ชจ๋ธ์ ํน์ ์์
(์: ์์ฝ, ๋ถ๋ฅ)์ ์ํํ๋๋ก ์ถ๊ฐ ํ์ต์ ์ํฌ ๋ ์ฌ์ฉ.
8. RL (Reinforcement Learning)
- ๋ชจ๋ธ์ด ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ๋ฉฐ ๋ณด์(Reward)์ ๊ธฐ๋ฐ์ผ๋ก ํ์ตํ๋ ๋ฐฉ์์ ๋๋ค.
- ์ ๋ต ๋์ "ํ๋"์ ๋ํ ๋ณด์์ด ์ฃผ์ด์ง๋ฉฐ, ์ด ๋ณด์์ ์ต๋ํํ๋๋ก ํ์ตํฉ๋๋ค.
์: ์ฒด์ค์์ ์น๋ฆฌํ๋ฉด ๋์ ๋ณด์์ ๋ฐ๊ณ , ํจ๋ฐฐํ๋ฉด ๋ฎ์ ๋ณด์์ ๋ฐ๋ ์.
LLM์์ ์ฌ์ฉ๋๋ ๋งฅ๋ฝ:
- LLM์ Fine-Tuning์์ **RLHF (Reinforcement Learning with Human Feedback)**๋ผ๋ ๋ฐฉ์์ผ๋ก ์์ฃผ ์ฌ์ฉ๋ฉ๋๋ค.
- ์: GPT ๊ณ์ด ๋ชจ๋ธ์์ ์ฌ์ฉ์ ํผ๋๋ฐฑ(์ข์/๋์จ)์ ๊ธฐ๋ฐ์ผ๋ก ๋ํ ํ์ง์ ๊ฐ์ .
- ๋ชจ๋ธ์ด "์ข์ ๋ต๋ณ"์ ๋ณด์์ ๋ฐ๊ณ , ์ด๋ฅผ ํตํด ๋์ฑ ์ธ๊ฐ ์นํ์ ์ธ ์๋ต์ ์์ฑํ๋๋ก ํ์ต.
- LLM์ ๋ช ์์ ์ธ ๋ค๋จ๊ณ ์ถ๋ก ๊ธฐ๋ฅ์ด๋ World Model์ด ์๋ค. (RAG๋ ๋งค์ฐ ์ ํ์ ์ธ ํํ์ World Model๋ก ๋ณผ ์ ์๋ค.) ์์ฒญ๋ ํ๋ผ๋ฏธํฐ์์ ํ์ต ๋ฐ์ดํฐ์ ์ํด ๊น์ ์ฌ๊ณ ๊ฐ ์๊ตฌ๋๋ ์์ ์ ๋จ์ ์์ ์ฒ๋ผ ์ฒ๋ฆฌํ ๋ฟ์ด๋ค. ์๋ฅผ ๋ค๋ฉด, ๋ณต์กํ ์ํ๋ฌธ์ ๋ ๊ณ ๋์ ์ฌ๊ณ ๋ฅผ ์๊ตฌํ์ง๋ง, ์ ํํ์ต์์ ๋น์ทํ ์ ํ์ ๋ฌธ์ ๋ฅผ ์ ํ ํ์์ ํผ์์ ์ธ ์ฌ๊ณ ๋ ฅ๋ง์ผ๋ก ํ ์ ์๋ค. (์ ํํ์ต์ ์ฌ๊ณ ๋ ฅ ํ๋ จ์ ์๊ธฐ๋ ฅ ํ๋ จ์ผ๋ก ๋์ฒดํ๋ค.) ์ด๋ฌํ LLM์ ๋์์ ์ถ๋ก ๋ฅ๋ ฅ์ด ์๋๋ผ ์ถ๋ก ์ simulateํ๋ ๋ฅ๋ ฅ์ด๋ค. (Weak AI๋ ๋ค ๊ทธ๋ฐ ๋ฐฉ์์ผ๋ก ๋ง๋ค์ด์ง๋ฏ๋ก ๋ฌธ์ ๋ ์๋๋ค.) ๋จ, LLM์ ๊ท๋ชจ์ ์์กดํ๊ธฐ ๋๋ฌธ์ ๋นํจ์จ์ ์ด๋ค.
GPT-4o๊ฐ ๋ฃ๊ธฐ๋ก, ์ถ๋ก ํ๋๋ก
2. ๋ฌผ๋ฆฌ ์ธ๊ณ(Physical world)๋ ์๋ฒ ๋ฉํ๊ณ ํ์ตํด์ผ ํ๋ค.
Meta AI ์์์ด๊ธฐ๋ ํ Yann Lecun, Lex Fredman์ ํ์บ์คํธ
(ํด์ธ ์ํ/๊ณผํ ์ ํ๋ฒ ์ค์ ์ง์ฑ Geek์ด๋ผ ํด์ผํ ์ง, ๊น์ด ์๋ ์์์ ๋ค๋ฃจ๋ ์ฑ๋์ด ๋ง์ ๊ฒ ๊ฐ๋ค.)
ํ์ฌ LLM์ ๊ทธ ๋จ์ด์ฒ๋ผ ์ธ์ด๋ฅผ ํ์ตํ๊ณ ์ถ๋ ฅํ๋ ๊ตฌ์กฐ์ด๋ค. ํ์ง๋ง, ์ ๋ฅด์ฟค์ ์จ์ ํ ์ง๋ฅ์ ๋ง๋ค๊ธฐ ์ํด ๋น์ธ์ด์ ์ธ ์ ๋ณด๊ฐ ๋ง์ด ํ์ํ๋ฉฐ ๋ฐ๋ผ์ ์ธ๊ณต์ง๋ฅ์ด ๋ฌผ๋ฆฌ ์ธ๊ณ(Physical world) ๋ํ ์ดํดํด์ผ ํ๋ค๊ณ ์ฃผ์ฅํ๋ค.
3. ์ฐ๋ฆฌ๋๋ผ์ ํ์ํ ์ด๊ณผ ์ ํ๋ฒ
๊ต์๋์ ํ์ด์ค๋ถ ๊ธ๊ณผ ์ ํ๋ธ ์ถ์ฐ์ ๋ณด๋ฉฐ ๋๋ ์ ์ค ํ๋๋ ๊ต์๋๋ค์ ๊ฑฐ๋ค๊ธฐ(?)๊ฐ ๋๋ฌด ์ข๋ค.
Lex Fredman์ ํ์บ์คํธ์ฒ๋ผ ์ฐ๋ฆฌ๋๋ผ๋ ์ผ๋ฐ ๋์ค๋ฟ๋ง ์๋๋ผ ๊ณผํ์ ๊ด์ฌ์๊ณ ๊น์ ๋ด์ฉ์๋ ํฅ๋ฏธ๋ฅผ ๊ฐ์ง ์ฒญ์๋ค์ ์ํ ์์์ด ๋ง์์ง๋ฉด ์ข๊ฒ ๋ค.
ํ์ฌ ๊ตญ๋ด์์๋ ์ ํ๋ธ ์ฑ๋ ๋ณด๋ค๊ฐ ๋ด์ฉ์ด ๋ฐ๋ ์์ผ๋ฉด์๋ ํฅ๋ฏธ๋กญ๋ค. ๊ทธ๋ฐ๋ฐ, ํ ๊ฐ์ง ์ค์ํ๋ค๊ณ ์๊ฐํ๋ ์ ์ ์์ด๋ก ์ปจํ ์ธ ๊ฐ ๋ฒ์ญ๋์ด์ผ ํ๋ค๋ ๊ฒ์ด๋ค.
์ฆ์์์ ์ด๋ ค์ด ๋ด์ฉ๋ ์์ด๋ก ์ ์ฐฝํ๊ฒ ๋งํ ์ ์๋ ์ฐ๊ตฌ์์ ๋ฐฉ์ก ์งํ์๋ฅผ ๋์์ ์ฐพ๋ ๊ฒ์ ๋งค์ฐ ์ด๋ ค์ด ์ผ์ผ ๊ฒ์ด๋ค. ํ์ง๋ง ์ต๊ทผ ์ ํ๋ธ์์ ๋๋น์ ๋ฃ๋ ์์์ด ๋ง์ด ์๊ธด ๊ฒ์ฒ๋ผ ๋ณด๋ค๊ฐ์ ๊ณ ํ๋ฆฌํฐ ์์๋ ๋๋น๋๋ค๋ฉด ์์ถ๋ ์ฌ์ง๊ฐ ๋ง์ ๊ฒ์ด๋ค.