Retrieval Augmented Generation
Tokeny
│
▼
Embedding
│
▼
+---------------------------+
| Self-Attention |
| Feed Forward |
+---------------------------+ × N vrstiev
│
▼
Embedding
│
▼
Výstupný token
👉 Model nevie nič iné, len predpovedať ďalší token.
Príklad:
"Bratislava je hlavné mesto ______"
↓
Slovenska
Model hľadá najpravdepodobnejšiu postupnosť slov.
P(veta) = P(w1) * P(w2|w1) * P(w3|w1,w2) * ...
Používané stratégie:
+----------------+
| System prompt |
+----------------+
| História |
+----------------+
| User prompt |
+----------------+
│
▼
MODEL
│
▼
Response
⚠ Kontext má obmedzenú veľkosť.
Ukážeme modelu správne odpovede a upravíme váhy.
Otázka → Správna odpoveď
Otázka → Správna odpoveď
Otázka → Správna odpoveď
↓
Úprava váh
Tu sa používa PEFT pre zníženie náročnostiQ
Modelu ukážeme:
Cieľ: zosúladenie s ľudskými hodnotami.
Pridáme príklady priamo do promptu:
Prelož do angličtiny:
pes → dog
mačka → cat
kôň → ?
👉 Do promptu pridáme relevantné dokumenty.
Výhody:
Otázka
│
▼
+-------------------+
| Vyhľadávací |
| systém |
+-------------------+
│
▼
Relevantné dokumenty
│
▼
+-------------------+
| Jazykový model |
+-------------------+
│
▼
Odpoveď
"Dnes je pekné počasie"
↓
[0.12, -0.44, 0.91, ...]
Vektorový priestor
• Dokument A
• Dokument B
• Dokument C
"Aké je dnes počasie?"
↓
[0.10, -0.40, 0.89, ...]
Vektorový priestor vo vektorvej databáze
• Dokument A
• Dokument B
* Otázka
• Dokument C
+-------------------+
| Dokumenty |
+-------------------+
│
▼
Embedding model
│
▼
+----------------+
| Vektorová DB |
+----------------+
▲
│
Otázka → Embedding → Vyhľadanie
│
▼
Relevantné texty
│
▼
+----------------+
| LLM |
+----------------+
│
▼
Odpoveď
doc. Daniel Hládek PhD.
BN32 - L610