Generatívne jazykové modely

Spracovanie prirodzeného jazyka

  • Text sa rozdelí na menšie jednotky nazývané tokeny.
  • Text sa premení na postupnosť čísel.
  • Neurónová sieť premení postupnosť čísel na inú postupnosť čísel.

Generatívne jazykové modely

  • Neurónová si dokáže predpovedať ďalšie slovo na základe predchádzajúcej histórie.
  • História môže byť dosť dlhá.
  • Ak dokážeme predpovedať ďalšie slovo, dokážeme generovať text.

Čo dokáže generatívny jazykový model

  • Má všeobecný prehľad v ľudských vedomostiach.
  • Programovať.
  • Preklad do viacerých jazykov.
  • Konverzácia vo viacerých jazykoch - cieľavedomá alebo nezáväzná.
  • Generovanie správ, životopisov.
  • Medicínske diagnózy.
  • Editovanie textu a oprava gramatických chýb.
  • Zostavenie návodov.

Čo dokáže generatívny model

  • Generovaní prehľadu literatúry.
  • Sumarizácia textu.
  • Zodpovedanie zložitejší otázok.
  • Porovnanie produktov.
  • Vyhľadávanie informácií.
  • Vytváranie odporúčaní.
  • Rozpoznávanie emócií v zadanom texte.

História jazykových modelov

  • N gramový model: štatistický prístup.
  • T5, BART: neurónová sieť Transformer typu kóder-dekóder.
  • GPT: Transformer typu kóder.
  • ChatGPT: GPT natrénovaný na porozumenie inštrukciám, konverzáciám/

iné konverzačné modely

  • OpenAI: ChatGPT.
  • Je použitý vo vyhľadávači BING.
  • GitHUB Copilot - nápoveda pri programovaní.
  • Google BARD.
  • Midjourney, Dallie pre generovanie obrázkov.

Otvorené generatívne modely

  • mBART, mT5
  • GPT-J, GPT-Neo
  • LLAMA, BLOOM, Falcon
  • Chinchilla, Alpaca, Vicuna

Spôsob trénovania ChatGPT

  • Generatívny model GPT, nedokáže "konverzovať".
  • Množina človekom generovaných konverzácií, spolu s vyhodnotením.
  • Na základe konverzácií sa vygeneruje model "odmeny a trestu" - reinforcement.
  • Model odmeny a trestu trénuje GPT na úlohu konverzácie.

Čo nedokáže generatívny model

  • rozumieť číslam a počítať zložitejšie matematické výrazy
  • vytvárať komplexné programy
  • dokonale rozumieť po slovensky
  • byť zodpovedný a predvídateľný.
  • neaktuálnosť, model bol trénovaní na dáta z roku 2021 a nedokáže reagovať na novšie udalosti.

aké sú bezpečnostné problémy

  • halucinácia, model si vymýšľal nezmysly
  • bias, model môže byť zaujatý voči určitej skupine ľudí, generovanie nenávisti
  • model môže generovať spoločensky neprijateľné výstupy.
  • nemožnosť vysvetliť výstup - na základe čoho model generoval, z toho vyplýva nespoľahlivosť
  • zneužitie interných informácií - konverzácie sa stávajú súčasťou trénovania, veľké jazykové modely typicky bežia na cudzej infraštruktúre, dialógy sa odosielajú a dáta sa využívajú na ďalšie "zlepšenie" modelu.
  • model môže predstierať, že je pracovník banky alebo podpory a vylákať citlivé údaje.

Dopady na zamestnanosť:

Niektoré profesiu môžu zaniknúť. nové pracovné miesta - prompt engineer

Ďalší tlak na vzdelávací systém a nové zručnosti.

Potreba regulácie

  • Generovanie nenávisti, falošných správ. Deepfake
  • Automatický troll.
  • Zneužívanie cudzích dát.
  • Zneužívanie osobných informácií na manipuláciu. Politickú, marketingovú.
  • Manipulácia prostredníctvom chatbota.
  • Možnosti obrany proti nenávisti.

Jazykový model ako autonḿomny inteligentný agent

  • samostatné zlepšovanie modelu.
  • riadenie robotov jazykovým modelom

Budúcnosť modelu

  • v modeli sa budú nachádzať všetky texty z celej histórie ľudstva.
  • efektívnejšie trénovanie a používanie
  • dostupnosť vlastných jazykových modelov.
  • lepšia vysvetliteľnosť

Triky pri používaní ChatGPT

  • Vytvorte si tzv. Persónu - fiktívnu postavu ktorá by mala vyplniť Vaše požiadavky. ChatGPT sa pokúsi "prevteliť" a odpovedať ako daná osoba. Inak by odpovedal učiteľ, inak programátor a inak manuálne pracujúci človek.
  • Hovorte po anglicky.
  • Používajte tzv. temperature: mieru kreativity. Vyššia kreativita znamená väčšia pravdepodobnosť halucinácie
  • Buďte zdvorilí, používajte prosím.
  • Vyjadrujte sa podrobne a exaktne.
  • Používajte rozpoznávanie reči.
  • Neposielajte citlivé informácie - model si to môže zapamätať.

Etické implikácie modelov

  • Príležitosť pre menej kvalifikovaných. Ako sa k tomu postaviť pri vzdelávaní?
  • Nadvláda veľkých technologických spoločností.
  • Je potrebný súhlas na zaradenie do trénovacej databázy?
  • Spotreba elektrickej energie pri trénovaní a pri používaní., Nové modely zvyšujú energetickú náročnosť webového vyhľadávania.

Kto je zodpovedný za výstupy z jazykového modelu?

Ten kto ich používa

Nedovoľte, aby vás nahradil jazykový model

(programujte vlastnou hlavou)

Reload?