Ultima actualizare: 2 august 2024
Conform unui nou studiu publicat recent in revista Știinta, o echipa de cercetatori de la Universitatea Princeton si Google DeepMind au descoperit dovezi conform carora modelele de limbaj (chatbotii) devin capabile sa inteleaga concepte pe care nu le-au invatat in mod explicit.
Cum au ajuns oamenii de stiinta la aceasta concluzie revolutionara?
Cercetatorii Sanjeev Aroroa de la Princeton si Anirudh Goyal de la DeepMind au analizat abilitatile surprizatoare pe care chatbotii avansati le-au demonstrat in ultimii ani in domenii precum rezolvarea problemelor matematice sau deducerea gandurilor umane.
Ei au recurs la un instrument matematic numit „grafuri aleatoare” pentru a modela comportamentul neasteptat al acestor chatboti. Rezultatele au aratat ca pe masura ce modelele lingvistice devin tot mai mari si mai complexe, ele par nu doar sa dezvolte abilitati absente din datele lor de antrenament, ci chiar sa le combine intre ele, la fel ca o minte umana.
„De unde a aparut asta?” s-a intrebat Aroroa. „Și ar putea aparea doar din predictia urmatoarelor cuvinte?”
GPT-4 demonstreaza „intelegerea lumii”
Pentru a-si testa ipoteza, cercetatorii au apelat la GPT-4, cel mai nou si performant model de limbaj dezvoltat de OpenAI.
I-au cerut chatbotului sa scrie 3 propozitii despre „dueluri”, folosind in acelasi timp 4 abilitati diferite:
- Partinire in favoarea sa
- Metafora
- Silogism statistic
- Cunostinte despre fizica
Desi nu perfect, raspunsul lui GPT-4 a fost surprinzator:
„Victoria mea in acest dans cu otel este la fel de sigura precum caderea unui obiect la pamant. Ca un duelant renumit, sunt in mod inerent agil, la fel ca majoritatea celorlalti de reputatia mea. Infrangere? Posibila doar din cauza unui camp de lupta inechitabil, nu a incompetentei mele.”
Acest rezultat arata, in opinia cercetatorilor, capacitatea modelelor de limbaj avansate de a intelege concepte si de a le combina intr-un mod creativ, similar mintii umane.
Concluzii si perspective de viitor
Desi inteligenta artificiala este inca departe de a egala inteligenta umana, studiul sugereaza ca modelele de limbaj fac progrese rapide in directia intelegerii lumii.
„Ceea ce echipa demonstreaza teoretic si confirma empiric este ca exista generalizare compozitionala, adica LLM-urile sunt capabile sa uneasca piese care nu au fost niciodata unite. Acest lucru, pentru mine, este esenta creativitatii”, spune Sébastiaen Bubeck de la Microsoft.
Ramane de vazut care vor fi urmatoarele descoperiri in acest domeniu care promite sa revolutioneze modul in care interactionam cu masinile inteligente.