Hosszú évek óta tartja magát az elképzelés, hogy a mesterséges intelligencia fejlesztésének kulcsa az emberi tanítás: adatok, címkék, finomhangolás, gondosan megtervezett beavatkozások. Most azonban egy új megközelítés látott napvilágot. Az MIT kutatóinak legújabb munkája, a SEAL (Self-Adapting Language Models) névre keresztelt rendszer olyan nyelvi modelleket mutat be, amelyek képessé válnak saját maguk tanítására. Az eredmények nemcsak technológiai újdonságot jelentenek, hanem felvetik a kérdést: vajon milyen szerepet szánunk a jövőben az embernek az intelligens rendszerek képzésében?
A SEAL alapötlete, hogy a mesterséges intelligenciának nem kell többé tétlen befogadóként várnia az új információkra, vagy a fejlesztői beavatkozásra. Ehelyett a modell képes felismerni, ha valami újat kell megtanulnia, és ezt a folyamatot maga is elindíthatja. Az ehhez szükséges adatokat saját maga generálja, eldönti, hogyan szervezze őket tanulásra alkalmassá, és az így kialakított tanítási anyag segítségével frissíti saját paramétereit – azaz „átalakítja” önmagát. A változtatások nemcsak átmenetiek: a tanult tudás a modell belső súlyaiba íródik be, így hosszú távon is befolyásolja működését.
Ez a működésmód természetesen komoly technikai kihívások elé állítja a fejlesztőket. A rendszernek el kell döntenie, hogy milyen módosítások vezetnek valódi fejlődéshez, és ehhez egy megerősítéses tanulási (reinforcement learning) ciklusban értékeli ki saját teljesítményét. Ha a módosítások pozitív hatással járnak, a modell megerősítést kap, és ezek mentén fejleszti tovább önszerkesztő mechanizmusait. A tanulás tehát nem előre beprogramozott pályán halad, hanem dinamikusan alkalmazkodik az új kihívásokhoz.
A SEAL fejlettsége akkor válik igazán érthetővé, ha megnézzük, hogyan teljesített konkrét feladatokban. Egy tudásbeépítési kísérletben a modellnek egy új szövegrészlet információit kellett beépítenie saját működésébe. Ahelyett, hogy egyszerűen megtanulta volna a szöveget, a rendszer következtetéseket vont le belőle, átalakította azt egy saját szempontjai szerint hatékonyabb tanulási formára, majd ezen az új formán tanította magát. Az eredmény meggyőző: a SEAL jobban teljesített, mint más, akár nagyobb modellek, amelyeket ugyanazon információ nyers formáján képeztek.
Hasonló előnyt mutatott egy absztrakt problémamegoldási feladatban is. Kezdetben a modell teljesítménye nulla volt, de miután saját magát képezte két tanulási cikluson keresztül, a helyes válaszok aránya 72,5%-ra emelkedett. Ez a különbség nem csupán technikai teljesítményként értelmezhető – a változás azt sugallja, hogy a modell képes a saját tanulási stratégiáját felismerni, kiértékelni és optimalizálni.
Mindez nem jelenti azt, hogy a SEAL technológia teljesen problémamentes lenne. A modell – hasonlóan az emberhez – hajlamos „elfelejteni” a régebbi ismereteit, ha túl sok új információval frissíti magát. Ez a jelenség, az ún. katasztrofális felejtés, a mesterséges intelligencia rendszerek egyik közismert gyengesége. A kutatók különféle megoldásokkal kísérleteznek, például rétegezett memória-architektúrák bevezetésével vagy a tanulási változások korlátozásával, de a tökéletes válasz még nem született meg.
Szintén fontos szempont a számítási igény. A SEAL működése jelentős erőforrásokat igényel, hiszen minden új tanulási ciklushoz a modellnek új tanítóanyagot kell előállítania, majd ezen újra és újra finomhangolnia önmagát. Ez a folyamat ma még elsősorban kutatólaborokban alkalmazható, de a tendencia világos: az önálló tanulás irányába mutató fejlesztések előbb-utóbb elérik az ipari alkalmazások szintjét is.
És hogy miért lehet mindez különösen fontos a gazdaság és a társadalom számára? Mert a SEAL olyan lehetőséget nyit meg, amely túllép az eddigi mesterséges intelligencia-modellek eszközként való használatán. A technológia egy olyan intelligens partner ígéretét hordozza, amely nemcsak végrehajtja az utasításokat, hanem értelmez, alkalmazkodik és önállóan fejlődik. Egy egészségügyi döntéstámogató rendszer például naponta képes lenne beépíteni az új kutatási eredményeket; egy jogi modell reggel megismerheti az új precedenseket, délután pedig már használhatja is azokat az elemzéseiben.
Természetesen túlzás lenne azt állítani, hogy az emberi tanítás feleslegessé válik. A mesterséges intelligencia autonómiája nem zárja ki az emberi irányítást, inkább átalakítja annak szerepét. A jövőben nem adatokat címkézünk, hanem kereteket szabunk, célokat definiálunk és figyeljük, hogyan tanul mellettünk egy újfajta intelligencia – saját tempóban, saját módszerekkel, de a közös cél érdekében. A SEAL ezt az irányt teszi először kézzelfoghatóvá.