A mesterséges intelligencia fejlesztése az elmúlt években látványos és gyakran lenyűgöző eredményeket produkált. Az olyan rendszerek, mint a ChatGPT, képesek természetes nyelvű szövegeket generálni, problémákat megoldani és sokszor az emberi teljesítményt is meghaladni különféle feladatokban. Ugyanakkor egyre több neves kutató és technológiai vezető – köztük John Carmack és François Chollet – hívja fel a figyelmet arra, hogy ezek az eredmények nem feltétlenül jelentik az általános mesterséges intelligencia (AGI) közeledtét. A színfalak mögött most új típusú problémák és kérdések kerültek a figyelem középpontjába, amelyek messze túlmutatnak a puszta teljesítményen.
Az emberhez hasonló intelligencia nem csak számítási kapacitás kérdése
François Chollet, az egyik legismertebb MI-kutató, már évekkel ezelőtt figyelmeztetett arra, hogy a mesterséges intelligencia jelenlegi fejlődése túlságosan a méret és adat irányába tolódott el. Az úgynevezett „skálázási törvények” – vagyis az a felismerés, hogy nagyobb modellek és több adat szinte minden benchmarkon jobb teljesítményt hoz – sokáig úgy tűnt, egyenes úton vezetik el a kutatást az általános intelligencia felé. Azonban Chollet által létrehozott ARC benchmark – amely az absztrakcióra és következtetésre fókuszál – világossá tette: ezek a modellek még a legalapvetőbb elvárásoknak sem felelnek meg, ha teljesen új típusú feladattal találják szembe magukat.
John Carmack, a szoftveripar egyik technikai úttörője, hasonló megállapításokra jutott, miután több évtizedes mérnöki pályafutását az MI-kutatás felé fordította. Bár lenyűgözőnek tartja a nagy nyelvi modellek képességeit, hangsúlyozza, hogy azok nem képesek valódi értelemben tanulni vagy alkalmazkodni új helyzetekhez. Az emberi intelligencia egyik legalapvetőbb jellemzője a rugalmasság – az, hogy képesek vagyunk olyan problémákat is megérteni és kezelni, amelyekhez nem kaptunk előzetes utasításokat. Az MI jelenlegi formái ettől még távol állnak.
A szimulációk határai és a valóság bonyolultsága
Carmack saját cégénél, a Keen Technologies-nál éppen ezt a hiányzó képességet próbálja közelebb hozni. Kutatásaik során az Atari videojátékokat használják tesztkörnyezetként, mivel ezek viszonylag egyszerűek, de mégis kellően sokféle és ember által tervezett kihívást kínálnak. Ugyanakkor a valódi próbatétel akkor következik, amikor ezeket a játékokat nem szimulált környezetben, hanem fizikailag, robotkar és kamera segítségével próbálják megoldatni a mesterséges ágensekkel. Itt már nem csak a képernyő pixeleit kell értelmezni, hanem megbirkózni a való világ időbeliségével, pontatlanságaival és zajaival is. A kutatások megmutatták: az MI-rendszerek teljesítménye jelentősen visszaesik, ha már nem csak digitális környezetben kell működniük.
Ez rámutat arra, mennyire fontos a rendszer-szintű gondolkodás az intelligens viselkedés kialakításában. Az MI nem zárt rendszer, és egy valóban intelligens gépnek képesnek kell lennie arra, hogy változó környezetben is működőképes maradjon. Az olyan problémák, mint a késleltetés kezelése, a fizikai érzékelés megbízhatatlansága vagy a ritka jutalmak észlelése, jelenleg jelentős akadályt jelentenek.
A jelen kutatási irányai: rugalmasság, adaptáció, tanulási hatékonyság
Mind Carmack, mind Chollet kiemelik, hogy az általános intelligencia felé vezető út nem a nagyobb modelleken és több adaton keresztül vezet. Ehelyett a kutatásnak olyan elvekre kell összpontosítania, mint a teszt-idejű adaptáció – vagyis hogy a gép képes legyen futás közben is új információkat feldolgozni és ezek alapján módosítani saját működését. Ez radikálisan eltér a ma domináns statikus megközelítéstől, ahol a modell egyszer megtanul valamit, majd „lefagyasztott” állapotban használják.
Szintén kulcskérdés a tanulási hatékonyság. A mai rendszerek gyakran több millió példán keresztül tanulnak meg viszonylag egyszerű viselkedéseket, miközben egy emberi gyermek – vagy akár egy kisállat – sokkal kevesebb tapasztalatból is képes általánosítani. Ez a különbség nem pusztán technológiai, hanem elméleti kihívás is, amely újfajta tanulási mechanizmusok kidolgozását igényli.
Hol van az MI valódi határa?
A jelenlegi helyzet tükrében nehéz lenne egyértelmű választ adni arra, mennyire vagyunk közel az emberi szintű mesterséges intelligenciához. A nagy nyelvi modellek kétségtelenül áttörést jelentettek a nyelvi feldolgozás és információszerzés terén, de a mélyebb, valódi megértést és problémamegoldó képességet még nem érték el. Az olyan új benchmarkok, mint az ARC vagy a Carmack-féle szekvenciális Atari környezetek, arra próbálnak választ adni, hogyan mérhető és fejleszthető az a típusú intelligencia, amely valóban újat tud alkotni, nem csak összegyűjteni a meglévőt.
A kutatás tehát új szakaszba lépett. Az egyszerűbb mérőszámok helyett komplexebb és életszerűbb problémák kerülnek a fókuszba. A cél nem csupán a „jó válasz” megtalálása, hanem a „hogyan” és a „miért” megértése is. Ebben az irányban haladva lehet esély arra, hogy a mesterséges intelligencia valóban mélyebbé, rugalmasabbá és – idővel – érthetőbbé váljon.