Gödel gép az MI, amely saját magát fejleszti

Képzeljük el, hogy egy számítógépes program képes önállóan, emberi beavatkozás nélkül módosítani a saját kódját, hogy még jobbá, okosabbá váljon! Ez a futurisztikusnak hangzó koncepció, a "Gödel gép".

Jürgen Schmidhuber, az MI-kutatás egyik neves alakja már több mint két évtizede felvetette az önmagát fejlesztő MI gondolatát, és "Gödel gépnek" nevezte el. Az eredeti elképzelés szerint a Gödel gép akkor írja újra saját kódját, ha matematikailag bizonyítani tudja, hogy egy adott önkorrekció teljesítményjavuláshoz vezet. Azonban az ilyen matematikai bizonyítások rendkívül nehezek, így a Gödel gép eddig csupán elméleti koncepció maradt.

Májusban azonban az internetes közösségi médiát is lázba hozta egy kutatási cikk, amely jelentős lépést tehet a Gödel gép megvalósítása felé. A "Darwin Gödel gép: Önmódosító ügynökök nyílt végű evolúciója" című tanulmányt a Kanadai Brit Columbia Egyetem és a Sakana AI kutatói jegyzik.

A most bemutatott "Darwin Gödel gép (DGM)" azonban egy elegáns megoldással kerüli meg a matematikai bizonyítás nehézségeit. A DGM evolúciós algoritmusokat és empirikus (tapasztalati) értékelési módszereket használ. Ez azt jelenti, hogy több, önkorrekcióra képes MI rendszert versenyeztetnek egymással különböző feladatok (benchmarkok) során. A folyamatos versengés és értékelés ösztönzi az MI-k önmódosítását és folyamatos fejlődését.

A kutatócsoport a DGM megközelítést olyan "kódoló ügynökökön" alkalmazta, amelyek automatikusan generálnak programkódot. Lehetővé tették ezeknek az ügynököknek, hogy módosítsák saját Python kódjukat, például új eszközöket adjanak hozzá, vagy eltérő munkafolyamatokat javasoljanak. A módosított ügynököket ezután kódolási teszteken értékelték. Érdekesség, hogy még a rosszabbul teljesítő ügynököket is archiválták, ha viselkedésük egyedi volt, ezzel biztosítva az evolúciós sokszínűséget. Ez az ötlet segít megelőzni, hogy az ügynökök "beragadjanak" egy helyi optimumba, és ösztönzi az innovatív megoldások felfedezését.

Ennek az "evolúciónak" köszönhetően a kódoló ügynökök teljesítménye jelentősen javult. A GitHub valós problémáinak megoldására szolgáló SWE-bench benchmarkon 20-50%-os, a többnyelvű kódolást mérő Polyglot benchmarkon pedig 14,2-30,7%-os növekedést értek el.

Természetesen felmerülnek biztonsági aggályok az ilyen önfejlesztő MI kutatásokkal kapcsolatban. Sokan félnek, hogy az MI evolúciója kicsúszik az emberi ellenőrzés alól, vagy hogy az MI "csalni" fog a tesztek során. A kutatócsoport ezekre az aggodalmakra úgy reagál, hogy az MI-k önfejlesztését emberi felügyelet mellett, egy "homokozó" (sandbox) környezetben teszik lehetővé.

Májusban a második legtöbbet emlegetett kutatási cikk az NVIDIA-tól érkezett, és az MI logikai gondolkodásának rejtélyét boncolgatja. A "ProRL: Hosszútávú megerősítő tanulás kiterjeszti a gondolkodási határokat a nagyméretű nyelvi modellekben" című tanulmány azzal foglalkozik, hogy az OpenAI o1-hez és DeepSeek-R1-hez hasonló legújabb MI modellek hogyan érik el kivételes logikai érvelési képességüket.

Élénk vita zajlik az MI kutatók között arról, hogy a megerősítő tanulás (reinforcement learning) mennyire befolyásolja az alapmodellek (foundation models) érvelési képességét. A vita lényege: a megerősítő tanulás csupán felszabadítja az alapmodellekben már meglévő érvelési képességeket, vagy teljesen új érvelési képességeket ruház át rájuk? A legújabb kutatások inkább az előbbi nézetet támasztották alá.

Az NVIDIA kutatása azonban megkérdőjelezi ezt a trendet. "ProRL" nevű, hosszú távú, stabil tanulást lehetővé tevő megerősítő tanulási módszerük alkalmazásával azt mutatták be, hogy a modell képes volt új következtetési stratégiákat "felfedezni", és olyan feladatokra is megoldást találni, amelyekre az eredeti alapmodell nem tudott helyes választ adni. Ez arra utal, hogy a megerősítő tanulás valóban új érvelési képességekkel ruházhatja fel az alapmodelleket.

Ezek a kutatási áttörések azt mutatják, hogy a mesterséges intelligencia fejlődése elképesztő sebességgel halad. Az önfejlesztő MI-k, mint a Darwin Gödel gép, forradalmasíthatják a szoftverfejlesztést és számos más területet. Ugyanakkor kulcsfontosságú, hogy felelősségteljesen és átgondoltan kezeljük az ezzel járó etikai és biztonsági kérdéseket, biztosítva, hogy az MI fejlődése az emberiség javát szolgálja. 

Osszd meg ezt a cikket
 Mit kínál a RefreshOS 2.5 a Linux-felhasználók számára?
A Linux-disztribúciók világa gazdag, de sokszor megosztó: az egyik oldalon a komplex, puritán rendszerek, a másikon a minden igényt kielégíteni próbáló, de gyakran túlterhelt megoldások állnak. A RefreshOS e kettő közé kíván hidat verni. Az eXybit Technologies™ (korábban eGoTech™) által fejlesztett rendszer legfrissebb, 2.5-ös kiadása ezen törekvés újabb állomása, amely a Debian stabil alapjaira építve igyekszik egyszerű, mégis korszerű felhasználói élményt nyújtani.
Az AI jövője és az átláthatóság ára – Mit mondanak az OpenAI-akták?
Az elmúlt időszakban egyre nagyobb érdeklődés övezi az OpenAI működését. Nem véletlenül: az általuk fejlesztett mesterséges intelligencia modellek – például a ChatGPT – széles körben használtak, miközben a mögöttük álló döntéshozatali és tulajdonosi struktúrákról csak töredékes információink vannak. Ebbe a homályba hoz némi világosságot az OpenAI Files nevű jelentés, amelyet két technológiai felügyeleti szervezet, a Midas Project és a Tech Oversight Project készített. A dokumentum nemcsak a vállalat belső működéséről szól, hanem szélesebb társadalmi kérdéseket is érint: milyen mechanizmusokra van szükség, ha egy magáncég a jövő gazdaságának kulcsát tartja a kezében?
A mesterséges intelligencia hajnala
Sam Altman, az OpenAI vezérigazgatója, egy friss beszélgetés során mélyreható betekintést nyújtott a mesterséges intelligencia (MI) jövőjébe, az OpenAI alapításának kihívásaiba és az általa elképzelt robbanásszerű fejlődésbe. Elmélkedései nem csupán technológiai víziónk határait feszegetik, hanem azt is megmutatják, miként változhat meg alapjaiban a munkánk, a mindennapjaink és a társadalmunk
A szoftverek fejlődésének új korszaka
Az elmúlt évtizedekben a szoftverfejlesztés alapvetően meghatározta digitális világunkat, de a legújabb technológiai áttörések új korszakot nyitnak meg, ahol a számítógépek programozása gyökeresen átalakul. Andrej Karpathy, a Tesla korábbi mesterséges intelligencia igazgatója szerint a szoftverek fejlődése a korábbi évtizedek lassú változása után az utóbbi években drámai gyorsulást mutatott, ami alapjaiban írja újra a programozásról alkotott képünket.
 Valós idejű zene komponálás a Google Magenta RT modelljével
A mesterséges intelligencia alkalmazása a zene komponálásban nem új keletű törekvés, ám a valós idejű működés sokáig jelentős akadályokba ütközött. A Google Magenta csapata most olyan fejlesztést mutatott be, amely a műfaj technikai és kreatív lehetőségeit egyaránt kiszélesítheti. A Magenta RealTime (röviden: Magenta RT) névre keresztelt új modell valós időben generál zenét, miközben nyitott forráskódjának köszönhetően bárki számára hozzáférhető.
Ufficio Zero egy olasz Linux disztribúció a fenntartható digitális munkavégzésért
Az Ufficio Zero Linux OS egy kevéssé ismert, de egyre komolyabb figyelmet érdemlő olasz fejlesztésű operációs rendszer. Elsősorban irodai és hivatali munkakörnyezetek számára készült, és különösen azoknak lehet érdekes, akik stabil, megbízható és hosszú távon is használható alternatívát keresnek a kereskedelmi rendszerekkel szemben. Az Ufficio Zero sajátos helyet foglal el a nyílt forráskódú rendszerek világában: egyszerre kíván választ adni a digitális infrastruktúra elavulására, valamint a munkavégzéshez nélkülözhetetlen szoftvereszközök elérhetőségének problémáira.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések