Gödel gép az MI, amely saját magát fejleszti

Képzeljük el, hogy egy számítógépes program képes önállóan, emberi beavatkozás nélkül módosítani a saját kódját, hogy még jobbá, okosabbá váljon! Ez a futurisztikusnak hangzó koncepció, a "Gödel gép".

Jürgen Schmidhuber, az MI-kutatás egyik neves alakja már több mint két évtizede felvetette az önmagát fejlesztő MI gondolatát, és "Gödel gépnek" nevezte el. Az eredeti elképzelés szerint a Gödel gép akkor írja újra saját kódját, ha matematikailag bizonyítani tudja, hogy egy adott önkorrekció teljesítményjavuláshoz vezet. Azonban az ilyen matematikai bizonyítások rendkívül nehezek, így a Gödel gép eddig csupán elméleti koncepció maradt.

Májusban azonban az internetes közösségi médiát is lázba hozta egy kutatási cikk, amely jelentős lépést tehet a Gödel gép megvalósítása felé. A "Darwin Gödel gép: Önmódosító ügynökök nyílt végű evolúciója" című tanulmányt a Kanadai Brit Columbia Egyetem és a Sakana AI kutatói jegyzik.

A most bemutatott "Darwin Gödel gép (DGM)" azonban egy elegáns megoldással kerüli meg a matematikai bizonyítás nehézségeit. A DGM evolúciós algoritmusokat és empirikus (tapasztalati) értékelési módszereket használ. Ez azt jelenti, hogy több, önkorrekcióra képes MI rendszert versenyeztetnek egymással különböző feladatok (benchmarkok) során. A folyamatos versengés és értékelés ösztönzi az MI-k önmódosítását és folyamatos fejlődését.

A kutatócsoport a DGM megközelítést olyan "kódoló ügynökökön" alkalmazta, amelyek automatikusan generálnak programkódot. Lehetővé tették ezeknek az ügynököknek, hogy módosítsák saját Python kódjukat, például új eszközöket adjanak hozzá, vagy eltérő munkafolyamatokat javasoljanak. A módosított ügynököket ezután kódolási teszteken értékelték. Érdekesség, hogy még a rosszabbul teljesítő ügynököket is archiválták, ha viselkedésük egyedi volt, ezzel biztosítva az evolúciós sokszínűséget. Ez az ötlet segít megelőzni, hogy az ügynökök "beragadjanak" egy helyi optimumba, és ösztönzi az innovatív megoldások felfedezését.

Ennek az "evolúciónak" köszönhetően a kódoló ügynökök teljesítménye jelentősen javult. A GitHub valós problémáinak megoldására szolgáló SWE-bench benchmarkon 20-50%-os, a többnyelvű kódolást mérő Polyglot benchmarkon pedig 14,2-30,7%-os növekedést értek el.

Természetesen felmerülnek biztonsági aggályok az ilyen önfejlesztő MI kutatásokkal kapcsolatban. Sokan félnek, hogy az MI evolúciója kicsúszik az emberi ellenőrzés alól, vagy hogy az MI "csalni" fog a tesztek során. A kutatócsoport ezekre az aggodalmakra úgy reagál, hogy az MI-k önfejlesztését emberi felügyelet mellett, egy "homokozó" (sandbox) környezetben teszik lehetővé.

Májusban a második legtöbbet emlegetett kutatási cikk az NVIDIA-tól érkezett, és az MI logikai gondolkodásának rejtélyét boncolgatja. A "ProRL: Hosszútávú megerősítő tanulás kiterjeszti a gondolkodási határokat a nagyméretű nyelvi modellekben" című tanulmány azzal foglalkozik, hogy az OpenAI o1-hez és DeepSeek-R1-hez hasonló legújabb MI modellek hogyan érik el kivételes logikai érvelési képességüket.

Élénk vita zajlik az MI kutatók között arról, hogy a megerősítő tanulás (reinforcement learning) mennyire befolyásolja az alapmodellek (foundation models) érvelési képességét. A vita lényege: a megerősítő tanulás csupán felszabadítja az alapmodellekben már meglévő érvelési képességeket, vagy teljesen új érvelési képességeket ruház át rájuk? A legújabb kutatások inkább az előbbi nézetet támasztották alá.

Az NVIDIA kutatása azonban megkérdőjelezi ezt a trendet. "ProRL" nevű, hosszú távú, stabil tanulást lehetővé tevő megerősítő tanulási módszerük alkalmazásával azt mutatták be, hogy a modell képes volt új következtetési stratégiákat "felfedezni", és olyan feladatokra is megoldást találni, amelyekre az eredeti alapmodell nem tudott helyes választ adni. Ez arra utal, hogy a megerősítő tanulás valóban új érvelési képességekkel ruházhatja fel az alapmodelleket.

Ezek a kutatási áttörések azt mutatják, hogy a mesterséges intelligencia fejlődése elképesztő sebességgel halad. Az önfejlesztő MI-k, mint a Darwin Gödel gép, forradalmasíthatják a szoftverfejlesztést és számos más területet. Ugyanakkor kulcsfontosságú, hogy felelősségteljesen és átgondoltan kezeljük az ezzel járó etikai és biztonsági kérdéseket, biztosítva, hogy az MI fejlődése az emberiség javát szolgálja. 

Osszd meg ezt a cikket
Történelmi fordulat után az SK Hynix az új piacvezető a memóriaiparban
Három évtizeden keresztül a Samsung neve szinte egyet jelentett a DRAM-piac vezető szerepével. Most azonban fordult a kocka: 2025 első félévében a dél-koreai SK Hynix először előzte meg riválisát a globális memóriaiparban, megszakítva ezzel egy több mint harmincéves sorozatot. A változás nem csupán egy vállalati rangsor átrendeződését jelenti, hanem mélyebb átalakulásra utal az egész félvezetőiparban.
Riasztó ütemben nő a szervezett tudományos csalások száma
A tudomány világa a kíváncsiságra, együttműködésre és közös fejlődésre épül – legalábbis az eszmény szerint. A valóságban azonban mindig is jelen volt benne a verseny, az egyenlőtlenség és a hibázás lehetősége. Régóta tartott attól a tudományos közösség, hogy ezek a nyomások néhány kutatót eltérítenek a tudomány alapvető küldetésétől: a hiteles tudás létrehozásától. Sokáig úgy tűnt, hogy a csalás főként magányos elkövetők műve. Az utóbbi években azonban egy aggasztó fordulat bontakozott ki: egyre több bizonyíték utal arra, hogy a csalás immár nem elszigetelt botlások sorozata, hanem szervezett, ipari méreteket öltő tevékenység, állítja egy nemrég megjelent tanulmány.
Túl a zajon, avagy mit hoz valójában a GPT-5?
A mesterséges intelligencia fejlődése az utóbbi években különösen gyors ütemet vett, olyannyira hogy már szinte fullasztó mennyiségben jönnek ki a hírek a fejlettebbnél fejlettebb modellekről. Így ebben a nagy zajban nem könnyű egy-egy új fejlesztésnek kitűnnie, hiszen egyre nagyobbat kell gurítani, ahhoz hogy a felhasználó ingerküszöbét átvigye. Az OpenAI duplán terhelt emiatt, mivel valahogyan meg kell őriznie az elsőbbségét a többiek előtt akik szorosan jönnek fel mögötte. Ebbe a feszült térbe érkezett meg az OpenAI által most bemutatott GPT-5 modellcsalád, amely a kritikusok által is nagyon várt, hiszen az előzetes beharangozások alapján nem kevesebbet várnak el tőle minthogy minimum új mérföldkő legyen a mesterséges intelligencia modellek tekintetében. A nagy kérdés tehát az, hogy vajon megfelel e ezeknek az elvárásoknak. A cikk során megvizsgáljuk, hogyan illeszkedik a GPT-5 a mesterséges intelligencia modellek a fejlődési ívébe, milyen újdonságokat hoz, és miképpen hat a jelenlegi technológiai ökoszisztémára.
A legnépszerűbb elméletek az AI munkahelyekre gyakorolt hatásáról
A ChatGPT 2022 év végi megjelenése óta szinte hónapról hónapra újabb lehengerlő fejlesztések jelennek meg az AI területén ezért szinte azonnal beindult a fantáziálás arról, hogy miként is fogja ez megváltoztatni az életünket. Ezen belül is az egyik elsődleges kérdés, hogy milyen hatással lesz a munkahelyekre. Mivel a félelmek nem csillapodnak ezzel kapcsolatban, megjegyzem teljesen jogosan, azt gondolom érdemes időnként újból és újból megvizsgálni ezt a kérdést, hiszen az AI fejlődése drámai, ugyanakkor az idő előrehaladtával mégis talán egyre pontosabb képet kaphatunk az ilyen jellegű kérdésekről, hiszen az empirikus tapasztalatok is egyre gyűlnek és egyre több olyan elmélet lát napvilágot, amely igyekszik megválaszolni a kérdéseket. A cikkben igyekeztem összegyűjteni a legrelevánsabb elméleteket, bár a teljesség igénye nélkül hiszen ezek irodalma napról napra bővül. A kérdés természetes az, hogy látható e már a fény az alagút végén, vagy még mindig befelé haladunk egy olyan új világba, amelyről még mindig túl keveset tudunk.
Gondolkodásra tanít az OpenAI Study Mode
Az utóbbi években a mesterséges intelligenciának köszönhetően forradalmi változások indultak be az oktatásban, ahol a hangsúly egyre inkább a passzív információbefogadásról az aktív, mélyebb megértést célzó tanulási folyamatokra helyeződik át.
 Megjelent a Linux Kernel 6.16
Megjelent a Linux kernel 6.16-os verziója. Bár a kiadási folyamat a fejlesztők szerint a lehető legjobb értelemben vett „eseménytelenséggel” zajlott le, a felszín alatt jelentős fejlesztések történtek, amelyek biztonsági, teljesítménybeli és rendszerkezelési szempontból is előrelépést jelentenek. Eközben a soron következő 6.17-es verzió fejlesztése a megszokottnál kissé zavarosabban indult – ennek hátterében olyan emberi tényezők állnak, amelyek ritkán kerülnek reflektorfénybe egy ilyen méretű nyílt forráskódú projekt esetében.