Jensen Huang (az NVIDIA CEO-ja) nemrégiben elmondott beszédében a mesterséges intelligencia fejlődését több szakaszra osztotta és a jelenlegi szakaszra az Agentic AI korszakaként hivatkozott. Bár előadásában már a főként a következő szakaszra fókuszált a fizikai AI korszakára, nem szabad elfelejtenünk, hogy az Agentic AI korszaka is még csak idén indult el, így annak kifejlett érett formáját nem láthattuk. Hogy milyen lesz majd ez a fejlettebb forma abba enged betekintést a Google legújabb bejelentése amelyben bemutatták a nyílt forráskódú Agener2Agent protokollt. A protokoll célja, hogy hidat képezzen a különböző platformok, keretrendszerek és gyártók által létrehozott MI ágensek között, elősegítve ezzel a zökkenőmentes kommunikációt és együttműködést.
A közelmúltban tartott Google Cloud Next konferencián bemutatott A2A protokoll, az Anthropic által tervezett MCP egyfajta „kiegészítőjeként” funkcionál. Az MCP célja az LLM-ek (nagy nyelvi modellek) és az azokhoz kapcsolódó eszközök közötti integrációs problémák megoldása. Az A2A ezzel szemben a teljesen autonóm ágensek közötti kommunikációs csatornát kívánja megteremteni. Ez a két megközelítés lehetőséget ad arra, hogy a fejlesztők egyaránt kihasználhassák az eszköz- és ágens integráció előnyeit, ami hosszú távon növelheti az MI alapú megoldások hatékonyságát.
Az A2A protokoll lényege egy szabványosított kommunikációs réteg kialakítása, amely lehetővé teszi az MI ügynökök számára, hogy gyártófüggetlenül, bármilyen rendszerkörnyezetben strukturált adatok formájában kommunikálhassanak. A protokoll alapját olyan internetes szabványok adják, mint a HTTP és a JSON, illetve az olyan kommunikációs eljárások, mint a JSON-RPC, amelyek biztosítják a kérések és válaszok szabványos kezelését.
Az A2A háromféle szereplőt definiál:
-
Távoli ágensek: Ezek olyan egymás számára „fekete doboz”-ként viselkedő ágensek, amelyek egy A2A szerveren keresztül kommunikálnak.
-
Kliensek: Olyan entitások, melyek feladatok indításával kérik a távoli ágensek segítségét.
-
Felhasználók: Legyen szó emberi felhasználóról vagy szolgáltatásról, akik az ágnesek segítségével kívánnak összetett feladatokat végrehajtani.
Az A2A specifikációja kiemelt szerepet tulajdonít a feladat fogalmának: egy ügyfél által létrehozott feladatot egy távoli ágensnek kell feldolgoznia – mindezt úgy hogy az információcsere strukturált módon kell hogy végbemenjen, itt főként JSON formátumra kell gondolni.
Az A2A protokoll működési modellje egy hagyományos kliens-szerver architektúrán alapul, de jelentős újdonságot képvisel abban, hogy lehetővé teszi az ágensek autonóm kommunikációját. Ennek során az alábbi komponensek játszanak kulcsszerepet:
-
Ágenskártya: Egy metaadatfájl (például a
/.well-known/agent.json
elérési útvonalon), amely az ágensek képességeit, végpontjait és hitelesítési követelményeit tartalmazza. -
A2A szerver: Ez a komponens fogadja a bejövő kéréseket, végrehajtja a feladatokat, és kezeli a hosszú távú műveleteket, mint például a folyamatban lévő jelentések generálását.
-
A2A kliens: Ez a komponens felelős az ágensek felkutatásáért, a kommunikációs kérelmek előkészítéséért, valamint a válaszok feldolgozásáért.
A kommunikáció során az ügyfelek JSON-RPC protokollon keresztül küldik a kéréseket, míg a szerver az adott ágens logikájának meghívásával, Server-Sent Events (SSE) használatával biztosítja a folyamatos, aszinkron adatfolyamot.
A Google által bemutatott protokoll ígéretes különösen annak nyílforráskódú mivolta miatt, amely hamarosan felválthatja a különböző gyártók által fejlesztett egyedi megoldásokat, vagy ha valamiért mégsem ez a megoldás terjed el, akkor mindenképpen inspirálhatja azt a megoldást, amely törvényszerűen be kell, hogy töltse ezt a küldetést, hiszen a szoftverfejlesztésben mindig a szabványosítás irányába hatnak ez erők, mert általában ez garantálja, hogy az alkalmazás fejlesztők a saját egyedi üzleti logikájukra tudjanak fókuszálni és ne a kommunikáció implementálása vigye el az erőforrásokat. A nyílforráskódú megközelítésről elmondható, hogy általában ösztönzően hat a különböző fejlesztői közösségekre, akik hamarosan új innovatív eszközökkel bővítik majd a protokollt, vagy az a köré épülő megoldásokat. Márpedig tennivaló lesz bőven, hiszen gondoljunk arra, hogy szükség lesz különböző hitelesítési mechanizmusokra, amikor olyan ágenseket kell elérni amelyek nem publikusak, vagy mindenképpen szükség lesz majd a feladatok nyomon követésére monitorozására, különös tekintettel arra, hogy itt nem determinisztikus elemek aszinkron kommunikációjáról beszélünk. Még az olyan szoftverek üzemeltetése is komoly kihívásokat jelent és külön szakember gárdát igényel, amikor hagyományos szoftverek bonyolult hálózata épít fel egy rendszert. Képzeljük el a jövőt amelyet ez a protokoll vázol fel elénk, a mesterséges intelligencia ágensek hálózata nem csak soha nem látott problémákra jelentenek majd megoldást, de üzemeltetésük is új kihívások elé állítja majd a szakembereket.