Az AI-alapú automatizálás és a digitális asszisztensek egy újabb lépést tettek a fizikai világ felé, nem csoda tehát, hogy Sam Altman, az OpenAI vezérigazgatója egy korábbi blogbejegyzésében arra utalt, hogy 2025 az AI asszisztensek éve lesz. Az OpenAI a mai napon (2025. január 23.) hivatalosan is bejelentette legújabb AI asszisztensét, az Operator kutatási előzetesét. Ez az eszköz a webböngésző fölött veszi át az irányítást, és bizonyos feladatokat teljesen önállóan végez el.
Egy AI, amely már nemcsak válaszol, hanem cselekszik is
Az Operator kezdetben az amerikai felhasználók számára lesz elérhető a ChatGPT Pro 200 dolláros előfizetési csomagján keresztül, de az OpenAI tervei szerint hamarosan további előfizetési szinteken is megjelenik. Sam Altman megerősítette, hogy a szolgáltatás más országokba is megérkezik, azonban Euróban a bevezetés tovább fog tartani.
Az Operator célja, hogy olyan feladatokat automatizáljon, mint a szállásfoglalás, az éttermi foglalás vagy az online vásárlás. A felhasználók több kategóriából választhatnak, mint például étkezés, utazás vagy kiszállítás, lehetőséget adva a személyre szabott AI-műveletekre. Az Operator egy különálló webböngészőt használ, amelyben a felhasználó továbbra is fenntarthatja az irányítást.
A CUA-modell
Az Operator működése az OpenAI Computer-Using Agent (CUA) modelljére épül, amely a GPT-4o nyelvi modelljét kombinálja az OpenAI fejlett érvelési mechanizmusával. A CUA nem kíván API-kon keresztül hozzáférni a weboldalakhoz, hanem képes interakcióba lépni a hagyományos felhasználói felületekkel, akárcsak egy ember.
Biztonság és kihívások
Az OpenAI szerint az Operator nem tökéletes, és egyes összetettebb feladatokat nem tud megbízhatóan kezelni. Az AI-ügynök közvetlen felhasználói megerősítést igényel bizonyos végleges lépések előtt, mint egy rendelés elküldése vagy egy e-mail elküldése. Az OpenAI egyelőre korlátozza az olyan érzékeny feladatokat, mint a banki tranzakciók vagy jelszók megadása, biztosítva, hogy a felhasználók teljes kontroll alatt tarthassák pénzügyi adataikat.

Hogyan működik?
A működést illetően a kezelőfelület nagyon hasonló ahhoz amit már megszokhattunk. Gyakorlatilag egy chat ablakunk van ahol a bal alsó sarokban egy gémkapocs szimbólumra kattintva kiválaszthatjuk opcionálisan, hogy a parancsokat az Operator melyik weboldalon hajtsa végre. Ha nem választjuk ki akkor egy keresést indít majd az interneten, hogy olyan weboldalt találjon ahol ez utasításokat végrehajthatja. A chat ablakban olyan üzeneteket adhatunk meg az Operatornak hogy például vásároljon be egy bevásárló lista alapján, vagy rendeljen nekünk pizzát esetleg foglaljon asztalt egy étterembe, stb. Az üzenet megadása után elindít egy böngészőt, ahol minden lépést kiír és végrehajtja a kérést úgy, hogy gyakorlatilag ebben a virtuális böngészőben kattintgat. A felhasználó minden egyes lépésnél átveheti az irányítást ha úgy kívánja, de az Operator maga is visszadobja az irányítást ha olyan problémába ütközik, amelyet nem tud leküzdeni, vagy valami gyanúsat szimatol.

Az AI-ügynökök jövője
Az OpenAI versenytársai, köztük a Google és az Anthropic, szintén fejlesztenek hasonló AI-ügynököket, de az Operator az egyik legambiciózusabb kísérlet ezen a téren. Ugyanakkor az AI-ügynökök komoly biztonsági kihívásokat vetnek fel, hiszen alkalmasak lehetnek visszaélésekre is. Az OpenAI több biztonsági mechanizmust épített be az Operatorba, hogy minimalizálja az olyan kockázatokat, mint az adathalász kísérletek vagy az automatizált visszaélések.
A közelmúltban bevezetett OpenAI Tasks szolgáltatás már megmutatta a ChatGPT egyre növekvő funkcionalitását, de az Operator a virtuális asszisztensek egy teljesen új generációját hozhatja el. Ahogy az AI-alapú automatizálás egyre inkább a mindennapjaink részévé válik, kíváncsian várjuk, milyen mélyreható változásokat hoz majd az OpenAI Operator a digitális asszisztensek piacán. Én személy szerint a nagy bevásárlást még nem bíznám rá de az adóbevallásom kitöltését már holnap átengedem neki.