Életre kelt az OpenAI Operator

 Az AI-alapú automatizálás és a digitális asszisztensek egy újabb lépést tettek a fizikai világ felé, nem csoda tehát, hogy Sam Altman, az OpenAI vezérigazgatója egy korábbi blogbejegyzésében arra utalt, hogy 2025 az AI asszisztensek éve lesz. Az OpenAI a mai napon (2025. január 23.) hivatalosan is bejelentette legújabb AI asszisztensét, az Operator kutatási előzetesét. Ez az eszköz a webböngésző fölött veszi át az irányítást, és bizonyos feladatokat teljesen önállóan végez el.

Egy AI, amely már nemcsak válaszol, hanem cselekszik is

Az Operator kezdetben az amerikai felhasználók számára lesz elérhető a ChatGPT Pro 200 dolláros előfizetési csomagján keresztül, de az OpenAI tervei szerint hamarosan további előfizetési szinteken is megjelenik. Sam Altman megerősítette, hogy a szolgáltatás más országokba is megérkezik, azonban Euróban a bevezetés tovább fog tartani.

Az Operator célja, hogy olyan feladatokat automatizáljon, mint a szállásfoglalás, az éttermi foglalás vagy az online vásárlás. A felhasználók több kategóriából választhatnak, mint például étkezés, utazás vagy kiszállítás, lehetőséget adva a személyre szabott AI-műveletekre. Az Operator egy különálló webböngészőt használ, amelyben a felhasználó továbbra is fenntarthatja az irányítást.

A CUA-modell

Az Operator működése az OpenAI Computer-Using Agent (CUA) modelljére épül, amely a GPT-4o nyelvi modelljét kombinálja az OpenAI fejlett érvelési mechanizmusával. A CUA nem kíván API-kon keresztül hozzáférni a weboldalakhoz, hanem képes interakcióba lépni a hagyományos felhasználói felületekkel, akárcsak egy ember.

Biztonság és kihívások

Az OpenAI szerint az Operator nem tökéletes, és egyes összetettebb feladatokat nem tud megbízhatóan kezelni. Az AI-ügynök közvetlen felhasználói megerősítést igényel bizonyos végleges lépések előtt, mint egy rendelés elküldése vagy egy e-mail elküldése. Az OpenAI egyelőre korlátozza az olyan érzékeny feladatokat, mint a banki tranzakciók vagy jelszók megadása, biztosítva, hogy a felhasználók teljes kontroll alatt tarthassák pénzügyi adataikat.   

Asztal foglalás egy étteremben az Operator segítségével
Asztal foglalás egy étteremben az Operator segítségével

Hogyan működik?

A működést illetően a kezelőfelület nagyon hasonló ahhoz amit már megszokhattunk. Gyakorlatilag egy chat ablakunk van ahol a bal alsó sarokban egy gémkapocs szimbólumra kattintva kiválaszthatjuk opcionálisan, hogy a parancsokat az Operator melyik weboldalon hajtsa végre. Ha nem választjuk ki akkor egy keresést indít majd az interneten, hogy olyan weboldalt találjon ahol ez utasításokat végrehajthatja. A chat ablakban olyan üzeneteket adhatunk meg az Operatornak hogy például vásároljon be egy bevásárló lista alapján, vagy rendeljen nekünk pizzát esetleg foglaljon asztalt egy étterembe, stb. Az üzenet megadása után elindít egy böngészőt, ahol minden lépést kiír és végrehajtja a kérést úgy, hogy gyakorlatilag ebben a virtuális böngészőben kattintgat. A felhasználó minden egyes lépésnél átveheti az irányítást ha úgy kívánja, de az Operator maga is visszadobja az irányítást ha olyan problémába ütközik, amelyet nem tud leküzdeni, vagy valami gyanúsat szimatol.    

Az Operator az asztalfoglalást egy böngésző irányítsásával teszi meg ahogy egy ember is tenné
Az Operator az asztalfoglalást egy böngésző irányítsásával teszi meg ahogy egy ember is tenné

Az AI-ügynökök jövője

Az OpenAI versenytársai, köztük a Google és az Anthropic, szintén fejlesztenek hasonló AI-ügynököket, de az Operator az egyik legambiciózusabb kísérlet ezen a téren. Ugyanakkor az AI-ügynökök komoly biztonsági kihívásokat vetnek fel, hiszen alkalmasak lehetnek visszaélésekre is. Az OpenAI több biztonsági mechanizmust épített be az Operatorba, hogy minimalizálja az olyan kockázatokat, mint az adathalász kísérletek vagy az automatizált visszaélések.

A közelmúltban bevezetett OpenAI Tasks szolgáltatás már megmutatta a ChatGPT egyre növekvő funkcionalitását, de az Operator a virtuális asszisztensek egy teljesen új generációját hozhatja el. Ahogy az AI-alapú automatizálás egyre inkább a mindennapjaink részévé válik, kíváncsian várjuk, milyen mélyreható változásokat hoz majd az OpenAI Operator a digitális asszisztensek piacán. Én személy szerint a nagy bevásárlást még nem bíznám rá de az adóbevallásom kitöltését már holnap átengedem neki.   

Osszd meg ezt a cikket
Mesterséges intelligencia a hálózat irányításban és karbantartásban
Az Ericsson nemrég bemutatta a 2025-re vonatkozó stratégiai terveit a Mobile World Congress 2025 (MWC25) keretében. Az itt ismertetett elképzelések azért különösen érdekesek, mert jól mutatják, miként épül be a mesterséges intelligencia olyan ipari folyamatokba, amelyek mindennapi életünket érintik, ám addig rejtve maradnak, amíg zökkenőmentesen működnek.
GTC 2025: Az NVIDIA Blackwell chipeken alapuló szerverei és a DGX Station
A 2009 óta megrendezett GTC (GPU Technológiai Konferencia) idén március 17 és 21 között kerül megrendezésre az NVIDIA által. A konferencia célja hogy bemutassa a legújabb fejlesztéseket és elősegítse a különböző iparágak közötti együttműködést és további fejlesztéseket, így többnyire fejlesztők, kutatók, technológiai vezetők vesznek részt rajta. Az NVIDIA CEO-ja Jensen Huang egy ideje emlegeti, hogy a vállalatok a jövőben token gyárrá változnak, ami alatt azt érti, hogy minden létező munkafolyamat mesterséges intelligencia által támogatott lesz. Ebben jelenleg nagy szerepet játszanak a nagy szerverek, de az AI integráció egyre inkább lecsorog majd a személyi számítógépek szintjére és a jövőben olyan számítógépek, laptopok lesznek amelyek megfelelő hardverrel rendelkeznek, ahhoz hogy akár nagy nyelvi modelleket futtassanak a háttérben. Erre azért van szükség mert a programozók, mérnökök és szinte mindenki mesterséges intelligencia által asszisztált munkát fog végezni.
Elérhető a Fedora 42 béta
A Fedora 42 béta verzió már elérhető és tesztelhető, míg a stabil kiadást április 15-re tervezik . Az új verzió számos jelentős fejlesztést tartalmaz, amelyek célja a felhasználói élmény javítása, a telepítési folyamat egyszerűsítése, valamint a modern asztali környezetek és technikai megoldások integrálása.
Videójátékok a mesterséges intelligencia tesztelésben
A videójátékok már évtizedek óta szolgálnak olyan laboratóriumként, ahol különböző AI-algoritmusok képességeit tesztelik. A játékok – legyen szó klasszikus platformjátékokról vagy összetettebb stratégiai környezetekről – lehetőséget nyújtanak arra, hogy a mesterséges intelligencia rendszerek megtanulják a cselekvést, alkalmazkodjanak a változó környezethez, és optimalizálják döntéseiket a jutalmak elérése érdekében.