Életre kelt az OpenAI Operator

 Az AI-alapú automatizálás és a digitális asszisztensek egy újabb lépést tettek a fizikai világ felé, nem csoda tehát, hogy Sam Altman, az OpenAI vezérigazgatója egy korábbi blogbejegyzésében arra utalt, hogy 2025 az AI asszisztensek éve lesz. Az OpenAI a mai napon (2025. január 23.) hivatalosan is bejelentette legújabb AI asszisztensét, az Operator kutatási előzetesét. Ez az eszköz a webböngésző fölött veszi át az irányítást, és bizonyos feladatokat teljesen önállóan végez el.

Egy AI, amely már nemcsak válaszol, hanem cselekszik is

Az Operator kezdetben az amerikai felhasználók számára lesz elérhető a ChatGPT Pro 200 dolláros előfizetési csomagján keresztül, de az OpenAI tervei szerint hamarosan további előfizetési szinteken is megjelenik. Sam Altman megerősítette, hogy a szolgáltatás más országokba is megérkezik, azonban Euróban a bevezetés tovább fog tartani.

Az Operator célja, hogy olyan feladatokat automatizáljon, mint a szállásfoglalás, az éttermi foglalás vagy az online vásárlás. A felhasználók több kategóriából választhatnak, mint például étkezés, utazás vagy kiszállítás, lehetőséget adva a személyre szabott AI-műveletekre. Az Operator egy különálló webböngészőt használ, amelyben a felhasználó továbbra is fenntarthatja az irányítást.

A CUA-modell

Az Operator működése az OpenAI Computer-Using Agent (CUA) modelljére épül, amely a GPT-4o nyelvi modelljét kombinálja az OpenAI fejlett érvelési mechanizmusával. A CUA nem kíván API-kon keresztül hozzáférni a weboldalakhoz, hanem képes interakcióba lépni a hagyományos felhasználói felületekkel, akárcsak egy ember.

Biztonság és kihívások

Az OpenAI szerint az Operator nem tökéletes, és egyes összetettebb feladatokat nem tud megbízhatóan kezelni. Az AI-ügynök közvetlen felhasználói megerősítést igényel bizonyos végleges lépések előtt, mint egy rendelés elküldése vagy egy e-mail elküldése. Az OpenAI egyelőre korlátozza az olyan érzékeny feladatokat, mint a banki tranzakciók vagy jelszók megadása, biztosítva, hogy a felhasználók teljes kontroll alatt tarthassák pénzügyi adataikat.   

Asztal foglalás egy étteremben az Operator segítségével
Asztal foglalás egy étteremben az Operator segítségével

Hogyan működik?

A működést illetően a kezelőfelület nagyon hasonló ahhoz amit már megszokhattunk. Gyakorlatilag egy chat ablakunk van ahol a bal alsó sarokban egy gémkapocs szimbólumra kattintva kiválaszthatjuk opcionálisan, hogy a parancsokat az Operator melyik weboldalon hajtsa végre. Ha nem választjuk ki akkor egy keresést indít majd az interneten, hogy olyan weboldalt találjon ahol ez utasításokat végrehajthatja. A chat ablakban olyan üzeneteket adhatunk meg az Operatornak hogy például vásároljon be egy bevásárló lista alapján, vagy rendeljen nekünk pizzát esetleg foglaljon asztalt egy étterembe, stb. Az üzenet megadása után elindít egy böngészőt, ahol minden lépést kiír és végrehajtja a kérést úgy, hogy gyakorlatilag ebben a virtuális böngészőben kattintgat. A felhasználó minden egyes lépésnél átveheti az irányítást ha úgy kívánja, de az Operator maga is visszadobja az irányítást ha olyan problémába ütközik, amelyet nem tud leküzdeni, vagy valami gyanúsat szimatol.    

Az Operator az asztalfoglalást egy böngésző irányítsásával teszi meg ahogy egy ember is tenné
Az Operator az asztalfoglalást egy böngésző irányítsásával teszi meg ahogy egy ember is tenné

Az AI-ügynökök jövője

Az OpenAI versenytársai, köztük a Google és az Anthropic, szintén fejlesztenek hasonló AI-ügynököket, de az Operator az egyik legambiciózusabb kísérlet ezen a téren. Ugyanakkor az AI-ügynökök komoly biztonsági kihívásokat vetnek fel, hiszen alkalmasak lehetnek visszaélésekre is. Az OpenAI több biztonsági mechanizmust épített be az Operatorba, hogy minimalizálja az olyan kockázatokat, mint az adathalász kísérletek vagy az automatizált visszaélések.

A közelmúltban bevezetett OpenAI Tasks szolgáltatás már megmutatta a ChatGPT egyre növekvő funkcionalitását, de az Operator a virtuális asszisztensek egy teljesen új generációját hozhatja el. Ahogy az AI-alapú automatizálás egyre inkább a mindennapjaink részévé válik, kíváncsian várjuk, milyen mélyreható változásokat hoz majd az OpenAI Operator a digitális asszisztensek piacán. Én személy szerint a nagy bevásárlást még nem bíznám rá de az adóbevallásom kitöltését már holnap átengedem neki.   

Osszd meg ezt a cikket
Mesterséges intelligencia, űr és emberiség
Elon Musk, a SpaceX, Tesla, Neuralink és xAI alapítója és vezetője egy közelmúltbeli interjúban osztotta meg gondolatait a jövő lehetséges irányairól, különös tekintettel a mesterséges intelligenciára, az űrbe való terjeszkedésre és az emberiség fejlődésére.
 Valós idejű zene komponálás a Google Magenta RT modelljével
A mesterséges intelligencia alkalmazása a zene komponálásban nem új keletű törekvés, ám a valós idejű működés sokáig jelentős akadályokba ütközött. A Google Magenta csapata most olyan fejlesztést mutatott be, amely a műfaj technikai és kreatív lehetőségeit egyaránt kiszélesítheti. A Magenta RealTime (röviden: Magenta RT) névre keresztelt új modell valós időben generál zenét, miközben nyitott forráskódjának köszönhetően bárki számára hozzáférhető.
Ufficio Zero egy olasz Linux disztribúció a fenntartható digitális munkavégzésért
Az Ufficio Zero Linux OS egy kevéssé ismert, de egyre komolyabb figyelmet érdemlő olasz fejlesztésű operációs rendszer. Elsősorban irodai és hivatali munkakörnyezetek számára készült, és különösen azoknak lehet érdekes, akik stabil, megbízható és hosszú távon is használható alternatívát keresnek a kereskedelmi rendszerekkel szemben. Az Ufficio Zero sajátos helyet foglal el a nyílt forráskódú rendszerek világában: egyszerre kíván választ adni a digitális infrastruktúra elavulására, valamint a munkavégzéshez nélkülözhetetlen szoftvereszközök elérhetőségének problémáira.
Mit jelentene az Apple számára a Perplexity AI felvásárlása?
Az Apple régóta igyekszik megtalálni a helyét a generatív mesterséges intelligencia gyorsan alakuló piacán. A vállalat évtizedeken át stratégikusan kivárt, mielőtt jelentősebb erőforrásokat irányított volna mesterséges intelligencia-alapú fejlesztésekbe. Most azonban, a legfrissebb hírek szerint, a cupertinói cég egy minden eddiginél nagyobb szabású lépésre készülhet: belső körökben megindultak az egyeztetések a Perplexity AI nevű startup esetleges felvásárlásáról.
Így torzít az LLM
A mesterséges intelligencia (MI) fejlődésével párhuzamosan egyre több figyelem irányul az úgynevezett nagy nyelvi modellekre (LLM-ekre), amelyek már nemcsak a tudományos kutatásban, hanem a mindennapi élet számos területén is jelen vannak – például ügyvédi munkában, egészségügyi adatok elemzésében vagy számítógépes programok kódolásában. E modellek működésének megértése ugyanakkor továbbra is komoly kihívást jelent, különösen akkor, amikor azok látszólag megmagyarázhatatlan módon követnek el hibákat vagy adnak félrevezető válaszokat.
MiniMax-M1 AI modell, célkeresztben a nagy méretű szövegek kezelése
A mesterséges intelligencia rendszerek fejlődésével egyre nagyobb az igény olyan modellekre, amelyek nemcsak a nyelv értelmezésére képesek, hanem összetett, többlépcsős gondolkodási folyamatokat is képesek végigvinni. Az ilyen modellek kulcsfontosságúak lehetnek nemcsak elméleti feladatokban, hanem például szoftverfejlesztés vagy valós idejű döntéshozatal során is. Ezek az alkalmazások azonban különösen érzékenyek a számítási költségekre, amelyeket a hagyományos megközelítések gyakran nehezen tudnak kordában tartani.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések