Életre kelt az OpenAI Operator

 Az AI-alapú automatizálás és a digitális asszisztensek egy újabb lépést tettek a fizikai világ felé, nem csoda tehát, hogy Sam Altman, az OpenAI vezérigazgatója egy korábbi blogbejegyzésében arra utalt, hogy 2025 az AI asszisztensek éve lesz. Az OpenAI a mai napon (2025. január 23.) hivatalosan is bejelentette legújabb AI asszisztensét, az Operator kutatási előzetesét. Ez az eszköz a webböngésző fölött veszi át az irányítást, és bizonyos feladatokat teljesen önállóan végez el.

Egy AI, amely már nemcsak válaszol, hanem cselekszik is

Az Operator kezdetben az amerikai felhasználók számára lesz elérhető a ChatGPT Pro 200 dolláros előfizetési csomagján keresztül, de az OpenAI tervei szerint hamarosan további előfizetési szinteken is megjelenik. Sam Altman megerősítette, hogy a szolgáltatás más országokba is megérkezik, azonban Euróban a bevezetés tovább fog tartani.

Az Operator célja, hogy olyan feladatokat automatizáljon, mint a szállásfoglalás, az éttermi foglalás vagy az online vásárlás. A felhasználók több kategóriából választhatnak, mint például étkezés, utazás vagy kiszállítás, lehetőséget adva a személyre szabott AI-műveletekre. Az Operator egy különálló webböngészőt használ, amelyben a felhasználó továbbra is fenntarthatja az irányítást.

A CUA-modell

Az Operator működése az OpenAI Computer-Using Agent (CUA) modelljére épül, amely a GPT-4o nyelvi modelljét kombinálja az OpenAI fejlett érvelési mechanizmusával. A CUA nem kíván API-kon keresztül hozzáférni a weboldalakhoz, hanem képes interakcióba lépni a hagyományos felhasználói felületekkel, akárcsak egy ember.

Biztonság és kihívások

Az OpenAI szerint az Operator nem tökéletes, és egyes összetettebb feladatokat nem tud megbízhatóan kezelni. Az AI-ügynök közvetlen felhasználói megerősítést igényel bizonyos végleges lépések előtt, mint egy rendelés elküldése vagy egy e-mail elküldése. Az OpenAI egyelőre korlátozza az olyan érzékeny feladatokat, mint a banki tranzakciók vagy jelszók megadása, biztosítva, hogy a felhasználók teljes kontroll alatt tarthassák pénzügyi adataikat.   

Asztal foglalás egy étteremben az Operator segítségével
Asztal foglalás egy étteremben az Operator segítségével

Hogyan működik?

A működést illetően a kezelőfelület nagyon hasonló ahhoz amit már megszokhattunk. Gyakorlatilag egy chat ablakunk van ahol a bal alsó sarokban egy gémkapocs szimbólumra kattintva kiválaszthatjuk opcionálisan, hogy a parancsokat az Operator melyik weboldalon hajtsa végre. Ha nem választjuk ki akkor egy keresést indít majd az interneten, hogy olyan weboldalt találjon ahol ez utasításokat végrehajthatja. A chat ablakban olyan üzeneteket adhatunk meg az Operatornak hogy például vásároljon be egy bevásárló lista alapján, vagy rendeljen nekünk pizzát esetleg foglaljon asztalt egy étterembe, stb. Az üzenet megadása után elindít egy böngészőt, ahol minden lépést kiír és végrehajtja a kérést úgy, hogy gyakorlatilag ebben a virtuális böngészőben kattintgat. A felhasználó minden egyes lépésnél átveheti az irányítást ha úgy kívánja, de az Operator maga is visszadobja az irányítást ha olyan problémába ütközik, amelyet nem tud leküzdeni, vagy valami gyanúsat szimatol.    

Az Operator az asztalfoglalást egy böngésző irányítsásával teszi meg ahogy egy ember is tenné
Az Operator az asztalfoglalást egy böngésző irányítsásával teszi meg ahogy egy ember is tenné

Az AI-ügynökök jövője

Az OpenAI versenytársai, köztük a Google és az Anthropic, szintén fejlesztenek hasonló AI-ügynököket, de az Operator az egyik legambiciózusabb kísérlet ezen a téren. Ugyanakkor az AI-ügynökök komoly biztonsági kihívásokat vetnek fel, hiszen alkalmasak lehetnek visszaélésekre is. Az OpenAI több biztonsági mechanizmust épített be az Operatorba, hogy minimalizálja az olyan kockázatokat, mint az adathalász kísérletek vagy az automatizált visszaélések.

A közelmúltban bevezetett OpenAI Tasks szolgáltatás már megmutatta a ChatGPT egyre növekvő funkcionalitását, de az Operator a virtuális asszisztensek egy teljesen új generációját hozhatja el. Ahogy az AI-alapú automatizálás egyre inkább a mindennapjaink részévé válik, kíváncsian várjuk, milyen mélyreható változásokat hoz majd az OpenAI Operator a digitális asszisztensek piacán. Én személy szerint a nagy bevásárlást még nem bíznám rá de az adóbevallásom kitöltését már holnap átengedem neki.   

Osszd meg ezt a cikket
Történelmi fordulat után az SK Hynix az új piacvezető a memóriaiparban
Három évtizeden keresztül a Samsung neve szinte egyet jelentett a DRAM-piac vezető szerepével. Most azonban fordult a kocka: 2025 első félévében a dél-koreai SK Hynix először előzte meg riválisát a globális memóriaiparban, megszakítva ezzel egy több mint harmincéves sorozatot. A változás nem csupán egy vállalati rangsor átrendeződését jelenti, hanem mélyebb átalakulásra utal az egész félvezetőiparban.
Riasztó ütemben nő a szervezett tudományos csalások száma
A tudomány világa a kíváncsiságra, együttműködésre és közös fejlődésre épül – legalábbis az eszmény szerint. A valóságban azonban mindig is jelen volt benne a verseny, az egyenlőtlenség és a hibázás lehetősége. Régóta tartott attól a tudományos közösség, hogy ezek a nyomások néhány kutatót eltérítenek a tudomány alapvető küldetésétől: a hiteles tudás létrehozásától. Sokáig úgy tűnt, hogy a csalás főként magányos elkövetők műve. Az utóbbi években azonban egy aggasztó fordulat bontakozott ki: egyre több bizonyíték utal arra, hogy a csalás immár nem elszigetelt botlások sorozata, hanem szervezett, ipari méreteket öltő tevékenység, állítja egy nemrég megjelent tanulmány.
Túl a zajon, avagy mit hoz valójában a GPT-5?
A mesterséges intelligencia fejlődése az utóbbi években különösen gyors ütemet vett, olyannyira hogy már szinte fullasztó mennyiségben jönnek ki a hírek a fejlettebbnél fejlettebb modellekről. Így ebben a nagy zajban nem könnyű egy-egy új fejlesztésnek kitűnnie, hiszen egyre nagyobbat kell gurítani, ahhoz hogy a felhasználó ingerküszöbét átvigye. Az OpenAI duplán terhelt emiatt, mivel valahogyan meg kell őriznie az elsőbbségét a többiek előtt akik szorosan jönnek fel mögötte. Ebbe a feszült térbe érkezett meg az OpenAI által most bemutatott GPT-5 modellcsalád, amely a kritikusok által is nagyon várt, hiszen az előzetes beharangozások alapján nem kevesebbet várnak el tőle minthogy minimum új mérföldkő legyen a mesterséges intelligencia modellek tekintetében. A nagy kérdés tehát az, hogy vajon megfelel e ezeknek az elvárásoknak. A cikk során megvizsgáljuk, hogyan illeszkedik a GPT-5 a mesterséges intelligencia modellek a fejlődési ívébe, milyen újdonságokat hoz, és miképpen hat a jelenlegi technológiai ökoszisztémára.
A legnépszerűbb elméletek az AI munkahelyekre gyakorolt hatásáról
A ChatGPT 2022 év végi megjelenése óta szinte hónapról hónapra újabb lehengerlő fejlesztések jelennek meg az AI területén ezért szinte azonnal beindult a fantáziálás arról, hogy miként is fogja ez megváltoztatni az életünket. Ezen belül is az egyik elsődleges kérdés, hogy milyen hatással lesz a munkahelyekre. Mivel a félelmek nem csillapodnak ezzel kapcsolatban, megjegyzem teljesen jogosan, azt gondolom érdemes időnként újból és újból megvizsgálni ezt a kérdést, hiszen az AI fejlődése drámai, ugyanakkor az idő előrehaladtával mégis talán egyre pontosabb képet kaphatunk az ilyen jellegű kérdésekről, hiszen az empirikus tapasztalatok is egyre gyűlnek és egyre több olyan elmélet lát napvilágot, amely igyekszik megválaszolni a kérdéseket. A cikkben igyekeztem összegyűjteni a legrelevánsabb elméleteket, bár a teljesség igénye nélkül hiszen ezek irodalma napról napra bővül. A kérdés természetes az, hogy látható e már a fény az alagút végén, vagy még mindig befelé haladunk egy olyan új világba, amelyről még mindig túl keveset tudunk.
Gondolkodásra tanít az OpenAI Study Mode
Az utóbbi években a mesterséges intelligenciának köszönhetően forradalmi változások indultak be az oktatásban, ahol a hangsúly egyre inkább a passzív információbefogadásról az aktív, mélyebb megértést célzó tanulási folyamatokra helyeződik át.
 Megjelent a Linux Kernel 6.16
Megjelent a Linux kernel 6.16-os verziója. Bár a kiadási folyamat a fejlesztők szerint a lehető legjobb értelemben vett „eseménytelenséggel” zajlott le, a felszín alatt jelentős fejlesztések történtek, amelyek biztonsági, teljesítménybeli és rendszerkezelési szempontból is előrelépést jelentenek. Eközben a soron következő 6.17-es verzió fejlesztése a megszokottnál kissé zavarosabban indult – ennek hátterében olyan emberi tényezők állnak, amelyek ritkán kerülnek reflektorfénybe egy ilyen méretű nyílt forráskódú projekt esetében.