Agent Laboratory nyílt forráskódú AI labor asszisztens

Az emberek sokszor félelemmel, vagy gyanakvással tekintenek a mesterséges intelligenciára annak rendkívül gyors előretörése miatt, de valószínűleg a legtöbben örülnek annak egyik leghasznosabb hozadékának, nevezetesen, hogy jelentősen gyorsítja a különböző kutatásokat. Az AMD és a Johns Hopkins Egyetem kutatói, hogy segítsék a kisebb laborok munkáját létrehoztak egy nyílt forráskódú szoftvert, amely különböző mesterséges intelligencia ágensekkel és azok összekapcsolásával segítheti a kutatók munkáját. Fontos kulcsszó a segítés, hiszen a mesterséges intelligencia önállóan nem képes kutatásokat végezni, de a megfelelő inputokkal, remek eszköz lehet egy kutató kezében.

A szoftver működése

A rendszer egy virtuális laboratóriumot hoz létre, ahol specializált AI ágensek csapata dolgozik együtt, mindegyik a kutatási folyamat egy-egy aspektusára összpontosítva, miközben folyamatosan emberi irányítás alatt maradnak. Az egyes ágensek különböző szerepeket betöltve tudnak hatékony segítség lenni:

  • PhD ágens: irodalmi áttekintések és kutatási tervezés
  • Posztdoktori ágensek: kísérleti megközelítések finomítása
  • ML mérnök ágensek: technikai implementáció
  • Professzor ágensek: kutatási eredmények értékelése és pontozása

A rendszer egyedülálló jellemzője, hogy ezek az ágensek nem elszigetelten működnek, hanem együttműködnek és építenek egymás munkájára, követve a természetes kutatási folyamatot:

  1. Irodalmi áttekintés: A PhD ágens az arXiv API segítségével gyűjti és rendszerezi a releváns kutatásokat
  2. Tervezés: PhD és posztdoktori ágensek együtt dolgoznak a részletes kutatási terveken
  3. Implementáció: ML mérnök ágensek kódot írnak és tesztelnek
  4. Elemzés és dokumentáció: A csapat közösen értelmezi az eredményeket és átfogó jelentéseket készít

Az Agent Laboratory egyik kulcsfontosságú előnye a rugalmas számítási kapacitás-kezelés. A kutatók a rendelkezésükre álló számítási erőforrások és költségvetési korlátok alapján allokálhatják az erőforrásokat, ami a rendszert rendkívül praktikussá teszi valós kutatási környezetekben.

A másik kiemelendő funkciója a co-pilot mód. Ebben a felállásban a kutatók minden szakaszban visszajelzést adhatnak, valódi együttműködést teremtve az emberi szakértelem és az AI asszisztencia között. A co-pilot visszajelzések elemzése érdekes eredményeket mutat:

  • Autonóm módban az Agent Laboratory által generált tanulmányok átlagosan 3,8/10 pontot értek el az emberi értékelésekben
  • Co-pilot módban ez a pontszám 4,38/10-re emelkedett
  • A legnagyobb javulás a tanulmányok érthetőségében, világos megfogalmazásában (+0,23) és a prezentáció (+0,33) terén mutatkozott

Fontos megjegyezni, hogy még emberi közreműködéssel is ezek a tanulmányok átlagosan 1,45 ponttal maradtak el egy átlagos, NeurIPS-en elfogadott tanulmánytól (5,85 pont). Ez rávilágít arra, hogy ennek a folyamatnak még az elején vagyunk, de a modellek fejlődésével ez vélhetően javulni fog. Egy másik érdekes megfigyelés, hogy az AI értékelők következetesen 2,3 ponttal magasabbra értékelték a tanulmányokat, mint az emberi bírálók. Ez a különbség kiemeli az emberi felügyelet fontosságát a kutatási értékelésben. Ha már azonban a modelleket említettük egyelőre a következő tapasztalatokat sikerült levonni:

  • o1-preview: a legjobb pontszámok a hasznosságot és generált tanulmány világosságát illetően
  • o1-mini: a legjobb pontszámok a kísérleti minőséget illetően
  • GPT-4o: alacsonyabb metrikák, de költséghatékonynak bizonyult, tanulmányonként csak 2,33 dollár, ami 84%-os költségcsökkentést jelent a korábbi autonóm kutatási módszerekhez képest (kb. 15 dollár). Valamint sebességben is ez a legjobb mindössze 1165,4 másodperc alatt teljesítve a teljes munkafolyamatot (3,2-szer gyorsabb, mint az o1-mini és 5,3-szor gyorsabb, mint az o1-preview)

Egyelőre tehát csak OpenAI modellekkel vannak tapasztalatok, de a szoftvertámogatásba már bekerült a DeepSeek modell is. Ugyanakkor más modelleket nem támogat, ami jelentős hiányosság, remélhetőleg ez változik majd a későbbiekben.

A kutatások jövője

Az Agent Laboratory képességei és eredményei alapján kijelenthető, hogy egy jelentős paradigmaváltás előtt állunk a kutatások lebonyolításában. Ez azonban nem az emberi kutatók helyettesítéséről szól, hanem egy kifinomultabb és hatékonyabb együttműködésről ember és gép között. Bár az Agent Laboratory által generált tanulmányok még nem érik el a top konferenciák színvonalát, egy új modellt teremtenek a kutatások felgyorsítására. Képzeljük el úgy, mintha egy csapat fáradhatatlan AI kutatóasszisztensünk lenne, akik a tudományos folyamat különböző aspektusaira specializálódtak. Ez a megközelítés számos előnnyel jár a kutatók számára:

  • Az irodalmi áttekintésekre és alapvető kódolásra fordított idő felszabadulhat a kreatív ötletelésre
  • Olyan kutatási ötletek is megvalósíthatóvá válhatnak, amelyeket korábban erőforráshiány miatt félre kellett tenni
  • A hipotézisek gyors prototípusozása és tesztelése gyorsabb áttörésekhez vezethet

A jelenlegi korlátok, mint például az AI és az emberi értékelések közötti különbség, további fejlesztési lehetőségeket rejtenek magukban. A rendszerek minden iterációja közelebb visz minket a kifinomultabb ember-gép kutatási együttműködéshez.

A szoftver ingyenesen elérhető a GitHub-on, bárki aki úgy érzi, hogy segítheti a munkáját bátran kipróbálhatja.    

Osszd meg ezt a cikket
Hol tart ma valójában a mesterséges intelligencia?
A mesterséges intelligencia fejlesztése az elmúlt években látványos és gyakran lenyűgöző eredményeket produkált. Az olyan rendszerek, mint a ChatGPT, képesek természetes nyelvű szövegeket generálni, problémákat megoldani és sokszor az emberi teljesítményt is meghaladni különféle feladatokban. Ugyanakkor egyre több neves kutató és technológiai vezető – köztük John Carmack és François Chollet – hívja fel a figyelmet arra, hogy ezek az eredmények nem feltétlenül jelentik az általános mesterséges intelligencia (AGI) közeledtét. A színfalak mögött most új típusú problémák és kérdések kerültek a figyelem középpontjába, amelyek messze túlmutatnak a puszta teljesítményen.
A Rhino Linux új kiadással jelentkezik: 2025.3
A Linux disztribúciók körében főként kétféle szemléletmód terjedt el, vannak a stabil, ritkán frissülő rendszerek biztonságos kiszámíthatósággal, és a naprakész, de időnként kényes egyensúlyon balanszírozó, gördülő kiadású disztribúciók. A Rhino Linux ezt a két ellenpontot próbálja áthidalni, azaz egyszerre próbál naprakész lenni gördülő disztribúcióként, de alapként az Ubuntura épül, hogy megfelelő stabilitást is biztosítson.
SEAL az önmagát tanító mesterséges intelligencia előhírnöke
Hosszú évek óta tartja magát az elképzelés, hogy a mesterséges intelligencia fejlesztésének kulcsa az emberi tanítás: adatok, címkék, finomhangolás, gondosan megtervezett beavatkozások. Most azonban egy új megközelítés látott napvilágot. Az MIT kutatóinak legújabb munkája, a SEAL (Self-Adapting Language Models) névre keresztelt rendszer olyan nyelvi modelleket mutat be, amelyek képessé válnak saját maguk tanítására. Az eredmények nemcsak technológiai újdonságot jelentenek, hanem felvetik a kérdést: vajon milyen szerepet szánunk a jövőben az embernek az intelligens rendszerek képzésében?
Elég egy fotó és egy hang – az Alibaba új mesterséges intelligenciája teljes testű avatárt készít belőle
Egyetlen hangfelvétel és egy fotó is elegendő ahhoz, hogy élethű, teljes testtel mozgó, arcjátékkal és érzelmekkel teli virtuális karaktereket hozzunk létre – stúdió, színész vagy zöld háttér nélkül. Az Alibaba legújabb fejlesztése, az OmniAvatar nevű nyílt forráskódú mesterséges intelligencia-modell legalábbis éppen ezt ígéri. Bár a technológia még formálódik, már most is érdemes figyelmet szentelni annak, amit lehetővé tesz – és annak is, hogy mindez milyen új kérdéseket vet fel.
ALT Linux 11.0 Education az orosz oktatási intézmények fundamentuma
Az ALT Linux egy orosz gyökerekkel rendelkező, RPM csomagkezelőre épülő Linux disztribúció, amelynek alapjait a Sisyphus csomagtár képezi. Kezdetben orosz lokalizációs erőfeszítésekből nőtte ki magát, együttműködve olyan nemzetközi disztribúciókkal, mint a Mandrake és a SUSE Linux, különös tekintettel a cirill betűs írás támogatására.
A térbeli intelligencia a következő leküzdendő akadály az AGI előtt
Az LLM megszületésével a gépek lenyűgöző képességekre tettek szert. Ráadásul fejlődési sebességük is nagyobb tempóra kapcsolt, nap mint nap jelennek meg újabb modellek, amelyek még hatékonyabbak még jobb képességekkel ruházzák fel a gépeket. Ha azonban közelebbről megvizsgáljuk, ezzel a technológiával még csak most értük el, hogy a gépek képesek egy dimenzióban gondolkodni. A világ amelyben élünk azonban az emberi érzékelés alapján három dimenziós. Egy ember számára nem okoz gondot, hogy megállapítsa, hogy valami egy szék alatt van, vagy mögött, vagy egy felénk repülő labda körülbelül hová fog érkezni. Számos mesterséges intelligencia kutató szerint az AGI azaz a mesterséges általános intelligencia megszületéséhez el kell érni, hogy a gépek három dimenzióban gondolkodjanak, ehhez pedig ki kell fejleszteni a térbeli intelligenciát.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések