Mesterséges intelligencia a gyakorlatban: az NVIDIA és a Boston Dynamics innovatív együttműködése

A modern robotika fejlődése szoros kapcsolatban áll a mesterséges intelligencia és a szimulációs technológiák fejlődésével. Az NVIDIA által indított Isaac™ GR00T kutatási kezdeményezés új alapmodellekkel kívánja felgyorsítani a humanoid robotok fejlesztését, míg a Boston Dynamics a hosszú évek tapasztalatát ötvözi a legmodernebb számítási platformokkal, hogy olyan robotokat hozzon létre, amelyek képesek az emberi mozgás finom és természetes megjelenítésére. A két vállalat közötti együttműködés új mérföldkőnek számít a humanoid robotika területén, hiszen a szimuláció, a tanulás és a valós környezetben való tesztelés összekapcsolása lehetővé teszi az adaptív, valós idejű robotikus megoldások kifejlesztését.

Az NVIDIA Isaac™ GR00T platform

Az NVIDIA Isaac™ GR00T egy átfogó kutatási és fejlesztési platform, melynek célja az általános célú robotalapmodellek és adatcsatornák kidolgozása. A GR00T platform számos összetevőt integrál.

Az egyik fontos összetevő az NVIDIA Isaac GR00T N1, amely az első olyan nyílt alapmodell amelyet a humanoid robotok általános mozgásához, gondolkodásához fejlesztettek ki. A modell multimodális bemeneteket képes feldolgozni (például nyelvi és vizuális információkat), ezáltal több lépcsős manipulációs feladatok elvégzésére alkalmas különféle környezetekben. A modell edzéséhez valós adatokat, szintetikus adatokat és internetes videóanyagokat használtak, így magas fokú adaptálhatóságot biztosít.

Az alapmodell mellett rendkívül nagy szerepet játszanak az NVIDIA Omniverse™ és Cosmos™ rendszerekre épülő szimulációs keretrendszerek, amelyek lehetővé teszik a robotok virtuális környezetben történő tanulását és tesztelését, amely elősegíti a valós világban megjelenő kihívásokhoz való gyors alkalmazkodást.

Ezeken túl az NVIDIA számítási platformot is biztosít. A Jetson AGX Thor™ számítási platform biztosítja a robot teljes stacket, lehetővé téve a valós idejű adatfeldolgozást és a komplex AI modellek futtatását. Ez a komponens kulcsfontosságú abban, hogy a GR00T N1 képes legyen a precíz, multimodális vezérlésre különböző fizikai és virtuális környezetekben.

A Boston Dynamics és az NVIDIA együttműködése

A Boston Dynamics hosszú múltra tekint vissza a robotikai mozgások természetes és dinamikus megjelenítésében. A vállalat az egyik korai támogatója volt a Project GROOT kezdeményezésnek, és azóta is folyamatosan bővíti együttműködését az NVIDIA-val. Az Atlas humanoid robot például az NVIDIA Jetson Thor platformját használja, amely a robot komplex, multimodális AI modelljeinek futtatását támogatja.

Az együttműködés egyik fő eleme az Isaac Lab, mely az NVIDIA Isaac Sim és Omniverse technológiáit hasznosítva segíti a robotok virtuális környezetben történő tanulását és fejlődését. Ez a megközelítés lehetővé teszi, hogy a Boston Dynamics Atlas robotja ne csak előre programozott mozdulatokat hajtson végre, hanem képes legyen reagálni a valós idejű, előre nem látott környezeti kihívásokra.

A legújabb bemutatókon az Atlas olyan dinamikus mozgásokat mutat be, amelyek megvalósítása komoly mérnöki kihívásnak számít. A robot képes futásra, kúszásra, illetve komplex manuális feladatok végrehajtására, amelyek a modern AI modellek és a precíz mechanikai vezérlés kombinációját igénylik. 

A két cég közötti együttműködés egyik alapvető célja, hogy a szimulált tanulás és a valós környezet közti átmenetet egyre gördülékenyebbé tegye. Aaron Saunders, a Boston Dynamics technológiai vezetője szerint a robotok egyfajta hidat képezve segítenek összekötni a virtuális szimulációkat a valós világ kihívásaival. Az ilyen fejlesztések hozzájárulnak a robotok biztonságosabb működéséhez, illetve az emberi munkakörnyezetbe történő integrációjukhoz.

Összegzés

Az NVIDIA Isaac™ GR00T platform és a Boston Dynamics, az NVIDIA közötti együttműködés példát mutat arra, hogyan ötvözhető a fejlett AI, a szimulációs technológia és a robotikai mérnöki szakértelem egy olyan rendszer kialakításában, amely a sci-fi irodalomból a valóságba emeli a robotkat. Az integrált alapmodellek, a valós idejű számítási kapacitás és a szimulációs tanulás együttesen biztosítják, hogy a jövő robotjai képesek legyenek a valós világ kihívásaival megbirkózni, ezáltal növelve azok biztonságát és alkalmazhatóságát a mindennapi életben.

A folyamatos kutatás és fejlesztés mellett várhatóan egyre több olyan alkalmazás és iparági megoldás jelenik meg, amelyek hozzájárulnak a robotok szélesebb körű elterjedéséhez, mind ipari, mind háztartási környezetben. 

Osszd meg ezt a cikket
Elég egy fotó és egy hang – az Alibaba új mesterséges intelligenciája teljes testű avatárt készít belőle
Egyetlen hangfelvétel és egy fotó is elegendő ahhoz, hogy élethű, teljes testtel mozgó, arcjátékkal és érzelmekkel teli virtuális karaktereket hozzunk létre – stúdió, színész vagy zöld háttér nélkül. Az Alibaba legújabb fejlesztése, az OmniAvatar nevű nyílt forráskódú mesterséges intelligencia-modell legalábbis éppen ezt ígéri. Bár a technológia még formálódik, már most is érdemes figyelmet szentelni annak, amit lehetővé tesz – és annak is, hogy mindez milyen új kérdéseket vet fel.
A térbeli intelligencia a következő leküzdendő akadály az AGI előtt
Az LLM megszületésével a gépek lenyűgöző képességekre tettek szert. Ráadásul fejlődési sebességük is nagyobb tempóra kapcsolt, nap mint nap jelennek meg újabb modellek, amelyek még hatékonyabbak még jobb képességekkel ruházzák fel a gépeket. Ha azonban közelebbről megvizsgáljuk, ezzel a technológiával még csak most értük el, hogy a gépek képesek egy dimenzióban gondolkodni. A világ amelyben élünk azonban az emberi érzékelés alapján három dimenziós. Egy ember számára nem okoz gondot, hogy megállapítsa, hogy valami egy szék alatt van, vagy mögött, vagy egy felénk repülő labda körülbelül hová fog érkezni. Számos mesterséges intelligencia kutató szerint az AGI azaz a mesterséges általános intelligencia megszületéséhez el kell érni, hogy a gépek három dimenzióban gondolkodjanak, ehhez pedig ki kell fejleszteni a térbeli intelligenciát.
Az Apple új képérzékelő szabadalommal sokkolja a versenytársakat
A digitális képalkotás a telefonoknál ha a vásárlóknál nem is mindig, de a tesztek során a figyelem középpontjában van. Nem csoda, hogy a cégek ezen a területen igyekeznek némi fejlődést felmutat, így előfordul, hogy ami ma csúcstechnológiának számít, holnapra már iparági alapkövetelménnyé válhat. Ezen a dinamikusan változó terepen mégis ritka, hogy egy szabadalmi bejegyzés akkora figyelmet kapjon, mint amekkorát az Apple nemrégiben nyilvánosságra került találmánya generált. A "Image Sensor With Stacked Pixels Having High Dynamic Range And Low Noise" című dokumentum ugyanis nem kevesebbet ígér, mint egy új, saját fejlesztésű képérzékelőt, amely a vállalat szerint a jelenleg elérhető legjobb filmes kamerák teljesítményét is meghaladhatja – legalábbis bizonyos szempontból.
Mi rejlik a Meta mesterséges intelligencia-újjászervezése mögött?
Mark Zuckerberg, a Meta vezérigazgatója nem először lép merészet, ám ezúttal minden eddiginél átfogóbb átszervezést hajt végre a cég mesterséges intelligenciával foglalkozó részlegeiben. A frissen létrehozott Meta Superintelligence Labs (MSL) névre keresztelt új divízió alá kerül az összes eddigi AI-csapat, beleértve a kutatás-fejlesztést, a termékfejlesztést és az alapmodellek építését. A cél nem csupán az emberi gondolkodással versenyképes mesterséges intelligencia (AGI), hanem egy olyan rendszerszintű szuperintelligencia megalkotása, amely meghaladja az emberi képességeket.
Miért áll le a Samsung a 1.4nm-es chipekkel – és mit jelent ez a jövő telefonjaira nézve?
A Samsung legújabb bejelentései a 1.4 nanométeres chipgyártás késlekedéséről aggasztó következményeket jeleznek előre. Bár elsőre ez csupán egy mérnöki részletkérdésnek tűnhet, a döntés következményei a mobilipar egészére és a Samsung saját chipgyártási stratégiájára is komoly hatással lehetnek. Érdemes megérteni, mit jelent ez valójában, és miért számít, hogy a jövő Exynos chipjei milyen gyártási technológián alapulnak.
Új irány az Apple-nél: iPhone-chipet kaphat a következő, olcsóbb MacBook
Az Apple egy olyan terméken dolgozik, amely első látásra nem tűnik forradalminak, mégis jól érzékelhető változást hozhat a cég stratégiájában. Egy új, alacsonyabb árú MacBook bevezetését tervezik, amely nem a megszokott M-szériás processzorokra épül, hanem az iPhone-okban is használt A18 Pro chipre. Ez az apró, de jelentős technológiai döntés nemcsak a gyártási költségek csökkentését célozza, hanem egyúttal új vásárlói rétegeket is megnyithat az Apple számára, különösen az oktatási szektorban és az alapszintű felhasználói igényekkel rendelkező közönség körében.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések