Számos fontos újdonsággal jelent meg a Llama 4

A Meta legújabb mesterséges intelligencia modellcsaládja a Llama 4 jelentős újításokat hozott a multimodális modellek fejlesztésében. A modellcsalád két azonnal elérhető változata – a Llama 4 Scout és a Llama 4 Maverick – mellett egy, még fejlesztés alatt álló, rendkívül nagy teljesítményű Llama 4 Behemoth is készül, amely a jövőben várhatóan további jelentős szerepet játszik majd a STEM (Science, Technology, Engineering, and Mathematics) fókuszú feladatokban.

Az utóbbi időben számos multimodális modell jelent meg, ezek olyan mesterséges intelligencia modellek, amelyek egyszerre képesek feldolgozni és integrálni többféle adatot, például szöveget, képet, hangot és videót. Az ilyen modellek sokkal gazdagabb kontextuson belül képesek értelmezni az egyes kérdéseket, ezáltal lényegesen komplexebb feladatokat is meg tudnak oldani, mint a korábbi csak szöveg alapú modellek. Azonban ami az előnyük az egyben a hátrányuk is hiszen általánosságban jóval több erőforrásra lehet szüksége egy ilyen modellnek mint egy hagyományos egymodális rendszernek. Ezen kíván segíteni a Llama 4 modellcsaládban alkalmazott Mixture of Experts (MoE) architektúra – amely csak a modell egy részét aktiválja adott bemenet esetén – jelentős hatékonyságot biztosítva ezzel, miközben a számítási költségek jelentősen csökkennek. Ez a megközelítés nem pusztán egy egyedi irány, hanem egy olyan trend, amelyben több nagyvállalat is elindult, de a Llama 4 nyíltforráskódú stratégiája egyértelműen megkülönbözteti a versenytársaktól.

Mint korábban említettem jelenleg még csak a modell család két kisebb modellje a Scout és a Maverick érhető el. Mindkettő 17 milliárd aktív paraméterrel rendelkezik, ami azt jelenti hogy a bemenetet ennyi paraméter dolgozza fel a modellen belül, de valójában mindkét modell jóval több valós paraméterrel rendelkezik. A Scout 109 milliárddal a Maverick pedig 400 milliárddal. Ez a MoE architektúrából következik, hiszen ahogy említettem a modellek mindig csak egyes almodulokat aktiválva dolgozzák fel a bemenetet. Ezeket az almodulokat a Meta szakértőknek nevezi, ennek megfelelően a Scout 16 szakértővel míg a Maverick 128 szakértő segítségével működik. A Scout tehát kisebb mint a Maverick ugyanakkor egyedülálló képessége hogy 10 millió token hosszú kontextusablakkal rendelkezik, amely ideálissá teszi hosszú szövegek, dokumentumok vagy például nagy kódbázisok elemzésére. A Maverick ugyan nem rendelkezik ekkora kontextus ablakkal, de következtetési és kódolási feladatokban több benchmark szerint is felülmúlja az olyan konkurenseket mint például a GPT-4o, vagy Gemini 2.0 Flash, miközben fele annyi paramétert használ mint a DeepSeek V3.

A Behemoth ugyan még nincs teljesen kész, de a Meta állítása szerint a STEM fókuszú feladatokban felül fogja múlni a GPT-4.5, Claude Sonnet 3.7 és Gemini 2.0 Pro modelleket. A Behemoth a két kis testvéréhez hasonló architektúra mellett 288 milliárd aktív paraméterrel fog rendelkezni, de a 16 almodulnak köszönhetően ez közel 2000 milliárd összesített paramétert jelent majd. A Behemoth azért is érdekes mivel a Meta ezt a modellt kívánja használni a kisebb modellek tanítására, valamint elképzelhető hogy integrálásra kerül a Meta olyan szolgáltatásaiba mint a Messanger, Instagram Direct illetve a WhatsApp. 

Osszd meg ezt a cikket
Thinkless, küzdelem az MI növekvő erőforrásigénye ellen
Amíg a nagy cégek sorra jelentették be az érvelési funkciókat a modelljeikben az elmúlt hónapokban, hamar kiderült ezen rendszerek hatalmas erőforrás igénye, így az ilyen szolgáltatásokra való előfizetések árai is az egekbe kúsztak. A Szingapúri Nemzeti Egyetem (NUS) kutatói egy új keretrendszert fejlesztettek ki „Thinkless” néven, amely akár jelentősen átalakíthatja a nagy nyelvi modellek (LLM) érvelési feladatainak megközelítését. Ez az innovatív megközelítés, amelyet Gongfan Fang, Xinyin Ma és Xinchao Wang fejlesztett ki a NUS xML Labban, lehetővé teszi az AI-rendszerek számára, hogy dinamikusan válasszanak az egyszerű és az összetett érvelési stratégiák között, ami akár 90%-kal is csökkentheti a számítási költségeket. A keretrendszer a jelenlegi mesterséges intelligencia érvelési módszerek kritikus hatékonysági hiányosságát orvosolja, és fontos előrelépést jelent az erőforrás-hatékonyabb mesterséges intelligencia megvalósításában.
Az EU Open Web Index projektje újabb lépés a digitális függetlenség felé
Az Open Web Index (OWI) az Európai Unió Horizont programjának keretében megvalósuló, nyílt forráskódú kezdeményezés, amelynek célja a webes keresési technológiák demokratizálása és az Európa digitális szuverenitásának erősítése. A projekt 2025 júniusában lép nyilvánosság elé, amikor is egy közös, mindenki számára hozzáférhető webindexet bocsát rendelkezésre, elválasztva az indexelési infrastruktúrát az azt hasznosító keresőszolgáltatásoktól. Ezzel az OWI nem csupán technikai újításokat kínál, hanem paradigmaváltást is a globális keresőpiacon, ahol ma több mint kilencven százalékos részesedésével egyetlen szereplő – a Google – határozza meg az online információhoz való hozzáférést.
Fejlettebb védelemmel jelenik meg az Android 16
Az Android 16 új kiadása az eddigi legátfogóbb eszközszintű védelmet kínálja a platform hárommilliárd felhasználója számára, középpontba helyezve a magas kockázatú személyek védelmét, ugyanakkor minden biztonságtudatos felhasználó számára jelentős előrelépést jelent. A rendszer legfontosabb eleme a továbbfejlesztett Speciális védelmi program, amely korábbi, fiókszintű beállítások helyett immár teljes körű, eszközszintű védelmi mechanizmusokat aktivál. Így az újságírók, közéleti személyiségek és más, kifinomult kiberfenyegetéseknek kitett felhasználók is egyetlen kapcsoló érintésével juthatnak hozzá a platform legerősebb biztonsági funkcióihoz.
GitHub-integrációval erősít a Gemini Advanced
A mesterséges intelligencia alapú fejlesztői eszközök terén nincs hiány újabb és újabb fejlesztésekben. A Google ezzel kapcsolatban most bejelentette, hogy közvetlen GitHub-integrációval bővíti Gemini Advanced nevű prémium AI-asszisztensét. A lépés nem csupán válasz a rivális OpenAI hasonló fejlesztéseire, hanem egyben komoly előrelépés is a fejlesztői munkafolyamatok hatékonyságának növelésében.