Az arabul is jól beszélő francia nagy nyelvi modell

 A nagy nyelvi modellek kapcsán sokat lehet hallani az erős amerikai-kínai versenyről, de az európai modellekről nem annyira. Ennek egyik oka, hogy sajnos IT területén eléggé le vagyunk maradva, pedig akad a kontinensen egy egy jó kezdeményezés, amiről érdemes említést tenni. Ilyen például a 2023-ban Arthur Mensch, Guillaume Lample és Timothée Lacroix által alapított Mistral AI, ami egy párizsi székhelyű francia startup. Az alapítók szakmai tapasztalatot a Google DeepMidn-nál illetve a Meta-nál szereztek, majd céljuk az lett, hogy olyan mesterséges intelligenciával foglalkozó céget hozzanak létre, amely képes felvenni a versenyt az amerikai székhelyű vállalatokkal, felhelyezve ezzel Európát a mesterséges intelligencia térképére.

Megalakulása óta a Mistral AI jelentős előrelépéseket tett a mesterséges intelligencia területén. A vállalat fejlett nagy nyelvi modellek (LLM) fejlesztésére specializálódott, és általános célú és speciális AI-megoldásokat egyaránt kínál. A Mistral AI-t a nyílt forráskódú elvek és az erőforrás-hatékony modellek iránti elkötelezettsége emelte ki a piacról.

A nemzetközi színtéren a Mistral AI lenyűgöző növekedést mutat. A vállalat kevesebb mint egy év alatt több mint 1 milliárd eurót gyűjtött be, a legutóbbi B sorozatú fordulóban pedig 5,8 milliárd euróra értékelték, ami a legmagasabb érték egy AI startup számára Európában. A Mistral AI Európán kívülre is kiterjesztette jelenlétét: csapatot hozott létre az Egyesült Államokban, és irodát tervez nyitni Szingapúrban. 

Mistral AI chat
Mistral AI chat

A Mistral AI modelljei, köztük a Mistral 7B és a Mistral 8x7B, több nyelven való jártasságukról és kódolási képességeikről ismertek. Különösen a Mistral 8x7B modell támogatja a 32K kontextuskapacitást, és folyékonyan beszél angolul, franciául, olaszul, németül, spanyolul és különböző kódolási nyelveken. Akárcsak a ChatGPT a Mistral is rendelkezik ingyenes chat felülettel, ahol bárki kipróbálhatja. A chat felületen a szöveg generáláson túl, generálhatunk kódot, képet, vagy a beszélgetéshez bekapcsolhatjuk a „Web search” funkciót ha aktuálisabb válaszokat akarunk, de Deep Research funkcióval még nem rendelkezik. Érdemes megemlíteni, hogy meglehetősen jó képeket lehet generáltatni vele, amihez a Black Forest Labs-al közösen fejlesztett Flux Pro modellt használja. Teszteléskor kissé házsártos volt, nem akart egyből képet generálni, mivel szerinte nem választottam ki a képgenerálás funkciót, de némi bizonygatás után elhitte, hogy kijelöltem az „Image generation” gombot és elvégezte a feladatát. 

Mistral AI Mona Lisa
Mistral AI Mona Lisa

 A parancs amit adtam így hangzott: „Készíts képet amelyen egy ultra futurisztikus humanoid robot áhítattal nézi a Mona Lisa képet a Louvre-ban”. Bár szegény Mona Lisa-t is robotizálta, de azért elég jó eredményt adott erre a szegényesen megfogalmazott parancsra.

A Mistral AI legújabb modellje amit a héten mutattak be a Mistral Saba, amely az arab nyelvre és kultúrára fókuszál. A Saba egy 24 milliárd paraméteres kis modell, melynek célja, hogy üzleti lehetőségeket biztosítson a Mistral számára a Közel-Keleten. Meg is kértem az egyik arab barátomat, hogy nézzük meg hogyan teljesít a ChatGPT-vel összevetve. A kulturális témát illetően az arab filozófiáról kérdezgette, valamint pár informatikai kérdést is feltett arabul, és meglehetősen elégedettnek tűnt. Amit rögtön kiemelt, hogy a ChatGPT hajlamos rosszul formázni az arab szövegeket és például a táblázatokban balról jobbra rendezi az arab szöveget. A Mistral viszont a táblázatokban is jól vizsgázott. Reménykedem benne, hogy semmi obszcén tartalmat nem íratott vele, arab nyelvtudás hiányában csak vakon kiteszem az általa készített képernyőképeket. 

ChatGPT rosszul formázott arab szöveg a táblázatban
ChatGPT rosszul formázott arab szöveg a táblázatban
Mistral AI jól formázott arab szöveg még a táblázatban is
Mistral AI jól formázott arab szöveg még a táblázatban is

A Mistral Saba bár az arabra lett trenírozva, egy érdekes mellékhatásként igen jól elboldogul a dél-indiai nyelvekkel, például a tamillal és a malajálammal, amelyre remélhetőleg nyelvészek és kultúrantropológusok is felfigyelnek majd valamilyen új elmélettel gazdagítva az emberiséget. Addig is a cég tervei között szerepel, hogy más regionális nyelvek irányába is szeretnének elmozdulni, kiterjesztve ezzel az üzleti lehetőségeiket. 

Osszd meg ezt a cikket
Mesterséges intelligencia a hálózat irányításban és karbantartásban
Az Ericsson nemrég bemutatta a 2025-re vonatkozó stratégiai terveit a Mobile World Congress 2025 (MWC25) keretében. Az itt ismertetett elképzelések azért különösen érdekesek, mert jól mutatják, miként épül be a mesterséges intelligencia olyan ipari folyamatokba, amelyek mindennapi életünket érintik, ám addig rejtve maradnak, amíg zökkenőmentesen működnek.
GTC 2025: Az NVIDIA Blackwell chipeken alapuló szerverei és a DGX Station
A 2009 óta megrendezett GTC (GPU Technológiai Konferencia) idén március 17 és 21 között kerül megrendezésre az NVIDIA által. A konferencia célja hogy bemutassa a legújabb fejlesztéseket és elősegítse a különböző iparágak közötti együttműködést és további fejlesztéseket, így többnyire fejlesztők, kutatók, technológiai vezetők vesznek részt rajta. Az NVIDIA CEO-ja Jensen Huang egy ideje emlegeti, hogy a vállalatok a jövőben token gyárrá változnak, ami alatt azt érti, hogy minden létező munkafolyamat mesterséges intelligencia által támogatott lesz. Ebben jelenleg nagy szerepet játszanak a nagy szerverek, de az AI integráció egyre inkább lecsorog majd a személyi számítógépek szintjére és a jövőben olyan számítógépek, laptopok lesznek amelyek megfelelő hardverrel rendelkeznek, ahhoz hogy akár nagy nyelvi modelleket futtassanak a háttérben. Erre azért van szükség mert a programozók, mérnökök és szinte mindenki mesterséges intelligencia által asszisztált munkát fog végezni.
Elérhető a Fedora 42 béta
A Fedora 42 béta verzió már elérhető és tesztelhető, míg a stabil kiadást április 15-re tervezik . Az új verzió számos jelentős fejlesztést tartalmaz, amelyek célja a felhasználói élmény javítása, a telepítési folyamat egyszerűsítése, valamint a modern asztali környezetek és technikai megoldások integrálása.
Videójátékok a mesterséges intelligencia tesztelésben
A videójátékok már évtizedek óta szolgálnak olyan laboratóriumként, ahol különböző AI-algoritmusok képességeit tesztelik. A játékok – legyen szó klasszikus platformjátékokról vagy összetettebb stratégiai környezetekről – lehetőséget nyújtanak arra, hogy a mesterséges intelligencia rendszerek megtanulják a cselekvést, alkalmazkodjanak a változó környezethez, és optimalizálják döntéseiket a jutalmak elérése érdekében.