A nagy nyelvi modellek kapcsán sokat lehet hallani az erős amerikai-kínai versenyről, de az európai modellekről nem annyira. Ennek egyik oka, hogy sajnos IT területén eléggé le vagyunk maradva, pedig akad a kontinensen egy egy jó kezdeményezés, amiről érdemes említést tenni. Ilyen például a 2023-ban Arthur Mensch, Guillaume Lample és Timothée Lacroix által alapított Mistral AI, ami egy párizsi székhelyű francia startup. Az alapítók szakmai tapasztalatot a Google DeepMidn-nál illetve a Meta-nál szereztek, majd céljuk az lett, hogy olyan mesterséges intelligenciával foglalkozó céget hozzanak létre, amely képes felvenni a versenyt az amerikai székhelyű vállalatokkal, felhelyezve ezzel Európát a mesterséges intelligencia térképére.
Megalakulása óta a Mistral AI jelentős előrelépéseket tett a mesterséges intelligencia területén. A vállalat fejlett nagy nyelvi modellek (LLM) fejlesztésére specializálódott, és általános célú és speciális AI-megoldásokat egyaránt kínál. A Mistral AI-t a nyílt forráskódú elvek és az erőforrás-hatékony modellek iránti elkötelezettsége emelte ki a piacról.
A nemzetközi színtéren a Mistral AI lenyűgöző növekedést mutat. A vállalat kevesebb mint egy év alatt több mint 1 milliárd eurót gyűjtött be, a legutóbbi B sorozatú fordulóban pedig 5,8 milliárd euróra értékelték, ami a legmagasabb érték egy AI startup számára Európában. A Mistral AI Európán kívülre is kiterjesztette jelenlétét: csapatot hozott létre az Egyesült Államokban, és irodát tervez nyitni Szingapúrban.

A Mistral AI modelljei, köztük a Mistral 7B és a Mistral 8x7B, több nyelven való jártasságukról és kódolási képességeikről ismertek. Különösen a Mistral 8x7B modell támogatja a 32K kontextuskapacitást, és folyékonyan beszél angolul, franciául, olaszul, németül, spanyolul és különböző kódolási nyelveken. Akárcsak a ChatGPT a Mistral is rendelkezik ingyenes chat felülettel, ahol bárki kipróbálhatja. A chat felületen a szöveg generáláson túl, generálhatunk kódot, képet, vagy a beszélgetéshez bekapcsolhatjuk a „Web search” funkciót ha aktuálisabb válaszokat akarunk, de Deep Research funkcióval még nem rendelkezik. Érdemes megemlíteni, hogy meglehetősen jó képeket lehet generáltatni vele, amihez a Black Forest Labs-al közösen fejlesztett Flux Pro modellt használja. Teszteléskor kissé házsártos volt, nem akart egyből képet generálni, mivel szerinte nem választottam ki a képgenerálás funkciót, de némi bizonygatás után elhitte, hogy kijelöltem az „Image generation” gombot és elvégezte a feladatát.

A parancs amit adtam így hangzott: „Készíts képet amelyen egy ultra futurisztikus humanoid robot áhítattal nézi a Mona Lisa képet a Louvre-ban”. Bár szegény Mona Lisa-t is robotizálta, de azért elég jó eredményt adott erre a szegényesen megfogalmazott parancsra.
A Mistral AI legújabb modellje amit a héten mutattak be a Mistral Saba, amely az arab nyelvre és kultúrára fókuszál. A Saba egy 24 milliárd paraméteres kis modell, melynek célja, hogy üzleti lehetőségeket biztosítson a Mistral számára a Közel-Keleten. Meg is kértem az egyik arab barátomat, hogy nézzük meg hogyan teljesít a ChatGPT-vel összevetve. A kulturális témát illetően az arab filozófiáról kérdezgette, valamint pár informatikai kérdést is feltett arabul, és meglehetősen elégedettnek tűnt. Amit rögtön kiemelt, hogy a ChatGPT hajlamos rosszul formázni az arab szövegeket és például a táblázatokban balról jobbra rendezi az arab szöveget. A Mistral viszont a táblázatokban is jól vizsgázott. Reménykedem benne, hogy semmi obszcén tartalmat nem íratott vele, arab nyelvtudás hiányában csak vakon kiteszem az általa készített képernyőképeket.


A Mistral Saba bár az arabra lett trenírozva, egy érdekes mellékhatásként igen jól elboldogul a dél-indiai nyelvekkel, például a tamillal és a malajálammal, amelyre remélhetőleg nyelvészek és kultúrantropológusok is felfigyelnek majd valamilyen új elmélettel gazdagítva az emberiséget. Addig is a cég tervei között szerepel, hogy más regionális nyelvek irányába is szeretnének elmozdulni, kiterjesztve ezzel az üzleti lehetőségeiket.