Az arabul is jól beszélő francia nagy nyelvi modell

 A nagy nyelvi modellek kapcsán sokat lehet hallani az erős amerikai-kínai versenyről, de az európai modellekről nem annyira. Ennek egyik oka, hogy sajnos IT területén eléggé le vagyunk maradva, pedig akad a kontinensen egy egy jó kezdeményezés, amiről érdemes említést tenni. Ilyen például a 2023-ban Arthur Mensch, Guillaume Lample és Timothée Lacroix által alapított Mistral AI, ami egy párizsi székhelyű francia startup. Az alapítók szakmai tapasztalatot a Google DeepMidn-nál illetve a Meta-nál szereztek, majd céljuk az lett, hogy olyan mesterséges intelligenciával foglalkozó céget hozzanak létre, amely képes felvenni a versenyt az amerikai székhelyű vállalatokkal, felhelyezve ezzel Európát a mesterséges intelligencia térképére.

Megalakulása óta a Mistral AI jelentős előrelépéseket tett a mesterséges intelligencia területén. A vállalat fejlett nagy nyelvi modellek (LLM) fejlesztésére specializálódott, és általános célú és speciális AI-megoldásokat egyaránt kínál. A Mistral AI-t a nyílt forráskódú elvek és az erőforrás-hatékony modellek iránti elkötelezettsége emelte ki a piacról.

A nemzetközi színtéren a Mistral AI lenyűgöző növekedést mutat. A vállalat kevesebb mint egy év alatt több mint 1 milliárd eurót gyűjtött be, a legutóbbi B sorozatú fordulóban pedig 5,8 milliárd euróra értékelték, ami a legmagasabb érték egy AI startup számára Európában. A Mistral AI Európán kívülre is kiterjesztette jelenlétét: csapatot hozott létre az Egyesült Államokban, és irodát tervez nyitni Szingapúrban. 

Mistral AI chat
Mistral AI chat

A Mistral AI modelljei, köztük a Mistral 7B és a Mistral 8x7B, több nyelven való jártasságukról és kódolási képességeikről ismertek. Különösen a Mistral 8x7B modell támogatja a 32K kontextuskapacitást, és folyékonyan beszél angolul, franciául, olaszul, németül, spanyolul és különböző kódolási nyelveken. Akárcsak a ChatGPT a Mistral is rendelkezik ingyenes chat felülettel, ahol bárki kipróbálhatja. A chat felületen a szöveg generáláson túl, generálhatunk kódot, képet, vagy a beszélgetéshez bekapcsolhatjuk a „Web search” funkciót ha aktuálisabb válaszokat akarunk, de Deep Research funkcióval még nem rendelkezik. Érdemes megemlíteni, hogy meglehetősen jó képeket lehet generáltatni vele, amihez a Black Forest Labs-al közösen fejlesztett Flux Pro modellt használja. Teszteléskor kissé házsártos volt, nem akart egyből képet generálni, mivel szerinte nem választottam ki a képgenerálás funkciót, de némi bizonygatás után elhitte, hogy kijelöltem az „Image generation” gombot és elvégezte a feladatát. 

Mistral AI Mona Lisa
Mistral AI Mona Lisa

 A parancs amit adtam így hangzott: „Készíts képet amelyen egy ultra futurisztikus humanoid robot áhítattal nézi a Mona Lisa képet a Louvre-ban”. Bár szegény Mona Lisa-t is robotizálta, de azért elég jó eredményt adott erre a szegényesen megfogalmazott parancsra.

A Mistral AI legújabb modellje amit a héten mutattak be a Mistral Saba, amely az arab nyelvre és kultúrára fókuszál. A Saba egy 24 milliárd paraméteres kis modell, melynek célja, hogy üzleti lehetőségeket biztosítson a Mistral számára a Közel-Keleten. Meg is kértem az egyik arab barátomat, hogy nézzük meg hogyan teljesít a ChatGPT-vel összevetve. A kulturális témát illetően az arab filozófiáról kérdezgette, valamint pár informatikai kérdést is feltett arabul, és meglehetősen elégedettnek tűnt. Amit rögtön kiemelt, hogy a ChatGPT hajlamos rosszul formázni az arab szövegeket és például a táblázatokban balról jobbra rendezi az arab szöveget. A Mistral viszont a táblázatokban is jól vizsgázott. Reménykedem benne, hogy semmi obszcén tartalmat nem íratott vele, arab nyelvtudás hiányában csak vakon kiteszem az általa készített képernyőképeket. 

ChatGPT rosszul formázott arab szöveg a táblázatban
ChatGPT rosszul formázott arab szöveg a táblázatban
Mistral AI jól formázott arab szöveg még a táblázatban is
Mistral AI jól formázott arab szöveg még a táblázatban is

A Mistral Saba bár az arabra lett trenírozva, egy érdekes mellékhatásként igen jól elboldogul a dél-indiai nyelvekkel, például a tamillal és a malajálammal, amelyre remélhetőleg nyelvészek és kultúrantropológusok is felfigyelnek majd valamilyen új elmélettel gazdagítva az emberiséget. Addig is a cég tervei között szerepel, hogy más regionális nyelvek irányába is szeretnének elmozdulni, kiterjesztve ezzel az üzleti lehetőségeiket. 

Osszd meg ezt a cikket
Szuverén AI, titkos részvényeladások – mi zajlik az NVIDIA kulisszái mögött?
A mesterséges intelligencia iparága az elmúlt években ritkán tapasztalt lendületet vett, és ennek a hullámnak az egyik legnagyobb nyertese kétségtelenül az NVIDIA. A grafikus processzorairól ismert vállalat mára nem csupán a játékosok és mérnökök kedvence, hanem a nemzetközi technológiai stratégiák központi szereplője is lett. Az amerikai tőzsdén a részvényeinek az értéke történelmi csúcsokat dönt, miközben egyre több kormányzati együttműködés és geopolitikai szál kezd köréje fonódni. De vajon mit árul el mindez a jövőről, és mennyire megalapozott a mostani optimizmus?
Nem támogatja tovább az X11-et GNOME 49
Bár a GNOME talán a legáltalánosabban használt asztali környezet az egyes Linux disztribúciók esetében, a fejlesztők a GNOME 49-ben mégis mélyebb szerkezeti változások mellett döntöttek, amely kihatással lesz a disztribúciók támogatására.
A Facebook új AI-funkciója csendben nyit kaput a személyes fotók tömeges elemzéséhez
Egy új figyelmeztetés fogadja azokat a felhasználókat, akik valamilyen bejegyzést szeretnének megosztani a Facebookon: egy felugró ablak, amely „felhőalapú feldolgozásra” kér engedélyt. A rendszer, ha jóváhagyjuk, hozzáférhet a telefonunk teljes fényképtárához – beleértve azokat a képeket is, amelyeket még soha nem töltöttünk fel a közösségi hálóra. A cél: mesterséges intelligencia által generált kreatív ötletek, például kollázsok, tematikus válogatások vagy stílusátalakított változatok készítése.
openEuler 24.03-LTS-SP2 a kínai nagyvállalatok meghatározó platformja
A digitális infrastruktúra jövője egyre inkább olyan operációs rendszerekre épül, amelyek képesek egyszerre kielégíteni a különböző iparágak stabilitási, innovációs és kompatibilitási elvárásait. Az openEuler, Kína első közösségi nyílt forráskódú operációs rendszere, nem csupán egy technológiai termék, hanem egy hosszú távú stratégiai törekvés eredménye, amely arra irányul, hogy független és sokrétű technológiai ökoszisztémát hozzon létre. Ennek a fejlesztési vonalnak legújabb fontos állomása az openEuler 24.03 LTS SP2.
 Google Gemini CLI, erős ajánlat a terminálból elérhető AI-k mezőnyében
A Google által nemrég bejelentett Gemini CLI egy nyílt forráskódú, parancssoros AI-eszköz, amely a Gemini 2.5 Pro nagy nyelvi modellt integrálja közvetlenül a terminálba. A kezdeményezés célja nem kevesebb, mint hogy a természetes nyelvi utasításokat valódi technikai munkafolyamatokká alakítsa, méghozzá egy olyan környezetben, amely sokak számára már eddig is a hatékonyság szinonimája volt.
Satya Nadella gondolatai a mesterséges intelligencia szerepéről jövőjéről és felelősségéről
A technológia világában nem ritkák a gyors váltások, de ezek ritkán érintenek ennyire sok szektort egyszerre, mint napjaink mesterséges intelligencia (AI) forradalma. Satya Nadella, a Microsoft vezérigazgatója a Y Combinatornak adott interjúban nemcsak a technológiai fejleményeket értékelte, hanem tágabb társadalmi és gazdasági összefüggésekbe is helyezte az AI fejlődését. Megközelítése visszafogott, higgadt és céltudatos: az AI nem misztikus entitás, hanem eszköz, amelyet megfelelően kell alkalmazni és értelmezni.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések