Az arabul is jól beszélő francia nagy nyelvi modell

 A nagy nyelvi modellek kapcsán sokat lehet hallani az erős amerikai-kínai versenyről, de az európai modellekről nem annyira. Ennek egyik oka, hogy sajnos IT területén eléggé le vagyunk maradva, pedig akad a kontinensen egy egy jó kezdeményezés, amiről érdemes említést tenni. Ilyen például a 2023-ban Arthur Mensch, Guillaume Lample és Timothée Lacroix által alapított Mistral AI, ami egy párizsi székhelyű francia startup. Az alapítók szakmai tapasztalatot a Google DeepMidn-nál illetve a Meta-nál szereztek, majd céljuk az lett, hogy olyan mesterséges intelligenciával foglalkozó céget hozzanak létre, amely képes felvenni a versenyt az amerikai székhelyű vállalatokkal, felhelyezve ezzel Európát a mesterséges intelligencia térképére.

Megalakulása óta a Mistral AI jelentős előrelépéseket tett a mesterséges intelligencia területén. A vállalat fejlett nagy nyelvi modellek (LLM) fejlesztésére specializálódott, és általános célú és speciális AI-megoldásokat egyaránt kínál. A Mistral AI-t a nyílt forráskódú elvek és az erőforrás-hatékony modellek iránti elkötelezettsége emelte ki a piacról.

A nemzetközi színtéren a Mistral AI lenyűgöző növekedést mutat. A vállalat kevesebb mint egy év alatt több mint 1 milliárd eurót gyűjtött be, a legutóbbi B sorozatú fordulóban pedig 5,8 milliárd euróra értékelték, ami a legmagasabb érték egy AI startup számára Európában. A Mistral AI Európán kívülre is kiterjesztette jelenlétét: csapatot hozott létre az Egyesült Államokban, és irodát tervez nyitni Szingapúrban. 

Mistral AI chat
Mistral AI chat

A Mistral AI modelljei, köztük a Mistral 7B és a Mistral 8x7B, több nyelven való jártasságukról és kódolási képességeikről ismertek. Különösen a Mistral 8x7B modell támogatja a 32K kontextuskapacitást, és folyékonyan beszél angolul, franciául, olaszul, németül, spanyolul és különböző kódolási nyelveken. Akárcsak a ChatGPT a Mistral is rendelkezik ingyenes chat felülettel, ahol bárki kipróbálhatja. A chat felületen a szöveg generáláson túl, generálhatunk kódot, képet, vagy a beszélgetéshez bekapcsolhatjuk a „Web search” funkciót ha aktuálisabb válaszokat akarunk, de Deep Research funkcióval még nem rendelkezik. Érdemes megemlíteni, hogy meglehetősen jó képeket lehet generáltatni vele, amihez a Black Forest Labs-al közösen fejlesztett Flux Pro modellt használja. Teszteléskor kissé házsártos volt, nem akart egyből képet generálni, mivel szerinte nem választottam ki a képgenerálás funkciót, de némi bizonygatás után elhitte, hogy kijelöltem az „Image generation” gombot és elvégezte a feladatát. 

Mistral AI Mona Lisa
Mistral AI Mona Lisa

 A parancs amit adtam így hangzott: „Készíts képet amelyen egy ultra futurisztikus humanoid robot áhítattal nézi a Mona Lisa képet a Louvre-ban”. Bár szegény Mona Lisa-t is robotizálta, de azért elég jó eredményt adott erre a szegényesen megfogalmazott parancsra.

A Mistral AI legújabb modellje amit a héten mutattak be a Mistral Saba, amely az arab nyelvre és kultúrára fókuszál. A Saba egy 24 milliárd paraméteres kis modell, melynek célja, hogy üzleti lehetőségeket biztosítson a Mistral számára a Közel-Keleten. Meg is kértem az egyik arab barátomat, hogy nézzük meg hogyan teljesít a ChatGPT-vel összevetve. A kulturális témát illetően az arab filozófiáról kérdezgette, valamint pár informatikai kérdést is feltett arabul, és meglehetősen elégedettnek tűnt. Amit rögtön kiemelt, hogy a ChatGPT hajlamos rosszul formázni az arab szövegeket és például a táblázatokban balról jobbra rendezi az arab szöveget. A Mistral viszont a táblázatokban is jól vizsgázott. Reménykedem benne, hogy semmi obszcén tartalmat nem íratott vele, arab nyelvtudás hiányában csak vakon kiteszem az általa készített képernyőképeket. 

ChatGPT rosszul formázott arab szöveg a táblázatban
ChatGPT rosszul formázott arab szöveg a táblázatban
Mistral AI jól formázott arab szöveg még a táblázatban is
Mistral AI jól formázott arab szöveg még a táblázatban is

A Mistral Saba bár az arabra lett trenírozva, egy érdekes mellékhatásként igen jól elboldogul a dél-indiai nyelvekkel, például a tamillal és a malajálammal, amelyre remélhetőleg nyelvészek és kultúrantropológusok is felfigyelnek majd valamilyen új elmélettel gazdagítva az emberiséget. Addig is a cég tervei között szerepel, hogy más regionális nyelvek irányába is szeretnének elmozdulni, kiterjesztve ezzel az üzleti lehetőségeiket. 

Osszd meg ezt a cikket
Mesterséges intelligencia, űr és emberiség
Elon Musk, a SpaceX, Tesla, Neuralink és xAI alapítója és vezetője egy közelmúltbeli interjúban osztotta meg gondolatait a jövő lehetséges irányairól, különös tekintettel a mesterséges intelligenciára, az űrbe való terjeszkedésre és az emberiség fejlődésére.
 Valós idejű zene komponálás a Google Magenta RT modelljével
A mesterséges intelligencia alkalmazása a zene komponálásban nem új keletű törekvés, ám a valós idejű működés sokáig jelentős akadályokba ütközött. A Google Magenta csapata most olyan fejlesztést mutatott be, amely a műfaj technikai és kreatív lehetőségeit egyaránt kiszélesítheti. A Magenta RealTime (röviden: Magenta RT) névre keresztelt új modell valós időben generál zenét, miközben nyitott forráskódjának köszönhetően bárki számára hozzáférhető.
Ufficio Zero egy olasz Linux disztribúció a fenntartható digitális munkavégzésért
Az Ufficio Zero Linux OS egy kevéssé ismert, de egyre komolyabb figyelmet érdemlő olasz fejlesztésű operációs rendszer. Elsősorban irodai és hivatali munkakörnyezetek számára készült, és különösen azoknak lehet érdekes, akik stabil, megbízható és hosszú távon is használható alternatívát keresnek a kereskedelmi rendszerekkel szemben. Az Ufficio Zero sajátos helyet foglal el a nyílt forráskódú rendszerek világában: egyszerre kíván választ adni a digitális infrastruktúra elavulására, valamint a munkavégzéshez nélkülözhetetlen szoftvereszközök elérhetőségének problémáira.
Mit jelentene az Apple számára a Perplexity AI felvásárlása?
Az Apple régóta igyekszik megtalálni a helyét a generatív mesterséges intelligencia gyorsan alakuló piacán. A vállalat évtizedeken át stratégikusan kivárt, mielőtt jelentősebb erőforrásokat irányított volna mesterséges intelligencia-alapú fejlesztésekbe. Most azonban, a legfrissebb hírek szerint, a cupertinói cég egy minden eddiginél nagyobb szabású lépésre készülhet: belső körökben megindultak az egyeztetések a Perplexity AI nevű startup esetleges felvásárlásáról.
Így torzít az LLM
A mesterséges intelligencia (MI) fejlődésével párhuzamosan egyre több figyelem irányul az úgynevezett nagy nyelvi modellekre (LLM-ekre), amelyek már nemcsak a tudományos kutatásban, hanem a mindennapi élet számos területén is jelen vannak – például ügyvédi munkában, egészségügyi adatok elemzésében vagy számítógépes programok kódolásában. E modellek működésének megértése ugyanakkor továbbra is komoly kihívást jelent, különösen akkor, amikor azok látszólag megmagyarázhatatlan módon követnek el hibákat vagy adnak félrevezető válaszokat.
MiniMax-M1 AI modell, célkeresztben a nagy méretű szövegek kezelése
A mesterséges intelligencia rendszerek fejlődésével egyre nagyobb az igény olyan modellekre, amelyek nemcsak a nyelv értelmezésére képesek, hanem összetett, többlépcsős gondolkodási folyamatokat is képesek végigvinni. Az ilyen modellek kulcsfontosságúak lehetnek nemcsak elméleti feladatokban, hanem például szoftverfejlesztés vagy valós idejű döntéshozatal során is. Ezek az alkalmazások azonban különösen érzékenyek a számítási költségekre, amelyeket a hagyományos megközelítések gyakran nehezen tudnak kordában tartani.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések