Az arabul is jól beszélő francia nagy nyelvi modell

 A nagy nyelvi modellek kapcsán sokat lehet hallani az erős amerikai-kínai versenyről, de az európai modellekről nem annyira. Ennek egyik oka, hogy sajnos IT területén eléggé le vagyunk maradva, pedig akad a kontinensen egy egy jó kezdeményezés, amiről érdemes említést tenni. Ilyen például a 2023-ban Arthur Mensch, Guillaume Lample és Timothée Lacroix által alapított Mistral AI, ami egy párizsi székhelyű francia startup. Az alapítók szakmai tapasztalatot a Google DeepMidn-nál illetve a Meta-nál szereztek, majd céljuk az lett, hogy olyan mesterséges intelligenciával foglalkozó céget hozzanak létre, amely képes felvenni a versenyt az amerikai székhelyű vállalatokkal, felhelyezve ezzel Európát a mesterséges intelligencia térképére.

Megalakulása óta a Mistral AI jelentős előrelépéseket tett a mesterséges intelligencia területén. A vállalat fejlett nagy nyelvi modellek (LLM) fejlesztésére specializálódott, és általános célú és speciális AI-megoldásokat egyaránt kínál. A Mistral AI-t a nyílt forráskódú elvek és az erőforrás-hatékony modellek iránti elkötelezettsége emelte ki a piacról.

A nemzetközi színtéren a Mistral AI lenyűgöző növekedést mutat. A vállalat kevesebb mint egy év alatt több mint 1 milliárd eurót gyűjtött be, a legutóbbi B sorozatú fordulóban pedig 5,8 milliárd euróra értékelték, ami a legmagasabb érték egy AI startup számára Európában. A Mistral AI Európán kívülre is kiterjesztette jelenlétét: csapatot hozott létre az Egyesült Államokban, és irodát tervez nyitni Szingapúrban. 

Mistral AI chat
Mistral AI chat

A Mistral AI modelljei, köztük a Mistral 7B és a Mistral 8x7B, több nyelven való jártasságukról és kódolási képességeikről ismertek. Különösen a Mistral 8x7B modell támogatja a 32K kontextuskapacitást, és folyékonyan beszél angolul, franciául, olaszul, németül, spanyolul és különböző kódolási nyelveken. Akárcsak a ChatGPT a Mistral is rendelkezik ingyenes chat felülettel, ahol bárki kipróbálhatja. A chat felületen a szöveg generáláson túl, generálhatunk kódot, képet, vagy a beszélgetéshez bekapcsolhatjuk a „Web search” funkciót ha aktuálisabb válaszokat akarunk, de Deep Research funkcióval még nem rendelkezik. Érdemes megemlíteni, hogy meglehetősen jó képeket lehet generáltatni vele, amihez a Black Forest Labs-al közösen fejlesztett Flux Pro modellt használja. Teszteléskor kissé házsártos volt, nem akart egyből képet generálni, mivel szerinte nem választottam ki a képgenerálás funkciót, de némi bizonygatás után elhitte, hogy kijelöltem az „Image generation” gombot és elvégezte a feladatát. 

Mistral AI Mona Lisa
Mistral AI Mona Lisa

 A parancs amit adtam így hangzott: „Készíts képet amelyen egy ultra futurisztikus humanoid robot áhítattal nézi a Mona Lisa képet a Louvre-ban”. Bár szegény Mona Lisa-t is robotizálta, de azért elég jó eredményt adott erre a szegényesen megfogalmazott parancsra.

A Mistral AI legújabb modellje amit a héten mutattak be a Mistral Saba, amely az arab nyelvre és kultúrára fókuszál. A Saba egy 24 milliárd paraméteres kis modell, melynek célja, hogy üzleti lehetőségeket biztosítson a Mistral számára a Közel-Keleten. Meg is kértem az egyik arab barátomat, hogy nézzük meg hogyan teljesít a ChatGPT-vel összevetve. A kulturális témát illetően az arab filozófiáról kérdezgette, valamint pár informatikai kérdést is feltett arabul, és meglehetősen elégedettnek tűnt. Amit rögtön kiemelt, hogy a ChatGPT hajlamos rosszul formázni az arab szövegeket és például a táblázatokban balról jobbra rendezi az arab szöveget. A Mistral viszont a táblázatokban is jól vizsgázott. Reménykedem benne, hogy semmi obszcén tartalmat nem íratott vele, arab nyelvtudás hiányában csak vakon kiteszem az általa készített képernyőképeket. 

ChatGPT rosszul formázott arab szöveg a táblázatban
ChatGPT rosszul formázott arab szöveg a táblázatban
Mistral AI jól formázott arab szöveg még a táblázatban is
Mistral AI jól formázott arab szöveg még a táblázatban is

A Mistral Saba bár az arabra lett trenírozva, egy érdekes mellékhatásként igen jól elboldogul a dél-indiai nyelvekkel, például a tamillal és a malajálammal, amelyre remélhetőleg nyelvészek és kultúrantropológusok is felfigyelnek majd valamilyen új elmélettel gazdagítva az emberiséget. Addig is a cég tervei között szerepel, hogy más regionális nyelvek irányába is szeretnének elmozdulni, kiterjesztve ezzel az üzleti lehetőségeiket. 

Osszd meg ezt a cikket
QnodeOS az első kvantum operációs rendszer
A kvantumhálózatok eddig elérhetetlenül bonyolultnak tűntek a fejlesztők számára, hiszen minden hardvertípushoz külön szoftverréteg készült. Március közepén azonban a Quantum Internet Alliance (QIA) kutatócsoportja bejelentette a QNodeOS névre keresztelt kvantumoperációs rendszert, amely – a klasszikus világ operációs rendszereihez hasonlóan – elrejti a hardver alacsony szintű részleteit, és lehetővé teszi a magasabb szintű alkalmazások fejlesztését különböző kvantumprocesszorokon. Az első bemutatót a Nature online kiadványa közölte 2025. március 12-én, és azóta a QNodeOS gyorsan a kvantumhálózati kutatások középpontjába került.
A két pólusúvá váló világ az AI ökoszisztémát is kettészakította
A Huawei 2025 tavaszán hivatalosan is megkezdte az Ascend 910C mesterséges intelligencia–chip tömeges kiszállítását kínai ügyfeleinek, amellyel a vállalat célja, hogy betöltse az amerikai exportkorlátozások által keletkezett űrt az AI chippek piacán. Az Ascend 910C nem egy teljesen új fejlesztés: két korábbi, Ascend 910B lapkát integrál egyetlen modulba, kihasználva a Huawei saját Da Vinci architektúráját és a chiplet-technológia előnyeit. A duál-chip kialakítás révén elérhető számítási teljesítmény MB16/FP16 pontossággal mintegy 780–800 TFLOPS, míg a memória­sávszélesség 3,2 TB/s körül alakul.
Az OpenAI megvenné a Chrome böngészőt
Az Egyesült Államok Igazságügyi Minisztériuma (DOJ) 2024 augusztusában indított antitröszt pert a Google ellen. A per során jogerős megállapítást nyert, hogy a Google jogellenes monopóliumot tart fenn az online keresőpiacon. A bírói ítélet szerint a Google piaci részesedése az általános keresőszolgáltatások terén eléri a 89,2 százalékot, míg mobil eszközökön 94,9 százalékot, ami alátámasztja a monopóliumra vonatkozó megállapításokat. A döntés nyomán verseny-helyreállítási intézkedéseket írtak elő.
 A Google bemutatta az Agent2Agent (A2A) nyílt forráskódú protokollt
Jensen Huang (az NVIDIA CEO-ja) nemrégiben elmondott beszédében a mesterséges intelligencia fejlődését több szakaszra osztotta és a jelenlegi szakaszra az Agentic AI korszakaként hivatkozott. Bár előadásában már a főként a következő szakaszra fókuszált a fizikai AI korszakára, nem szabad elfelejtenünk, hogy az Agentic AI korszaka is még csak idén indult el, így annak kifejlett érett formáját nem láthattuk. Hogy milyen lesz majd ez a fejlettebb forma abba enged betekintést a Google legújabb bejelentése amelyben bemutatták a nyílt forráskódú Agener2Agent protokollt. A protokoll célja, hogy hidat képezzen a különböző platformok, keretrendszerek és gyártók által létrehozott MI ágensek között, elősegítve ezzel a zökkenőmentes kommunikációt és együttműködést.