Érkezik a Microsoft Phi-4

A Microsoft nemrégiben bejelentette a Phi-4-et, egy 14 milliárd paraméteres, fejlett AI modellt, amelyet kifejezetten komplex következtetési feladatokhoz terveztek. Az új modell kiemelkedő teljesítményt nyújt olyan területeken, mint a matematikai problémamegoldás és a STEM-kérdések kezelése, sok esetben felülmúlva a hasonló vagy még nagyobb modelleket.


Miért jelentős a Phi-4?


A Phi-4 a Microsoft kis nyelvi modellek (Small Language Models, SLM) családjának új tagja, amely az Azure AI Foundryn keresztül érhető el a Microsoft Research License Agreement keretében. A modell hamarosan a Hugging Face platformján is elérhető lesz, lehetővé téve a szélesebb közönség számára, hogy kihasználja annak képességeit.


A Microsoft hangsúlyozta, hogy a Phi-4 képés túlmutatni a hasonló modellek teljesítményén, mivel képzési folyamata egyedi megközelítést alkalmaz. Ez a folyamat a szintetikus és kurált adatkészletek ötvözésére épül, valamint innovatív utólagos képzési technikákat alkalmaz, amelyek biztosítják a pontosságot és a skálázhatóságot.


Hogyan mérkőzik meg a Phi-4 a nagyobb modellekkel?


A jelenlegi trendekkel ellentétben – amelyek a minél nagyobb paraméterszámú modellek fejlesztésére összpontosítanak – a Phi-4 bebizonyította, hogy kisebb paraméterszámmal is lehet kiemelkedő teljesítményt elérni. Míg az olyan nagy nyelvi modellek (Large Language Models, LLM) mint a ChatGPT 4 vagy a Google Gemini Ultra több százmilliárd paraméterrel működnek, a Phi-4 kisebb léptékű, de mégis hatékonyabb alternatívát kínál.


Egy friss technikai jelentés szerint a Phi-4 80,4 pontot ért el a MATH benchmarkon, és képes volt felülmúlni más, hasonló kategóriájú modelleket a problémamegoldó és érvelési feladatokban. A modell számos újítást vezetett be, többek között a többágenses munkafolyamatok és az adatvezérelt innovációk integrálását, amely tovább növeli a következtetési hatékonyságot.


Verseny az iparban

A Phi-4 közvetlen versenytársai közé tartozik az OpenAI GPT-4o Mini, az Anthropic Claude 3 Haiku és a Google Gemini 1.5 Flash. Ezek a modellek mind sajátos alkalmazásokra optimalizáltak:

  • GPT-4o Mini: költséghatékony megoldás ügyféltámogatási rendszerekhez, nagy kontextusablakokat igénylő műveletekhez.

  • Claude 3 Haiku: kiváló az összegzésben és strukturálatlan dokumentumok feldolgozásában.

  • Gemini 1.5 Flash: multimodális alkalmazások terén jeleskedik, képes nagy méretű adathalmazok, mint videók és hanganyagok kezelésére.

A Microsoft állítása szerint a Phi-4 egyensúlyban tartja a teljesítményt és a hatékonyságot, ezzel megkérdőjelezve az ipar azon normáját, amely a nagyobb modellek preferálását helyezi előtérbe.

Fókuszban a felelősségteljes mesterséges intelligencia

A Microsoft különösen nagy hangsúlyt fektetett az etikus AI-fejlesztésre. A Phi-4 beépített biztonsági funkciókat tartalmaz, mint például az Azure AI Content Safety megoldásai, amelyek segítenek felismerni a káros promptokat és megóvni az adatok biztonságát. Ezen felül a platform valós idejű alkalmazásfigyelést is biztosít a felhasználók számára.

Az Azure AI Foundry, amely otthont ad a Phi-4-nek, eszközöket kínál az AI kockázatok mérésére és csökkentésére. A fejlesztők beépített mutatók és egyéni értékelések segítségével finomhangolhatják modelljeiket, biztosítva a felelős telepítést.

Mit jelent mindez az ipar számára?

A Phi-4 bemutatása jelentős hatást gyakorolhat a mesterséges intelligencia alkalmazásának jövőjére. Az, hogy kisebb méretű modellekkel is el lehet érni magas szintű teljesítményt, arra késztetheti a szervezeteket, hogy újragondolják a modell méretének és teljesítményének kapcsolatát.

A Phi-4 képességei, köztük az érvelés és a következtetés terén mutatott kiváló teljesítmény, lehetővé teszik olyan alkalmazások fejlesztését, amelyek a tudományos számításoktól kezdve a vállalati automatizációig terjednek.

A Microsoft ezen modelljével nemcsak technológiailag, hanem etikai szempontból is új mércét állít, amely irányadó lehet a mesterséges intelligencia jövőbeli fejlesztése szempontjából.

Osszd meg ezt a cikket
Hol tart ma valójában a mesterséges intelligencia?
A mesterséges intelligencia fejlesztése az elmúlt években látványos és gyakran lenyűgöző eredményeket produkált. Az olyan rendszerek, mint a ChatGPT, képesek természetes nyelvű szövegeket generálni, problémákat megoldani és sokszor az emberi teljesítményt is meghaladni különféle feladatokban. Ugyanakkor egyre több neves kutató és technológiai vezető – köztük John Carmack és François Chollet – hívja fel a figyelmet arra, hogy ezek az eredmények nem feltétlenül jelentik az általános mesterséges intelligencia (AGI) közeledtét. A színfalak mögött most új típusú problémák és kérdések kerültek a figyelem középpontjába, amelyek messze túlmutatnak a puszta teljesítményen.
A Rhino Linux új kiadással jelentkezik: 2025.3
A Linux disztribúciók körében főként kétféle szemléletmód terjedt el, vannak a stabil, ritkán frissülő rendszerek biztonságos kiszámíthatósággal, és a naprakész, de időnként kényes egyensúlyon balanszírozó, gördülő kiadású disztribúciók. A Rhino Linux ezt a két ellenpontot próbálja áthidalni, azaz egyszerre próbál naprakész lenni gördülő disztribúcióként, de alapként az Ubuntura épül, hogy megfelelő stabilitást is biztosítson.
SEAL az önmagát tanító mesterséges intelligencia előhírnöke
Hosszú évek óta tartja magát az elképzelés, hogy a mesterséges intelligencia fejlesztésének kulcsa az emberi tanítás: adatok, címkék, finomhangolás, gondosan megtervezett beavatkozások. Most azonban egy új megközelítés látott napvilágot. Az MIT kutatóinak legújabb munkája, a SEAL (Self-Adapting Language Models) névre keresztelt rendszer olyan nyelvi modelleket mutat be, amelyek képessé válnak saját maguk tanítására. Az eredmények nemcsak technológiai újdonságot jelentenek, hanem felvetik a kérdést: vajon milyen szerepet szánunk a jövőben az embernek az intelligens rendszerek képzésében?
Elég egy fotó és egy hang – az Alibaba új mesterséges intelligenciája teljes testű avatárt készít belőle
Egyetlen hangfelvétel és egy fotó is elegendő ahhoz, hogy élethű, teljes testtel mozgó, arcjátékkal és érzelmekkel teli virtuális karaktereket hozzunk létre – stúdió, színész vagy zöld háttér nélkül. Az Alibaba legújabb fejlesztése, az OmniAvatar nevű nyílt forráskódú mesterséges intelligencia-modell legalábbis éppen ezt ígéri. Bár a technológia még formálódik, már most is érdemes figyelmet szentelni annak, amit lehetővé tesz – és annak is, hogy mindez milyen új kérdéseket vet fel.
ALT Linux 11.0 Education az orosz oktatási intézmények fundamentuma
Az ALT Linux egy orosz gyökerekkel rendelkező, RPM csomagkezelőre épülő Linux disztribúció, amelynek alapjait a Sisyphus csomagtár képezi. Kezdetben orosz lokalizációs erőfeszítésekből nőtte ki magát, együttműködve olyan nemzetközi disztribúciókkal, mint a Mandrake és a SUSE Linux, különös tekintettel a cirill betűs írás támogatására.
A térbeli intelligencia a következő leküzdendő akadály az AGI előtt
Az LLM megszületésével a gépek lenyűgöző képességekre tettek szert. Ráadásul fejlődési sebességük is nagyobb tempóra kapcsolt, nap mint nap jelennek meg újabb modellek, amelyek még hatékonyabbak még jobb képességekkel ruházzák fel a gépeket. Ha azonban közelebbről megvizsgáljuk, ezzel a technológiával még csak most értük el, hogy a gépek képesek egy dimenzióban gondolkodni. A világ amelyben élünk azonban az emberi érzékelés alapján három dimenziós. Egy ember számára nem okoz gondot, hogy megállapítsa, hogy valami egy szék alatt van, vagy mögött, vagy egy felénk repülő labda körülbelül hová fog érkezni. Számos mesterséges intelligencia kutató szerint az AGI azaz a mesterséges általános intelligencia megszületéséhez el kell érni, hogy a gépek három dimenzióban gondolkodjanak, ehhez pedig ki kell fejleszteni a térbeli intelligenciát.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések