Forradalmi AI memóriarendszer MemOS

A nagy nyelvi modellek (LLM-ek) központi szerepet játszanak az általános mesterséges intelligencia (AGI) fejlesztésében, azonban jelenleg jelentős korlátokkal szembesülnek a memóriakezelés terén. A mai LLM-ek működésük során általában a rögzített súlyokba ágyazott tudásra és egy korlátozott kontextusablakra támaszkodnak, ami gátolja őket abban, hogy hosszabb ideig megőrizzék vagy frissítsék az információkat. Bár az olyan megközelítések, mint a visszakereséssel kiegészített generálás (RAG), integrálják a külső tudást, gyakran hiányzik belőlük a memóriára vonatkozó strukturált megközelítés. Ez gyakran olyan problémákhoz vezet, mint a korábbi interakciók elfelejtése, a csökkent alkalmazkodóképesség és a különböző platformok közötti elszigetelt memória. Lényegében a jelenlegi LLM-ek nem kezelik a memóriát tartós, kezelhető vagy megosztható erőforrásként, ami korlátozza gyakorlati hasznosságukat.

Ezekre a kihívásokra válaszul a MemTensor (Shanghai) Technology Co., Ltd., a Shanghai Jiao Tong University, a Renmin University of China és a China Telecom Kutatóintézet kutatói közösen fejlesztették ki a MemOS-t. Ez az újszerű memóriaoperációs rendszer a memóriát alapvető erőforrásként kezeli a nyelvi modellekben. A MemOS egyik kulcsfontosságú eleme a MemCube, egy egységes absztrakció, amely felügyeli a paraméteres, aktivációs és szöveges memóriát. A MemOS elősegíti a strukturált, nyomon követhető és feladatok közötti memóriakezelést, lehetővé téve a modellek folyamatos alkalmazkodását, a felhasználói preferenciák internalizálását és a konzisztens viselkedés fenntartását. Ez jelentős változást jelent, amely az LLM-eket statikus generátorokból dinamikus, fejlődő rendszerekké alakítja, amelyek képesek hosszú távú tanulásra és koordinációra különböző platformokon.

Ahogy az AI-rendszerek egyre összetettebbé válnak, és egyre többféle feladatot, szerepet és adattípust kezelnek, a nyelvi modelleknek túl kell lépniük a puszta szövegértésen, és magukba kell foglalniuk a memória megtartását és a folyamatos tanulást is. A jelenlegi LLM-ek strukturált memóriakezelés terén mutatkozó hiányosságai korlátozzák alkalmazkodási és növekedési képességüket az idő múlásával. A MemOS ezt úgy oldja meg, hogy a memóriát alapvető, ütemezhető erőforrásként kezeli, lehetővé téve a hosszú távú tanulást strukturált tárolás, verziókezelés és egységes memóriahozzáférés révén. A hagyományos képzési módszerekkel ellentétben a MemOS támogatja a folyamatos „memória-képzés” paradigmát, amely elmosja a tanulás és a következtetés közötti különbséget. Ezenkívül irányítási funkciókat is tartalmaz, amelyek biztosítják a nyomon követhetőséget, a hozzáférés-ellenőrzést és a biztonságos felhasználást a fejlődő AI-rendszerekben.

A MemOS-t memóriaközpontú operációs rendszerként tervezték nyelvi modellek számára, amely a memóriát nem csupán tárolt adatokként, hanem a modell kognitív folyamatainak aktív, fejlődő elemeként fogja fel. A memóriát három különálló típusba sorolja: a paraméteres memóriát, amely a modellek súlyaiba előzetes képzés vagy finomhangolás révén kódolt tudást foglalja magában; az aktivációs memóriát, amely az ideiglenes belső állapotokra utal, mint például a KV-cache-ek és a következtetés során használt figyelem-minták; valamint a sima szöveges memóriát, amely szerkeszthető és visszakereshető külső adatokból áll, beleértve a dokumentumokat és a promptokat. Ezek a memóriatípusok egy MemoryCube (MemCube) nevű egységes keretrendszerben működnek együtt, amely mind a tartalmat, mind a metaadatokat magában foglalja. Ez lehetővé teszi a dinamikus ütemezést, verziókezelést, hozzáférés-vezérlést és a memóriatípusok közötti átalakításokat. Ez a strukturált rendszer lehetővé teszi az LLM-ek számára, hogy alkalmazkodjanak, releváns információkat idézzenek fel és hatékonyan fejlesszék képességeiket, túllépve statikus generátorok szerepén.

A MemOS háromrétegű architektúrán működik: az interfészréteg feldolgozza a felhasználói beviteleket és memóriával kapcsolatos feladatokká alakítja őket; az operációs réteg kezeli a különböző memóriatípusok ütemezését, szervezését és fejlődését; az infrastruktúra réteg pedig biztosítja a biztonságos tárolást, a hozzáférés-irányítást és az ügynökök közötti együttműködést. A MemOS-on belüli összes interakciót a MemCubes segíti elő, biztosítva a nyomon követhető, szabályalapú memória műveleteket.

Összefoglalva, a MemOS egy memóriaoperációs rendszer, amely a memóriát az LLM-ek központi és kezelhető komponenseként pozícionálja. A hagyományos modellekkel ellentétben, amelyek elsősorban statikus modell súlyokra és rövid távú futási állapotokra támaszkodnak, a MemOS egységes keretrendszert vezet be a paraméteres, aktivációs és sima szöveges memória kezelésére. Központi eleme a MemCube, egy szabványosított memóriaegység, amely támogatja a strukturált tárolást, az életciklus-kezelést és a feladat-érzékeny memória-bővítést. Ez a rendszer elősegíti a koherensebb érvelést, a jobb alkalmazkodóképességet és a jobb ügynökök közötti együttműködést. A MemOS jövőbeli céljai között szerepel a modellek közötti memóriamegosztás lehetővé tétele, az önfejlődő memóriablokkok fejlesztése és egy decentralizált memóriapiac létrehozása a folyamatos tanulás és az intelligens fejlődés támogatása érdekében. 

Osszd meg ezt a cikket
Brutális negyedév az Apple-nél, de mi lesz az iPhone után?
Az Apple a globális gazdasági és kereskedelmi kihívások közepette ismét bizonyította rendkívüli piaci erejét, felülmúlva az elemzői várakozásokat a 2025-ös pénzügyi év harmadik negyedévében. A cupertinói óriás nem csupán rekordbevételt könyvelt el a júniussal zárult időszakban, de egy történelmi mérföldkövet is elért: leszállította a hárommilliárdodik iPhone-t. Ez az eredmény egy olyan korszakban született, amikor a vállalatot egyszerre sújtják a büntetővámok költségei és a mesterséges intelligencia területén tapasztalható, egyre élesedő verseny és számos kudarc amit a vállalat kénytelen volt elszenvedni.
A Micron 9650-el megérkezett a világ első megvásárolható PCIe 6.0 SSD-je
A mesterséges intelligencia és a nagy teljesítményű számítástechnika korában az adatok sebessége kulcsfontosságúvá vált. Ebben a folyamatosan gyorsuló digitális világban a Micron egy olyan technológiai ugrást jelentett be, amely újradefiniálja az adatközponti tárolásról alkotott képünket. Bemutatkozott a Micron 9650, a világ első PCIe 6.0 interfésszel rendelkező SSD-je, amely nem csupán egy újabb termék a piacon, hanem egy új korszak hírnöke a szerveroldali adattárolásban, páratlan sebességet és hatékonyságot ígérve.
Gondolkodásra tanít az OpenAI Study Mode
Az utóbbi években a mesterséges intelligenciának köszönhetően forradalmi változások indultak be az oktatásban, ahol a hangsúly egyre inkább a passzív információbefogadásról az aktív, mélyebb megértést célzó tanulási folyamatokra helyeződik át.
 Megjelent a Linux Kernel 6.16
Megjelent a Linux kernel 6.16-os verziója. Bár a kiadási folyamat a fejlesztők szerint a lehető legjobb értelemben vett „eseménytelenséggel” zajlott le, a felszín alatt jelentős fejlesztések történtek, amelyek biztonsági, teljesítménybeli és rendszerkezelési szempontból is előrelépést jelentenek. Eközben a soron következő 6.17-es verzió fejlesztése a megszokottnál kissé zavarosabban indult – ennek hátterében olyan emberi tényezők állnak, amelyek ritkán kerülnek reflektorfénybe egy ilyen méretű nyílt forráskódú projekt esetében.
Mi az a WhoFi?
A vezeték nélküli internet, vagyis a WiFi, ma már életünk szinte mindenütt jelenlévő, nélkülözhetetlen része. Arra használjuk, hogy eszközeinket a világhálóra csatlakoztassuk, kommunikáljunk és információt cseréljünk. Képzeljük el azonban, ha ugyanez a technológia, amely láthatatlanul szövi be otthonainkat és városainkat, képes lenne arra is, hogy kamerák nélkül, akár falakon keresztül is azonosítson és kövessen bennünket. Ez a gondolat nem a távoli jövő sci-fi forgatókönyve, hanem egy újonnan kifejlesztett technológia, a WhoFi valósága, amely a WiFi jelek egy eddig kiaknázatlan tulajdonságát használja fel. A helyzetet bonyolítja, hogy a „WhoFi” név egy teljesen más, közösségi célokat szolgáló szolgáltatást is takar, így a kifejezés hallatán fontos tisztázni, melyik jelentéséről van szó.
Felfokozott a várakozás GPT-5 megjelenése kapcsán, de mégis mire kell számítanunk?
Az OpenAI következő nyelvi modellje, a GPT-5, az elmúlt hónapok egyik legjobban várt technológiai fejlesztése lett. A GPT-4o és a speciális o1 modellek megjelenése után a figyelem most a következő generációs nyelvi modellre irányul, amely a pletykák és a vállalat vezetőinek elejtett megjegyzései szerint jelentős előrelépést hozhat a mesterséges intelligencia képességeiben. De mit tudunk eddig, és mi az, ami csupán spekuláció?