A VLC lejátszó hamarosan mesterséges intelligenciával generált feliratozásra lesz képes

A VideoLAN, a népszerű nyílt forráskódú médialejátszót a VLC-t fejlesztő nonprofit szervezet a Las Vegas-i CES 2025-ön jelentette be, hogy a szoftvert már több mint 6 milliárd alkalommal töltötték le világszerte. Ez a szám önmagában is lenyűgöző, de a fejlesztők egy igazán izgalmas új funkcióval is előrukkoltak.   

Mesterséges intelligencia a feliratozás szolgálatában

A VLC hamarosan képes lesz valós időben, mesterséges intelligencia segítségével feliratozni és fordítani a videókat. A legérdekesebb ebben az, hogy mindez helyben, a felhasználó eszközén történik majd, internetkapcsolat és felhőszolgáltatások igénybevétele nélkül.

Ez a megoldás több szempontból is előnyös:

  • Adatvédelem: Mivel a folyamat teljes egészében a felhasználó eszközén zajlik, nem kell attól tartani, hogy érzékeny információk kerülnek ki a netre.
  • Offline használat: Internetkapcsolat nélkül is működik, ami utazás vagy gyenge hálózati lefedettség esetén különösen hasznos lehet.
  • Többnyelvű támogatás: A rendszer képes lesz a feliratokat több nyelvre is lefordítani, bár a pontos nyelvi támogatás egyelőre nem ismert.

A VLC sikertörténete

A VLC története 1996-ban kezdődött, amikor párizsi diákok egy projektbe fogtak, hogy videókat streameljenek az egyetemi kampuszon. Azóta a szoftver hatalmas utat járt be, és ma már számos operációs rendszeren elérhető.

A VLC sikerének egyik kulcsa, hogy ingyenes és reklámmentes maradt, miközben folyamatosan fejlődött. Jean-Baptiste Kempf, a VideoLAN elnöke szerint a VLC aktív felhasználóinak száma még a streaming szolgáltatások korában is növekszik.

Mi várható a jövőben?

Bár a fejlesztők egyelőre nem árulták el, mikor lesz elérhető az új AI-alapú feliratozó funkció, ígéretet tettek arra, hogy hamarosan egy blogbejegyzésben részletesebben is bemutatják a technológiát. Addig is kíváncsian várjuk, milyen rendszerkövetelményei lesznek az új funkciónak, és pontosan milyen nyelveket fog támogatni.

A VLC újítása mindenképpen izgalmas fejlemény a médialejátszók világában. Ha beváltja a hozzá fűzött reményeket, jelentősen megkönnyítheti a külföldi tartalmak élvezetét, és új dimenziókat nyithat meg a videónézés terén.   

Osszd meg ezt a cikket
Mesterséges intelligencia, űr és emberiség
Elon Musk, a SpaceX, Tesla, Neuralink és xAI alapítója és vezetője egy közelmúltbeli interjúban osztotta meg gondolatait a jövő lehetséges irányairól, különös tekintettel a mesterséges intelligenciára, az űrbe való terjeszkedésre és az emberiség fejlődésére.
 Valós idejű zene komponálás a Google Magenta RT modelljével
A mesterséges intelligencia alkalmazása a zene komponálásban nem új keletű törekvés, ám a valós idejű működés sokáig jelentős akadályokba ütközött. A Google Magenta csapata most olyan fejlesztést mutatott be, amely a műfaj technikai és kreatív lehetőségeit egyaránt kiszélesítheti. A Magenta RealTime (röviden: Magenta RT) névre keresztelt új modell valós időben generál zenét, miközben nyitott forráskódjának köszönhetően bárki számára hozzáférhető.
Mit jelentene az Apple számára a Perplexity AI felvásárlása?
Az Apple régóta igyekszik megtalálni a helyét a generatív mesterséges intelligencia gyorsan alakuló piacán. A vállalat évtizedeken át stratégikusan kivárt, mielőtt jelentősebb erőforrásokat irányított volna mesterséges intelligencia-alapú fejlesztésekbe. Most azonban, a legfrissebb hírek szerint, a cupertinói cég egy minden eddiginél nagyobb szabású lépésre készülhet: belső körökben megindultak az egyeztetések a Perplexity AI nevű startup esetleges felvásárlásáról.
 Nanomásodpercek alatt dönt az új AI-chip ami épp most forradalmasítja az orvoslást és a távközlést
Ahogy egyre több eszköz kapcsolódik az internetre, és nő az igény az azonnali, nagy sávszélességet igénylő alkalmazások iránt – ilyenek például a felhőalapú játékok, a videóhívások vagy az okosotthonok –, egyre komolyabb kihívást jelent a vezeték nélküli hálózatok hatékony működtetése. A problémát tovább súlyosbítja, hogy a vezeték nélküli spektrum – vagyis a rendelkezésre álló frekvenciasáv – korlátozott. A megoldás keresése során a mérnökök egyre inkább a mesterséges intelligenciához fordulnak, ám a jelenlegi rendszerek sokszor lassúak és energiaigényesek. Ezen a helyzeten változtathat egy új fejlesztés, amely az adattovábbítást és -feldolgozást a fénysebességre emeli.
Így torzít az LLM
A mesterséges intelligencia (MI) fejlődésével párhuzamosan egyre több figyelem irányul az úgynevezett nagy nyelvi modellekre (LLM-ekre), amelyek már nemcsak a tudományos kutatásban, hanem a mindennapi élet számos területén is jelen vannak – például ügyvédi munkában, egészségügyi adatok elemzésében vagy számítógépes programok kódolásában. E modellek működésének megértése ugyanakkor továbbra is komoly kihívást jelent, különösen akkor, amikor azok látszólag megmagyarázhatatlan módon követnek el hibákat vagy adnak félrevezető válaszokat.
MiniMax-M1 AI modell, célkeresztben a nagy méretű szövegek kezelése
A mesterséges intelligencia rendszerek fejlődésével egyre nagyobb az igény olyan modellekre, amelyek nemcsak a nyelv értelmezésére képesek, hanem összetett, többlépcsős gondolkodási folyamatokat is képesek végigvinni. Az ilyen modellek kulcsfontosságúak lehetnek nemcsak elméleti feladatokban, hanem például szoftverfejlesztés vagy valós idejű döntéshozatal során is. Ezek az alkalmazások azonban különösen érzékenyek a számítási költségekre, amelyeket a hagyományos megközelítések gyakran nehezen tudnak kordában tartani.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések