Az Open Web Index (OWI) az Európai Unió Horizont programjának keretében megvalósuló, nyílt forráskódú kezdeményezés, amelynek célja a webes keresési technológiák demokratizálása és az Európa digitális szuverenitásának erősítése. A projekt 2025 júniusában lép nyilvánosság elé, amikor is egy közös, mindenki számára hozzáférhető webindexet bocsát rendelkezésre, elválasztva az indexelési infrastruktúrát az azt hasznosító keresőszolgáltatásoktól. Ezzel az OWI nem csupán technikai újításokat kínál, hanem paradigmaváltást is a globális keresőpiacon, ahol ma több mint kilencven százalékos részesedésével egyetlen szereplő – a Google – határozza meg az online információhoz való hozzáférést.
A projekt alapgondolata, hogy a web feltérképezése, metaadatokkal való gazdagítása és indexelése közös európai erőforrásként működjön. A fejlesztés hatalmas adatközpontokban zajlik, amelyek naponta több terabájtnyi nyers adatot dolgoznak fel, és ezt a teljes indexet nyílt adatként teszik közzé. A szoftverkomponensek mind nyílt forráskódúak, a CIFF formátum pedig biztosítja, hogy a Lucene, Solr vagy Terrier alapú rendszerek gond nélkül kapcsolódhassanak az OWI-hoz. Így a kutatók és fejlesztők minimális erőfeszítéssel hozhatnak létre vertikális keresőmotorokat, amelyek specifikus szempontok – például fenntarthatósági vagy adatvédelmi prioritások – alapján rangsorolhatják a találatokat.
A feldolgozott webes tartalmakat a rendszer változatos metaadatokkal látja el, lehetővé téve, hogy a később épülő szolgáltatások személyre szabott rangsorolási stratégiákat alkalmazzanak. Ez hozzájárul, ahhoz, hogy a felhasználók az általuk preferált értékek mentén kereshetnek, vagy a fejlesztők olyan speciális nyelvi modelleket képezhetnek, amelyek nem egy kereskedelmi adatbázistól függenek. A 2024 szeptemberében készült piaci elemzés szerint a közös webindex makrogazdasági értéke eurómilliárdos nagyságrendet érhet el, ami jól mutatja a kezdeményezés stratégiai fontosságát az európai digitális gazdaság számára.
Az OWI többéves fejlesztői együttműködés eredményeként 2025 tavaszára nyerte el végleges formáját. A kilenc új partnerrel bővült konzorcium decemberben további közel egymillió euró kiegészítő forráshoz jutott, míg februárban a projekt vezetői egy fontos mérföldkövet ünnepeltek a federált adatinfrastruktúra megvalósulásában. A közvélemény számára a hivatalos bemutatkozás május közepén történt, és a kezdeti eredmények ismertetése nyáron Brüsszelben, a Next Generation Internet Forum keretében kerülnek publikálásra.
Noha a kezdeti finanszírozás és fejlesztés lezárult, a fenntarthatóság hosszú távú biztosítása még napirenden van. A konzorcium folyamatosan keresi azokat a szervezeti és közösségi modelleket, amelyek révén a nyílt index működését a Horizont-programon túli források is támogatni tudják. Emellett az oktatási és szakmai közösségek számára rendszeres webináriumokat szerveznek, ahol a résztvevők a keresőalkalmazások fejlesztésének, a rendszer architektúrájának gyakorlatban való alkalmazásának részleteit ismerhetik meg.