Google Gemini CLI, erős ajánlat a terminálból elérhető AI-k mezőnyében

A Google által nemrég bejelentett Gemini CLI egy nyílt forráskódú, parancssoros AI-eszköz, amely a Gemini 2.5 Pro nagy nyelvi modellt integrálja közvetlenül a terminálba. A kezdeményezés célja nem kevesebb, mint hogy a természetes nyelvi utasításokat valódi technikai munkafolyamatokká alakítsa, méghozzá egy olyan környezetben, amely sokak számára már eddig is a hatékonyság szinonimája volt.

A Gemini CLI lehetővé teszi, hogy a felhasználók természetes nyelven kommunikáljanak a modellel, legyen szó kódelemzésről, hibakeresésről, dokumentáció készítéséről vagy akár valós idejű webes információk elemzéséről. A rendszer ereje részben abban rejlik, hogy ugyanazt a háttérrendszert használja, mint a Gemini Code Assist, amely már korábban is elérhető volt például a Visual Studio Code-ban. Így azok, akik az integrált fejlesztői környezeteken kívül, parancssorban dolgoznak, most ugyanezeket a képességeket érhetik el a saját eszközeikben, bármiféle kompromisszum nélkül.

A CLI használata meglepően egyszerű: egy rövid telepítési parancs, egy Google-fiókkal való hitelesítés, és máris használatba vehető a modell. A felhasználási keretek bőségesek: napi 1000, percenként akár 60 kérés is engedélyezett ingyenesen, ami kiemelkedőnek számít az iparági gyakorlatban. A háttérben futó Gemini 2.5 Pro modell akár egymillió tokennyi kontextust is képes kezelni, így hosszabb beszélgetések, bonyolultabb feladatok esetén is stabilan és konzisztensen működik.

A telepítéshez szükség lehet NodeJS-re, de fejlesztőknél ez gyakran megvan a gépen, ha nem akkor a NodeJS hivatalos oldaláról be lehet szerezni.

Ezután telepíteni kell a Gemini CLI-t Linux terminálban vagy Windows konzolban: npm install -g @google/gemini-cli

Majd a gemini parancsal lehet elindítani az alkalmazást.

A Gemini CLI használata nemcsak interaktív módon történhet: beépíthető szkriptekbe, CI/CD-folyamatokba vagy épp más automatizált munkafolyamatokba is. Ha eddig fizetős API-kat használtunk AI modellek hívására, akkor ez az ingyenes lehetőség akár kiválthatja azt, ha nincs szükségünk túl sok kérés feldolgozására. A konfigurálhatóság terén is figyelemre méltó: a GEMINI.md fájl segítségével előre definiálható kontextus, rendszerutasítások, vagy épp projekt-specifikus működés. A fejlesztők így valóban testre szabhatják az eszközt a saját igényeiknek megfelelően.

Például a következő nem túl fantáziadús bash scriptben megkérjük a modellt hogy listázza ki az összes fájlt az aktuális könyvtárban ahonnan a scriptet futtatjuk: 

 #!/bin/bash

gemini --prompt “list files in the current directory” 

Bővebb információk erről és sok egyéb másról a projekt GitHub oldalán elérhető.

Külön figyelmet érdemel, hogy a rendszer képes valós idejű információk feldolgozására, köszönhetően a Google kereső integrációjának és az úgynevezett Model Context Protocol (MCP) támogatásának. Ez azt jelenti, hogy nem csupán statikus modellként működik, hanem képes reagálni az aktuális, weben található információkra is. A multimodális eszközökkel való integráció, mint az Imagen (képalkotás) vagy a Veo (videók generálása), tovább bővíti a használhatósági kört. 

Gemini CLI keresés a weben
Gemini CLI keresés a weben

A nyílt forráskódú licenc (Apache 2.0) révén bárki szabadon tanulmányozhatja, módosíthatja vagy továbbfejlesztheti a kódot. Ez nemcsak technikai, hanem etikai szempontból is fontos lépés, hiszen a transzparens működés hozzájárulhat a közösségi bizalom kialakulásához és az AI-fejlesztések nyíltabb, demokratikusabb jövőjéhez.

A Google jelen lépése arra utal, hogy a mesterséges intelligencia a fejlesztői/felhasználói eszköztárakba való szerves integráció felé halad – nem mint külön modul, hanem mint beépülő, intelligens réteg. A Gemini CLI nem forradalmat ígér, hanem egy csendes, de határozott lépést az automatizált és természetes nyelvi vezérlésű fejlesztési gyakorlat felé. Ebben rejlik valódi jelentősége. 

Osszd meg ezt a cikket
Hol tart ma valójában a mesterséges intelligencia?
A mesterséges intelligencia fejlesztése az elmúlt években látványos és gyakran lenyűgöző eredményeket produkált. Az olyan rendszerek, mint a ChatGPT, képesek természetes nyelvű szövegeket generálni, problémákat megoldani és sokszor az emberi teljesítményt is meghaladni különféle feladatokban. Ugyanakkor egyre több neves kutató és technológiai vezető – köztük John Carmack és François Chollet – hívja fel a figyelmet arra, hogy ezek az eredmények nem feltétlenül jelentik az általános mesterséges intelligencia (AGI) közeledtét. A színfalak mögött most új típusú problémák és kérdések kerültek a figyelem középpontjába, amelyek messze túlmutatnak a puszta teljesítményen.
A Rhino Linux új kiadással jelentkezik: 2025.3
A Linux disztribúciók körében főként kétféle szemléletmód terjedt el, vannak a stabil, ritkán frissülő rendszerek biztonságos kiszámíthatósággal, és a naprakész, de időnként kényes egyensúlyon balanszírozó, gördülő kiadású disztribúciók. A Rhino Linux ezt a két ellenpontot próbálja áthidalni, azaz egyszerre próbál naprakész lenni gördülő disztribúcióként, de alapként az Ubuntura épül, hogy megfelelő stabilitást is biztosítson.
SEAL az önmagát tanító mesterséges intelligencia előhírnöke
Hosszú évek óta tartja magát az elképzelés, hogy a mesterséges intelligencia fejlesztésének kulcsa az emberi tanítás: adatok, címkék, finomhangolás, gondosan megtervezett beavatkozások. Most azonban egy új megközelítés látott napvilágot. Az MIT kutatóinak legújabb munkája, a SEAL (Self-Adapting Language Models) névre keresztelt rendszer olyan nyelvi modelleket mutat be, amelyek képessé válnak saját maguk tanítására. Az eredmények nemcsak technológiai újdonságot jelentenek, hanem felvetik a kérdést: vajon milyen szerepet szánunk a jövőben az embernek az intelligens rendszerek képzésében?
Elég egy fotó és egy hang – az Alibaba új mesterséges intelligenciája teljes testű avatárt készít belőle
Egyetlen hangfelvétel és egy fotó is elegendő ahhoz, hogy élethű, teljes testtel mozgó, arcjátékkal és érzelmekkel teli virtuális karaktereket hozzunk létre – stúdió, színész vagy zöld háttér nélkül. Az Alibaba legújabb fejlesztése, az OmniAvatar nevű nyílt forráskódú mesterséges intelligencia-modell legalábbis éppen ezt ígéri. Bár a technológia még formálódik, már most is érdemes figyelmet szentelni annak, amit lehetővé tesz – és annak is, hogy mindez milyen új kérdéseket vet fel.
ALT Linux 11.0 Education az orosz oktatási intézmények fundamentuma
Az ALT Linux egy orosz gyökerekkel rendelkező, RPM csomagkezelőre épülő Linux disztribúció, amelynek alapjait a Sisyphus csomagtár képezi. Kezdetben orosz lokalizációs erőfeszítésekből nőtte ki magát, együttműködve olyan nemzetközi disztribúciókkal, mint a Mandrake és a SUSE Linux, különös tekintettel a cirill betűs írás támogatására.
A térbeli intelligencia a következő leküzdendő akadály az AGI előtt
Az LLM megszületésével a gépek lenyűgöző képességekre tettek szert. Ráadásul fejlődési sebességük is nagyobb tempóra kapcsolt, nap mint nap jelennek meg újabb modellek, amelyek még hatékonyabbak még jobb képességekkel ruházzák fel a gépeket. Ha azonban közelebbről megvizsgáljuk, ezzel a technológiával még csak most értük el, hogy a gépek képesek egy dimenzióban gondolkodni. A világ amelyben élünk azonban az emberi érzékelés alapján három dimenziós. Egy ember számára nem okoz gondot, hogy megállapítsa, hogy valami egy szék alatt van, vagy mögött, vagy egy felénk repülő labda körülbelül hová fog érkezni. Számos mesterséges intelligencia kutató szerint az AGI azaz a mesterséges általános intelligencia megszületéséhez el kell érni, hogy a gépek három dimenzióban gondolkodjanak, ehhez pedig ki kell fejleszteni a térbeli intelligenciát.

Az elmúlt néhány napban megjelent Linux disztribúció frissítések