Edit Template

A Google bemutatja a Gemini 3-at: Egy új fejezet a mesterséges intelligencia korszakában

Összefoglalás

A Google bemutatta a Gemini 3-at, az eddigi legintelligensebb és legfejlettebb multimodális mesterséges intelligencia modelljét. A modell a legfontosabb iparági mérföldköveken (benchmarkokon) csúcsteljesítményt nyújt, és a bejelentéssel egy időben már elérhetővé is vált a Google kulcsfontosságú termékeiben, mint például a Keresőben és a Gemini alkalmazásban. A bevezetéssel párhuzamosan a vállalat egy új, fejlesztőknek szánt platformot is elindított Google Antigravity néven, amely az ágens alapú szoftverfejlesztés új korszakát hivatott megnyitni.

8 perc olvasási idő

A Gemini-korszak új mérföldköve

A Google közel két évvel ezelőtt indította útjára a „Gemini-korszakot”, amely a vállalat egyik legnagyobb tudományos és termékfejlesztési vállalkozásává nőtte ki magát. A mostani bejelentés ennek a stratégiának a következő jelentős evolúciós lépése. Sundar Pichai, a Google és az Alphabet vezérigazgatójának közleménye szerint a korábbi Gemini verziók elképesztő népszerűségre tettek szert: az AI Overviews funkciónak havonta 2 milliárd felhasználója van, a Gemini alkalmazás pedig átlépte a havi 650 milliós felhasználószámot. Emellett a Google Cloud ügyfeleinek több mint 70%-a használja a vállalat AI-megoldásait, ami jól mutatja a technológia széles körű üzleti elterjedését.

A fejlődés útja egyértelműen kirajzolódik. A Gemini 1 áttörést hozott a natív multimodalitás és a hosszú kontextusablak terén, míg a Gemini 2 az ágens képességekre és a fejlett logikai következtetésre helyezte a hangsúlyt, ami odáig vezetett, hogy a Gemini 2.5 Pro több mint hat hónapig vezette az LMArena ranglistát. A most bemutatott Gemini 3 mindezeket a képességeket egyetlen, rendkívül intelligens modellben egyesíti. Ahogy Pichai fogalmazott, a mesterséges intelligencia mindössze két év alatt eljutott oda, hogy „már nemcsak szöveget és képeket olvas, hanem képes a helyzetet is felmérni”, ami a kontextus és a szándék mélyebb megértésére utal.

A Gemini 3: Az eddigi legintelligensebb modell

A Gemini 3 a Google új zászlóshajó modellje, amelynek stratégiai célja, hogy a világ legjobbja legyen a multimodális megértés és az ágens képességek terén. Demis Hassabis és Koray Kavukcuoglu, a Google DeepMind vezetőinek nyilatkozata szerint a modell a vállalat eddigi legerősebb alkotása. A Gemini 3 Pro válaszai intelligensek, tömörek és direktek, a közhelyeket és a hízelgést valódi meglátásokra cserélik – azt közli, amit hallanod kell, nem csupán azt, amit hallani akarsz.

A Gemini 3 Pro lenyűgöző eredményekkel igazolja státuszát a legfontosabb AI-mérföldköveken, jelentősen felülmúlva elődjét. A legfontosabb eredmények a következők:

  • LMArena Leaderboard: Áttörést jelentő 1501 Elo pontszámot ért el.
  • Humanity’s Last Exam: Eszközök használata nélkül 37,5%-os eredményt produkált, ami PhD-szintű logikai képességeket jelez.
  • GPQA Diamond: 91,9%-os pontszámot ért el.
  • MathArena Apex: Új csúcsot állított fel 23,4%-os eredménnyel.
  • Multimodális tesztek: Az MMMU-Pro teszten 81%-ot, míg a Video-MMMU-n 87,6%-ot ért el.
  • Ténybeli pontosság (SimpleQA Verified): 72,1%-os pontosságot mutatott.
Benchmark Leírás Gemini 3 Pro Gemini 2.5 Pro Claude Sonnet 4.5 GPT-5.1
Humanity’s Last Exam Akadémiai logikai következtetés Eszközök nélkül / kereséssel és kódfuttatással 37.5% 45.8% 21.6% 13.7% 26.5%
ARC-AGI-2 Vizuális logikai feladványok ARC Prize Verified 31.1% 4.9% 13.6% 17.6%
GPQA Diamond Tudományos tudás Eszközök nélkül 91.9% 86.4% 83.4% 88.1%
AIME 2025 Matematika Eszközök nélkül / kódfuttatással 95.0% 100% 88.0% 87.0% 100% 94.0%
MathArena Apex Versenyszintű, nehéz matematikai feladatok 23.4% 0.5% 1.6% 1.0%
MMMU-Pro Multimodális megértés és következtetés 81.0% 68.0% 68.0% 76.0%
ScreenSpot-Pro Képernyőn megjelenő információk értelmezése 72.7% 11.4% 36.2% 3.5%
CharXiv Reasoning Információkinyerés grafikonokból 81.4% 69.6% 68.5% 69.5%
OmniDocBench 1.5 OCR Átlagos edit distance – minél alacsonyabb, annál jobb 0.115 0.145 0.145 0.147
Video-MMMU Videókból szerzett tudás 87.6% 83.6% 77.8% 80.4%
LiveCodeBench Pro Versenykódolási feladatok (Codeforces, ICPC, IOI) Elo érték – minél magasabb, annál jobb 2,439 1,775 1,418 2,243
Terminal-Bench 2.0 Ágens terminálos kódfeladatok Terminus-2 ágens 54.2% 32.6% 42.8% 47.6%
SWE-Bench Verified Ágens kódolás Egy próbálkozás 76.2% 59.6% 77.2% 76.3%
t2-bench Ágens eszközhasználat 85.4% 54.9% 84.7% 80.2%
Vending-Bench 2 Hosszú távú ágenses tervezés Átlagos nettó érték – minél magasabb, annál jobb $5,478.16 $573.64 $3,838.74 $1,473.43
FACTS Benchmark Suite Belső tények, paraméterek, multimodális és keresési benchmarkok 70.5% 63.4% 50.4% 50.8%
SimpleQA Verified Parametrikus tudás 72.1% 54.5% 29.3% 34.9%
MMLU Többnyelvű kérdés-válasz (Multilingual Q&A) 91.8% 89.5% 89.1% 91.0%
Global PIQA Mindennapi józan észre épülő következtetés 100 nyelven és kultúrán 93.4% 91.5% 90.1% 90.9%
MRCR v2 (8-needle) Hosszú kontextusú teljesítmény 128k (átlag) / 1M (pontszerű) 77.0% 26.3% 58.0% 16.4% 47.1% 61.6%

A 91,9%-os GPQA Diamond pontszám a diplomás szintű, szakértői kérdések megválaszolásában mutatott jártasságot igazolja, míg a MathArena Apex teszten elért új csúcs a modell határterületi matematikai problémamegoldó képességét demonstrálja. Ezek nem csupán elvont számok, hanem a modell megbízhatóságának és tudományos pontosságának kézzelfogható bizonyítékai.

A Gemini 3 Deep Think mód

A Google bemutatta a „Gemini 3 Deep Think” módot is, amely egy továbbfejlesztett logikai következtetési képességekkel rendelkező verzió. Célja, hogy a legnehezebb problémák megoldásában is áttörést érjen el. A tesztek során ez a mód még a már amúgy is lenyűgöző Gemini 3 Pro teljesítményét is felülmúlta:

  • Humanity’s Last Exam: 41,0%-os eredményt ért el.
  • GPQA Diamond: 93,8%-os pontszámot produkált.
  • ARC-AGI-2: Példa nélküli 45,1%-ot ért el, ami az újszerű kihívások megoldásában mutatott képességeit dicséri.

A Deep Think mód kezdetben biztonsági tesztelők számára válik elérhetővé, mielőtt a Google AI Ultra előfizetői is hozzáférhetnének. Ezek a kiemelkedő technikai mérőszámok képezik az alapot a Gemini 3 azon gyakorlati képességeihez, amelyek átalakítják a tanulás, az alkotás és a tervezés folyamatait.

final dt blog evals 2 copy

Gyakorlati alkalmazások: Tanulás, alkotás és tervezés

A Gemini 3 fejlett képességei három fő területen jelentenek konkrét előnyöket a felhasználók számára: a tanulás, az alkotás és a tervezés folyamatában.

A modell képes zökkenőmentesen szintetizálni a különböző modalitásokból (szöveg, kép, videó, kód) származó információkat. A gyakorlatban ez azt jelenti, hogy képes például kézzel írt családi recepteket megfejteni és lefordítani, tudományos cikkekből interaktív tanulókártyákat generálni, vagy egy pickleball meccsről készült videó elemzése után személyre szabott edzéstervet készíteni. A Google Kereső AI módjában a Gemini 3 új, generatív felhasználói felületeket hoz létre, például interaktív szimulációkat készít komplex tudományos témák megértéséhez.

A fejlesztők számára a Gemini 3 a vállalat eddigi legjobb „ágens alapú kódolási” és „vibe coding” modellje. Utóbbi azt a képességet jelenti, hogy a modell nemcsak precíz, technikai utasításokból, hanem absztrakt vagy stílusbeli leírásokból is képes komplex, interaktív felhasználói felületeket generálni. A modell vezető helyen áll a fejlesztői benchmarkokon: 1487 Elo pontot ért el a WebDev Arena ranglistán, 76,2%-os eredményt az SWE-bench Verified teszten, és 54,2%-ot a Terminal-Bench 2.0-n, amely a modell terminálon keresztüli, eszközhasználati képességeit méri.

Ezeket a képességeket a Google egy új platformon, a Google Antigravity-n teszi elérhetővé. Ez a platform paradigmaváltást jelent: az AI már nem csupán asszisztens, amely kódrészleteket javasol, hanem egy autonóm partner. Az ágensek önállóan képesek megtervezni és végrehajtani komplex szoftveres feladatokat, miközben folyamatosan validálják a saját kódjukat. Ez a megközelítés alapjaiban változtatja meg a fejlesztői munkafolyamatot, a soronkénti kódolásról a magas szintű feladatmeghatározásra helyezve a hangsúlyt, ami jelentősen növelheti a produktivitást és felgyorsíthatja az innovációs ciklusokat.

Hosszú távú tervezés és ágens képességek

A Gemini 3 jelentős előrelépést tett a hosszú távú tervezési képességek terén is. Ezt igazolja a Vending-Bench 2 teszten elért első helyezése, amely egy szimulált vállalkozás egy éven át tartó menedzselését méri. A modell képes volt következetes döntéseket hozni anélkül, hogy letért volna a feladatról. A gyakorlatban ez azt jelenti, hogy a Gemini 3 hatékonyabban tud segíteni összetett, több lépésből álló feladatok elvégzésében, például helyi szolgáltatások lefoglalásában vagy egy e-mail fiók rendszerezésében. Ezek a funkciók a Google AI Ultra előfizetők számára a „Gemini Agent” segítségével már ma is elérhetők.

Felelős fejlesztés és biztonság

A Google hangsúlyozza, hogy a Gemini 3 az eddigi legbiztonságosabb modelljük, amely a vállalat történetének legátfogóbb biztonsági értékelésén esett át. A forrás szerint a modell kevésbé hajlamos a túlzott hízelgésre („sycophancy”), jobban ellenáll a rosszindulatú utasításoknak (prompt injection), és fokozott védelmet nyújt a visszaélésekkel szemben. A belső tesztelések mellett a Google külső partnerekkel is együttműködött, többek között a brit AISI-vel, valamint független szakértői értékeléseket kért olyan cégektől, mint az Apollo, a Vaultis és a Dreadnode.

Elérhetőség és a Gemini 3 jövője

A Gemini 3 sorozat bevezetése a mai nappal megkezdődött, és a következő hetekben folytatódik.

A Gemini 3 Pro a következő platformokon érhető el:

  • Minden felhasználó számára: a Gemini alkalmazásban, valamint a Google AI Pro és Ultra előfizetőknek a Kereső AI módjában.
  • Fejlesztőknek: a Gemini API-n keresztül az AI Studio-ban, a Google Antigravity platformon és a Gemini CLI-ben.
  • Vállalati ügyfeleknek: a Vertex AI-ban és a Gemini Enterprise-ban.

A Gemini 3 Deep Think mód a további biztonsági teszteket követően a következő hetekben válik elérhetővé a Google AI Ultra előfizetők számára.

Záró gondolatok

A Gemini 3 bevezetése egyértelműen egy új, jelentős fejezetet nyit a Google mesterséges intelligenciára vonatkozó törekvéseiben, tovább feszegetve az intelligencia és az ágens képességek határait. A vállalat tervei szerint a Gemini 3 sorozat hamarosan további modellekkel bővül, megerősítve, hogy a Google stratégiájának középpontjában már nem csupán az információszerzés, hanem az autonóm cselekvés képessége áll.


Források:

Ha szeretne többet tudni, tájékozottabb lenni a tőzsde, a befektetés, vagy akár az aktív kereskedés témájában: Állunk rendelkezésére. Kérjen egy kapcsolattartó tanácsadót:

Fáy Péter

Kommentáld!

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

Hasonló témák

A szerkesztő válogatása

  • All Post
  • Business - Gazdaság
  • Oktatás
  • Technológia
  • Trading - kereskedés
    •   Back
    • Elemzés
    • Kripto devizák
    • Forex
    • Részvények, Indexek
    • Pszichológia

Utolsó cikkek

  • All Post
  • Trading - kereskedés
    •   Back
    • Elemzés
    • Kripto devizák
    • Forex
    • Részvények, Indexek
    • Pszichológia

TURTLE
TANFOLYAM

A híres kísérlet után kapta nevét a kezdőknek szánt tanfolyamunk. Az alapoktól indulva, konkrét stratégiákig jutunk el.

KEZDŐKBŐL PROFIKAT

Célunk egy olyan gazdasági magazin létrehozása, amely elősegíti a hazai gazdasági tudatosság növekedését, és hozzájárul a tőzsdéhez, a devizakereskedelemhez, valamint más befektetési formákhoz való pozitívabb hozzáállás kialakításához.

Szerkesztők

Várkuti Géza

Fáy Péter

Csákó Zsuzsanna

Polyánszky Attila

Company

Obsydium Ltd.

TIN 60141463P
VAT CY60141463P

Christodolou Sozou 15
3035 Limassol CY

© 1997-2025 Obsydium Ltd.

Az egyes gazdasági adatok közlése, nem minősül befektetési tanácsadásnak, kizárólag a forrás véleményét tükrözik.