Edit Template

ChatGPT Agent: Az AI, ami már gondolkodik és cselekszik


Összefoglalás

A ChatGPT Agent egy jelentős előrelépés az AI autonómiája terén, képessé téve a modellt arra, hogy komplex feladatokat hajtson végre a valós világban. Az Operator és a deep research funkciók egyesítése, valamint a saját virtuális számítógép használata teljesen új szintre emeli a ChatGPT funkcionalitását. Miközben a potenciális előnyök hatalmasak a mindennapi és szakmai életben, a fejlesztők komoly hangsúlyt fektetnek a biztonsági intézkedésekre, különösen a prompt injection és a biológiai kockázatok kezelésére, biztosítva a felhasználói kontrollt és az átláthatóságot. A kezdeti korlátok ellenére a jövőbeli fejlesztések további jelentős javulásokat ígérnek.


4 perc olvasási idő

Főbb témák és legfontosabb gondolatok/tények:

A ChatGPT Agent lényege és új képességei:

  • Gondolkodás és cselekvés összekapcsolása: A ChatGPT Agent “mostantól gondolkodik és cselekszik, proaktívan választva ügynöki képességek eszköztárából, hogy feladatokat hajtson végre Önnek a saját számítógépén.” Ez azt jelenti, hogy már nem csak válaszol a kérdésekre, hanem aktívan cselekszik is a célok elérése érdekében.
  • Önálló feladatvégzés: Képes komplex feladatokat kezelni elejétől a végéig, mint például “nézze meg a naptáramat, és tájékoztasson a közelgő ügyféltalálkozókról a friss hírek alapján”, “tervezzen és vásároljon alapanyagokat négy személyre japán reggeli készítéséhez”, vagy “elemezzen három versenytársat, és hozzon létre egy diashow-t.”
  • Integrált képességek: A “unified agentic system” egyesíti az “Operator” webes interakciós képességeit, a “deep research” információszintézisét és a ChatGPT intelligenciáját/beszélgetési folyékonyságát. Ez az integráció lehetővé teszi a weboldalak aktív kezelését (kattintás, szűrés, pontosabb eredmények gyűjtése) és a természetes átmenetet a beszélgetésből a cselekvésbe.
  • Virtuális számítógép és eszköztár: A ChatGPT Agent saját virtuális számítógépet használ, amely magában foglal egy “visual browser” (grafikus felületű webinterakcióhoz), egy “text-based browser” (egyszerűbb, érvelés-alapú lekérdezésekhez), egy terminált és közvetlen API hozzáférést. Képes ChatGPT csatlakozókat is használni (pl. Gmail, Github) releváns információk eléréséhez.
  • Interaktív és együttműködő munkafolyamatok: A felhasználó bármikor megszakíthatja a feladatot, tisztázhatja az utasításokat, átveheti a böngésző irányítását vagy leállíthatja a folyamatot. A modell proaktívan kérhet további részleteket is a felhasználótól.

A valós hasznosság és teljesítmény növelése:

  • Széles körű alkalmazás: Jelentősen növeli a ChatGPT hasznosságát mind a mindennapi, mind a szakmai kontextusban. Munkahelyen “automatizálhatja az ismétlődő feladatokat, mint például képernyőképek vagy irányítópultok szerkeszthető vektorelemekből álló prezentációkká alakítása”, és személyes életben “könnyedén tervezhet és foglalhat utazási útvonalakat, tervezhet és foglalhat teljes vacsorapartikat”.
  • Piacvezető (SOTA) teljesítmény a benchmarkokon:Humanity’s Last Exam (HLE): Új pass@1 SOTA pontszámot ért el 41.6-tal, és párhuzamos próbálkozásokkal 44.4-re nőtt.
  • FrontierMath: “27.4%-os pontosságot ért el, messze felülmúlva a korábbi modelleket”, köszönhetően az eszköztár használatának, mint például a terminálhoz való hozzáférés.
  • Belső, komplex valós feladatok: Kimenete “összehasonlítható vagy jobb, mint az embereké az esetek nagyjából felében” összetett, gazdaságilag értékes tudásmunka-feladatokon.
  • DSBench: “Jelentős mértékben felülmúlja az emberi teljesítményt” adatkutatási feladatokon.
  • SpreadsheetBench: Jelentősen felülmúlja a meglévő modelleket, 45.5%-os pontszámmal közvetlen táblázatkezelési képességgel.
  • Belső befektetési banki elemzői benchmark: Jelentősen felülmúlja a deep research és o3 modelleket.
  • BrowseComp: Új SOTA-t ért el 68.9%-kal, 17.4 százalékponttal magasabbal, mint a deep research.
  • WebArena: Javulást mutat az o3-alapú CUA-hoz képest.

Biztonság és kockázatkezelés:

  • Új kockázatok: A webes műveletek végrehajtásának képessége “új kockázatokat vezet be, különösen azért, mert a ChatGPT Agent közvetlenül dolgozhat az Ön adataival”.
  • Prompt Injekció: Különös hangsúlyt fektettek a “prompt injection” elleni védelemre, amely során rosszindulatú utasítások manipulálhatják a modell viselkedését (pl. privát adatok megosztása). A modell kiképzésre került az azonosításra és ellenállásra, kiegészítve monitorozással és explicit felhasználói megerősítéssel a következményekkel járó cselekvések előtt.
  • Modellhibák kezelése:Explicit felhasználói megerősítés: Engedélyt kér a valós következményekkel járó cselekvések előtt (pl. vásárlás).
  • Aktív felügyelet (“Watch Mode”): Bizonyos kritikus feladatokhoz (pl. e-mailek küldése) aktív felügyelet szükséges.
  • Proaktív kockázatcsökkentés: Képzésre került a magas kockázatú feladatok (pl. banki átutalások) aktív elutasítására.
  • Adatvédelem és hozzáférés-szabályozás:Adatvédelmi beállítások: Egy kattintással törölhető minden böngészési adat és kijelentkezhető az összes aktív weboldal-munkamenetből.
  • Biztonságos böngészőátvétel mód: “Az Ön bemenetei privátak maradnak. A ChatGPT nem gyűjt vagy tárol semmilyen adatot, amelyet Ön ezekben a munkamenetekben megad, például jelszavakat”.
  • Biológiai kockázat és a legátfogóbb biztonsági keretrendszer: A modell megnövekedett képességei miatt a ChatGPT Agent-et “magas biológiai és kémiai képességekkel rendelkezőként kezelik a felkészültségi keretrendszerünk szerint”. Ez a “valaha volt legátfogóbb biztonsági keretrendszert” jelenti, beleértve a fenyegetésmodellezést, a kettős felhasználású elutasítási képzést, az állandó osztályozókat és érvelési monitorokat, valamint a szigorú végrehajtási rendszereket. Külső szakértőkkel, biológiai biztonsági intézetekkel és kutatókkal is együttműködnek.
  • Bug Bounty program: Elindítottak egy hibavadász programot a valós kockázatok felderítése és orvoslása érdekében.

Elérhetőség és jövőbeli tervek:

  • Elérhetőség: Ma kezdődik a bevezetés a Pro, Plus és Team felhasználók számára, az Enterprise és Education felhasználók a következő hetekben kapnak hozzáférést. A Pro felhasználók 400 üzenetet kapnak havonta, más fizetős felhasználók 40-et, további használat rugalmas, kredit alapú opciókkal lehetséges.
  • Geográfiai korlátozások: Még dolgoznak a hozzáférés engedélyezésén az Európai Gazdasági Térségben és Svájcban.
  • Az Operator és deep research jövője: Az Operator kutatási előzetes oldal néhány hét múlva megszűnik. A deep research a ChatGPT Agent képességeinek része, de továbbra is elérhető külön funkcióként, ha valaki az eredeti, részletesebb alapértelmezett válaszokat preferálja.
  • Korlátok és fejlesztések: A ChatGPT Agent még “korai stádiumban van” és hibázhat. Különösen a diashow generálási funkció van béta állapotban, ahol a formázás és a kidolgozottság még javításra szorul, de a hangsúly az exportálható, szerkeszthető struktúrán van. A jövőben “folyamatos javulást” várnak a hatékonyság, mélység és sokoldalúság terén.

Fáy Péter

Kommentáld!

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük

Hasonló témák

A szerkesztő válogatása

  • All Post
  • Business - Gazdaság
  • Oktatás
  • Technológia
  • Trading - kereskedés
    •   Back
    • Elemzés
    • Kripto devizák
    • Forex
    • Részvények, Indexek
    • Pszichológia

Utolsó cikkek

  • All Post
  • Trading - kereskedés
    •   Back
    • Elemzés
    • Kripto devizák
    • Forex
    • Részvények, Indexek
    • Pszichológia

TURTLE
TANFOLYAM

A híres kísérlet után kapta nevét a kezdőknek szánt tanfolyamunk. Az alapoktól indulva, konkrét stratégiákig jutunk el.

KEZDŐKBŐL PROFIKAT

Célunk egy olyan gazdasági magazin létrehozása, amely elősegíti a hazai gazdasági tudatosság növekedését, és hozzájárul a tőzsdéhez, a devizakereskedelemhez, valamint más befektetési formákhoz való pozitívabb hozzáállás kialakításához.

Szerkesztők

Várkuti Géza

Fáy Péter

Csákó Zsuzsanna

Polyánszky Attila

Company

Obsydium Ltd.

TIN 60141463P
VAT CY60141463P

Christodolou Sozou 15
3035 Limassol CY

© 1997-2025 Obsydium Ltd.

Az egyes gazdasági adatok közlése, nem minősül befektetési tanácsadásnak, kizárólag a forrás véleményét tükrözik.