Az OpenAI piacra dobta az o3-pro-t, egy olyan AI-modellt, amelyről a vállalat azt állítja, hogy ez az eddigi legképesebb modellje.
Az O3-pro az OpenAI o3-ának egy változata, egy érvelési modellé, amelyet a startup idén korábban indított el. A hagyományos AI-modellekkel ellentétben az érvelési modellek lépésről lépésre oldják meg a problémákat, ami lehetővé teszi számukra, hogy megbízhatóbban teljesítsenek olyan területeken, mint a fizika, a matematika és a kódolás.
Az O3-pro keddtől elérhető a ChatGPT Pro és Team felhasználók számára, felváltva az o1-pro modellt. Az OpenAI szerint az Enterprise és Edu felhasználók egy héttel később kapnak hozzáférést. Az O3-pro ma délutántól az OpenAI fejlesztői API-jában is elérhető.
Az O3-pro ára az API-ban 20 dollár millió bemeneti tokenenként és 80 dollár millió kimeneti tokenenként. A bemeneti tokenek a modellbe betáplált tokenek, míg a kimeneti tokenek azok a tokenek, amelyeket a modell a bemeneti tokenek alapján generál.
Egy millió bemeneti token körülbelül 750 000 szónak felel meg, ami valamivel hosszabb, mint a „Háború és béke”.
„Szakértői értékelések szerint az értékelők következetesen az o3-pro-t részesítették előnyben az o3-mal szemben minden tesztelt kategóriában, különösen olyan kulcsfontosságú területeken, mint a tudomány, az oktatás, a programozás, az üzlet és az írási segítség” – írja az OpenAI a változási naplóban. „Az értékelők az o3-pro-t következetesen magasabbra értékelték az egyértelműség, az átfogó jelleg, az utasításkövetés és a pontosság tekintetében is.”
Az OpenAI szerint az O3-pro hozzáfér eszközökhöz, lehetővé téve számára az interneten való keresést, fájlok elemzését, vizuális bemenetek elemzését, Python használatát, válaszainak személyre szabását a memória felhasználásával és még sok mást. Hátrányként az OpenAI szerint a modell válaszai jellemzően tovább tartanak, mint az o1-pro esetében.
Az O3-pro-nak más korlátai is vannak. A modellel folytatott ideiglenes csevegések a ChatGPT-ben jelenleg le vannak tiltva, amíg az OpenAI egy „technikai problémát” old meg. Az O3-pro nem tud képeket generálni. Emellett a Canvas, az OpenAI mesterséges intelligenciával működő munkaterület funkciója, sem támogatott az O3-pro által.
Pozitívum, hogy az O3-pro lenyűgöző pontszámokat ér el a népszerű mesterséges intelligencia benchmarkokon, az OpenAI belső tesztjei szerint. Az AIME 2024-en, amely a modell matematikai képességeit értékeli, az O3-pro jobban teljesít, mint a Google legjobban teljesítő AI-modellje, a Gemini 2.5 Pro. Az O3-pro emellett legyőzi az Anthropic nemrég megjelent Claude 4 Opusát a GPQA Diamond teszten is, amely a PhD szintű tudományos ismereteket méri.
