Google elindította a Gemini 3 Deep Think‑et – egy fejlett MI‑szolgáltatást tudományos feladatokhoz, amely folyamatosan „hangolja” a válaszait a kéréshez.
Google bemutatta a Gemini 3 Deep Think frissített verzióját
A Google vállalat bejelentette a Gemini 3 Deep Think platformjának új, jelentős frissítését – olyan mesterséges intelligenciát, amely képes gondolkodni és megoldani összetett tudományos‑mérnöki feladatokat.
Mi változott
Paraméter Új Megjelenés Cél Átállás a tiszta elméletből a gyakorlati alkalmazásba Feladatok megoldása egyértelmű korlátok nélkül, hiányzó adatokkal Hozzáférés Beépítve a Gemini alkalmazásba A Google AI Ultra előfizetők használhatják, API-n keresztül – mérnökök és vállalatok (jelentkezés szükséges) Fejlesztői partnerek Tudós‑kutatók Együttműködés bonyolult feladatokon
Teljesítménymutatók
Teszt Eredmény Megjegyzés Humanity’s Last Exam 48,4 % Külső eszközök nélkül ARC‑AGI‑284,6 % AI-alkalmazó benchmark Codeforces (Elo) 3455 Magas rang a programozási megoldások között IMO 2025 Aranyérmes Egyenértékű a nemzetközi olimpián résztvevőkkel Kémia/Fizika Ugyanaz az eredmény Mutatja a sokoldalúságot különböző tantárgyakban CMT‑Benchmark (elméleti fizika) 50,5 % Jó kezelés komplex fogalmak
AI-ügynök „Aletheia”
DeepMind Google laboratóriumában létrehozták az Aletheia ügynöket a Gemini 3 Deep Think alapjaira. Fő jellemzők:
1. Hipotézis ellenőrzése – az ügynök felismeri a gyengeségeket a javasolt megoldásokban és iteratív módon korrigálja őket.
2. Bizonytalanság elismerése – tudomásul veszi, ha nem ismer választ.
3. Közvetlen kapcsolat külső forrásokkal – használja a Google keresőszolgáltatást és web‑navigációt, de kerül az álhivatkozások kitalálását.
Elért szintek
A Google öt fokozatra bontotta Aletheia sikereit:
Fokozat Leírás Példák 0 – „kisebb újdonság” Teljesen autonóm mód, három Erdős‑feladat megoldva (első szint) Három Erdős‑feladat 1 – „minimális újdonság” Egy további eredmény autonóm módban Negyedik feladat 2 – „közzétételre alkalmas” Eredmények önállóan és emberi együttműködésben, valamint segédes eszközök Adott feladatok 3–4 – „jelentős/megforduló áttörés” Még nem elérték —
Hogyan kezeli Aletheia Erdős‑feladatokat
* 700 eddig megoldatlan problémából az ügynök 13-at sikerült megoldania.
* Azonban csak 4 új – a többi már ismert a tudományos közösségben.
* 212 bemeneti megoldásból mindössze 6,5 % volt tartalmi helyes; 68,5 % alapvető hibákat tartalmazott, és 31,5 % – félreértelmezte a feladatot.
A fejlesztők kiemelik, hogy az AI hajlamos „átértelmezni a kérdést úgy, hogy egyszerűbben válaszoljon”, és „nagyon hajlamos hibákra összehasonlítva az emberekkel”. Ennek eredményeként még nem lehet helyettesíteni a matematikusokat mesterséges intelligenciával.
Összegzés: A Gemini 3 Deep Think és ügynöke, az Aletheia lenyűgöző eredményeket mutat különböző tudományterületeken, de jelentős korlátok maradnak a pontosságban és megbízhatóságban. A Google továbbra is dolgozik az AI mély gondolkodási képességeinek és önellenőrzésének fejlesztésén.
Hozzászólások (0)
Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.
Jelentkezz be a hozzászóláshoz