Google elindította a Gemini 3 Deep Think‑et – egy fejlett MI‑szolgáltatást tudományos feladatokhoz, amely folyamatosan „hangolja” a válaszait a kéréshez.

Google elindította a Gemini 3 Deep Think‑et – egy fejlett MI‑szolgáltatást tudományos feladatokhoz, amely folyamatosan „hangolja” a válaszait a kéréshez.

5 software

Google bemutatta a Gemini 3 Deep Think frissített verzióját

A Google vállalat bejelentette a Gemini 3 Deep Think platformjának új, jelentős frissítését – olyan mesterséges intelligenciát, amely képes gondolkodni és megoldani összetett tudományos‑mérnöki feladatokat.

Mi változott
Paraméter Új Megjelenés Cél Átállás a tiszta elméletből a gyakorlati alkalmazásba Feladatok megoldása egyértelmű korlátok nélkül, hiányzó adatokkal Hozzáférés Beépítve a Gemini alkalmazásba A Google AI Ultra előfizetők használhatják, API-n keresztül – mérnökök és vállalatok (jelentkezés szükséges) Fejlesztői partnerek Tudós‑kutatók Együttműködés bonyolult feladatokon

Teljesítménymutatók
Teszt Eredmény Megjegyzés Humanity’s Last Exam 48,4 % Külső eszközök nélkül ARC‑AGI‑284,6 % AI-alkalmazó benchmark Codeforces (Elo) 3455 Magas rang a programozási megoldások között IMO 2025 Aranyérmes Egyenértékű a nemzetközi olimpián résztvevőkkel Kémia/Fizika Ugyanaz az eredmény Mutatja a sokoldalúságot különböző tantárgyakban CMT‑Benchmark (elméleti fizika) 50,5 % Jó kezelés komplex fogalmak

AI-ügynök „Aletheia”
DeepMind Google laboratóriumában létrehozták az Aletheia ügynöket a Gemini 3 Deep Think alapjaira. Fő jellemzők:

1. Hipotézis ellenőrzése – az ügynök felismeri a gyengeségeket a javasolt megoldásokban és iteratív módon korrigálja őket.

2. Bizonytalanság elismerése – tudomásul veszi, ha nem ismer választ.

3. Közvetlen kapcsolat külső forrásokkal – használja a Google keresőszolgáltatást és web‑navigációt, de kerül az álhivatkozások kitalálását.

Elért szintek
A Google öt fokozatra bontotta Aletheia sikereit:

Fokozat Leírás Példák 0 – „kisebb újdonság” Teljesen autonóm mód, három Erdős‑feladat megoldva (első szint) Három Erdős‑feladat 1 – „minimális újdonság” Egy további eredmény autonóm módban Negyedik feladat 2 – „közzétételre alkalmas” Eredmények önállóan és emberi együttműködésben, valamint segédes eszközök Adott feladatok 3–4 – „jelentős/megforduló áttörés” Még nem elérték —

Hogyan kezeli Aletheia Erdős‑feladatokat
* 700 eddig megoldatlan problémából az ügynök 13-at sikerült megoldania.

* Azonban csak 4 új – a többi már ismert a tudományos közösségben.

* 212 bemeneti megoldásból mindössze 6,5 % volt tartalmi helyes; 68,5 % alapvető hibákat tartalmazott, és 31,5 % – félreértelmezte a feladatot.

A fejlesztők kiemelik, hogy az AI hajlamos „átértelmezni a kérdést úgy, hogy egyszerűbben válaszoljon”, és „nagyon hajlamos hibákra összehasonlítva az emberekkel”. Ennek eredményeként még nem lehet helyettesíteni a matematikusokat mesterséges intelligenciával.

Összegzés: A Gemini 3 Deep Think és ügynöke, az Aletheia lenyűgöző eredményeket mutat különböző tudományterületeken, de jelentős korlátok maradnak a pontosságban és megbízhatóságban. A Google továbbra is dolgozik az AI mély gondolkodási képességeinek és önellenőrzésének fejlesztésén.

Hozzászólások (0)

Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.

Még nincsenek hozzászólások. Írj hozzászólást és oszd meg a véleményed!

Hozzászóláshoz kérjük, jelentkezz be.

Jelentkezz be a hozzászóláshoz