Az Nvidia bemutatta a Nemotron 3 Super 120B‑t — egy nyílt LLM, amely ötszörös sebességnövelést biztosít az AI‑ügynökök számára.

Az Nvidia bemutatta a Nemotron 3 Super 120B‑t — egy nyílt LLM, amely ötszörös sebességnövelést biztosít az AI‑ügynökök számára.

9 hardware

Új modell az Nvidia-tól – Nemotron 3 Super

Az Nvidia bejelentette a Nemotron 3 Super indítását, egy nyílt MI‑modellt Mixture‑of‑Experts (MoE) típusban.

* 120 milliárd összes paraméter, ebből 12 milliárd aktív.
* Kifejezetten agent MI számára – olyan rendszerekhez, ahol több „ügynök” kölcsönhatásba lép egymással és a külvilággal.

Architektúra
A modell hibrid megközelítést használ Mamba‑Transformerrel (Mamba rétegek és Transformer elemek kombinációja).

A Nemotron 3 Superben először alkalmazzák a LatentMoE paradigmát, Multi‑Token Prediction rétegeket és az NVFP4 protokoll szerinti előképzés. Az Nvidia szerint ez a stack növeli a pontosságot és gyorsítja a inferenciát.

Teljesítmény
* Átviteli sebesség – akár 5× gyorsabb, mint a korábbi Nemotron Super.
* Pontosság – akár 2× magasabb.
* A 1 millió tokenes kontextusablak támogatása lehetővé teszi az ügynökök számára, hogy tárolják a teljes munkafolyamat állapotát, csökkentve a céltól való eltérés kockázatát.

Gyakorlati alkalmazás
A Nemotron 3 Super jól alkalmas bonyolult feladatokra többügynökségi rendszerekben:

FeladatHasználati példa
Kód generálása és hibakeresése dokumentumok nélkülAutomatikus nagy programok írása és ellenőrzése
Pénzügyi elemzésTázsze számú jelentés beágyazása a modell memóriájába

Oktatás
A modellt szintetikus adatokon, logikai gondolkodási modellek segítségével tanították. Az Nvidia teljes módszertant feltár:

* Több mint 10 trillió token elő- és utótanulás során;
* 15 környezet a megerősítéses tanuláshoz;
* Értékelési receptek.

A kutatók az Nvidia NeMo platformot használhatják további finomhangoláshoz vagy saját modellverziók létrehozásához.

Technikai részletek
* NVFP4 támogatás a Nvidia Blackwell architektúráján.
* Memóriaigény csökkentése és négyzetes gyorsítás az outputban, összehasonlítva a FP8-vel a Nvidia Hoppernél pontosság elvesztése nélkül.

Elérhetőség
A modell már elérhető:

* build.nvidia.com, Hugging Face, OpenRouter és Perplexity keresztül.
* Felhőpartnerek: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Nvidia NIM mikro-szolgáltatásként, amely lehetővé teszi a modell helyi vagy felhőben történő telepítését.

A Nemotron 3 Super új lehetőségeket nyit az agent MI számára, kombinálva magas pontosságot, skálázhatóságot és testreszabhatóságot.

Hozzászólások (0)

Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.

Még nincsenek hozzászólások. Írj hozzászólást és oszd meg a véleményed!

Hozzászóláshoz kérjük, jelentkezz be.

Jelentkezz be a hozzászóláshoz