Az Nvidia bemutatta a Nemotron 3 Super 120B‑t — egy nyílt LLM, amely ötszörös sebességnövelést biztosít az AI‑ügynökök számára.
Új modell az Nvidia-tól – Nemotron 3 Super
Az Nvidia bejelentette a Nemotron 3 Super indítását, egy nyílt MI‑modellt Mixture‑of‑Experts (MoE) típusban.
* 120 milliárd összes paraméter, ebből 12 milliárd aktív.
* Kifejezetten agent MI számára – olyan rendszerekhez, ahol több „ügynök” kölcsönhatásba lép egymással és a külvilággal.
Architektúra
A modell hibrid megközelítést használ Mamba‑Transformerrel (Mamba rétegek és Transformer elemek kombinációja).
A Nemotron 3 Superben először alkalmazzák a LatentMoE paradigmát, Multi‑Token Prediction rétegeket és az NVFP4 protokoll szerinti előképzés. Az Nvidia szerint ez a stack növeli a pontosságot és gyorsítja a inferenciát.
Teljesítmény
* Átviteli sebesség – akár 5× gyorsabb, mint a korábbi Nemotron Super.
* Pontosság – akár 2× magasabb.
* A 1 millió tokenes kontextusablak támogatása lehetővé teszi az ügynökök számára, hogy tárolják a teljes munkafolyamat állapotát, csökkentve a céltól való eltérés kockázatát.
Gyakorlati alkalmazás
A Nemotron 3 Super jól alkalmas bonyolult feladatokra többügynökségi rendszerekben:
| Feladat | Használati példa |
|---|---|
| Kód generálása és hibakeresése dokumentumok nélkül | Automatikus nagy programok írása és ellenőrzése |
| Pénzügyi elemzés | Tázsze számú jelentés beágyazása a modell memóriájába |
Oktatás
A modellt szintetikus adatokon, logikai gondolkodási modellek segítségével tanították. Az Nvidia teljes módszertant feltár:
* Több mint 10 trillió token elő- és utótanulás során;
* 15 környezet a megerősítéses tanuláshoz;
* Értékelési receptek.
A kutatók az Nvidia NeMo platformot használhatják további finomhangoláshoz vagy saját modellverziók létrehozásához.
Technikai részletek
* NVFP4 támogatás a Nvidia Blackwell architektúráján.
* Memóriaigény csökkentése és négyzetes gyorsítás az outputban, összehasonlítva a FP8-vel a Nvidia Hoppernél pontosság elvesztése nélkül.
Elérhetőség
A modell már elérhető:
* build.nvidia.com, Hugging Face, OpenRouter és Perplexity keresztül.
* Felhőpartnerek: Google Cloud Vertex AI, Oracle Cloud Infrastructure, CoreWeave, Together AI, Baseten, Cloudflare, DeepInfra, Fireworks AI, Modal.
* Nvidia NIM mikro-szolgáltatásként, amely lehetővé teszi a modell helyi vagy felhőben történő telepítését.
A Nemotron 3 Super új lehetőségeket nyit az agent MI számára, kombinálva magas pontosságot, skálázhatóságot és testreszabhatóságot.
Hozzászólások (0)
Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.
Jelentkezz be a hozzászóláshoz