Az Alibaba bejelenti a Qwen 3.5 kompakt modelleket, amelyek közvetlenül laptopokon futnak és felülmúlják az OpenAI megfelelőit.

Az Alibaba bejelenti a Qwen 3.5 kompakt modelleket, amelyek közvetlenül laptopokon futnak és felülmúlják az OpenAI megfelelőit.

8 hardware

Alibaba Qwen 3.5 – új sorozat kompakt mesterséges intelligencia modellekből

Az Alibaba Mesterséges Intelligencia részlege bejelentette a Qwen 3.5 modellcsalád kiadását, amely ígéri a „kicsi méret + magas hatékonyság” előnyét. Az amerikai megfelelőkkel összehasonlítva jobb pontosságot mutat kisebb memóriaigénnyel.

ModellMéretFő jellemzők
Qwen 3.5‑0.8B0,8 milliárd paraméter„Miniatűr” és „gyors”, prototípusokhoz és korlátozott akkumulátorú mobil eszközökhöz tervezve
Qwen 3.5‑2B2 milliárdHasonló a 0,8B-hez, de kicsit erősebb
Qwen 3.5‑4B4 milliárdMultimodális, 262 144 tokenes kontextusablak; könnyű ügynöki megoldásokhoz alkalmas
Qwen 3.5‑9B9 milliárdKépes érvelni, meghaladja az OpenAI gpt‑oss‑120B (13,5× több paraméter) és logikai gondolkodás szintjén doktori szintet nyújt

Minden modell Apache 2.0 licenc alatt érhető el, ami lehetővé teszi kereskedelmi projektekben való használatát és szükség esetén további finomhangolást.

Mi az újdonság az architektúrában?
Az Alibaba megszűnt a hagyományos Transformer-ekkel dolgozni, és egy hibrid megoldást alkalmazott:

* Gated Delta Networks (GDN) – magas sávszélességet és alacsony késleltetést biztosítanak.
* Mixture‑of‑Experts (MoE) – megoldja a memóriakorlátot, amely jellemző a kisebb modellekre.

Ennek köszönhetően a Qwen 3.5 képes multimodális tokenekkel egyidejűleg dolgozni, nem kell „képalkotó generátorokat” csatolni szöveges modellekhez, mint az előző generációk. Ennek eredményeként a 4B és 9B verziók képesek felismerni UI‑elemeket és számolni objektumokat videókban.

Tesztelés és eredmények
| Benchmark | Qwen 3.5‑9B |
|-----------|-------------|
| MMTU‑Pro (vizuális) | 70,1 % – meghaladta a Google Gemini 2.5 Flash‑Lite (59,7) és a Qwen 3‑VL‑30B‑A3B (63,0) |
| Logikai gondolkodás | 81,7 % – több, mint az OpenAI gpt‑oss‑120B (80,1), bár az utóbbi 10× több paraméterrel rendelkezik |
| HMMT Feb 2025 (matematika) | 83,2 % (9B), 74,0 % (4B) – bizonyítja, hogy a komplex tudományos feladatokhoz nem szükséges hatalmas felhőerőforrás |
| OmniDocBench v1.58 | 7 87,7 % – vezető minden modell között |
| MMMLU (többnyelvűség) | 81,2 % – meghaladta a gpt‑oss‑120B-t (78,2 %) |

Miért fontos ez?
A Qwen 3.5 megjelenése összhangban volt az autonóm AI ügynökek iránti növekvő kereslettel. A mai felhasználó nem csak csevegőbotokat vár el, hanem olyan rendszereket, amelyek:

1. Gondolkodnak – érvelnek a problémákról.
2. Látják – képeket, videókat és UI‑elemeket dolgoznak fel.
3. Cselekszenek – képesek eszközöket használni (űrlapok kitöltése, fájlok rendezése).

Mivel a nagy modellek (három-háromszoros milliárd paraméter) drágák az üzemeltetésben, a Qwen 3.5 gazdaságosabb megoldás. A modelleket helyben futtathatjuk felhő vagy API nélkül, és megerősítéses tanulással „emberi döntéseket” hozhatnak – például asztal szervezését vagy kódfejlesztést videófelvétel alapján.

Gyakorlati alkalmazás
* Mobil eszközök – 0,8 milliárd paraméter könnyen elfér egy okostelefonban és önállóan működik.
* Munkagépek – 9 milliárd paraméter teljes ügynöki funkciókhoz felhő nélkül.
* UI‑ügynökség – a „pixel szintű rögzítés” révén a modellek mozoghatnak az UI-n, kitölthetik az űrlapokat és rendezhetik a fájlokat, egyszerű természetes nyelvű parancsokkal körülbelül 90 % pontossággal.

Így az Alibaba Qwen 3.5 új utat nyit a hozzáférhetőbb, rugalmasabb és erőteljesebb AI ügynökek felé, amelyek akár felhőben, akár helyben is képesek működni, kielégítve a mai felhasználók növekvő igényeit.

Hozzászólások (0)

Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.

Még nincsenek hozzászólások. Írj hozzászólást és oszd meg a véleményed!

Hozzászóláshoz kérjük, jelentkezz be.

Jelentkezz be a hozzászóláshoz