Az Alibaba bejelenti a Qwen 3.5 kompakt modelleket, amelyek közvetlenül laptopokon futnak és felülmúlják az OpenAI megfelelőit.
Alibaba Qwen 3.5 – új sorozat kompakt mesterséges intelligencia modellekből
Az Alibaba Mesterséges Intelligencia részlege bejelentette a Qwen 3.5 modellcsalád kiadását, amely ígéri a „kicsi méret + magas hatékonyság” előnyét. Az amerikai megfelelőkkel összehasonlítva jobb pontosságot mutat kisebb memóriaigénnyel.
| Modell | Méret | Fő jellemzők |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 milliárd paraméter | „Miniatűr” és „gyors”, prototípusokhoz és korlátozott akkumulátorú mobil eszközökhöz tervezve |
| Qwen 3.5‑2B | 2 milliárd | Hasonló a 0,8B-hez, de kicsit erősebb |
| Qwen 3.5‑4B | 4 milliárd | Multimodális, 262 144 tokenes kontextusablak; könnyű ügynöki megoldásokhoz alkalmas |
| Qwen 3.5‑9B | 9 milliárd | Képes érvelni, meghaladja az OpenAI gpt‑oss‑120B (13,5× több paraméter) és logikai gondolkodás szintjén doktori szintet nyújt |
Minden modell Apache 2.0 licenc alatt érhető el, ami lehetővé teszi kereskedelmi projektekben való használatát és szükség esetén további finomhangolást.
Mi az újdonság az architektúrában?
Az Alibaba megszűnt a hagyományos Transformer-ekkel dolgozni, és egy hibrid megoldást alkalmazott:
* Gated Delta Networks (GDN) – magas sávszélességet és alacsony késleltetést biztosítanak.
* Mixture‑of‑Experts (MoE) – megoldja a memóriakorlátot, amely jellemző a kisebb modellekre.
Ennek köszönhetően a Qwen 3.5 képes multimodális tokenekkel egyidejűleg dolgozni, nem kell „képalkotó generátorokat” csatolni szöveges modellekhez, mint az előző generációk. Ennek eredményeként a 4B és 9B verziók képesek felismerni UI‑elemeket és számolni objektumokat videókban.
Tesztelés és eredmények
| Benchmark | Qwen 3.5‑9B |
|-----------|-------------|
| MMTU‑Pro (vizuális) | 70,1 % – meghaladta a Google Gemini 2.5 Flash‑Lite (59,7) és a Qwen 3‑VL‑30B‑A3B (63,0) |
| Logikai gondolkodás | 81,7 % – több, mint az OpenAI gpt‑oss‑120B (80,1), bár az utóbbi 10× több paraméterrel rendelkezik |
| HMMT Feb 2025 (matematika) | 83,2 % (9B), 74,0 % (4B) – bizonyítja, hogy a komplex tudományos feladatokhoz nem szükséges hatalmas felhőerőforrás |
| OmniDocBench v1.58 | 7 87,7 % – vezető minden modell között |
| MMMLU (többnyelvűség) | 81,2 % – meghaladta a gpt‑oss‑120B-t (78,2 %) |
Miért fontos ez?
A Qwen 3.5 megjelenése összhangban volt az autonóm AI ügynökek iránti növekvő kereslettel. A mai felhasználó nem csak csevegőbotokat vár el, hanem olyan rendszereket, amelyek:
1. Gondolkodnak – érvelnek a problémákról.
2. Látják – képeket, videókat és UI‑elemeket dolgoznak fel.
3. Cselekszenek – képesek eszközöket használni (űrlapok kitöltése, fájlok rendezése).
Mivel a nagy modellek (három-háromszoros milliárd paraméter) drágák az üzemeltetésben, a Qwen 3.5 gazdaságosabb megoldás. A modelleket helyben futtathatjuk felhő vagy API nélkül, és megerősítéses tanulással „emberi döntéseket” hozhatnak – például asztal szervezését vagy kódfejlesztést videófelvétel alapján.
Gyakorlati alkalmazás
* Mobil eszközök – 0,8 milliárd paraméter könnyen elfér egy okostelefonban és önállóan működik.
* Munkagépek – 9 milliárd paraméter teljes ügynöki funkciókhoz felhő nélkül.
* UI‑ügynökség – a „pixel szintű rögzítés” révén a modellek mozoghatnak az UI-n, kitölthetik az űrlapokat és rendezhetik a fájlokat, egyszerű természetes nyelvű parancsokkal körülbelül 90 % pontossággal.
Így az Alibaba Qwen 3.5 új utat nyit a hozzáférhetőbb, rugalmasabb és erőteljesebb AI ügynökek felé, amelyek akár felhőben, akár helyben is képesek működni, kielégítve a mai felhasználók növekvő igényeit.
Hozzászólások (0)
Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.
Jelentkezz be a hozzászóláshoz