Alibaba, ByteDance és Kuaishou új MI-modelleket vezettek be – a robotikától a filmekhez használt videótartalom-generálásig.
Kínai IT-gigantok bemutatják az új MI-algoritmusokat
Kontextus
A múlt héten az amerikai mesterséges intelligencia piacán a beszélgetés az Anthropic és Altruist modellek lehetőségeiről zajlott, amelyek hatással vannak a programozásra és a pénzügyi szolgáltatásokra. Ugyanakkor a kínai technológiai óriások – Alibaba, ByteDance (a TikTok tulajdonosa) és Kuaishou – bemutatták saját MI-modelleiket, megmutatva a robotika és videógenerálás teljesítményének növekedését. Ezek a fejlesztések megerősítik, hogy Kína nem marad le a nyugati versenytársaktól.
Háttér
Az új algoritmusokról szóló bejelentések a Google DeepMind alapítója, Demis Hassabis (amely szerint a kínai MI-modellek több hónappal hátrébb vannak a nyugati modellektől) utóbbi kijelentése után érkeztek. Ennek ellenére az ebben az évben bemutatott eszközök képesek közvetlen versenytársaként szerepelni az OpenAI (Sora), Nvidia és Google videógenerálási és robotikai termékei előtt.
1. RynnBrain – „okos” robotizált segítő az Alibaba-tól
* Mi ez?
Az Alibaba DAMO kutatási osztálya bejelentette a RynnBrain modellt, amelyet arra terveztek, hogy a robotok jobban felismerjék a környezetüket és hatékonyabban kommunikáljanak az objektumokkal.
* Bemutató
A videó egy klímpes karokkal rendelkező robottal mutatja be, amely narancsokat gyűjt össze és rakja őket kosárba. Emellett a robot a hűtőből kinyeri a tejet is.
* Technikai jellemzők
- Alapos tanulás szükséges a mindennapi tárgyak felismeréséhez.
- A RynnBrain beépített idő- és térfelismerést tartalmaz: a robot emlékszik arra, hol és mikor történnek események, nyomon követi a feladat előrehaladását, és több szakaszban is képes folytatni a munkát.
- Ez növeli a megbízhatóságot és az egységességet valós körülmények között.
* Pozicionálás
Az Alibaba célja egy „alapvető intelligens szint” létrehozása a beépített rendszerek számára, versenyezve a Nvidia-val és a Google-lal a robotikában.
2. Seedance 2.0 – videógenerálás ByteDance-tól
* Funkció
A modell lehetővé teszi valósághű videók létrehozását egyszerű szöveges leírás alapján. Az algoritmus képes feldolgozni meglévő videókat és képeket, majd új kompozíciókba kombinálni őket.
* Előnyök
- Javított kezelhetőség, sebesség és hatékonyság a korábbi verziókkal szemben.
- Pozitív visszajelzés kapott Hugging Face kutatója, Adina Yakefu: a modell „meglepően kiegyensúlyozott” és már az első futtatáskor is minőségi eredményeket ad.
* Technikai részletek
A Seedance 2.0 vizualizációt, hangot és operátori munkát egyetlen folyamatba ötvöz, így befejezett terméket hoz létre a kísérleti prototípus helyett.
* Problémák és korlátozások
- Adatvédelmi kérdések miatt a ByteDance ideiglenesen letiltotta az emberi hang generálását feltöltött fénykép alapján.
- Ez a döntés egy blogger aggodalmai után született, aki a nem engedélyezett beszédszintézis veszélyeire hívta fel a figyelmet.
3. Kling 3.0 – Kuaishou versenytársa
* Általános leírás
A Kling 3.0 modell videógenerálásra van tervezve, és közvetlen ellenfeleként pozicionálják a Seedance 2.0-hoz.
* Főbb fejlesztések
- Javított koherencia (a részletek szövegben nem kerülnek kifejtésre, de jelentős minőségjavulásra utalnak).
Összegzés
- A kínai vállalatok aktívan fejlesztik az MI-algoritmusokat a robotika és videógenerálás területén, bemutatva versenyképes megoldásokat.
- Az Alibaba „okos” robotokra összpontosít, amelyek időt és helyet is felismernek.
- A ByteDance fejlett videótartalomkészítő modellt kínál, de etikai kérdésekkel szembesül a hangszintézis terén.
- A Kuaishou tovább bővíti generatív modell portfólióját, versenyezve a ByteDance-tól.
Ezek a fejlesztések megerősítik, hogy Kína nem csupán követi a nyugati innovációkat, hanem aktívan formálja saját MI-termékpiacát.
Hozzászólások (0)
Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.
Jelentkezz be a hozzászóláshoz