Az Anthropic Claude‑komplexus, amely 16 MI‑ügynökből áll, önmagától létrehozta a C fordítót.

Az Anthropic Claude‑komplexus, amely 16 MI‑ügynökből áll, önmagától létrehozta a C fordítót.

8 software

A kísérlet keretein belül az Anthropic cég 16 autonóm AI ügynökből álló csapatot gyűjtött össze, akik együtt a nulláról létrehoztak egy C nyelvű fordítót Rustban. Az eredmény – „tiszta” megvalósítás, amely képes Linux 6.19 magját összerakni és olyan projekteket fordítani, mint a PostgreSQL, SQLite, Redis, FFmpeg és QEMU, de jelentős mértékben hátrébb marad a GCC-hez képest minőségben és hatékonyságban.

Hogyan történt
1. Előkészítés: 16 Claude Opus 4.6 példányt futtattak külön Docker‑konténerekben internet hozzáférés nélkül. Mindegyik klónozza a közös Git repo-t, és lock‑fájlokon keresztül kap feladatokat.
2. Önálló tervezés: nincs központi koordinátor; minden ügynök önállóan határozza meg, mely „érthető” munkadarabot hajtja végre a következőként. Konfliktus esetén a kód automatikusan egyesül.
3. Fejlesztés: az ügynököket arra bízták, hogy teljesen a nulláról írjanak C fordítót. A munka 2 hetet vett igénybe és majdnem 2000 Claude Code session-t igényelt.
4. Tesztelés: ahhoz, hogy ne „szennyezze” a modell kontextusát hosszú lekérdezésekkel, a teszteket összefoglaló módban futtatják (csak néhány sor kimenet). Gyorsítás céljából 1–10 % tesztet dolgoznak fel gyors módon.

Végtermék
* Méret – körülbelül 100 000 Rust sor.
* Funkcionalitás – képes Linux 6.19 magját x86, ARM és RISC‑V architektúrákon összerakni; fordítja a PostgreSQL-t, SQLite-t, Redis-t, FFmpeg-et, QEMU-t; átmegy ~99 % GCC tesztet.
* Korlátok – nem generál 16 bites gépi kódot (Linux futtatásához GCC szükséges), az assembler és linker hibákat tartalmaz, a kód teljesítménye alacsonyabb, mint a GCC-é. A Rust forráskód minősége kevésbé jó, mint egy tapasztalt programozó munkája.

A kísérlet költsége
| Mutató | Költség |
|--------|---------|
| Tokenek Claude API | ~20 000 $ |
| További kiadások (modell képzés, projekt szervezés, tesztkészletek) | Nem tartozik bele a megadott összegbe |

Tanulságok és következtetések
1. Autonómia határa – amikor a kód 100 000 sor körül van, az ügynökök már nem értik teljesen a projektet; ez valószínűleg a független AI felső határa.
2. Támogatás szükségessége – a funkcionalitás bővítése gyakran törte már működő kódrészeket.
3. Fejlesztői környezet fontossága – az internet elválasztása és a tesztek helyes beállítása kritikus volt az ügynökök stabil működéséhez.

Összegzés
A kísérlet azt mutatja, hogy a modern AI modellek képesek komplex szoftverrendszereket generálni minimális felügyelettel. Mégis nem tudják teljesen helyettesíteni a tapasztalt fejlesztőket: a kód minősége, a teljesítmény és megbízhatóság alacsonyabb, mint a hagyományos fordítókonfigurációk esetén, és a projekt mérete korlátozva van néhány százezer sorra. Ez fontos lépés előre, de még messze van a teljesen autonóm szoftverfejlesztéstől.

Hozzászólások (0)

Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.

Még nincsenek hozzászólások. Írj hozzászólást és oszd meg a véleményed!

Hozzászóláshoz kérjük, jelentkezz be.

Jelentkezz be a hozzászóláshoz