A régi PDP-11-en való MI-modell futtatása: a rajongó 6 MHz CPU-t és 64 KB RAM‑ot használt
Veterán Microsoft bemutatja a transzformátor működését egy régi számítógépen
*Dave Plummer – ismert Windows fejlesztő,*
*megmutatja, hogy a modern MI‑modelleket akár tízéves hardveren is lehet betanítani.*
Mi történt
- Hardver: PDP‑11 / 44, 47 éves számítógép 6 MHz processzorral és 64 KB RAM-mal.
- Modell: „Attention 11” – transzformátor hálózat, PDP‑11 assemblerben írt Damien Buret (Damien Buret) által.
- Tanulási feladat: nyolc szám fordított sorozatának előállítása.
A modellnak nem kell példákat memorizálnia; a „fordítás” szabályát kell megtanulnia.
Hogyan működik
1. Inicializálás – a modell véletlenszerű súlyokkal kezd, pontosság szinte nulla.
2. Tanulás – minden lépésben egy előre terjedő passz (8‑bites fixpont) és a súlyfrissítés történik.
3. A mintázat fokozatos elsajátítása – több száz iteráció után a figyelemmechanizmus „felfedezi” a szabályt, és a modell átlép az adathibák becsléséről való tényleges tudásra.
> “Megfigyeljük a tanulás egyszerűsített anatómiai szerkezetét… a gép végül átlépi a láthatatlan határt – a becsléstől a tudáshoz.” – Plummer
Eredmények
- Pontosság: 100 % az inverz sorozat feladatán.
- Sebesség: körülbelül 350 tanulási lépés, ami kb. 3,5 percet vett igénybe a PDP‑11/44 cache memóriával.
Mit jelent ez a modern MI számára
Plummer hangsúlyozza, hogy a tanulás alapelvei – ismétlődő aritmetikai műveletek és hibajavítás – teljesen megvalósulnak még ilyen egyszerű rendszerekben is.
„Ez a régi gép nem gondolkodik misztikusan; csak néhány ezer számot frissít. A modern MI lényege, hogy ezt a folyamatot skálázzuk.”
Így az író bebizonyította, hogy a transzformátorok alapmechanizmusa ugyanaz marad, függetlenül attól, milyen hardveren futnak.
Hozzászólások (0)
Oszd meg a véleményed — kérjük, légy udvarias és maradj a témánál.
Jelentkezz be a hozzászóláshoz