Generalist GEN-1: Fyzická inteligence, která se učí z lidského doteku
V dubnu 2026 oznámila společnost Generalist AI vydání modelu GEN-1, který mnozí odborníci označují za „GPT-3 moment“ pro robotiku. Za projektem stojí veteráni z týmu Google DeepMind (autoři modelů RT-2 a PaLM-E), jako jsou Pete Florence a Andy Zeng. GEN-1 není jen dalším robotem, ale tzv. embodied foundation model (vtělený základní model), který byl od základu (z 99 % parametrů) trénován pro fyzickou interakci se světem. Na rozdíl od předchozích systémů, které se spoléhaly na vizuální modely určené pro statické obrázky, GEN-1 nativně rozumí fyzikálním zákonům, jako je hybnost nebo tření.
Klíčem k úspěchu je radikální změna v získávání dat. Zatímco běžný výcvik robotů vyžaduje tisíce hodin drahé teleoperace, GEN-1 byl předtrénován na více než 500 000 hodinách dat lidské manipulace. Tato data byla získána pomocí nízkonákladových nositelných zařízení, tzv. „data hands,“ která dobrovolníci nosili při běžných denních činnostech. Díky tomuto masivnímu základu se GEN-1 dokáže adaptovat na zcela nový úkol v novém prostředí za pouhou jednu hodinu specifických robotických dat. To dramaticky mění ekonomiku nasazení – robot už nepotřebuje týdny ladění, ale stačí mu krátká instruktáž.
Výkonnostní metriky ukazují, že robotika konečně překračuje práh komerční rentability. Úspěšnost při plnění fyzických úkolů (např. skládání krabic nebo kitting autodílů) vyskočila z 64 % u předchozí generace na současných 99 %. Model je navíc 3× rychlejší než dosavadní technologická špička (SOTA) – například sestavení krabice zvládne za 12,1 sekundy, zatímco konkurenčním modelům to trvá přes 34 sekund. Tato spolehlivost je měřena na tisících pokusů v kontrolovaných, ale variabilních prostředích, což z něj dělá ideálního kandidáta pro logistiku a lehký průmysl.
Fascinujícím rysem GEN-1 je tzv. „improvizační inteligence“. Jedná se o schopnost reagovat na nečekané situace, které nebyly součástí tréninku. Pokud robotovi vyklouzne součástka, model „nezamrzne,“ ale dokáže ji v reálném čase přerovnat v dlani nebo využít hranu stolu k jejímu narovnání. Tento fyzický selský rozum vychází z obrovského objemu lidských dat, ze kterých se AI naučila implicitní řešení problémů. Pro model není fyzika souborem rovnic, ale naučenou reflexivní odezvou, podobně jako u lidské svalové paměti.
V konkurenčním prostředí roku 2026 se GEN-1 vymezuje proti gigantům jako Tesla Optimus Gen 3 nebo Figure 03. Zatímco Tesla sází na masovou výrobu a integraci do svého ekosystému a Figure na konverzační inteligenci díky OpenAI, Generalist AI sází na škálovatelnost dat a nízké náklady na adaptaci. Model GEN-1 je v podstatě „mozkem“, který lze nasadit na různé hardwarové platformy. Přestože trh stále postrádá jednotný benchmark pro srovnání všech modelů, GEN-1 aktuálně dominuje v disciplíně rychlosti učení nových úkonů.
Navzdory optimismu zůstává kritickým bodem přechod do zcela neuspořádaného prostředí. Oněch 99 % úspěšnosti bylo dosaženo ve strukturovaných scénářích (např. balení 1 800 bloků v řadě). Jak se model zachová při extrémním zmatku nebo proměnlivém osvětlení, zatím nebylo plně publikováno. Zakladatelé však věří, že cesta k Physical AGI (fyzické obecné inteligenci) je již otevřená. GEN-1 dokázal, že úzkým hrdlem nebyla architektura kódu, ale měřítko dat. S podporou investorů jako NVIDIA a Jeff Bezos je GEN-1 jasným signálem, že roboti v našich domovech a skladech jsou realitou dneška, nikoliv vizí roku 2030.
Zdroje
Výzkumník na RICAIP Testbedu Praha na CIIRC ČVUT specializující se na vývoj robotických aplikací a výzkum mobilní a humanoidní robotiky. Podílí se na projektech, které propojují akademickou sféru s průmyslovou praxí, a soustavně rozšiřuje své technické znalosti na hranici toho, co moderní robotika umožňuje.