Nowa AI od Generalist dla robotyki osiąga „produkcyjną” skuteczność

Foto: Generalist
Pół miliona godzin nagrań i petabajty danych o fizycznych interakcjach pozwoliły firmie Generalist stworzyć GEN-1 – system AI, który osiąga „produkcyjny poziom skuteczności” w zadaniach wymagających dotąd ludzkiej zręczności i pamięci mięśniowej. To przełom w robotyce, który przesuwa granice z fazy eksperymentalnej do realnych zastosowań przemysłowych. Kluczem do sukcesu okazało się obejście największej bariery w branży: braku wysokiej jakości danych treningowych dotyczących manipulacji obiektami. Podczas gdy modele LLM uczą się na tekstach z internetu, Generalist wykorzystał autorskie „data hands” – ubieralne chwytaki rejestrujące mikroruchy ludzi podczas pracy. Model GEN-1 stanowi ewolucję wersji GEN-0, udowadniając, że prawa skalowania (scaling laws) działają również w świecie fizycznym – im więcej danych i mocy obliczeniowej, tym większa precyzja maszyny. Największą innowacją jest jednak zdolność systemu do improwizacji i reagowania na zakłócenia w czasie rzeczywistym. Robot potrafi łączyć koncepcje z różnych scenariuszy, aby rozwiązywać nowe, nieprzewidziane problemy. Dla użytkowników i firm oznacza to nadejście ery robotów uniwersalnych, które nie wymagają żmudnego programowania każdej ścieżki ruchu, lecz uczą się wykonywania skomplikowanych czynności manualnych niemal tak naturalnie jak człowiek. Technologia ta otwiera drogę do pełnej automatyzacji procesów, które dotychczas uznawano za zbyt chaotyczne dla maszyn.
Branża robotyki właśnie przekroczyła próg, który jeszcze kilka lat temu wydawał się nieosiągalny bez bezpośredniego nadzoru człowieka. Firma Generalist, specjalizująca się w uczeniu maszynowym dla systemów fizycznych, zaprezentowała model GEN-1. To nie jest kolejna laboratoryjna ciekawostka, ale system, który według deklaracji twórców osiąga „produkcyjny poziom skuteczności” w zadaniach wymagających precyzji, zręczności i – co najważniejsze – improwizacji. W świecie, gdzie roboty zazwyczaj zawodzą przy najmniejszym odstępstwie od zaprogramowanego schematu, GEN-1 wprowadza nową jakość: zdolność do radzenia sobie z nieprzewidzianymi zakłóceniami w czasie rzeczywistym.
Kluczem do przełomu jest odejście od sztywnych algorytmów na rzecz elastycznej inteligencji fizycznej. Model GEN-1 potrafi łączyć idee z różnych scenariuszy treningowych, aby rozwiązywać problemy, z którymi wcześniej nie miał do czynienia. Oznacza to, że jeśli robot napotka przeszkodę lub obiekt przesunie się w nieoczekiwany sposób, system nie „zawiesi się”, lecz samodzielnie wypracuje nowy ruch. To fundamentalna zmiana w podejściu do automatyzacji, przybliżająca maszyny do poziomu ludzkiej pamięci mięśniowej i intuicji motorycznej.
Skalowanie danych w świecie fizycznym
Sukces GEN-1 opiera się na fundamencie położonym przez jego poprzednika, model GEN-0. W listopadzie ubiegłego roku Generalist udowodniło za pomocą GEN-0, że tzw. prawa skalowania (scaling laws), które zrewolucjonizowały duże modele językowe (LLM), mają zastosowanie również w robotyce. Wykazano wówczas, że zwiększenie ilości danych przedtreningowych oraz mocy obliczeniowej przekłada się bezpośrednio na lepszą wydajność po zakończeniu treningu. Jednak robotyka boryka się z problemem, którego nie znają twórcy GPT-4 czy Claude: brakiem gigantycznych zasobów gotowych danych cyfrowych.
Czytaj też

Podczas gdy modele tekstowe mogą czerpać z bilionów słów dostępnych w internecie, roboty nie mają globalnego repozytorium wysokiej jakości danych o tym, jak ludzkie dłonie manipulują przedmiotami w trzech wymiarach. Aby zasypać tę lukę, Generalist musiało stworzyć własny ekosystem zbierania informacji. Wykorzystano do tego autorskie rozwiązanie o nazwie data hands – zestaw noszonych na dłoniach chwytaków, które rejestrują każdy mikroruch i sygnał wizualny podczas wykonywania manualnych zadań przez ludzi. To podejście pozwoliło na zgromadzenie bazy danych o skali dotąd niespotykanej w tej branży.
W efekcie Generalist dysponuje obecnie ponad pół milionem godzin nagrań i petabajtami danych o interakcjach fizycznych. To właśnie ta masa krytyczna informacji pozwoliła GEN-1 na osiągnięcie płynności, która wcześniej była zarezerwowana wyłącznie dla operatorów ludzkich. Model nie tylko kopiuje ruchy, ale rozumie fizykę otoczenia, co pozwala mu na operowanie w dynamicznych, nieustannie zmieniających się środowiskach przemysłowych.
Improwizacja zamiast sztywnego kodu
Największym wyzwaniem dla współczesnej robotyki nie jest powtarzalność, lecz reakcja na chaos. Tradycyjne systemy wymagają precyzyjnego ustawienia każdego elementu na linii produkcyjnej. GEN-1 zmienia tę dynamikę, wprowadzając zdolność do „improwizowania nowych ruchów”. Jeśli obiekt, który robot ma podnieść, zostanie potrącony lub upadnie w nienaturalny sposób, model potrafi skorygować trajektorię chwytaka w locie. Jest to możliwe dzięki unikalnej architekturze, która pozwala systemowi na kreatywne łączenie wyuczonych wzorców w celu znalezienia wyjścia z nowej sytuacji.

Zdolność do „łączenia idei z różnych miejsc” sugeruje, że Generalist stworzyło model o wysokim stopniu generalizacji. Oznacza to, że umiejętności nabyte podczas nauki jednej czynności – na przykład delikatnego chwytania owoców – mogą zostać zaadaptowane do manipulowania delikatnymi komponentami elektronicznymi bez konieczności przechodzenia pełnego cyklu szkoleniowego od zera. To drastycznie skraca czas wdrożenia robotów do nowych zadań, co jest kluczowe dla firm o zmiennym profilu produkcji.
Warto zwrócić uwagę na specyfikację techniczną tego procesu. GEN-1 operuje na danych pochodzących bezpośrednio z sensorów wizualnych i kinestetycznych, co eliminuje potrzebę stosowania kosztownych i skomplikowanych systemów zewnętrznego pozycjonowania. Dzięki wykorzystaniu urządzenia data hands, model uczy się nie tylko końcowego efektu ruchu, ale całego spektrum sił i napięć, jakie towarzyszą ludzkiej pracy. To właśnie te detale sprawiają, że sukcesy modelu są określane mianem „produkcyjnych” – są po prostu wystarczająco niezawodne, by powierzyć im realne procesy biznesowe.
Nowy paradygmat w automatyzacji fizycznej
Pojawienie się GEN-1 sygnalizuje koniec ery, w której roboty były jedynie „programowalnymi maszynami”. Wchodzimy w fazę autonomicznych agentów fizycznych, którzy potrafią uczyć się na błędach i dostosowywać do otoczenia. Skala petabajtów danych, o której wspomina Generalist, stawia poprzeczkę bardzo wysoko dla konkurencji. Budowa fizycznego AI wymaga nie tylko zaawansowanych algorytmów, ale przede wszystkim unikalnej infrastruktury do pozyskiwania danych z realnego świata, co firma zrealizowała za pomocą swojego autorskiego sprzętu.
Ograniczenia, które do tej pory hamowały robotykę – takie jak brak elastyczności czy wysoki koszt rekonfiguracji – zaczynają znikać. GEN-1 udowadnia, że przy odpowiedniej ilości danych treningowych, maszyny mogą nabyć zręczność, która do tej pory wydawała się domeną wyłącznie biologiczną. Nie chodzi tu o zastąpienie człowieka w prostych czynnościach, ale o stworzenie systemów zdolnych do współpracy w złożonych, nieprzewidywalnych warunkach, gdzie każda sekunda przestoju generuje straty.
Można postawić tezę, że Generalist właśnie otworzyło drogę do „momentu GPT” w robotyce. Jeśli skalowanie danych fizycznych będzie postępować w tym samym tempie, co w przypadku modeli językowych, wkrótce zobaczymy systemy, których nie trzeba będzie programować do żadnego konkretnego zadania. Będą one posiadać ogólną wiedzę o tym, jak manipulować materią, a ich wdrożenie sprowadzi się do pokazania im celu, jaki mają osiągnąć. GEN-1 to pierwszy, niezwykle solidny krok w stronę tej rzeczywistości, w której granica między ludzką zręcznością a maszynową precyzją ostatecznie się zaciera.
Więcej z kategorii Sztuczna inteligencja
Podobne artykuły

Jak korzystać z nowych integracji ChatGPT z DoorDash, Spotify, Uber i innymi aplikacjami
10h
Hiszpański Xoople pozyskuje 130 mln dolarów w serii B na mapowanie Ziemi dla AI
12h
Copilot służy wyłącznie do celów rozrywkowych według regulaminu Microsoft
5 kwi





