Sztuczna inteligencja4 min czytaniaThe Verge AI

Claude Code i Cowork od Anthropic mogą przejąć kontrolę nad Twoim komputerem

P
Redakcja Pixelift0 views
Udostępnij
Claude Code i Cowork od Anthropic mogą przejąć kontrolę nad Twoim komputerem

Foto: The Verge AI

Claude potrafi teraz przejąć pełną kontrolę nad Twoim komputerem, aby samodzielnie wykonywać złożone zadania, nawet gdy nie ma Cię przy biurku. Anthropic wprowadził tę przełomową funkcję w ramach podglądu badawczego (research preview) dla narzędzi Claude Code oraz Cowork, dedykowanych programistom i profesjonalistom. System potrafi autonomicznie otwierać pliki, obsługiwać przeglądarkę, a nawet uruchamiać narzędzia deweloperskie, symulując ruchy myszy, kliknięcia oraz wprowadzanie tekstu z klawiatury. Aktualizacja jest obecnie dostępna wyłącznie dla użytkowników systemów macOS posiadających subskrypcję Claude Pro lub Max. Funkcjonalność opiera się na modelu Claude 3.5 Sonnet i najlepiej współpracuje z nowym rozwiązaniem Dispatch, które pozwala zlecać zadania komputerowi stacjonarnemu bezpośrednio z poziomu aplikacji mobilnej. Choć AI priorytetyzuje bezpośrednie konektory do usług takich jak Slack czy Google Workspace, w razie ich braku potrafi „patrzeć” na ekran i nawigować po interfejsie dowolnej aplikacji. Dla użytkowników oznacza to wejście w nową erę agentów AI, którzy zamiast tylko generować tekst, stają się cyfrowymi asystentami wykonawczymi. Mimo że Anthropic zapewnia o konieczności każdorazowego udzielenia wyraźnej zgody na działanie bota, technologia ta niesie ze sobą istotne wyzwania w zakresie bezpieczeństwa i prywatności. To wyraźny sygnał, że rozwój sztucznej inteligencji przesuwa się z fazy doradczej w stronę pełnej, autonomicznej integracji z systemami operacyjnymi.

Granica między asystentem AI a autonomicznym agentem właśnie uległa zatarciu. Anthropic ogłosił wprowadzenie przełomowej aktualizacji dla swoich narzędzi Claude Code oraz Cowork, która pozwala sztucznej inteligencji na bezpośrednie przejęcie kontroli nad komputerem użytkownika. To nie jest już tylko generowanie tekstu czy analiza kodu wewnątrz zamkniętego okna czatu – to technologia, która potrafi samodzielnie poruszać kursorem, klikać w przyciski i nawigować po systemie operacyjnym, aby wykonać powierzone jej zadania.

Nowa funkcja, udostępniona jako research preview, jest skierowana do subskrybentów planów Claude Pro oraz Max. Choć Anthropic eksperymentował z autonomicznymi możliwościami modelu Claude 3.5 Sonnet już w 2024 roku, obecna implementacja przenosi te funkcje bezpośrednio do codziennego workflow programistów i pracowników biurowych. System został zaprojektowany tak, aby działać bez zbędnej konfiguracji (no setup required), co ma stanowić kluczową przewagę nad skomplikowanymi rozwiązaniami konkurencji.

Autonomia pod pełną kontrolą użytkownika

Mechanizm działania nowych agentów opiera się na głębokiej integracji z interfejsem graficznym. Claude potrafi automatycznie otwierać pliki, korzystać z przeglądarek internetowych, a nawet uruchamiać zaawansowane narzędzia deweloperskie. Co istotne, system może pracować nawet wtedy, gdy użytkownik znajduje się z dala od swojego stanowiska. Anthropic kładzie jednak ogromny nacisk na bezpieczeństwo i transparentność: Claude za każdym razem poprosi o wyraźną zgodę (explicit permission), zanim zacznie eksplorować system, przewijać strony czy klikać w elementy interfejsu.

Interfejs Claude kontrolujący przeglądarkę
Claude potrafi teraz samodzielnie nawigować po aplikacjach i przeglądarce, naśladując ruchy użytkownika.

Pod względem technicznym priorytetem dla AI są dedykowane konektory do popularnych usług, takich jak Slack czy Google Workspace. Jeśli jednak dana aplikacja nie posiada bezpośredniej integracji, Claude przełącza się w tryb bezpośredniego sterowania. W tym modelu AI analizuje obraz z wyświetlacza i symuluje fizyczne interakcje za pomocą wirtualnej myszy i klawiatury. Jest to podejście brutalnie skuteczne, choć – jak przyznaje sam producent – wolniejsze niż korzystanie z API i wymagające niekiedy drugiej próby przy bardziej złożonych operacjach.

Ekosystem Apple na pierwszym planie

W obecnej fazie testów funkcja sterowania komputerem jest ograniczona wyłącznie do urządzeń z systemem macOS. Aby skorzystać z tej nowości, użytkownik musi posiadać zainstalowaną aplikację desktopową Claude na wspieranym komputerze Apple, która następnie musi zostać sparowana z aplikacją mobilną chatbota. Taka konfiguracja pozwala na zdalne zlecanie zadań i monitorowanie postępów pracy AI z dowolnego miejsca na świecie.

Kluczowym elementem tej układanki jest funkcja Dispatch. To rozwiązanie typu cross-device, które umożliwia delegowanie zadań do aplikacji desktopowej bezpośrednio z telefonu. Dzięki temu programista może zlecić Claude'owi przygotowanie środowiska testowego lub naprawę błędu w kodzie podczas powrotu do domu, a po otwarciu laptopa zastać gotowe wyniki pracy. To znaczący krok w stronę wizji "cyfrowego pracownika", który operuje na tych samych narzędziach co człowiek, ale z szybkością i precyzją maszyny.

Prezentacja możliwości Claude Cowork
Narzędzia Code i Cowork stają się autonomicznymi agentami zdolnymi do pracy w tle.
  • Dostępność: Research preview dla subskrybentów Claude Pro i Max.
  • Wymagania systemowe: Wyłącznie macOS (stan na marzec 2026).
  • Główne zastosowania: Automatyzacja narzędzi dev tools, zarządzanie plikami, obsługa przeglądarki.
  • Bezpieczeństwo: Wymagana jawna zgoda na każdą sesję interakcji z systemem.

Wyzwania i realna wydajność agentów

Mimo imponujących możliwości, Anthropic zachowuje zdrowy rozsądek w komunikacji marketingowej. Firma otwarcie przyznaje, że technologia ta wciąż znajduje się we wczesnej fazie rozwoju. "Przekazujemy ją wcześniej, ponieważ chcemy dowiedzieć się, gdzie działa, a gdzie zawodzi" – czytamy w oficjalnym komunikacie. Problemami pozostają prędkość działania oraz bezbłędność przy wieloetapowych procesach, które wymagają od modelu AI stałej uwagi i interpretacji zmieniającego się kontekstu na ekranie.

Warto również zauważyć, że sterowanie komputerem "poprzez ekran" jest procesem znacznie bardziej obciążającym zasoby niż tradycyjne zapytania tekstowe. Claude musi nieustannie przetwarzać strumień wizualny, co generuje opóźnienia. Niemniej jednak, dla zadań powtarzalnych i żmudnych, takich jak wypełnianie formularzy, migracja danych między niekompatybilnymi aplikacjami czy wstępna konfiguracja projektów programistycznych, Claude może stać się niezastąpionym wsparciem, eliminując tzw. "pusty przebieg" w pracy twórczej.

Wprowadzenie autonomicznych agentów przez Anthropic to jasny sygnał dla branży: wyścig zbrojeń w AI przeniósł się z poziomu "co model wie" na poziom "co model potrafi zrobić". Podczas gdy inni giganci wciąż dopracowują multimodalność w obrębie okna czatu, Claude wychodzi na zewnątrz, przejmując kontrolę nad systemem operacyjnym. Jeśli testy na macOS zakończą się sukcesem, możemy spodziewać się szybkiego rozszerzenia tych możliwości na inne platformy, co ostatecznie zmieni sposób, w jaki definiujemy interakcję człowieka z komputerem. Era, w której AI prosi nas o pozwolenie na kliknięcie w przycisk "Wyślij", właśnie się rozpoczęła.

Źródło: The Verge AI
Udostępnij

Komentarze

Loading...