W świecie generatywnej sztucznej inteligencji, gdzie moc obliczeniowa stała się nową walutą, liderzy rynku muszą szukać kreatywnych sposobów na zarządzanie infrastrukturą. Anthropic, twórca cenionego modelu Claude, właśnie wprowadził bezprecedensowe zmiany w sposobie naliczania limitów użytkowania. Od środy firma oficjalnie modyfikuje zasady dostępu do swoich usług, wprowadzając mechanizm, który można roboczo nazwać „taryfą szczytową”. W praktyce oznacza to, że godzina pracy z AI w południe może kosztować użytkownika znacznie więcej limitu niż ta sama godzina spędzona na sesji w środku nocy.

Decyzja ta jest bezpośrednią odpowiedzią na gwałtownie rosnące zapotrzebowanie, które zaczyna testować granice wydajności serwerowni firmy. Zamiast prostego zwiększenia abonamentu lub drastycznego cięcia funkcjonalności, Anthropic zdecydował się na model dynamiczny, który ma zniechęcać do intensywnego korzystania z modelu Claude w godzinach największego obciążenia globalnego. To sygnał dla branży: darmowe i nielimitowane zasoby AI to definitywna przeszłość, a optymalizacja kosztów operacyjnych schodzi na poziom pojedynczego zapytania użytkownika.

Godziny szczytu w chmurze obliczeniowej

Nowy system operuje na specyficznych oknach czasowych, które Anthropic zdefiniował jako okresy wzmożonego ruchu. Są to godziny między 05:00 a 11:00 PT (co odpowiada 13:00 – 19:00 GMT). W tym czasie użytkownicy subskrypcji Free, Pro oraz Max mogą odczuć, że ich pięciogodzinne limity sesji wyczerpują się znacznie szybciej, niż wskazywałby na to zegar. W praktyce pięciogodzinny przydział czasu może zostać „spalony” w znacznie krótszym terminie, jeśli interakcje z modelem będą intensywne.

Mechanizm ten jest możliwy dzięki temu, że Anthropic wiąże limity czasowe z faktyczną konsumpcją tokenów, choć sama metodologia tych wyliczeń pozostaje niejawna. Podczas gdy poza godzinami szczytu pięć godzin dostępu faktycznie oznacza 300 minut pracy, w szczycie algorytm staje się bardziej restrykcyjny. Thariq Shihipar z zespołu technicznego firmy przyznał, że około 7 procent użytkowników – szczególnie tych korzystających z planów Pro – odczuje te zmiany poprzez wcześniejsze blokady sesji, których wcześniej by nie doświadczyli.

Matematyka tokenów i ukryte limity

Dla przeciętnego użytkownika system limitów w Claude pozostaje dość nieprzejrzysty. W przeciwieństwie do klientów korzystających z API, którzy płacą według jasnego cennika za Base Input Tokens, Cache Writes czy Output Tokens, subskrybenci planów abonamentowych poruszają się w sferze szacunków. Anthropic oferuje obecnie cztery główne poziomy subskrypcji:

Free – podstawowy dostęp z najniższymi priorytetami.
Pro – kosztujący $20 miesięcznie.
Max 5x – wyceniony na $100 miesięcznie.
Max 20x – najwyższy plan za $200 miesięcznie.

Nawet najwyższe plany nie gwarantują jednak całkowitej odporności na nowe regulacje. Firma tłumaczy w dokumentacji, że zużycie limitu zależy od długości i złożoności konwersacji, używanych funkcji oraz konkretnego modelu Claude, z którym prowadzony jest dialog. Nowością jest fakt, że teraz do tego równania dochodzi zmienna czasu rzeczywistego. Użytkownicy mają co prawda dostęp do dashboardu pokazującego postęp w zużyciu limitu sesji i tygodniowego przydziału, ale nie mają narzędzi, by precyzyjnie zaplanować wydajność swoich tokenów przed rozpoczęciem pracy.

Strategia przesunięcia obciążenia

Ruch podjęty przez Anthropic to klasyczny przykład „load balancing” przeniesionego na grunt relacji z klientem końcowym. Firma otwarcie zachęca programistów i użytkowników biznesowych do przesuwania ciężkich zadań, takich jak przetwarzanie dużych zbiorów danych czy zadania tła (background jobs), na godziny nocne lub poranne poza oknem szczytowym. Ma to pozwolić na „rozciągnięcie” dostępnych limitów sesji bez konieczności dopłacania za dodatkowe pakiety.

Warto zauważyć, że Anthropic jednocześnie zwiększył wydajność w godzinach o niskim natężeniu ruchu. Według zapewnień Shihipara, ogólne tygodniowe limity pozostają niezmienione – zmianie ulega jedynie ich dystrybucja. Jest to próba złagodzenia frustracji użytkowników, którzy płacąc 200 dolarów miesięcznie, oczekują niezawodności niezależnie od pory dnia. Firma argumentuje jednak, że jest to niezbędny krok w celu utrzymania stabilności serwisu dla wszystkich subskrybentów w obliczu wykładniczego wzrostu zainteresowania modelami Claude.

Można oczekiwać, że model „dynamicznego kosztu sesji” stanie się wkrótce standardem w całej branży AI. W miarę jak modele stają się coraz bardziej zasobożerne, a dostęp do najnowszych procesorów graficznych pozostaje wąskim gardłem, dostawcy usług będą zmuszeni do coraz agresywniejszego zarządzania popytem. Anthropic jako jeden z pierwszych otwarcie przyznaje, że czas spędzony z modelem nie jest równy czasowi procesora, a użytkownicy muszą nauczyć się optymalizować swoje interakcje z AI nie tylko pod kątem jakości promptów, ale również zegara na ścianie.

Anthropic zmienia limity czasowe, aby ograniczyć popyt na Claude w godzinach szczytu

Godziny szczytu w chmurze obliczeniowej

Czytaj też

Matematyka tokenów i ukryte limity

Strategia przesunięcia obciążenia

Więcej z kategorii Branża

Broadcom rozszerza współpracę z Google oraz Anthropic w zakresie dostaw chipów

OpenAI prosi organy w California i Delaware o zbadanie „antykonkurencyjnych zachowań” Muska przed kwietniowym procesem

Nadzieja na układ USA-Iran, rocznica Apple i OpenAI w Morning Squawk

Boom centrów danych AI wystawia ubezpieczycieli na próbę przy napływie prywatnego kapitału

Podobne artykuły

Ryzykowny i niezwykle ambitny plan Intel, który może przynieść miliardy zysku

Badacze nie chcieli gloryfikować cyberprzestępców, więc postanowili ich wyśmiać

Agenci AI obiecują „prowadzenie biznesu”, ale kto odpowie za ich błędy?

Netflix, Meta i IBM: AI zrobi z każdego programistę 10x, ale z dziesięciokrotnie większym bałaganem

Komentarze