Branża4 min czytaniaThe Register

Anthropic zmienia limity czasowe, aby ograniczyć popyt na Claude w godzinach szczytu

P
Redakcja Pixelift0 views
Udostępnij
Anthropic zmienia limity czasowe, aby ograniczyć popyt na Claude w godzinach szczytu

Foto: The Register

Około 7 procent użytkowników Claude odczuje bezpośrednie skutki nowej polityki Anthropic, która wprowadza zmienne limity zużycia tokenów w zależności od pory dnia. Firma zdecydowała się na nietypowy krok: w godzinach szczytu (między 13:00 a 19:00 GMT) pięciogodzinny limit sesji może wyczerpać się znacznie szybciej niż w rzeczywistości, podczas gdy poza tymi oknami wydajność systemu zostaje zwiększona. Zmiana dotyczy zarówno darmowych kont, jak i subskrypcji Pro oraz Max, choć ogólna pula dostępna w skali tygodnia pozostaje bez zmian. Decyzja ta jest odpowiedzią na gwałtownie rosnące zapotrzebowanie, którego infrastruktura nie jest w stanie obsłużyć w sposób liniowy. Anthropic nie ujawnia dokładnych przeliczników tokenów na czas dostępu, co sprawia, że limity pozostają dla użytkowników nieprzejrzyste. W praktyce oznacza to, że praca nad złożonymi, długimi projektami w godzinach szczytu staje się „droższa” pod kątem dostępnych zasobów. Dla profesjonalistów i deweloperów korzystających z Claude globalna zmiana wymusza nową strategię planowania pracy. Aby zmaksymalizować potencjał modelu, najbardziej obciążające zadania, takie jak analizy obszernych dokumentów czy generowanie długich partii kodu, powinny być przesuwane na godziny nocne lub poranne. To wyraźny sygnał, że nawet najwięksi gracze na rynku AI muszą obecnie balansować między innowacyjnością a fizycznymi ograniczeniami centrów danych.

W świecie generatywnej sztucznej inteligencji, gdzie moc obliczeniowa stała się nową walutą, liderzy rynku muszą szukać kreatywnych sposobów na zarządzanie infrastrukturą. Anthropic, twórca cenionego modelu Claude, właśnie wprowadził bezprecedensowe zmiany w sposobie naliczania limitów użytkowania. Od środy firma oficjalnie modyfikuje zasady dostępu do swoich usług, wprowadzając mechanizm, który można roboczo nazwać „taryfą szczytową”. W praktyce oznacza to, że godzina pracy z AI w południe może kosztować użytkownika znacznie więcej limitu niż ta sama godzina spędzona na sesji w środku nocy.

Decyzja ta jest bezpośrednią odpowiedzią na gwałtownie rosnące zapotrzebowanie, które zaczyna testować granice wydajności serwerowni firmy. Zamiast prostego zwiększenia abonamentu lub drastycznego cięcia funkcjonalności, Anthropic zdecydował się na model dynamiczny, który ma zniechęcać do intensywnego korzystania z modelu Claude w godzinach największego obciążenia globalnego. To sygnał dla branży: darmowe i nielimitowane zasoby AI to definitywna przeszłość, a optymalizacja kosztów operacyjnych schodzi na poziom pojedynczego zapytania użytkownika.

Godziny szczytu w chmurze obliczeniowej

Nowy system operuje na specyficznych oknach czasowych, które Anthropic zdefiniował jako okresy wzmożonego ruchu. Są to godziny między 05:00 a 11:00 PT (co odpowiada 13:00 – 19:00 GMT). W tym czasie użytkownicy subskrypcji Free, Pro oraz Max mogą odczuć, że ich pięciogodzinne limity sesji wyczerpują się znacznie szybciej, niż wskazywałby na to zegar. W praktyce pięciogodzinny przydział czasu może zostać „spalony” w znacznie krótszym terminie, jeśli interakcje z modelem będą intensywne.

Mechanizm ten jest możliwy dzięki temu, że Anthropic wiąże limity czasowe z faktyczną konsumpcją tokenów, choć sama metodologia tych wyliczeń pozostaje niejawna. Podczas gdy poza godzinami szczytu pięć godzin dostępu faktycznie oznacza 300 minut pracy, w szczycie algorytm staje się bardziej restrykcyjny. Thariq Shihipar z zespołu technicznego firmy przyznał, że około 7 procent użytkowników – szczególnie tych korzystających z planów Pro – odczuje te zmiany poprzez wcześniejsze blokady sesji, których wcześniej by nie doświadczyli.

Matematyka tokenów i ukryte limity

Dla przeciętnego użytkownika system limitów w Claude pozostaje dość nieprzejrzysty. W przeciwieństwie do klientów korzystających z API, którzy płacą według jasnego cennika za Base Input Tokens, Cache Writes czy Output Tokens, subskrybenci planów abonamentowych poruszają się w sferze szacunków. Anthropic oferuje obecnie cztery główne poziomy subskrypcji:

  • Free – podstawowy dostęp z najniższymi priorytetami.
  • Pro – kosztujący $20 miesięcznie.
  • Max 5x – wyceniony na $100 miesięcznie.
  • Max 20x – najwyższy plan za $200 miesięcznie.

Nawet najwyższe plany nie gwarantują jednak całkowitej odporności na nowe regulacje. Firma tłumaczy w dokumentacji, że zużycie limitu zależy od długości i złożoności konwersacji, używanych funkcji oraz konkretnego modelu Claude, z którym prowadzony jest dialog. Nowością jest fakt, że teraz do tego równania dochodzi zmienna czasu rzeczywistego. Użytkownicy mają co prawda dostęp do dashboardu pokazującego postęp w zużyciu limitu sesji i tygodniowego przydziału, ale nie mają narzędzi, by precyzyjnie zaplanować wydajność swoich tokenów przed rozpoczęciem pracy.

Strategia przesunięcia obciążenia

Ruch podjęty przez Anthropic to klasyczny przykład „load balancing” przeniesionego na grunt relacji z klientem końcowym. Firma otwarcie zachęca programistów i użytkowników biznesowych do przesuwania ciężkich zadań, takich jak przetwarzanie dużych zbiorów danych czy zadania tła (background jobs), na godziny nocne lub poranne poza oknem szczytowym. Ma to pozwolić na „rozciągnięcie” dostępnych limitów sesji bez konieczności dopłacania za dodatkowe pakiety.

Warto zauważyć, że Anthropic jednocześnie zwiększył wydajność w godzinach o niskim natężeniu ruchu. Według zapewnień Shihipara, ogólne tygodniowe limity pozostają niezmienione – zmianie ulega jedynie ich dystrybucja. Jest to próba złagodzenia frustracji użytkowników, którzy płacąc 200 dolarów miesięcznie, oczekują niezawodności niezależnie od pory dnia. Firma argumentuje jednak, że jest to niezbędny krok w celu utrzymania stabilności serwisu dla wszystkich subskrybentów w obliczu wykładniczego wzrostu zainteresowania modelami Claude.

Można oczekiwać, że model „dynamicznego kosztu sesji” stanie się wkrótce standardem w całej branży AI. W miarę jak modele stają się coraz bardziej zasobożerne, a dostęp do najnowszych procesorów graficznych pozostaje wąskim gardłem, dostawcy usług będą zmuszeni do coraz agresywniejszego zarządzania popytem. Anthropic jako jeden z pierwszych otwarcie przyznaje, że czas spędzony z modelem nie jest równy czasowi procesora, a użytkownicy muszą nauczyć się optymalizować swoje interakcje z AI nie tylko pod kątem jakości promptów, ale również zegara na ścianie.

Źródło: The Register
Udostępnij

Komentarze

Loading...