Premiera DLSS 5 miała być kolejnym triumfem technologicznym Nvidii, ale zamiast entuzjazmu, firma zderzyła się z murem sceptycyzmu ze strony społeczności graczy. Zarzuty są poważne: technologia oparta na generatywnej sztucznej inteligencji ma rzekomo zamieniać unikalne wizje artystyczne w generyczną papkę, określaną dosadnie jako "AI slop". Jensen Huang, CEO Nvidii, postanowił przerwać milczenie i w obszernym wywiadzie dla Lex Fridman Podcast wyjaśnić, dlaczego jego zdaniem te obawy wynikają z niezrozumienia fundamentów nowej technologii.

Huang, znany ze swojego entuzjazmu do AI, tym razem przyjął bardziej stonowaną postawę, przyznając rację krytykom w kwestii estetyki współczesnych generatorów obrazu. "Rozumiem, skąd biorą się te obawy, ponieważ sam nie jestem fanem AI slop" – stwierdził szef Nvidii. Jego zdaniem problemem dzisiejszego AI jest powtarzalność i fakt, że niemal wszystkie generowane treści zaczynają wyglądać tak samo, mimo ich obiektywnego piękna. To wyznanie jest o tyle istotne, że po raz pierwszy lider giganta z Santa Clara tak otwarcie dystansuje się od wizualnej monotonii, którą sam pomagał stworzyć poprzez dostarczanie infrastruktury obliczeniowej.

Geometria jako fundament, a nie sugestia

Kluczem do zrozumienia obrony DLSS 5 jest sposób, w jaki algorytm przetwarza dane. W przeciwieństwie do modeli typu "text-to-image", które tworzą obrazy z próżni na podstawie statystycznego prawdopodobieństwa, nowa iteracja Deep Learning Super Sampling opiera się na tym, co Huang nazywa "3D conditioned, 3D guided". Oznacza to, że proces generatywny nie jest pozostawiony sam sobie, lecz jest ściśle ograniczony przez geometrię i struktury dostarczone przez twórców gry.

Według szefa Nvidii, artyści wciąż tworzą to, co nazywa "ground truth structure" – podstawową prawdę o scenie, jej bryłach i teksturach. DLSS 5 ma za zadanie jedynie wzmocnić te elementy, a nie je redefiniować. Huang podkreśla, że każda klatka obrazu jest ulepszana w sposób, który nie zmienia intencji artystycznej, ponieważ AI jest "prowadzone za rękę" przez silnik gry. To fundamentalna różnica względem modeli wideo, które potrafią wygenerować surrealistyczne artefakty, ponieważ nie rozumieją fizyki ani stałości obiektów w przestrzeni trójwymiarowej.

Mimo tych zapewnień, gracze obawiają się zjawiska "homogenizacji foto-realizmu". Głównym zarzutem nie jest to, że DLSS 5 zacznie dorysowywać w grach dodatkowe palce czy zmieniać smoki w samochody, ale że wygładzi różnice między stylami graficznymi różnych deweloperów. Istnieje realna obawa, że niezależnie od tego, czy gramy w mroczny horror, czy kolorową platformówkę, filtr generatywny Nvidii nałoży na wszystko ten sam "perfekcyjny" połysk, sprawiając, że gry stracą swój unikalny charakter na rzecz uśrednionego standardu wizualnego.

Narzędzie w rękach artysty, a nie filtr post-processingu

Jensen Huang odpiera te ataki, twierdząc, że DLSS 5 nie jest rozwiązaniem typu "pudełkowego", które nakłada się na gotowy produkt. "To nie jest technologia, w której gra jest wysyłana w jednym stanie, a my ją potem post-procesujemy" – wyjaśniał w podkaście. Zamiast tego, nowa technologia ma być zintegrowana z procesem twórczym już na etapie produkcji. Nvidia chce, aby deweloperzy traktowali generatywne AI jako kolejny pędzel w swoim arsenale, a nie jako automatyczny retusz.

Wizja Huanga zakłada, że to twórcy decydują o stopniu ingerencji algorytmów. Jeśli studio chce zachować surowy, ziarnisty styl, ma mieć nad tym pełną kontrolę poprzez odpowiednie "warunkowanie" modelu. DLSS 5 ma dawać artystom narzędzie do osiągnięcia poziomu szczegółowości, który przy tradycyjnych metodach renderowania byłby niemożliwy do uzyskania w czasie rzeczywistym, nawet na najpotężniejszych układach RTX. To przesunięcie ciężaru z czystej mocy obliczeniowej na inteligentną rekonstrukcję obrazu.

3D Conditioning: Wykorzystanie danych o głębi i wektorach ruchu do stabilizacji obrazu AI.
Artist Integration: Głęboka współpraca algorytmu z silnikiem gry, a nie tylko analiza gotowych pikseli.
Generative Glow-ups: Możliwość rekonstrukcji detali, które nie istnieją w niższych rozdzielczościach bazowych.
Opcjonalność: Deweloperzy mają pełną swobodę w implementacji lub rezygnacji z poszczególnych modułów DLSS 5.

Zaawansowane generatywne ulepszenia obrazu w DLSS 5 — Przykład ulepszenia sceny dzięki generatywnej sztucznej inteligencji z zachowaniem struktury 3D.

Warto zauważyć, że branża gier znajduje się obecnie w punkcie zwrotnym. Przez lata DLSS ewoluowało od prostego upscalingu (DLSS 1), przez doskonałą rekonstrukcję krawędzi (DLSS 2), aż po generowanie całych klatek (DLSS 3) i rekonstrukcję promieni światła (DLSS 3.5). DLSS 5 idzie o krok dalej, wprowadzając komponent czysto generatywny. To naturalna ewolucja, ale też najbardziej ryzykowna, ponieważ dotyka samej tkanki wizualnej utworu, którą gracze utożsamiają z pracą ludzkich rąk.

Demokratyzacja czy degradacja jakości?

Huang kończy swoją argumentację prostym stwierdzeniem: ostateczna decyzja należy do twórców. "Jeśli twórcom gier się to nie spodoba, mogą po prostu zdecydować, że tego nie użyją" – uciął krótko. Ta rynkowa logika ma uspokoić nastroje, sugerując, że Nvidia dostarcza jedynie technologię, a nie narzuca nowej estetyki. Jednak w rzeczywistości, przy stale rosnących kosztach produkcji gier AAA i presji na coraz wyższą rozdzielczość, mało które studio będzie mogło pozwolić sobie na ignorowanie narzędzi, które drastycznie redukują zapotrzebowanie na surową moc obliczeniową.

Analizując obecną sytuację, można dojść do wniosku, że DLSS 5 stanie się standardem szybciej, niż chcieliby tego puryści. Nvidia skutecznie przesuwa definicję "renderowania" w stronę "halucynowania w oparciu o dane". Jeśli technologia rzeczywiście utrzyma rygor geometryczny, o którym mówi Huang, obawy o "AI slop" mogą okazać się przedwczesne. Prawdziwym testem nie będą jednak wywiady w podkastach, ale pierwsze duże tytuły, które w pełni zintegrują ten model. Granica między ulepszeniem a zniekształceniem jest cienka, a gracze, mający wyjątkowo wyczulone oko na wszelkie anomalie wizualne, będą bezlitosnymi sędziami tej technologii.

Można przewidywać, że DLSS 5 zapoczątkuje nową erę w grafice komputerowej, gdzie tradycyjny rasteryzator stanie się jedynie szkicem dla potężnych sieci neuronowych. Ryzyko standaryzacji wyglądu gier jest realne, ale historia technologii pokazuje, że artyści zazwyczaj znajdują sposób, by nagiąć nowe narzędzia do swojej wizji, zamiast im ulegać. Nvidia stawia wszystko na jedną kartę: generatywne AI jest przyszłością interaktywnej rozrywki, a my właśnie obserwujemy moment, w którym "sztuczne" musi udowodnić, że potrafi być "artystyczne".

Szef Nvidia wyjaśnia, dlaczego DLSS 5 to coś więcej niż zwykła „papka AI”

Geometria jako fundament, a nie sugestia

Czytaj też

Narzędzie w rękach artysty, a nie filtr post-processingu

Demokratyzacja czy degradacja jakości?

Więcej z kategorii Sztuczna inteligencja

Szef Cisco, Chuck Robbins, chce budować centra danych w kosmosie

Jak korzystać z nowych integracji ChatGPT z DoorDash, Spotify, Uber i innymi aplikacjami

Hiszpański Xoople pozyskuje 130 mln dolarów w serii B na mapowanie Ziemi dla AI

Copilot służy wyłącznie do celów rozrywkowych według regulaminu Microsoft

Podobne artykuły

„Problemem jest Sam Altman”: Pracownicy OpenAI nie ufają swojemu CEO

Google po cichu udostępnia nową aplikację AI do dyktowania działającą offline

Iran grozi centrom danych AI o nazwie kodowej Stargate

Iran grozi centrum danych Stargate od OpenAI w Abu Dhabi

Komentarze