Technologia3 kwietnia 2026•5 min czytania•Gizmodo

Gigant danych dla AI, firma Mercor, chce odkupić efekty Twojej pracy z poprzednich firm

Redakcja Pixelift13 views

Udostępnij

Foto: Robot And Woman Working On Laptop In Office © Valerii Apetroaiei via Getty

Nawet 500 dolarów za dostęp do starych plików projektowych i dokumentów z poprzedniej pracy – taką propozycję składa użytkownikom gigant danych treningowych Mercor, wyceniając intelektualny dorobek pracowników na potrzeby rozwoju AI. Według doniesień Wall Street Journal, firma aktywnie poszukuje wysokiej jakości materiałów, które mogą posłużyć do trenowania dużych modeli językowych (LLM), oferując gratyfikację finansową osobom gotowym udostępnić swoje archiwa. Dla globalnej społeczności specjalistów to kusząca, ale ryzykowna szansa na dodatkowy zarobek. Praktyka ta budzi ogromne kontrowersje prawne, ponieważ większość umów o pracę zawiera rygorystyczne zapisy o własności intelektualnej, przenoszące prawa do wszelkich wytworzonych treści na pracodawcę. Sprzedaż takich danych przez byłych pracowników może skutkować poważnymi konsekwencjami prawnymi, w tym oskarżeniami o kradzież tajemnic przedsiębiorstwa. Z perspektywy technologicznej trend ten pokazuje, jak desperacko firmy AI potrzebują unikalnych, ludzkich danych do walki z halucynacjami modeli. Użytkownicy muszą jednak pamiętać, że jednorazowy przelew od Mercor może oznaczać trwałe spalenie mostów w relacjach zawodowych i wejście na ścieżkę sądową z potężnymi korporacjami, które nie zamierzają rezygnować z praw do swoich zasobów.

Rynek danych do trenowania modeli sztucznej inteligencji przypomina obecnie gorączkę złota, w której tradycyjne złoża — publicznie dostępny internet — zaczynają gwałtownie wysychać. W obliczu pozwów o naruszenie praw autorskich i blokowania botów przez gigantów medialnych, firmy technologiczne szukają nowych, coraz bardziej kontrowersyjnych źródeł "paliwa" dla swoich algorytmów. Jak donosi Wall Street Journal, gigant w branży pozyskiwania danych, firma Mercor, postanowił pójść o krok dalej, uderzając bezpośrednio do pracowników. Propozycja jest prosta i jednocześnie szokująca: sprzedaj nam owoce swojej pracy z poprzednich firm, a my ci za to zapłacimy.

To podejście rzuca zupełnie nowe światło na wartość intelektualną, którą generujemy w trakcie kariery zawodowej. Mercor nie szuka już tylko ogólnodostępnych postów na Reddicie czy artykułów z Wikipedii. Firma celuje w wysokiej jakości, specjalistyczne dane: kod źródłowy, wewnętrzne analizy, dokumentację techniczną czy strategie marketingowe, które nigdy nie miały opuścić korporacyjnych serwerów. Dla wielu osób, które czują się niedocenione finansowo przez byłych pracodawców, może to brzmieć jak kusząca okazja do "wyrównania rachunków", jednak prawnicy i eksperci ds. etyki ostrzegają, że wchodzimy na wyjątkowo grząski grunt.

Handel własnością intelektualną w cieniu NDA

Mechanizm działania Mercor opiera się na założeniu, że indywidualni pracownicy dysponują unikalnym wglądem w procesy twórcze i techniczne, które są bezcenne dla trenowania modeli Large Language Models (LLM). Problem polega na tym, że w niemal każdym nowoczesnym kontrakcie o pracę widnieje zapis, według którego wszelkie efekty pracy wytworzone w godzinach służbowych lub przy użyciu zasobów firmy należą wyłącznie do pracodawcy. Próba monetyzacji tych materiałów przez byłego pracownika to nie tylko naruszenie etyki zawodowej, ale przede wszystkim bezpośrednie złamanie umów o poufności (NDA) oraz przepisów o ochronie tajemnicy przedsiębiorstwa.

Czytaj też

Nowy raport: anonimowe źródła o rzekomej niewiarygodności Sama Altmana

Puchar League of Legends KeSPA Cup będzie transmitowany na całym świecie w Disney+

Robot i człowiek zbijający żółwia jako symbol współpracy AI z ludźmi — Współpraca między ludźmi a systemami AI wchodzi na nowy, kontrowersyjny poziom pozyskiwania danych.

Działania Mercor pokazują desperację sektora AI w dążeniu do uzyskania przewagi konkurencyjnej. Modele takie jak GPT-4 czy nadchodzące iteracje od Anthropic wymagają danych o coraz wyższym stopniu skomplikowania, aby wyjść poza etap generowania prostych tekstów. Płacenie osobom prywatnym za dostęp do ich "archiwów" zawodowych to próba obejścia oficjalnych kanałów licencjonowania danych, które są drogie i obwarowane restrykcyjnymi warunkami prawnymi. Dla korporacji, których dane mogą w ten sposób wyciec do modeli konkurencji, jest to scenariusz z najgorszego koszmaru.

Moralny i prawny hazard na koszt pracownika

Choć Mercor oferuje realne pieniądze za dostarczenie materiałów, ryzyko w całości spoczywa na barkach osoby sprzedającej dane. Jeśli algorytmy trenowane na wykradzionym kodzie lub dokumentach zaczną generować treści zbyt mocno przypominające materiały źródłowe, wytropienie źródła wycieku przez działy prawne wielkich korporacji stanie się tylko kwestią czasu. W dobie zaawansowanej analizy metadanych i cyfrowych znaków wodnych, anonimowość w takim transakcjach jest złudna. Użytkownik, który zdecyduje się na taki krok, naraża się na wielomilionowe odszkodowania i trwałe wykluczenie z rynku pracy.

Analiza trendów w branży technologicznej wskazuje na coraz większą agresję w pozyskiwaniu danych treningowych.

Z perspektywy rozwoju sztucznej inteligencji, ten model pozyskiwania wiedzy budzi również wątpliwości natury jakościowej. Mercor tworzy swego rodzaju "czarny rynek" danych, gdzie weryfikacja autentyczności i praw własności jest niemal niemożliwa. Jeśli branża AI zacznie polegać na materiałach pozyskanych w sposób wątpliwy prawnie, cała struktura prawna wokół takich modeli jak Llama czy Claude może się zawalić pod ciężarem pozwów zbiorowych. Nie chodzi już tylko o to, czy AI "kradnie" sztukę z internetu, ale o to, czy aktywnie korumpuje pracowników do wynoszenia firmowych sekretów.

Ryzyko prawne: Naruszenie umów NDA i praw autorskich należących do pracodawcy.
Cel Mercor: Pozyskanie wysokiej jakości danych specjalistycznych, niedostępnych publicznie.
Konsekwencje dla branży: Możliwa fala pozwów przeciwko firmom AI o paserstwo własności intelektualnej.
Etyka: Wykorzystywanie frustracji finansowej pracowników do obchodzenia standardów rynkowych.

Nowa era cyfrowego szpiegostwa przemysłowego

To, co proponuje Mercor, można bez przesady nazwać demokratyzacją szpiegostwa przemysłowego. Dawniej wykradanie planów czy kodu wymagało zaawansowanych operacji lub infiltracji. Dziś wystarczy odpowiednio wysoka stawka i formularz na stronie internetowej firmy zajmującej się trenowaniem AI. Granica między "współpracą przy rozwoju technologii" a działaniem na szkodę byłego pracodawcy staje się niebezpiecznie płynna. Warto zadać pytanie, czy jakakolwiek kwota oferowana przez Mercor jest w stanie zrekompensować utratę reputacji w branży, w której zaufanie jest kluczową walutą.

Zjawisko to wymusi na firmach technologicznych radykalną zmianę podejścia do bezpieczeństwa danych po ustaniu stosunku pracy. Możemy spodziewać się jeszcze bardziej restrykcyjnych procedur czyszczenia urządzeń, monitorowania aktywności w chmurze w ostatnich tygodniach zatrudnienia oraz agresywnego ścigania wszelkich prób transferu własności intelektualnej. Inicjatywa Mercor, zamiast pomóc pracownikom "odkuć się" na korporacjach, może doprowadzić do powstania atmosfery wzajemnej nieufności, która uderzy w całe środowisko kreatywne i inżynieryjne.

W mojej ocenie, agresywne metody pozyskiwania danych przez podmioty takie jak Mercor doprowadzą do szybkiej interwencji regulatorów. Obecnie poruszamy się w szarej strefie, ale precedensowe wyroki sądowe w sprawach o kradzież własności intelektualnej na potrzeby trenowania AI są nieuniknione. Firmy, które budują swoje modele na fundamencie "odkupionym" od nielojalnych pracowników, ryzykują, że ich największy atut — unikalny zbiór danych — stanie się ich największym obciążeniem prawnym, prowadzącym do nakazów usunięcia całych wag modeli z serwerów.

Źródło: Gizmodo

Udostępnij

#mercor #ai training data #llm #intellectual property #machine learning