poniedziałek, 13 maja, 2024

Ostatnie posty

The New York Times przedstawia pokwitowania w pozwie przeciwko OpenAI

Pozew wskazuje na prawie słowo w słowo fragmenty artykułów wygenerowanych przez chatboty.

The New York Times building

Mike Coppola/Getty Images

W kwietniu The New York Times skontaktował się z OpenAI i Microsoftem w celu zbadania umowy, która rozwiązałaby obawy związane z wykorzystaniem jego artykułów do szkolenia automatycznych chatbotów. Organizacja medialna, po szeroko nagłośnionych publikacjach ChatGPT i BingChat, zwróciła uwagę firmom, że ich technologia narusza prawa autorskie. Warunki rozwiązania obejmowały umowę licencyjną i instytucję barier wokół generatywnych narzędzi sztucznej inteligencji, chociaż rozmowy nie osiągnęły takiego rozejmu.

W obliczu impasu w negocjacjach, Times stał się w środę pierwszą dużą firmą medialną, która pozwała nowe kwestie praw autorskich podniesione przez technologię w pozwie, który może mieć daleko idące konsekwencje dla branży wydawniczej. Potencjalna stawka: Finansowa rentowność mediów w krajobrazie, w którym czytelnicy mogą ominąć bezpośrednie źródła na rzecz wyników wyszukiwania generowanych przez narzędzia AI. Pozew może zmusić OpenAI do zaakceptowania drogiej umowy licencyjnej, ponieważ może stworzyć niekorzystne orzecznictwo uniemożliwiające mu korzystanie z materiałów chronionych prawem autorskim do szkolenia swojego chatbota.

Skarga Times opiera się na argumentach z innych pozwów o naruszenie praw autorskich przeciwko firmom zajmującym się sztuczną inteligencją, unikając jednocześnie niektórych z ich pułapek. W szczególności unika się w niej tezy, że chatbot OpenAI sam w sobie jest dziełem naruszającym prawa autorskie i wskazuje na dosłowne fragmenty artykułów wygenerowanych przez technologię firmy – dowody, których zażądało wiele sądów nadzorujących podobne sprawy.

Pozew przedstawia obszerne dowody na to, że produkty OpenAI i Microsoftu wyświetlają niemal słowo w słowo fragmenty artykułów, pozwalając użytkownikom na obejście paywalla. Odpowiedzi te, jak twierdzi Times, wykraczają daleko poza fragmenty tekstów zwykle wyświetlane w zwykłych wynikach wyszukiwania. Jeden przykład: Bing Chat skopiował wszystkie z wyjątkiem dwóch z pierwszych 396 słów artykułu z 2023 r. „Sekrety, które Hamas wiedział o izraelskim wojsku” Wystawa pokazuje 100 innych sytuacji, w których GPT OpenAI zostało przeszkolone i zapamiętało artykuły z The Times, z kopiowaniem słowo w słowo na czerwono i różnicami na czarno.

Eksponat ze skargi Times pokazujący plagiat z produktu OpenAI.

Według dwóch sądów zajmujących się identycznymi sprawami, powodowie prawdopodobnie będą musieli wykazać dowód rzekomo naruszających prawa utworów wyprodukowanych przez chatboty, które są identyczne z materiałami chronionymi prawem autorskim, na których rzekomo zostały przeszkolone. Potencjalnie stanowi to poważny problem dla artystów pozywających StabilityAI, ponieważ przyznali oni, że „żaden z obrazów wyjściowych Stable Diffusion dostarczonych w odpowiedzi na konkretny monit tekstowy prawdopodobnie nie będzie pasował do żadnego konkretnego obrazu w danych szkoleniowych” Sędzia okręgowy USA William Orrick napisał w orzeczeniu oddalającym roszczenia przeciwko generatorom sztucznej inteligencji w październiku, że „nie jest przekonany”, że roszczenia dotyczące praw autorskich „mogą przetrwać bez zarzutów typu” znacznego podobieństwa ” Idąc w jego ślady miesiąc później, sędzia okręgowy USA Vince Chhabria zakwestionował, czy Meta może zostać pociągnięta do odpowiedzialności za naruszenie praw autorskich w przypadku braku dowodów na to, że którykolwiek z wyników „można rozumieć jako przekształcenie, przekształcenie lub dostosowanie książek powodów”

Czytaj również:  "Road House" to największy filmowy debiut Amazon w streamingu

„Musisz pokazać przykład produkcji, która jest zasadniczo podobna do twojej pracy, aby mieć sprawę, która prawdopodobnie przetrwa zwolnienie” – mówi Jason Bloom, przewodniczący praktyki własności intelektualnej Haynes Boone. „To było naprawdę trudne do udowodnienia w innych sprawach.”

Wyniki te pełnią podwójną funkcję, dostarczając przekonujących dowodów na to, że artykuły z Times zostały wykorzystane do szkolenia systemów sztucznej inteligencji. Ponieważ treningowe zbiory danych są w dużej mierze czarnymi skrzynkami, powodowie w większości innych spraw nie byli w stanie definitywnie stwierdzić, że ich prace zostały uwzględnione. Autorzy pozywający OpenAI, na przykład, mogą jedynie wskazać na ChatGPT generujący streszczenia i dogłębne analizy tematów w ich powieściach jako dowód na to, że firma korzystała z ich książek.

Podejście The Times w pozwie kontrastuje ze skargą The Authors Guild, która zdecydowała się ograniczyć swoją sprawę głównie do kwestii związanych z przyjmowaniem materiałów chronionych prawem autorskim w celu szkolenia systemów sztucznej inteligencji. „Prawo autorskie zawsze kładło nacisk na znaczne podobieństwo” – mówi Mary Rasenberger, dyrektor wykonawczy organizacji. „A kiedy masz dokładną reprodukcję, jest to z definicji zasadniczo podobne.”

The Times podkreśla, że jest to największe źródło zastrzeżonych danych, które zostały wykorzystane do szkolenia GPT (i trzecie ogólnie za Wikipedią i bazą danych amerykańskich dokumentów patentowych). Wśród oceanu śmieciowych treści powszechnie dostępnych w Internecie, artykuły renomowanych wydawców nabierają nowego znaczenia jako dane szkoleniowe, ponieważ istnieje większe prawdopodobieństwo, że są dobrze napisane i dokładne niż inne treści zwykle znajdowane w Internecie. W tym kontekście pozew może być pierwszym z kilku, które nadejdą, ponieważ archiwa wiadomości stają się coraz bardziej wartościowe dla firm technologicznych. Axel Springer, właściciel Politico i Business Insider , zawarł w tym miesiącu porozumienie z OpenAI w sprawie treści do szkolenia produktów GPT, decydując się na przyjęcie pieniędzy od giganta AI zamiast inicjowania własnego wyzwania prawnego.

W swojej skardze Times twierdzi, że jest największym źródłem zastrzeżonych danych, które zostały wykorzystane do szkolenia GPT (i trzecim ogólnie za Wikipedią i bazą danych amerykańskich dokumentów patentowych).

Mimo to Times może stanąć w obliczu trudnej bitwy w porównaniu z niektórymi innymi pozwami prowadzonymi przez autorów treści beletrystycznych. Pozew złożony przez Gildię Autorów prawdopodobnie ma na celu reprezentowanie wyłącznie klasy pisarzy beletrystyki, ponieważ fakty nie podlegają prawom autorskim, co utrudnia zarzucanie naruszenia artykułów informacyjnych lub powieści non-fiction. Dostarczenie dowodów na niemal dosłowne kopiowanie będzie kluczowe dla Times, aby pokazać, że produkty OpenAI nie tylko dostarczają fakty, ale kopiują kompozycję, w której są prezentowane.

Czytaj również:  'Emancypacja' Recenzja: Will Smith prowadzi dynamiczny, ale płytki dramat o niewolnikach Antoine'a Fuqua

Skarga zawiera roszczenia dotyczące naruszenia praw autorskich, przyczynienia się do naruszenia praw autorskich, rozmycia znaku towarowego, nieuczciwej konkurencji i naruszenia ustawy Digital Millennium Copyright Act. Zmarszczka w pozwie odróżniająca go od innych przeciwko firmom AI obejmuje zarzuty, że fałszywie przypisuje „halucynacje” The Times.

„W odpowiedzi na prośbę o napisanie eseju informacyjnego na temat doniesień głównych gazet, że sok pomarańczowy jest powiązany z chłoniakiem nieziarniczym, model GPT całkowicie sfabrykował, że The New York Times opublikował 10 stycznia 2020 r. artykuł zatytułowany 'Study Finds Possible Link Between Orange Juice and Non-Hodgkin’s Lymphoma'” – czytamy w skardze. „The Times nigdy nie opublikował takiego artykułu”

Stwierdzenie naruszenia może skutkować ogromnym odszkodowaniem, ponieważ ustawowe maksimum za każde umyślne naruszenie wynosi 150 000 USD.

Biuletyny THR

Zapisz się, aby codziennie otrzymywać wiadomości THR prosto do swojej skrzynki odbiorczej

SubscribeSign Up

Latest Posts

Nie przegap