Dzisiejszy wpis miał pierwotnie dotyczyć afery dotyczącej wykorzystania elementów stockowych w logo znanej pracowni wykonanym dla Polskiego Związku Łowieckiego albo być kontynuacją tematu podstawowych umów w branży kreatywnej, ale otrzymałem od Was kilka maili sugerujących, że większym zainteresowaniem będzie się cieszyć jednak temat AI, a konkretnie wątek legalności korzystania z „generatorów AI” takich jak Midjourney czy Stable Diffusion we własnym zakresie, w tym w celach komercyjnych.
Midjourney i Stable Diffusion wciąż na szczycie
Co by nie było, to faktycznie o umowach dla zawodów kreatywnych napisano już mnóstwo, a jeśli chodzi o aferę z logo PZŁ, to też było o tym w ostatnim miesiącu dość głośno. Najpewniej napiszę jeszcze o jednym i o drugim, ale rzeczywiście temat generative AI jest na tyle świeży i skomplikowany, że ciężko znaleźć jakiekolwiek opracowanie, nie mówiąc o tym, żeby było aktualne, kompletne i napisane innym językiem niż prawnicze monografie dla prawników.
No więc skoro tak, to kontynuujmy tę podróż, jednocześnie pamiętając o tym, że to, co piszę na temat prawnych aspektów generatorów AI, jest nieprzetestowane w sądach, nie ma też na ten temat – przynajmniej wg moich informacji – kompletnych opracowań uwzględniających bieżący rozwój sprawy (zwłaszcza z perspektywy prawa polskiego).
Innymi słowy, to są wyłącznie moje uproszczone przemyślenia oparte o moje rozumienie technologii i przepisów polskiego prawa autorskiego. Czy się okażą trafione – zobaczymy, ale na pierwszy prawomocny wyrok sądowy w Polsce trochę trzeba będzie poczekać, więc na razie niczego lepszego od przemyśleń prawników nie będzie.
No dobrze, zacznijmy od faktów.
Sprawa sądowa przeciwko Midjourney, Stable Diffusion i innym
13 stycznia 2023 r. do sądu w USA wpłynął pierwszy pozew artystów w sprawie masowych naruszeń praw autorskich przez producentów generatywnych AI (czyli, obrazowo mówiąc, programów tworzących grafiki na podstawie komend użytkowników). Wśród pozwanych są m.in. nasi blogowi ulubieńcy, czyli Stability AI (producent Stable Diffusion) i Midjourney (producent – uwaga – Midjourney) i inni, jak choćby nie mniej popularny wśród grafików DeviantArt (od niedawna producent modelu DreamUp opartego na Stable Diffusion).
17 stycznia 2023 r. świat obiegła informacja, że przeciwko Stability AI do sądu w Londynie wpłynął pozew od innego giganta – firmy Getty Images, również w związku z prawami autorskimi, a konkretnie „wciągnięciem” przez producenta Stable Diffusion milionów grafik z bazy stockowej Getty Images do swojej bazy danych treningowych, na których potem uczone było/jest Stable Diffusion.
Można zatem powiedzieć, że machina powoli rusza, choć z opóźnieniem.
Dlaczego rusza teraz?
No cóż, z każdym kolejnym miesiącem temat generative AI robi się coraz bardziej popularny i coraz więcej osób chce wykorzystywać je w celach komercyjnych, a nie do własnej zabawy wieczorem przy muzyce relaksacyjnej.
Ale moim zdaniem jest jeszcze jeden powód – publiczne samobójstwa, jakie zdarza się w ostatnim czasie popełniać technologicznym gigantom (niedawno pisałem o tym, jak czołowy człowiek z Mety [dawnego Facebooka] w dziwaczny sposób bronił na Twitterze nieszkodliwości generatora tekstu Galactica, który tworzył pseudonaukowe artykuły dotyczące np. zalet jedzenia… szkła).
Wywiad Forbes z założycielem i szefem Midjourney – początek końca?
Takiego gola do własnej bramki strzelił sobie m.in. założyciel i jednocześnie prezes/szef Midjourney w wywiadzie dla Forbesa (dostępnym w całości tutaj), który podał do publicznej wiadomości np. takie informacje:
- z Midjourney korzystają miliony użytkowników, a sam serwer Discorda Midjourney, na którym użytkownicy mogą generować grafiki na podstawie komend tekstowych, jest największym aktywnym serwerem Discorda na świecie;
- Midjourney pozwala na komercyjne korzystanie przez użytkowników z wygenerowanych grafik, ale w przypadku firm zarabiających więcej niż milion dolarów rocznie wymagana jest (płatna) licencja korporacyjna;
- baza danych Midjourney, na podstawie której generator o tej samej nazwie był i jest trenowany, to po prostu duży wycinek Internetu, wycięty bez szczególnej finezji;
- firma Midjourney nie próbowała nawet uzyskiwać zgody od autorów grafik, którymi „karmiony” był generator o tej samej nazwie, bo „nie da się zdobyć setek milionów grafik wraz z danymi ich twórców, nie ma rejestru praw autorskich, nawet jakbyśmy chcieli wystąpić do artystów o zgody to i tak nie wiedzielibyśmy kto jest twórcą danej grafiki ani nie mielibyśmy jak tego sprawdzić”;
- firma Midjourney dopiero pracuje nad tym, żeby artyści mogli się „wypisać” ze swoją twórczością z bazy Midjourney,
- firma Midjourney zastanawia się czy wprowadzać jakiś mechanizm pozwalający twórcom, których nazwiska pojawiają się w komendach użytkowników, na „zablokowanie” ich nazwisk, tak żeby nie pojawiały się w komendach, przy czym niestety na razie nie mają pomysłu jak weryfikować, czy Kowalski, który się zgłasza, to rzeczywiście jest Kowalski, a nie np. Iksiński, który się tylko pod Kowalskiego podszywa.
„Nie próbowaliśmy w Midjourney uzyskiwać zgody twórców.”
Niby nic nowego, ale jednak prosto od człowieka nr 1 w Midjourney, więc ciężko się potem będzie z takich słów wycofać.
Przypomnę w tym miejscu, że wg różnych informacji dostępnych w Internecie, bazy danych, w oparciu o które „uczono” Midjourney czy Stable Diffusion, to miliony, jak nie miliardy grafik, które zostały „wciągnięte” jako dane treningowe, zatem skala potencjalnego naruszenia jest monstrualna. Jeśli sądy dopatrzyłyby się naruszenia i zasądziłyby po złotówce od każdej grafiki, do której naruszono prawa autorskie, to wysokości odszkodowań byłyby po prostu astronomiczne.
O tym, dlaczego już samo „zassanie” grafik, którymi następnie karmiono (trenowano) modele AI jest problematyczne, pisałem w listopadzie we wpisie dotyczącym tego kto ma prawa autorskie do grafik wygenerowanych przez generatory takie jak Midjourney, Stable Diffusion czy Dall-E. W skrócie – można bronić tezy, że dochodzi do naruszenia praw autorskich majątkowych i osobistych twórców.
No dobrze, pomyślicie, ale to przecież producent modelu AI dokonał naruszenia praw autorskich. A jak to się ma do korzystania z tych generatorów przez zwykłych ludzi, którzy albo chcą pobawić się tymi narzędziami do celów własnej rozrywki, albo chcą wykorzystać te narzędzia w pracy i po prostu przy ich pomocy zarobić?
Czy można legalne korzystać z grafik tworzonych przez generatory AI takie jak Midjourney albo Stable Diffusion?
Jak zwykle odpowiedź nie jest jednoznaczna, bo „generator AI” jest tylko oprogramowaniem, narzędziem, podobnie jak Photoshop czy Paint. To, czy możemy z takich programów korzystać bez obaw o konsekwencje prawne, zależy przede wszystkim od tego czy one mogą wygenerować coś, czego dalsze wykorzystywanie może być nielegalne.
A to z kolei zależy od tego co te generatory wiedzą i skąd to wiedzą.
Pamiętajmy, że generatory AI same z siebie przecież nie wiedzą czym się różni (prawdziwe) ufortyfikowane średniowieczne miasteczko (np. hiszpańskie Toledo albo włoska Siena) od jakiegoś fotorealistycznego projektu miasta stworzonego choćby na potrzeby gry wideo, a zatem producent takiego AI (albo inna firma na jego zlecenie) musi te generatory tego nauczyć.
Na czym polega uczenie AI?
Nie mam wykształcenia, żeby prawidłowo rozumieć i tłumaczyć takie procesy, ale w dużym uproszczeniu chodzi o to, że to, co nazywamy generatywnym AI, nie jest prawdziwą sztuczną inteligencją, a zwykłym algorytmem, który działa na zasadzie input – output, choć oczywiście ten algorytm jest niezwykle zaawansowany.
Innymi słowy, algorytm nie może wyprodukować czegoś „z niczego”, bo – jak to mawiają – z pustego nawet Salomon nie naleje.
A zatem żeby generator wygenerował nam grafikę przedstawiającą kota w czapce bejsbolowej, musimy umożliwić mu analizę jak największej ilości zdjęć albo ilustracji m.in. kotów i czapek bejsbolowych. Nie wspominając o zdjęciach czy ilustracjach, na podstawie których algorytm się nauczy, że czapka powinna być na kociej głowie, a nie np. na ogonie.
Mówiąc obrazowo (ha!), trzeba ten generator nakarmić danymi. Ogromną ilością danych. Przypominam – w przypadku Midjourney i Stable Diffusion mówi się, że były to nawet miliardy grafik.
Następnie, poprzez proces tzw. dyfuzji, generator będzie w stanie odtworzyć („zrekonstruować”) to, czym został nakarmiony. Opracowania naukowe na temat sposobu działania modeli dyfuzyjnych można pobrać np. stąd. Dotyczy to sposobu działania wszystkich generatorów, o których pisałem, czyli Stable Diffusion, Midjourney i Dall-E 2.
Tymczasem w UE i w Polsce prawo autorskie co do zasady zabrania karmienia AI czymś, co jest chronione prawem autorskim, bez zgody twórcy W USA dozwolony użytek w prawie autorskim jest uregulowany inaczej, ale wiele wskazuje na to, że również i tam potrzebna jest zgoda twórców na karmienie AI ich twórczością – stąd ten głośny pozew przeciwko Midjourney, Stability AI i innym producentom, o którym pisałem wyżej.
A wystarczyło zapytać twórców o zgodę.
No to teraz pozostaje zapytać: skoro na karmienie cudzą twórczością trzeba mieć zgodę, to na jakiej podstawie producenci oprogramowania nazywanego generatorami AI nakarmili swoje oprogramowanie?
Jak przyznał szef Midjourney – na żadnej, bo stwierdzili, że to i tak niewykonalne.
Zanim jednak komuś przyjdzie do głowy, że problem dotyczy wyłącznie Midjourney, to sugeruję spojrzeć na obrazek niżej.
Stability AI przyłapane na gorącym uczynku.
Jak widać, nie dość, że Stable Diffusion wciągnął grafiki stockowe z bazy Getty Images (wg doniesień medialnych bez zgody Getty Images i bez zgody twórców), to jeszcze ze znakami wodnymi Getty Images, które teraz „wypływają” na generowanych grafikach.
Getty pewnie nie będzie pozywało zwykłych ludzi, tylko ograniczy się do pozwania producenta AI, ale istnieją firmy, które nie biorą jeńców i pozywają wszystkich po kolei, byle tylko chronić swoją własność intelektualną, o czym pisałem przy okazji wpisu o twórczości fanowskiej.
Innymi słowy problem polega na tym, że te wycinki Internetu, na których szkolonych jest przynajmniej spora część generatorów, zawierają dane, które nigdy nie powinny się były znaleźć w bazie.
Problem można porównać do zatrutej żywności, choć to niezbyt smaczny przykład.
A skoro te skażone dane już się znalazły wśród danych treningowych generatorów, to wszystko, co z generatorów wyjdzie, też może być skażone, a generator nas w żaden sposób nie ostrzeże.
I tak np. chcąc „narysować” w generatorze rudego kota w obuwiu sportowym, nieopatrzny entuzjasta generative AI może niechcący naruszyć np. prawa autorskie do wizerunku kota Garfielda (o setkach wizerunków baśniowej postaci Kota w butach nie wspomnę).
Albo prawo do znaku towarowego w postaci designu obuwia czy logo jakiejś firmy, które się znajdzie na bucie, czy też do wzoru przemysłowego.
Albo do wizerunku człowieka, który został „zassany” z jakichś fotografii, a teraz z jakiegoś powodu się pojawi (nieprzetworzony, albo lekko przetworzony jak logo Getty Images) w wygenerowanej grafice w towarzystwie usportowionego kota.
Naprawdę jest się o co potknąć, więc pytanie, czy warto, skoro konsekwencje są dotkliwe.
Z perspektywy odszkodowania za naruszenie praw autorskich, wina naruszyciela nie ma znaczenia (poza naprawdę marginalnymi przypadkami). A zatem osoba, która naruszyła prawa autorskie nieświadomie, wciąż może być zmuszona np. do zapłaty dwukrotności opłaty licencyjnej i/lub wydania uzyskanych korzyści.
Ale nie chodzi tylko o wchłanianie przez Midjourney czy Stable Diffusion wyglądu postaci czy przedmiotów.
Chodzi o wchłonięcie wycinka Internetu, a potem wypluwanie grafik, które przejmują twórcze elementy cudzych prac (w rozumieniu prawa autorskiego) albo inne chronione elementy z internetowych zasobów jak wizerunek człowieka czy znak towarowy.
Wystarczy porównać słynną „Gwiaździstą noc” Vincenta van Gogha, uznawaną za jeden z najbardziej rozpoznawalnych obrazów zachodniej sztuki, z efektami zabawy z generatorami AI.
Zresztą wystarczy wpisać w Google hasło typu „starry night midjourney” albo „starry night stable diffusion”, a przykładów tego, co potrafi AI po wciągnięciu cudzej twórczości, będzie aż nadto. Abstrahując od tego czy/kiedy przejęcie cudzego stylu, w ogólności, jest naruszeniem praw autorskich (nie jest to takie oczywiste i jednoznaczne, nawet wśród prawników), to w mojej ocenie tak właśnie może wyglądać przykład naruszenia praw autorskich poprzez przejęcie elementów twórczych z cudzego utworu chronionego prawem autorskim.
Co prawda „Gwiaździsta noc” jest w domenie publicznej, więc w tym wypadku do naruszenia praw autorskich (majątkowych) wyjątkowo nie doszło, ale to nie rozwiązuje problemu, bo po pierwsze wciąż trwają autorskie prawa osobiste, w tym prawo do integralności utworu (o różnicach między prawami autorskimi majatkowymi i osobistymi pisałem tutaj), a po drugie przecież nie jest tak, że generatory były karmione wyłącznie tym, co jest w domenie publicznej.
Były karmione po prostu wszystkim, bez finezji. Jak sam stwierdził szef Midjourney w linkowanym wyżej wywiadzie – „Nie byliśmy wybredni.”.
Korzystanie z Midjourney czy Stable Diffusion jest po prostu ryzykowne.
A zatem korzystanie z takich skażonych grafik nie jest moim zdaniem najlepszym pomysłem, bo istnieje spore ryzyko, że wypluta na podstawie komendy grafika będzie naruszać czyjeś prawa autorskie (przejęcie istotnych elementów twórczych oryginału i/lub naruszenie prawa do integralności utworu) albo inne prawa własności intelektualnej, np. prawo ochronne na znak towarowy albo wzór przemysłowy.
[Na marginesie – warto pamiętać, że to są skomplikowane kwestie prawne, które mogą być oceniane różnie nie tylko z perspektywy prawa różnych krajów, ale nawet przez prawników w obrębie jednego kraju. W Polsce te zagadnienia również są sporne, zarówno w teorii jak i w praktyce, a sądy nie wypracowały jednolitej linii orzeczniczej ani w zakresie przejmowania twórczych elementów cudzej twórczości ani w zakresie wielu innych zagadnień związanych z prawem autorskim. Tak czy inaczej, ryzyko naruszenia istnieje, a konsekwencje są dotkliwe.]
Co prawda da się postąpić w ten sposób, żeby jednorazowo wymusić na generatorze skupienie się na przetwarzaniu konkretnych prac, które sami załadujemy (pisałem o takim sposobie pracy ze Stable Diffusion tutaj – autor doskonale wiedział co robi i robił to ostrożnie), a wtedy ryzyko naruszenia cudzych praw można ograniczyć praktycznie do zera, ale wtedy użyteczność generatorów AI jest zbliżona do poziomu takiego Photoshopa, czyli narzędzia, które co prawda może dać spektakularne efekty, ale jednak wymaga pewnych umiejętności i nakładu pracy.
Krótko mówiąc – dla elektryka majstrowanie w gniazdku elektrycznym prawdopodobnie nie jest szczególnie niebezpieczne, ale dla innych (a na pewno dla mnie) już tak. Dlatego jeśli ktoś wie co robi, to może to być w stanie robić legalnie, ale to wyjątek, a nie reguła.
A co jeśli dane treningowe generatorów AI zostały(by) pozyskane zgodnie z prawem?
A gdyby model AI był uczony wyłącznie na podstawie legalnych źródeł, np. grafik udostępnionych za zgodą twórców właśnie do szkolenia sztucznej inteligencji, najlepiej z jednoczesną zgodą twórców na pomijanie ich imion i nazwisk?
Myślę, że wtedy korzystanie z takiego narzędzia byłoby legalne. Kto wie, może serwisy stockowe same będą niedługo oferować możliwość „wygenerowania sobie” gotowców na podstawie ich własnych stockowych baz. Gdyby wcześniej zaczęły masowo skupować prawa autorskie od grafików, którzy będą chętni na taki układ, to czemu nie. Rynek zweryfikuje.
[AKTUALIZACJA NA 04.2023 – Jest już narzędzie, które wygląda dobrze. Piszę o tym w artykule o legalnej alternatywie do Midjourney i Stable Diffusion]
Jest jednak pewien problem.
Da się to zrobić legalnie, ale zawsze jest jakieś „ale”.
Świat się nie kończy na przepisach prawnych, bo nawet jak nie będzie przeszkód prawnych, to mogą być finansowe. Przecież opracowanie takiego narzędzia, którego dalsze wykorzystywanie przez każdego byłoby w pełni legalne, na pewno byłoby znacznie droższe dla producenta z uwagi na licencję do wykorzystania milionów albo i miliardów grafik jako danych treningowych.
A skoro producent musiałby ponieść dodatkowe koszty na wynagrodzenia twórców, to pewnie chciałby się finansowo „odbić” na którymś etapie tego biznesu, np. pobierając od użytkowników wysokie opłaty licencyjne za korzystanie z oprogramowania.
Coś za coś.
Tak samo jak więcej kosztuje oryginalny pluszak na licencji Disneya, niż jakaś chińska podróbka. O przykładach takich zdeformowanych postaci fikcyjnych i o niektórych aspektach zarabiania na nich pisałem we wpisie na temat FanArtu.
Kiedyś to było…
Były czasy, że w Polsce dosłownie wszędzie handlowano towarami naruszającymi cudzą własność intelektualną – odzieżą, zabawkami, muzyką, filmami, oprogramowaniem czy grami. Choć taki sposób prowadzenia biznesu był niezgodny z prawem, to przez jakiś czas był społecznie akceptowany i organy ścigania zdawały się patrzeć na to przez palce, nawet nie celowo, ale choćby przez brak doświadczenia z zakresu zwalczania takich praktyk. Podobnie było z piractwem internetowym, które obecnie jest zjawiskiem marginalnym, choć jeszcze niedawno było zmorą branży kreatywnej.
Czasy się jednak zmieniły.
Ale te czasy odeszły i to raczej bezpowrotnie (choć nie wszędzie, bo np. w Rosji wróciły jako część machiny wojennej Putina… o ile w ogóle kiedykolwiek w Rosji zdążyły odejść), a wiele osób, które na tym zarobiły, zostało skazanych na wysokie odszkodowania i nierzadko również kary pozbawienia wolności.
Przykładowo, pewien 25-latek, który podobno zarobił na swoim znanym (polskim) pirackim serwisie z filmami około milion złotych z małym hakiem w ciągu 4 lat, został w 2021 skazany na rok więzienia w zawieszeniu i konieczność zapłaty 48 mln zł odszkodowania na rzecz pokrzywdzonych. A i tak mogło być gorzej, bo zamiast „roku w zawiasach” prokuratura domagała się 3,5 roku bezwzględnej kary więzienia. O tej sprawie i o wielu innych podobnych było, jest i jeszcze przez jakiś czas pewnie będzie głośno.
Podsumowanie
Generatory AI to niesamowite narzędzia, które potrafią w sekundy stworzyć fascynujące efekty. Można bronić poglądu, że potrafią zrobić więcej, szybciej i lepiej niż człowiek, więc naturalnym jest, że każdy chciałby z nich skorzystać.
Od strony prawnej temat jest skomplikowany, ale w skrócie, w mojej ocenie, korzystanie z tych narzędzi poza domowym zaciszem (które i tak jest z perspektywy prawnej szarą strefą, a nie zieloną wyspą), zwłaszcza bezrefleksyjnie, może grozić naruszeniem praw autorskich, które – uwaga – nie jest wcale uzależnione od winy naruszyciela.
A naruszenie praw autorskich to poważna sprawa, która może się skończyć nie tylko sprawą o odszkodowanie, ale nawet sprawą karną.
Do tego warto pamiętać o tym, że jeśli posłużymy się grafikami wytworzonymi przez AI, które same z siebie nie będą chronione prawem autorskim (o zasadach takiej ochrony pisałem tutaj), to bardzo ułatwimy komuś korzystanie z „naszych” grafik. Mogą się one np. pojawić na portalach aukcyjnych na produktach niższej jakości oferowanych przez innych sprzedawców, po niższych cenach, z gorszą obsługą klienta itd. W takiej sytuacji znacznie trudniej bronić się przed nieuczciwą konkurencją, niż gdybyśmy do tych „naszych” grafik mieli prawa autorskie.
Poza tym dochodzi jeszcze kwestia etyki i wpływu na pracę i życie twórców, którzy są podwójnie pokrzywdzeni. Nie dość, że nie otrzymali wynagrodzenia za to, że AI było karmione ich twórczością (na to potrzebna jest przecież zgoda, a takie zgody są w praktyce płatne), to jeszcze teraz to samo AI może tych artystów – przynajmniej w niektórych dziedzinach – zastąpić, odbierając im zawód.
A co jest w tym wszystkim najgorsze?
To, że choć cały ten proces odbywa się prawdopodobnie (a przynajmniej moim zdaniem) nielegalnie, to jednak mało kto na to zwraca uwagę, udając, że problemu albo nie ma, albo go marginalizując. I o ile jest to zrozumiałe przy domowej zabawie zwykłego człowieka, o tyle korporacjom trudno będzie wybaczyć.
P.s. Dla głodnych wiedzy z perspektywy osoby niebędącej prawnikiem, polecam ten materiał na YouTube. Ułatwia zrozumienie wielu problemów związanych z generatorami AI, daje ciekawą perspektywę i zachęca do dyskusji.
Marek Nowicki
adwokat
***
Prawa autorskie a sztuczna inteligencja (Dall-E)
Dzisiaj mała przerwa od plagiatów i zmian, bo zajmiemy się dość głośnym ostatnio tematem za sprawą Dall-E – prawa autorskie a sztuczna inteligencja.
Prawa autorskie a sztuczna inteligencja (Dall-E, Dall-E Mini, Midjourney)
Myślałem, że to temat, który bardziej interesuje filozofów, socjologów i prawników, niż grafików, ale na jednym z forów dla grafików na FB zadano mi takie pytanie [Czytaj dalej…]
***
Zobacz też:
Legalna alternatywa do Midjourney i Stable Diffusion
Prawa autorskie do komiksu stworzonego przy pomocy Midjourney
Kto ma prawa autorskie do grafik Midjourney, Stable Diffusion i Dall-E 2?
Czy AI może się uczyć na cudzej twórczości bez licencji?
Sztuczna inteligencja wygrała konkurs plastyczny (Midjourney)
Prawa autorskie zwierząt
Prawa autorskie a sztuczna inteligencja (Dall-E)
{ 0 komentarze… dodaj teraz swój }