Marek Nowicki

adwokat

Prowadzę kancelarię w Bielsku-Białej, ale doradzam twórcom i przedsiębiorcom z całej Polski. Mam przyjemność łączyć zainteresowania z życiem zawodowym - moją pasją są technologia i gry wideo, a na co dzień zajmuję się głównie prawem autorskim, przygotowując umowy, regulaminy i pisma dla branży kreatywnej i e-commerce...
[Więcej >>>]

Potrzebujesz porady albo umowy?

Czy AI może się uczyć na cudzej twórczości bez licencji?

Marek Nowicki30 października 2022Komentarze (1)

Temat grafik generowanych przez AI w ostatnich miesiącach szaleje. Kiedy pracowałem nad pierwszym wpisem poświęconym problemom AI z perspektywy prawa autorskiego i zabawie z Dall-E Mini, opublikowanym 1 lipca 2022, to nie sądziłem, że sprawy pójdą do przodu aż tak szybko, że modele oparte na sztucznej inteligencji jeszcze w tym samym roku będą w stanie rywalizować z prawdziwymi artystami. Mowa tu głównie o Midjourney i Stable Diffusion (przy czym biorę też pod uwagę łatwość korzystania i dostępność).

Tak czy inaczej, potraktowałem to jako kolejną viralową nowinkę technologiczną, której daleko do doskonałości.

Midjourney i Stable Diffusion podbijają świat

midjourney ai prawo autorskie marek nowicki adwokat bielsko

Niby Darth Vader, ale jednak mocno zepsuty. Gdyby nie to, że wygląd tej postaci jest tak charakterystyczny i unikatowy, to można byłoby się zastanawiać kogo „autor” miał na myśli.

I to właśnie brak doskonałości tego, co „wypluwał” na moje komendy Dall-E Mini (Crayion), spowodował, że w kontekście prawa autorskiego myślałem i pisałem głównie o tym co my, ludzie siedzący przed ekranem, możemy zrobić z tym, co wygeneruje AI, natomiast nieszczególnie mnie wtedy interesowało skąd taki np. Dall-E Mini wie jak wygląda Darth Vader.

Od tamtej pory trochę się jednak zmieniło, bo 12 lipca rozpoczęła się otwarta beta modelu Midjourney, który generuje obrazy na podstawie komend tekstowych na… Discordzie. Miesiąc później światło dzienne ujrzał z kolei Stable Diffusion, który też się w tańcu nie hamuje.

O ile temat autorstwa „prac” wygenerowanych przez AI jest w tym samym miejscu co początkiem lata (chociaż chętnie napiszę na ten temat więcej), o tyle obecnie na uwagę zasługuje inna kwestia, na którą zwrócił uwagę w komentarzach jeden z czytelników (któremu serdecznie z tego miejsca za to dziękuję):

Sprawy i technika tak szybko posuwają się do przodu, że skrypty i i efekty ich działania sprzed miesiąca są dzisiaj nieaktualne i za miesiąc prawdopodobnie znowu się to zmieni. Chciałbym zwrócić Twoją uwagę na ten artykuł: https://waxy.org/2022/08/exploring-12-million-of-the-images-used-to-train-stable-diffusions-image-generator/

Autorzy piszą w nim o przeanalizowaniu 2% bazy danych użytych przez twórców Stable Diffusion do wytrenowania swojego algorytmu. Znalazłem tam jeden swój obraz, ale np. Simon Stalenhag ma ich tam ponad 400 – a to tylko fragmencik całej bazy. Wygląda więc na to, że twórcy po prostu przeczesali internet jak leciało, żeby zbudować sobie swoją bazę danych. Później następuje proces przetworzenia tych obrazów na gaussowski szum, z którego powstaje wsad dla generatora. Krótka piłka – czy to jest legalne? Ludzie porównują to naiwnie do uczenia się przez ludzi, ale to nie ma z tym nic wspólnego. Nie mówimy tu o uczeniu się przez człowieka, tylko o skrypcie, kodzie, kalkulatorze przeczesującym miliardy grafik, zapakowanego w formie produktu, za który się płaci (Midjourney, Dalle) lub korzysta za darmo (Stable Diffusion). Będę wielce zobowiązany za Twój komentarz.

prawo autorskie stable diffusion marek nowicki adwokat bielsko

Źródło: Unsplash

Niedobrze

Biorąc pod uwagę wykładniczy wzrost zainteresowania grafikami tworzonymi przez AI i ich komercyjnym zastosowaniem, sprawa jest moim zdaniem bardzo poważna.

I to zarówno pod kątem skali potencjalnego naruszenia jak i konsekwencji – zarówno dla poszkodowanych jak i w ogóle dla całego społeczeństwa. Przecież jeżeli każdy będzie mógł sobie wygenerować dosłownie wszystko we względnie precyzyjny sposób, za darmo albo za symboliczną opłatą, bez umowy i wychodzenia z domu, to po co w ogóle będą potrzebni gospodarce prawdziwi artyści? Do karmienia algorytmu, który ich zastąpi z marszu?

Z tego co mi wiadomo (np. z wywiadu z Gregiem Rutkowskim, odpowiedzialnym za ilustracje m.in. do Horizon Forbidden West czy karcianki Magic: the Gathering), to już teraz wydawcy książek, gier i innych podobnych produktów czerpią z „generatorów ilustracji”, bo z finansowego punktu widzenia jest to po prostu szalenie opłacalne.

Midjourney i Stable Diffusion a prawo autorskie

A czy takie działanie w ogóle jest legalne?

prawo autorskie stable diffusion marek nowicki adwokat bielsko

Źródło: Unsplash

Klasyczne „to zależy” się należy.

[Pomijam rozbieżności w podejściu autorów tych narzędzi do tego kto jest autorem i na jakiej zasadzie użytkownik i inne osoby mogą z tych wygenerowanych grafik korzystać. To jest niezwykle ciekawe, ale zostawmy to na kiedy indziej.]

Krótko mówiąc, w większości przypadków nie ma przeszkód, żeby takie wydawnictwo sobie wygenerowało jakieś ilustracje a potem wykorzystało je np. jako oprawę komiksu. Są od tego rzecz jasna wyjątki, bo przecież świat się nie kończy na prawie autorskim i trzeba pamiętać choćby o znakach towarowych i prawie do wizerunku, ale chodzi mi o ogólną zasadę. Więcej na ten temat pisałem w pierwszym wpisie na temat korzystania z generatorów AI.

prawo autorskie stable diffusion marek nowicki adwokat bielsko

Źródło: Unsplash

Swoją drogą, we wrześniu tego roku pewna Amerykanka właśnie zgłosiła swój komiks Zarya of the Dawn do US Copyright Office. Nie byłoby w tym nic szczególnego, gdyby nie to, że ilustracje do komiksu „zrobił” Midjourney. I szok, bo wnioskodawczyni przyznano ochronę prawną (na jej nazwisko), co jeszcze bardziej podgrzało temat zarówno w mediach jak i w branży grafików i prawników. O szczegółach można przeczytać np. tutaj.

Wracając, z perspektywy tej pani od komiksu, tak samo jak z perspektywy pana, który wygrał konkurs plastyczny za pomocą projektu stworzonego w Midjourney, wszystko jest legalne.

Gdzie zatem jest problem z legalnością?

Cofnijmy się trochę, a wszystko będzie jasne:

Skąd taki np. Dall-E Mini wie jak wygląda Darth Vader?

No cóż, odpowiedź na to pytanie jest zawarta w pytaniu, które przytoczyłem:

Wygląda więc na to, że twórcy po prostu przeczesali internet jak leciało, żeby zbudować sobie swoją bazę danych. Później następuje proces przetworzenia tych obrazów na gaussowski szum, z którego powstaje wsad dla generatora. Krótka piłka – czy to jest legalne?

Ok, krótka piłka:

Moim zdaniem uczenie maszynowe na cudzej twórczości bez licencji nie jest legalne.

Jednym z podstawowych uprawnień twórcy wynikających z przepisów ustawy o prawie autorskim i prawach pokrewnych jest uprawnienie do zabraniania innym utrwalania i zwielokrotniania utworu chronionego prawem autorskim (o tym czym jest utwór i kiedy jest chroniony pisałem, odpowiednio, tutaj i tutaj).

Brzmi to enigmatycznie, ale chodzi o wszystkie sposoby, w ramach których powstaje kopia utworu. Dotyczy to zarówno „ręcznego powielenia” (np. replika obrazu), skopiowania pliku znajdującego się w folderze X na dysku i wklejenia go do folderu Y, pobrania grafiki czy tekstu z tego bloga na dysk, jak i milionów innych sposobów korzystania, które wiążą się z kopiowaniem, choćby ze względów technologicznych. Wchodzi w to nawet powielenie utworu w pamięci RAM komputera.

Oczywiście od powyższej zasady są wyjątki, w Polsce nazywane postaciami dozwolonego użytku. Są to np. dozwolony użytek prywatny, prawo publicznego wystawienia egzemplarza, prawo cytatu, prawo panoramy, czy – skoro jesteśmy przy temacie technologii – prawo tymczasowego zwielokrotnienia, do którego dochodzi w pamięci RAM naszych urządzeń, które potem wyświetlają interesującą nas treść.

prawo autorskie stable diffusion marek nowicki adwokat bielsko

Źródło: Unsplash

Ciekawostka – YouTube nie pozwala na pobieranie filmów i zapisanie ich na dysku. Właśnie na tym polega prawo YouTube (otrzymane na zasadzie licencji od użytkownika, który umieścił na YT swoją treść) do zabraniania innym kopiowania i powielania filmów dostępnych na tej platformie. Skoro jednak wyświetlając ten film dokonujemy powielenia pliku w pamięci RAM komputera czy telefonu, to powinno dojść do naruszenia praw autorskich, prawda?

Powinno, ale nie dochodzi właśnie dlatego, że mamy wyjątek w postaci prawa tymczasowego zwielokrotniania, z którego może korzystać legalny nabywca. A legalnym nabywcą będzie każdy, kto odtworzy film dostępny na YT zgodnie z warunkami regulaminu korzystania z YouTube.

Co to ma do rzeczy?

No dobrze, zapytacie, ale co to ma do trenowania „generatorów sztuki”, które dziwnym trafem wiedzą jak wygląda Darth Vader?

Otóż sęk w tym, że modele AI same z siebie nic nie wiedzą. Program jak program. Trzeba ten program dopiero nauczyć czym się różni Vader od wiadra.

I to tutaj widzę problem.

O ile twórcy Dall-E 2 unikają odpowiedzi na pytanie skąd ich program wie jak wygląda Darth Vader, o tyle twórcy Stable Diffusion przyznają to otwarcie – ich program był uczony na podstawie bazy danych niemieckiej organizacji LAION.

A skąd LAION ma bazę danych, w której znajdują się grafiki cudzego autorstwa?

LAION twierdzi, że nie ma tam grafik, a jedynie są… linki do grafik. A linkowanie rzeczywiście jest legalne, poza szczególnymi przypadkami typu linkowanie do materiałów umieszczonych bez zgody twórcy (bazy torrentów, chomikuj i inne).

Tak czy inaczej, ostateczny efekt jest taki, że Stable Diffusion doskonale odróżnia Vadera od wiadra, więc wygląda na to, że wizerunek znanego Lorda Sithów został przeżuty na tyle intensywnie, że obecnie program nie ma problemu z wypluciem tego, czego szukamy. Twórcy twierdzą, że to tylko narzędzie jak każde inne, że można je wykorzystywać właściwie lub niewłaściwie, i że oni zachęcają do respektowania prawa i cudzej twórczości.

greg rutkowski stable diffusion marek nowicki adwokat bielsko

Grzegorz Rutkowski – Castle Defense (2018) | Źródło

No ale zaraz, czy oni zalecają respektowanie prawa i cudzej twórczości po tym jak doszło do powielenia astronomicznej liczby cudzych grafik bez zgody ich twórców?

Panie Areczku, dla Pana jest respektowanie prawa i cudzej twórczości

Jak to jest, że dziwnym trafem Stable Diffusion jest ekspertem od twórczości Grega Rutkowskiego, który wg informacji zawartych w tym artykule, był „świadomie” naśladowany przez SD ok. 93 000 razy podczas 10 milionów zapytań? I tu nie chodzi o naśladowanie w ogóle, ale wpisanie komendy w stylu „Castle by Greg Rutkowski”, która ma na celu wygenerowanie zamku w stylu kojarzonym konkretnie ze stylem Grega Rutkowskiego.

greg rutkowski stable diffusion marek nowicki adwokat bielsko 2

Grafika typu „Greg Rutkowski” wygenerowana przez Stable Diffusion. Widać podobieństwo?

Dla przykładu, komendy zawierające nazwiska Picassa czy Leonarda da Vinci, były częścią zapytań mniej niż 2 000 razy (źródło).

Podkreślam, że nie chodzi o inspirację stylem Grega Rutkowskiego, w ramach której ja albo ktoś bardziej uzdolniony stworzy przepiękną ilustrację w stylu wspomnianego artysty.

Chodzi mi wyłącznie o „zaciągnięcie” jego twórczości do bazy, która posłużyła do nakarmienia algorytmu, który teraz może tworzyć ilustracje w stylu Grega Rutkowskiego, za które naśladowany ilustrator nigdy nie otrzyma ani złotówki.

Ktoś mógłby powiedzieć, że to znak czasów. W końcu jak inaczej miałaby się rozwinąć taka technologia?

Dyrektywa UE – prawo do eksploracji tekstów i danych

No więc jest na to rozwiązanie.

W 2019 uchwalono dyrektywę Unii Europejskiej, której celem było właśnie to, żeby stworzyć uproszczony sposób na legalne karmienie algorytmu danymi, a tym samym uczynić UE korzystniejszym środowiskiem do rozwoju technologii opartej na uczeniu maszynowym. Dzisiaj algorytm nie powinien być karmiony bez licencji, choćby otwartej jak Creative Commons.

Na podstawie tej dyrektywy do lipca 2021 wszystkie państwa członkowskie UE, w tym Polska, miały wprowadzić do swojego prawa pewne zasady. Jedną z tych zasad jest to, że państwa mają zapewnić podstawę prawną m.in. do trenowania modeli AI takich jak Midjourney czy Stable Diffusion. Warunkiem jednak jest taki, że każdy twórca ma mieć możliwość wyrażenia sprzeciwu za pomocą komend możliwych do odczytania przez algorytm przeczesujący Internet.

Trochę jak z losem naszych organów po śmierci. W Polsce, domyślnie mogą one zostać przekazane… dalej. Oczywiście jeśli komuś takie rozwiązanie nie odpowiada, to może przejąć inicjatywę i coś z tym zrobić. Gdyby zasada była odwrotna, to pewnie zgodę na wykorzystanie organów wyraziłaby niewielka część społeczeństwa, a tak to wszyscy są zadowoleni, a organów jest więcej.

Przenosząc to na grunt prawa autorskiego i uczenia maszynowego na podstawie ogólnodostępnych danych – jeśli pozostanę pasywny, to na podstawie nowych przepisów Stable Diffusion i inne narzędzia będą mogły legalnie karmić się tym, co wrzucę na swojego bloga, niezależnie od tego czy będą to grafiki, zdjęcia czy tekst.

Natomiast jeśli zaszyję w kodzie strony sprzeciw, to musi on być respektowany przez każdego, kogo nie obejmuje specjalny wyjątek (sprzeciw ma nie dotyczyć np. jednostki prowadzącej badania naukowe do celów niekomercyjnych (np. uniwersytet).

Crème de la crème

Te przepisy powinny były zostać wprowadzone do przepisów krajowych do 7 czerwca 2021.

prawo autorskie stable diffusion marek nowicki adwokat bielsko

A co na to Temida? | Źródło: Unsplash

Ale… nie zostały uchwalone ani w Polsce ani w niektórych innych państwach UE.

Na razie jesteśmy w Polsce od X miesięcy na etapie projektu ustawy, który może wejdzie w takim kształcie, może w trochę innym, ale te przepisy jeszcze nie obowiązują.

I nie ma moim zdaniem żadnego uzasadnienia, żeby moja twórczość została dzisiaj wykorzystana do karmienia algorytmu. No chyba, że tak jak w przypadku korzystania z Google Translate, wyrażę zgodę na to, żeby Google uczył swojego tłumacza na podstawie mojej aktywności (to jest warunek korzystania).

A skąd mogę wiedzieć, że moja twórczość została wykorzystana przez Stable Diffusion?

No cóż, bohaterami w przysłowiowym domu są w tym wypadku Holly Herndon i Mat Dryhurst, berlińscy artyści odpowiedzialni za stronę internetową haveibeentrained.com. Jak sama nazwa wskazuje, strona ta pozwala na sprawdzenie, czy nasza twórczość wylądowała w bazie wykorzystywanej do karmienia algorytmów, liczącej… 5,8 miliarda grafik wykorzystanych do uczenia maszynowego modeli Midjourney i Stable Diffusion.

5,8 miliarda.

Jest wysoko.

Co z tym zrobić? Ciężko powiedzieć. Jedni wypłyną na nieznane wody i podejmą walkę, o której będzie głośno w mediach, inni machną ręką, bo końcówka 2022 to kiepski moment na tak wzniosłe kwestie, kiedy na horyzoncie mamy dosłownie 4 Jeźdźców Apokalipsy, a zaraz zacznie się robić zimno niczym za Murem.

Jedno jest pewne – o temacie generatorów AI będzie jeszcze głośniej.

Marek Nowicki
adwokat

***

Prawa autorskie a sztuczna inteligencja (Dall-E)

Dzisiaj mała przerwa od plagiatów i zmian, bo zajmiemy się dość głośnym ostatnio tematem za sprawą Dall-E – prawa autorskie a sztuczna inteligencja.

Prawa autorskie a sztuczna inteligencja (Dall-E, Dall-E Mini, Midjourney)

Myślałem, że to temat, który bardziej interesuje filozofów, socjologów i prawników, niż grafików, ale na jednym z forów dla grafików na FB zadano mi takie pytanie [Czytaj dalej…]

***

Zobacz też:

Sztuczna inteligencja wygrała konkurs plastyczny (Midjourney)
Prawa autorskie zwierząt
Prawa autorskie a sztuczna inteligencja (Dall-E)

W czym mogę Ci pomóc?

Na blogu jest wiele artykułów, w których dzielę się swoją wiedzą bezpłatnie.

Jeżeli potrzebujesz indywidualnej płatnej pomocy prawnej, to zapraszam Cię do kontaktu.

Przedstaw mi swój problem, a ja zaproponuję, co możemy wspólnie w tej sprawie zrobić i ile będzie kosztować moja praca.

Marek Nowicki

    Twoje dane osobowe będą przetwarzane przez Kancelaria Adwokacka Marek Nowicki w celu obsługi przesłanego zapytania. Szczegóły: polityka prywatności.

    { 1 komentarz… przeczytaj go poniżej albo dodaj swój }

    Mikołaj 30 października, 2022 o 14:43

    Doskonały artykuł.

    Odpowiedz

    Dodaj komentarz

    Twoje dane osobowe będą przetwarzane przez Kancelaria Adwokacka Marek Nowicki w celu obsługi komentarzy. Szczegóły: polityka prywatności.

    Poprzedni wpis:

    Następny wpis: