Pierwsza fala głównych narzędzi generatywnej sztucznej inteligencji była w dużej mierze szkolona na „publicznie dostępne„dane” – w zasadzie wszystko, co można pobrać z Internetu. Obecnie źródła danych szkoleniowych coraz bardziej ograniczają dostęp i nalegają na zawieranie umów licencyjnych. Wraz z intensyfikacją poszukiwań dodatkowych źródeł danych pojawiły się nowe start-upy licencyjne, które zapewniają przepływ materiałów źródłowych.
The Sojusz dostawców zbiorów danychgrupa branżowa utworzona tego lata, chce uczynić branżę sztucznej inteligencji bardziej ujednoliconą i sprawiedliwą. W tym celu właśnie wypuścił dokument przedstawiający stanowisko przedstawiając swoje stanowisko w głównych kwestiach związanych ze sztuczną inteligencją. Sojusz składa się z siedmiu firm licencjonujących sztuczną inteligencję, w tym firmy zarządzającej prawami autorskimi do muzyki Uprawnijjapońska giełda zdjęć Pixtaoraz start-up zajmujący się licencjonowaniem praw autorskich w zakresie generatywnej sztucznej inteligencji Sieci Kaliope. (Co najmniej pięciu nowych członków zostanie ogłoszonych jesienią).
Organ ochrony danych opowiada się za systemem opt-in, co oznacza, że dane mogą być wykorzystywane wyłącznie po wyraźnym wyrażeniu zgody przez twórców i posiadaczy praw. Stanowi to znaczące odejście od sposobu działania większości dużych firm zajmujących się sztuczną inteligencją. Niektóre opracowały własne systemy rezygnacji, które nakładają na właścicieli danych obowiązek wykonywania swoich obowiązków w oparciu o indywidualne podejście do każdego przypadku. Inne nie oferują żadnych możliwości rezygnacji.
DPA, który oczekuje, że członkowie będą przestrzegać zasady wyrażenia zgody, uważa tę drogę za znacznie bardziej etyczną. „Artyści i twórcy powinni wziąć w tym udział” – mówi Alex Bestall, dyrektor generalny Rightsify i firmy licencjonującej dane muzyczne Globalna wymiana praw autorskichktóry stał na czele tego wysiłku. Bestall postrzega zgodę jako podejście pragmatyczne i moralne: „Sprzedaż publicznie dostępnych zbiorów danych to jeden ze sposobów, w jaki można zostać pozwanym i stracić wiarygodność”.
Ed Newton-Rex, były dyrektor ds. sztucznej inteligencji, który obecnie prowadzi etyczną organizację non-profit Fairly Trained zajmującą się sztuczną inteligencją, nazywa rezygnację „zasadniczo nieuczciwą wobec twórców” i dodaje, że niektórzy mogą nawet nie wiedzieć, kiedy oferowana jest rezygnacja. „Szczególnie miło jest widzieć, że DPA wzywa do wyrażenia zgody” – mówi.
Shayne Longpre, lider w Inicjatywa dotycząca pochodzenia danychkolektyw wolontariuszy, który audytuje zbiory danych sztucznej inteligencji, uważa wysiłki organu ochrony danych na rzecz etycznego pozyskiwania danych za godne podziwu, chociaż podejrzewa, że standard dotyczący zgody może być trudny do sprzedania ze względu na ogromną ilość danych wymaganych przez większość współczesnych modeli sztucznej inteligencji. „W ramach tego systemu albo zabraknie danych, albo zapłacisz dużo” – mówi. „Może być tak, że tylko kilku graczy, duże firmy technologiczne, może sobie pozwolić na licencjonowanie wszystkich tych danych”.
W artykule DPA sprzeciwia się udzielaniu licencji narzucanych przez rząd, opowiadając się zamiast tego za podejściem „wolnorynkowym”, w ramach którego twórcy danych i firmy zajmujące się sztuczną inteligencją negocjują bezpośrednio. Inne wytyczne są bardziej szczegółowe. Sojusz sugeruje na przykład pięć potencjalnych struktur wynagrodzeń, aby zapewnić twórcom i posiadaczom praw odpowiednie wynagrodzenie za ich dane. Należą do nich model oparty na subskrypcji, „licencjonowanie oparte na użytkowaniu” (w którym opłaty są płacone za każde użycie) oraz licencjonowanie „oparte na wynikach”, w którym opłaty licencyjne są powiązane z zyskiem. „Mogą one nadawać się do wszystkiego, od muzyki, przez obrazy, po filmy, programy telewizyjne i książki” – mówi Bestall.