Regulamin serwisu YouTube zabrania wykorzystywania publikowanych tam treści do szkolenia sztucznej inteligencji. Wygląda jednak na to, że kilka dużych firm z szeroko pojętej branży technologicznej naruszyło ten zakaz. W gronie tym znalazło się również Apple.

Według ustaleń serwisu Wired, firmy takie jak Apple, Anthropic, Nvidia i Salesforce używały do szkolenia swoich modeli AI zbiory danych zawierające transkrypcje ponad 170 tysięcy filmów zaczerpniętych bez zgody twórców z niemal 50 tysięcy różnych kanałów z serwisu YouTube. Wśród wykorzystanych treści znalazły się m.in. kanały edukacyjne Khan Academy, MIT i Harvard, serwisy informacyjne The Wall Street Journal, NPR i BBC oraz programy rozgrywkowe The Late Show With Stephen Colbert, Last Week Tonight With John Oliver i Jimmy Kimmel Live. Nie zabrakło wśród nich także treści tworzonych przez popularnych youtuberów, takich jak MrBeast, Jacksepticeye, PewDiePie czy Marques Brownlee. Ten ostatni, który w swoich filmach wielokrotnie poruszał tematy związane z Apple, opublikował krótkie nagranie komentujące całą sytuację.

Za przygotowanie wspomnianego zbioru danych odpowiadała firma EleutherAI. Oficjalnie powstał on z myślą o małych deweloperach i naukowcach prowadzących badania nad rozwojem sztucznej inteligencji. Według ustaleń serwisu Wired Apple wykorzystywało go m.in. do szkolenia zaprezentowanego w kwietniu modelu językowego OpenELM.

Źródło: Wired