In den letzten Tagen sorgte ein Thema für große Aufregung in der Tech-Branche: Apple und andere Tech-Konzerne hatten ohne Zustimmung der Content Creators YouTube-Videos verwendet, um damit ihre KI-Modelle zu trainieren. Dazu wurden Untertitel – und damit ganze Transkripte – von mehr als 170.000 YouTube-Videos über eine Organisation namens EleutherAI heruntergeladen. Betroffen waren unter anderem Tech-Reviewer Marques Brownlee mit seinem Kanal MKBHD, PewDiePie, Mr. Beast, Stephen Colbert und Jimmy Kimmel.
Apple hatte diese Daten verwendet, um die eigenen Open Source-Modelle OpenELM, die im April dieses Jahres veröffentlicht worden sind, damit zu trainieren. Nun hat sich Apple gegenüber 9to5Mac geäußert und gibt an, dass OpenELM keine der eigenen KI- oder maschinellen Lernfunktionen, einschließlich Apple Intelligence, betreibe. Bei 9to5Mac heißt es dazu:
„Apple sagt, dass es das OpenELM-Modell geschaffen hat, um einen Beitrag zur Forschungsgemeinschaft zu leisten und die Entwicklung großer Open Source-Sprachmodelle voranzutreiben. In der Vergangenheit haben Apple-Forscher OpenELM als ein ‚hochmodernes offenes Sprachmodell‘ bezeichnet.
Nach Angaben von Apple wurde OpenELM nur für Forschungszwecke entwickelt und nicht für die Nutzung der Apple Intelligence-Funktionen. Das Modell wurde als Open Source veröffentlicht und ist weithin verfügbar, unter anderem auf der Apple-Website Machine Learning Research.
Da OpenELM nicht als Teil von Apple Intelligence verwendet wird, bedeutet dies, dass der ‚YouTube-Untertitel’-Datensatz nicht für Apple Intelligence verwendet wird. In der Vergangenheit hat Apple erklärt, dass die Apple Intelligence-Modelle ‚auf lizenzierten Daten, einschließlich Daten, die zur Verbesserung bestimmter Funktionen ausgewählt wurden, sowie auf öffentlich verfügbaren Daten, die von unserem Web-Crawler gesammelt wurden‘, trainiert wurden.“
Apple stellte gegenüber 9to5Mac auch klar, dass man keine Pläne habe, weitere neuen Versionen von OpenELM zu entwickeln. Aufgedeckt hatte das Magazin Wired die Tatsache, dass Konzerne wie Apple, NVIDIA, Salesforce und Anthropic Untertitel von 173.536 YouTube-Videos, die von mehr als 48.000 Kanälen stammten, verwendeten, um ihre eigenen KI-Modelle zu trainieren.