Seit dem 16. August 2023, dem Datum des ursprünglichen Beitrags, hat sich ja einiges in der Szene getan, und ich dachte, dem müsse man Rechnung tragen.
Es ist ja so - die Welt ist bekanntlich ein Dorf. Und in diesem Dorf werden gern Geschäfte gemacht. Und wenn ein gutes Geschäft erwartet wird, dann legt man auch gerne mal 'ne Schippe drauf, um ein Geschäft zu ermöglichen. Nun ist es aber auch so, daß die Welt ein Dorf ist, in dem einem nicht jedes Geschäft wirklich gefällt. Vor allem natürlich denjenigen nicht, deren Existenz dadurch gefährdet wird. Alter Hut seit Erfindung des Wortes "Globalisierung": wer etwas anzubieten hat, das aus einer anderen Ecke der Welt niedrigpreisiger angeboten werden kann, der sollte besser ein Alleinstellungsmerkmal haben, ansonsten laufen einem eins-fix-drei die Kunden weg. Wenn man kein Alleinstellungsmerkmal hat, dann sollte man sich zeitnah nach einer sichereren Scholle umschauen, denn Geiz war schließlich lange genug geil, um verstanden zu haben, daß man sich nicht unbedingt darauf verlassen sollte, daß die lieben Zeitgenossen auf die Billigware verzichten und einem selbstlos weiterhin Brötchen, Butter und Aufstrich finanzieren.
Die Künstliche Intelligenz (KI) ist natürlich auch ein Geschäft. Schon seit Jahren, machen wir uns nix vor. Das Thema kam vor einigen Monaten etwas mehr in den Fokus, als im November 2022 ChatGPT verfügbar wurde. Mag Leute geben, die über die damaligen Versuche von ChatGPT auch manchmal noch geschmunzelt haben - sei ihnen gegönnt -, aber natürlich sollte jedem klar gewesen sein: das da, das ist nicht das Ende der Entwicklung, das ist der Anfang, und es wird sich rasant entwickeln. Die Entwicklung bis zu obigem Beitrag war danach eben dieses - rasant. Es wurden Plattformen für Künstliche Intelligenz mit unterschiedlichen Schwerpunkten aus dem Boden gestampft. Eine konzentrierte sich beispielsweise auf das Erstellen von Fotos aus der Retorte oder automatisierte Bildmanipulation etc. Dann hat man gemerkt, daß es sinnvoll sein könnte, sich nicht nur um die Sprache oder Allerwelts-Bildchen zu kümmern, sondern auch um Kunst. Und an der Stelle veränderten sich die Einstellungsmöglichkeiten für die Bilder. Oder für die Sprache. Und irgendwann erwischte es auch die Musik, und so entstanden auch hier entsprechende Plattformen. Eine der ... nennen wir sie mal "eierlegenden Wollmilchsäue", bei denen man ebenfalls Gesang aus der Retorte generieren konnte (zur Not inklusive Text etc.), war und ist Suno, zum Zeitpunkt dieses aktuellen Textes in der Version 3.5, vor nur wenigen Monaten warf Udio seinen Hut in den denselben Ring. Beide Programme haben jeweils ihre Vor- und Nachteile, es gibt auch noch einige Alternativen, aber bleiben wir erst mal bei diesen zweien. Über die technischen Details will ich hier nicht viel sagen, das Thema soll ein Anderes sein. Wichtig ist allerdings: beide Programme sind nicht darauf ausgelegt, bestehende Lieder anderen Interpreten gezielt "in den Mund zu legen", im Gegenteil wird in beiden Fällen darauf geachtet, vom Nutzer eingegebene Interpretennamen möglichst zu filtern und zu ersetzen, und es wird auch darauf geachtet, daß bei vom User vorgeschlagenen Texten keine Urheberrechte verletzt werden - was schon ein hartes Brot sein kann, wenn irgendein Künstler schon mal eine 08/15-Floskel in seinen Liedtext eingebaut hat ... egal.
Wenn ich sage, daß die Programme nicht darauf ausgelegt sind, Interpreten zu simulieren, so kann es trotzdem passieren. Es ist mir beim Herumspielen mit udio sogar zweimal in kurzer Folge untergekommen, daß ich sehr wohl wußte, wessen Stimme mir da gerade zum Rumspielen angeboten wurde. Den Mainzer Kabarettisten Lars Reichow hat's bei einem Stück erwischt, bei dem ich im Text sowohl gesprochene als auch gesungene Passagen gefordert hatte. Lars Reichow via Künstliche Intelligenz zu simulieren, war mir allerdings zu doof. Ich weiß, wo er wohnt, das sind von der Arbeit aus 10 Minuten Fußweg, von zu Hause aus wären's 10 Minuten Busfahrt, und wahrscheinlich krieg' ich den auch günstig für diesen Text belatschert, wenn ich's drauf anlege, für Lars Reichow brauch' ich jedenfalls keine Retorte. Und eigentlich will ich auch gar nicht, daß überhaupt eine Stimme verwendet wird, die man zweifelsfrei zuordnen kann. Hörspiel-Legende Reinhilt Schneider war's im zweiten Fall. Scheiß-Versuchung, wenn eine hörbar junge Reinhilt Schneider einem den eigenen Text halb vorspricht, halb einsingt, in dem es ausgerechnet um Literatur geht
- wahrscheinlich bleibt das Lied erst mal ein Fragment, denn rigoroses Löschen hab' ich dann doch noch nicht übers Herz gebracht ...
Stellt sich natürlich nun abermals die Frage, die schon im Ursprungsbeitrag genannt wurde: sind das Verletzungen von Copyright oder Urheberrechten oder Persönlichkeitsrechten? Aktuell gibt es drei Major-Labels auf dem Weltmarkt - Sony, Warner und Universal mitsamt ihren jeweiligen Sub-Label-Geflechten. Seit dem unwürdigen Tod von EMI anno 2011 teilen diese drei Labels irgendwas über 70 % des Marktes unter sich auf, meint: wenn was an Musik auf einem Label erscheint, dann kommt es in drei von vier Fällen auf eben einem jener drei Labels oder ihren Sublabeln heraus. Diese drei Labels haben vor etwa drei Wochen in einer gemeinsamen (!) Klage sowohl Suno als auch Udio vor den Kadi gezerrt. Man wirft den dahinterstehenden Unternehmen vor, Versatzstücke aus dem Repertoire der Labels zu verwenden, um die jeweilige Datenbank zu füttern. Ist das so? Nun, ich würd' sagen: natürlich. Sowohl Suno als auch Udio dürften sich welcher Quellen auch immer bedienen, um Klänge und Versatzstücke ebenso zu sammeln wie Informationen über Songaufbau, Besonderheiten bei einzelnen Genres, vielleicht auch das Textgedicht etc., um diese zu analysieren und abzuspeichern zwecks weiterer Verwendung. Und selbstverständlich sind dabei auch urheberrechtlich/via Copyright geschützte Werke. Aber das allein ist - meine Interpretation - keine Verletzung von Copyright oder Urheberrechten. Ich gehe noch weiter: selbst das Verwenden von Versatzstücken oder synthetisierten Elementen aus dieser Datenbank stellt per se erst mal keine Verletzung irgendwelcher Rechte dar. Jeder kann erst mal mit dem künstlerischen Werk Dritter anstellen, was ihm so einfällt. Solange es halt die eigenen vier Wände bzw. den Kreis der engen Freunde nicht verläßt, heißt: schwierig wird's erst, wenn wir an den Punkt der öffentlichen Wiedergabe kommen. Aber dann im gegebenen Fall auch gleich so richtig schwierig, denn es muß unterschieden werden zwischen dem Gebrauch von unveränderten Elementen, nennen wir sie "Samples", und solchen, die durch den elektronischen Wolf der Software gedreht wurden, meint: sie wurden verändert, und das teilweise deutlich über das mittlerweile normale Maß (Tonhöhe, Geschwindigkeit) hinaus. Gut, eigentlich ist davon auszugehen, daß immer derjenige den Schwarzen Peter abkriegt, der die Geschichte in die Öffentlichkeit trägt, sprich: der User, allerdings wäre es wirklich nicht das erste Mal, daß derjenige, der die Manipulation vorgenommen hat, bei der Gelegenheit gleich mitgehängt wird. Oder stellvertretend allein gehängt wird. Über den zusätzlichen Punkt aus dem Ursprungsbeitrag (Persönlichkeitsrechte aufgrund der verwendeten, eindeutig zuzuordnenden Gesangsstile/Klangfarben der Interpreten) wird an dieser Stelle und bei dieser Klage noch nicht gesprochen. Betonung auf "noch".
Ganz allgemein gesprochen urteilen in den USA in den vergangenen Monaten die Gerichte ziemlich konsequent nach dem Credo "Werke, die von einer Künstlichen Intelligenz geschaffen werden, können keinem Copyright unterliegen", aber das letzte Wort ist hier sicher noch nicht gesprochen.
Soweit zu den Schritten der Major-Labels, um ihre Künstler vor einer Ausbeutung zu bewahren.
Späßle gmacht. Es dürfte in erster Linie um die Hoheitsrechte gehen. Wer hat das Recht an einem Lied, vor allem an einem Lied, das aus einer oder mehreren Blaupausen entstanden ist, an der/denen man selbst als Copyright-Inhaber die Rechte hat? Es gibt auch einige Leute, die in dem Vorgehen der drei Major-Labels abzulesen glauben, wohin die Reise gehen wird, nämlich in Richtung eines von den Major-Labels kontrollierten Umgangs der künstlichen Erzeugnisse, meint: "Wenn hier irgendwer Material nutzt, zu dem wir die Rechte haben, um neues Material zu erzeugen, dann sind entweder wir das direkt, oder wir werden entsprechend bezahlt". Da wir an dieser Stelle zunächst von Copyright reden, heißt das nicht, daß die Urheber davon direkt etwas hätten, denn die haben ja mit dem Copyright bereits die Rechte an den Liedern abgetreten an den neuen Besitzer, sondern das wäre ein ungebremstes Aufforsten der eigenen Umsätze. Falls jetzt jemand darüber nachdenken sollte, wer jetzt die Labels daran hindern sollte, den künstlerischen Nachlaß eines Künstlers nachträglich zu verwässern, indem man nicht nur seine Erzeugnisse auf den Markt bringt, sondern auch KI-Material, das auf seinen Erzeugnissen basiert ... gute Frage. In Deutschland mit seinem Urheber- und mit seinen Persönlichkeitsrechten mag das wieder etwas anders ausschauen, aber ansonsten - echt gute Frage.
Jetzt ist die Welt aber auch ein Dorf, wie schon mal gesagt, und in diesem Dorf gibt es auch Künstler. Der eine oder andere mag sich erinnern. Natürlich zählt als "Künstler" nicht nur derjenige, der sich auf die Bühne stellt und vor Publikum agiert, sondern auch der in seinem Tonstudio, der munter Titel komponiert oder textet, sei es für die Werbung, für kleine Computerspiele, ein Radiojingle, ein paar Töne für ein Theaterstück, halt so das, was man mehr oder weniger "Stock-Music" schimpft ... Wenn man bei Udio Geld in die Hand nimmt, bekommt man einen Standard-Account mit einer Reihe von Möglichkeiten für 10 $ pro Monat, bei dem man 1.200 Credits pro Monat erhält, mit jedem einzelnen Credit lassen sich binnen weniger Augenblicke 30 Sekunden Musik generieren, macht 36.000 Sekunden, also 600 Minuten, also 10 Stunden Musik pro Monat, mehr oder weniger nach Wunsch geformt. Aktuell noch mit einigen Wenns und Abers, zugegeben - aber da tut sich ja rasant was -, natürlich sind einige 30-Sekunden-Ergebnisse unbrauchbar, teilweise grenzen sie auch in ihrer Unbrauchbarkeit schon an Körperverletzung, aber mit ein bißchen Routine oder Kreativität kann man Fehlerquellen sehr schnell ausräumen und in Zukunft vermeiden. Das Komponieren von vielleicht nicht super-kreativer, aber halt eben vielseitig einsetzbarer Musik war praktisch nie ein Geschäft, mit dem man bequem, schnell und sicher zur eigenen Immobilie gekommen ist. Aber die aktuellen Entwicklungen der letzten drei, vier Monate sprechen schon gar nicht mehr davon, daß dieser Betriebszweig bald aussterben wird, sondern sie haben ihn direkt für tot erklärt. Und die Künstliche Intelligenz lernt noch.
Die Künstliche Intelligenz, sowohl die von Suno als auch von Udio, wurde mit Massen von Musik gefüttert, Quelle wie gesagt unbekannt. Es muß aber Musik gewesen sein, die mit Informationen versehen war. Je mehr Musik man füttert, desto eher durchschauen die Programme das dahinterliegende Regelwerk und desto leichter ist es, mit Künstlicher Intelligenz hörbare und täuschend echte Musik zu erzeugen. Es ist kein Problem, ein Lied zurechtzuschustern, das Zwölfton- oder Barockmusik simuliert, denn Barock folgt sehr strengen, auch oft gut vermittelbaren Regeln (womit ich nicht sagen möchte, daß Barockmusik leicht zu komponieren wäre). Es ist vergleichsweise einfach, ein leicht verdauliches 08/15-Lied in einem 4/4-Takt zu erzeugen, noch dazu in einem relativ modernen Sound. Generischen Allerwelts-Schlager mit Bumsbeat und einem passenden Briefmarkenniveau-Text passend zum Almabtrieb vom Ballermann oder wie man die ganzen Party-Gelegenheiten so nennt - leichte Übung. Und sind wir ehrlich - weil ja ohnehin Autotune und andere kleine digitale Helferlein recht weit verbreitet sind, fallen digitale Hopplas bei der Erstellung der Melodieführung der Gesangsstimme teilweise noch nicht mal wirklich negativ auf, im Gegenteil. Je komplexer das Lied werden soll, je weiter es sich von 08/15 entfernen soll, desto schwieriger wird es, ein gutes Ergebnis mit Künstlicher Intelligenz zu erzielen. "Schwierig" nicht im Sinne von Eigenleistung - letzten Endes bedeutet es, daß man mehr Credits verwenden muß, um dem Programm einige Durchläufe mehr zu ermöglichen, ehe ein akzeptables Stück Musik entsteht. Auch andere Sachen sind schwierig bis schlichtweg unmöglich. Wenn man in einer bestimmten Sequenz die Dynamik eines Stücks ändern möchte oder den Takt, der hat aktuell vergleichsweise schlechte Karten. Krumme Takte abseits von 4/4 und 3/4 (und Artverwandte) verstehen die Programme aktuell nur sehr schwer. Sowohl Suno als auch Udio scheinen mehr oder weniger auch zu versuchen, einen Liedtext, den man ihnen mitgibt, zu verstehen und in ihrer musikalischen Interpretation zu berücksichtigen. Höhere Poesie kriegen sie aber noch nicht vernünftig hin, und auch Ironie oder Humor ganz allgemein ist ein Problem, mehrsprachige Texte sind manchmal ein echter Graus, wenn man sie singen läßt, ... keine Panik, nächstes Jahr wird's an dieser Stelle schon wieder völlig anders aussehen, weil - rasant! Mal sehen, vielleicht können wir auch über einige Wetten nachdenken, welche weiteren kreativen Personen in nächster Zeit arbeitslos werden oder werden könnten ... Möglicherweise ist bis dahin aber auch schon die Flatrate draußen, mit der man sich 24 Stunden am Tag mit individuell frisch synthetisierter Meditationsmusik einlullen lassen kann. Würde mich auch nicht wundern, wenn es so etwas bereits gäbe.
Im Prinzip feiert die Tonkonserve in drei Jahren ihren 150. Geburtstag, wenn man die erste Aufnahme von "Mary Had A Little Lamb" von Thomas A. Edison von 1877 als Punkt X nimmt. Diese 150 Jahre wurden geprägt von Menschen, die Zeit und Mühen auf sich genommen haben, ihre Instrumente angemessen zu lernen, und von Menschen, die sich kreativ betätigt haben. Deren Tonaufnahmen und dahinterliegende Informationen werden nun dazu verwendet, neue Inhalte nicht nur zu generieren, sondern sich künstlich generieren zu lassen von Programmen, die sich die Erzeugnisse der Kreativität angeschaut haben und nun zu simulieren versuchen. Man nimmt also den Menschen aus der Kunst, der kunstschaffende Mensch wird zu einem kunstsimulations-abnickenden Menschen. Ist ein bißchen widerlich, in diese Richtung weiterzudenken, hab' ich festgestellt. Übrigens - nein, ich glaube nicht, daß in absehbarer Zeit plötzlich kein Mensch mehr Musik macht, davon sind wir noch weit entfernt, wie ich meine. Aber ich gehe davon aus, daß der Markt der kommerziellen Musik grundsätzlich geflutet werden wird mit künstlichen Erzeugnissen, meint: daß der Anteil menschenerdachter oder -gemachter Musik, mit dem man in der Öffentlichkeit konfrontiert wird, in absehbarer Zeit stark sinken wird. Und ich denke, daß einige Leute, die im musikalischen Kreativität-Bereich beruflich unterwegs sind, anfangen sollten, sich über ihren Beruf Gedanken zu machen, denn daß die Dampfwalze auf sie zurollt, sollte spätestens jetzt klar sein, und daß Musiker keine echte Lobby besitzen, sollte spätestens seit der Pandemie auch klar sein. Es wird wahrscheinlich keinen Schutz der Künstler geben, wenn an anderer Stelle in breitem Stil Geld gemacht oder gespart wird ... es geht um die Konkurrenzfähigkeit und letzten Endes um gefährdete Steuergelder aufgrund sinkender Umsätze, da werden sicher auch die Künstler Verständnis für haben und so.
Es ist im Augenblick ein spannendes Leben auf dem Dorf, und im Augenblick passiert eine ganze Menge. Mal sehen, was die Zukunft noch bereit hält. Da brauchen wir wahrscheinlich auch gar nicht so lange auf Antworten zu warten, denn die Entwicklungen laufen ja bekanntermaßen rasant.
Gruß
Skywise