Von künstlicher Intelligenz generierte Musik: jetzt schon in den Charts

  • #201
die unzähligen 'Whooshes' und 'Riser' aus den Sample Bibliotheken und die immergleichen industriellen 'cinematic-Sounds' in mittlerweile nahezu allen 'Dokus' zunehmend auf den Nerv.
!!!!!
Wenn ich heutzutage eine Doku nicht weiter schaue, dann liegt zu oft nur an der Musik.
 
  • Like
Reaktionen: fisherman, Ruhrwestfale und Musikanna

  • #202
Wenn ich heutzutage eine Doku nicht weiter schaue, dann liegt zu oft nur an der Musik.
An die Musik habe ich keine Erwartungen ... und werde dennoch immer wieder enttäuscht.

Ich mache eine Doku sofort aus, wenn ich die KI-typischen vorgelesenen Bindestriche wahrnehme ... sowas hält doch nur jemand für OK, der es sich nicht ein einziges Mal selbst angehört hat.

Falsch ausgesprochene Namen ("Scho-Pin" ... statt Chopin) ... und vor allem die absolute Überforderung der KI mit der Silbentrennung (mit einem Bindestrich dazwischen wird das irgendwie nicht als ein Wort erkannt ... wahrscheinlich können das die Entwickler selbst nicht).
Daher mache ich die automatische Übersetzung bei YT auch immer sofort aus ... ich weiß, dass da nichts vernünftiges bei rumkommt. Schlimm wirds, wenn dann auch die Originaltonspur KI-generiert ist ... dann hilft nur noch eins ... abschalten.
So einen Müll ziehe ich mir nicht rein.

Ich fände es sehr gut, wenn KI-generiertes als "ai-generated" gekennzeichnet werden müsste.
Dann könnte man es automatisiert aussortieren (wohlmöglich per KI).
Ja ... ich möchte mich sehr gerne davor schützen können, denn es ist einfach unter aller Sau, was da momentan geliefert wird.

Wer glaubt, dass Erfolg was mit Qualität zu tun habe, der hat einfach nicht kapiert, wie Markt funktioniert.
 
  • Like
Reaktionen: fisherman, Peter, Demian und eine weitere Person
  • #203
Also, erst einmal gibt es ja Multitrack-Aufnahmen mit bis zu 48 Spuren auf Magnetbändern wesentlich länger. Dabei erhielten doch wohl unterschiedliche Instrumente oder Instrumentengruppen eigene Mikrofone. Der Sinn dahinter war doch wohl, dadurch Studioqualität zu erreichen, weil die Abmischung mit Mischpulten erfolgte, und eben möglichst wenig Instrumentenbrei (Stimmenbrei) vorher aufgezeichnet werden sollte. Dieses Prinzip wurde dann doch später nur für DAWs in digitaler Form übernommen, wodurch die Anzahl der Spuren noch einmal beinahe beliebig erhöht werden konnte. Und selbstverständlich hätte man in einer DAW drei Instrumente, wie Trompete, Saxophon und Posaune ebenfalls in drei Spuren.


Was Du da als "nerviges Rumgefrickel" bezeichnest, würden andere wohl eher in den Bereich Mixen und Mastering einordnen.
Hab schon etliche Produktionen mit 24-Spur recordings gemacht, und auch schon etliche Produktionen mit 24 oder mehr Spuren abgemischt/gemastert.
Natürlich haben Mehrspuraufnahmen ihre volle Berechtigung, aber Spurenanzahl ist nicht gleichbedeutend mit der Frage von gleichzeitig oder nacheinander.
Man kann nacheinander aufnehmen, je ein Mikro nehmen und am Ende >24 Spuren haben, oder auch mit >24Spuren und entsprechend vielen Mikrofonen/Di-Boxen gleichzeitig aufnehmen.
Zudem ist auch das gleichzeitige Aufnehmen von zB 3 Bläsern nicht daran gebunden 3 Spuren zu verwenden. Da besteht durchaus Spielraum von 1-7 Mikrofonen.
Bei gutem Raum und sehr guten Musikern klingen bei Bläsern sparsam mikrofonierte Settings oft weit besser und druckvoller als aufwändige Multimikrofonierungen (siehe zB ältere Blue Note Recordings). Damals war natürlich auch mehr Studiozeit eingeplant, und es kam zB vor, dass ein ganzer Tag nur zur Positionierung eines(!) Mikrofons und zB einer Bläsergruppe verwendet wurde.
Es ist ja zu bedenken, dass es immer zu Übersprechen zwischen den Mikrofonen kommt, was den Sound i.d.R. verschlechtert und nicht etwa verbessert (von optionalen Raummikros oder passend zugemischten 'Stützen' mal abgesehen).
Das schließt natürlich nicht aus, dass zB für großes Orchester auch mal
40 - >60Mikros angemessen sind. Kommt halt drauf an.
Für akustische Musik (Klassik/akust.Jazz, etc.) lässt sich m.E. eine klare Regel aufstellen:
je besser die Aufnahme ist, desto weniger muss hinterher 'gefrickelt' werden, und desto besser klingt am Ende das Resultat.
Die Entscheidung nacheinander aufzunehmen hat i.d.R. vor allem ökonomisch/organisatorische Gründe, keine klanglich/künstlerischen, wobei Gesang oft (nicht immer) ne Ausnahme darstellen kann.
Oder die Musiker sind halt einfach zu schlecht bzw. zu schlecht vorbereitet, so dass zu selten mal alle x-Beteiligten überhaupt fehlerfrei performen, was im professionellen Bereich aber eigentlich nie oder kaum mal der Fall ist. Sowas entsteht eher bei Amateuren, wenn die Sachen nicht sitzen, aber dennoch eine perfekte Aufnahme entstehen soll. Das ist dann SEHR mühsam, nervig und 'frickelig'.
 
  • Like
Reaktionen: Melegrian

  • #204
Die Entscheidung nacheinander aufzunehmen hat i.d.R. vor allem ökonomisch/organisatorische Gründe, keine klanglich/künstlerischen, wobei Gesang oft (nicht immer) ne Ausnahme darstellen kann.
In meiner Band hat die Entscheidung, einzeln aufzunehmen (erst Drums, dann Bass, dann Gitarre und am Ende Gesang) durchaus klangliche Gründe.
Die tiefen Frequenzen vom Bass will man weder auf den Schlagzeug-, noch auf den Gitarrenspuren mit drauf haben ... das lässt sich aber beim gemeinsamen Aufnehmen kaum vermeiden. Also nehmen wir getrennt auf, und können dadurch zum Beispiel meist drauf verzichten, die Toms zu gaten.
Wir nehmen getrennt auf, um saubere Spuren zu bekommen, auf denen dann nur Bass, Gitarre oder Gesang sind.
Die einzelnen Instrumente eines Drumkits einzeln aufzunehmen, wäre optimal ... aber die Arbeit tut sich kein Drummer an (und es ist klanglich wirklich unnötig).

Ich kann mir allerdings gut vorstellen, dass es weniger "Fremdsound" gibt, wenn nicht so ein Schalldruck herrscht.
Aber auch bei Musik in Zimmerlautstärke finde ich es nervig, wenn man dann auf der Spur von Gitarre oder Cavaquinho noch ein bisschen "Geklapper" (Percussion) oder Querflöte mit drauf hat.

Einzeln aufzunehmen, reduziert die Nachbearbeitungszeit, denn den besten Klang eines Instrumentes kann man am einfachsten aus einer Tonspur rausholen, auf der nur dieses Instrument zu hören ist.
Natürlich braucht man dafür Instrumentalisten, die den Kopfhörer nicht nur für warme Ohren auf haben.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Melegrian
  • #205
Sowas entsteht eher bei Amateuren, wenn die Sachen nicht sitzen, aber dennoch eine perfekte Aufnahme entstehen soll. Das ist dann SEHR mühsam, nervig und 'frickelig'.
Ich kenne einige recht bekannte Bands, die eigentlich nur "Schnipsel" aufnehmen. Jedes Riff ein paar mal, und der beste Schnipsel wird dann kopiert ... die spielen für ihre Aufnahmen nie eine komplette Line durch, weil sie es einfach für unnötig halten. Ich finde diese Aufnahmen seelenlos, aber die Jungs scheinen das so zu wollen (macht halt etwas weniger Arbeit und spart Studiozeit).
Und auch wenn ich diesen Spruch hasse, wie die Pest. "Der Erfolg gibt ihnen schon irgendwie Recht".

Ich spiele nur Riffs mit unterschiedlichen Sounds (Effekte) getrennt ein (damit das Umschalten auf der Aufnahme nicht zu hören ist). Ansonsten spiele ich meine Lines komplett, und lasse an den Stellen, wo andere Sounds kommen sollen, halt eine entsprechende Pause. Natürlich brauche ich dann auch mal ein paar Takes, bis ich zufrieden bin. Ich habe aber die Erfahrung gemacht, dass das am ehesten zu einer brauchbaren Gesamtaufnahme führt, die dann nicht nur korrekt gespielt ist, sondern auch "lebt".
Natürlich nutze ich auch punch-In/Out, um nicht die ganze Line nochmal einspielen zu müssen, nur weil mir im letzten oder vorletzten Takt ein Fehler unterlaufen ist. Wir tricksen auch ab und zu ... aber eigentlich ist immer der Ehrgeiz da, sowas nicht nötig zu haben.

"The real thing" findet auf der Bühne statt, und da hat man all die Tricks eh nicht zur Verfügung.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Melegrian
  • #206
In meiner Band hat die Entscheidung, einzeln aufzunehmen (erst Drums, dann Bass, dann Gitarre und am Ende Gesang) durchaus klangliche Gründe.
Mit meiner Band machen wir keine "echten" Studioaufnahmen. Für Demozwecke aber schon mal Mehrspuraufnahmen im Proberaum, dabei wird aber immer die ganze Band komplett aufgenommen. Unser Argument ist, dass die Aufnahme so klingen soll, wie wir auch live klingen. Es gibt daher auch keine Overdubs oder einzeln eingespielte Spuren, bis es "passt".

Wir nehmen getrennt auf, um saubere Spuren zu bekommen
Ich bin mir der Vorteile von sauberen Spuren absolut bewusst, gebe aber zu bedenken, dass das Resultat - je nach Genre - dann zu sauber klingen kann. Mir ist da eine Geschichte in Erinnerung eines bekannten Toningenieurs, der ein Re-Mix von Aufnahmen aus den 70ern zu machen hatte. Nachdem er die original Masterbänder digitalisiert hatte, hat er die einzelnen Spuren erst nach allen Regeln der Kunst gesäubert. Beim Mischen hat er irgendwann festgestellt, dass der alte Mix im Vergleich irgendwie immer "besser" klang. Er hat dann seine Säuberungsaktion rückgängig gemacht, erst danach wurde die Mixe wirklich gut. Davon abgesehen gibt es auch heute noch Bands, die sich weigern, seriell Spuren aufzunehmen, mit dem Argument, dass ihnen beim Aufnehmen die Interaktion der Bandmitglieder wichtig ist.

Die einzelnen Instrumente eines Drumkits einzeln aufzunehmen, wäre optimal ... aber die Arbeit tut sich kein Drummer an (und es ist klanglich wirklich unnötig).
Ich wage es schwer zu bezweifen, dass ein Drummer es überhaupt vernünftig hinbekommt, seine Schlaginstrumente Spur für Spur einzuspielen. Ich denke, es ist klanglich nicht nur unnötig, sondern tatsächlich kontraproduktiv.
 
Zuletzt bearbeitet:
  • #207
Unser Argument ist, dass die Aufnahme so klingen soll, wie wir auch live klingen.
Ich bin auch durchaus ein Verfechter von "lieber wie live", musste aber in den letzten 30 Jahren immer wieder einsehen, dass die Ergebnisse beim einizeln einspielen klanglich besser sind.
Gegen overdubs wehre ich mich aber noch immer ... ich will nichts auf der Aufnahme haben, was wir nicht auch genau so auf die Bühne bringen können.

Um das Leben in eine Aufnahme zu bekommen, machen wir ganz gerne "Ghost-tracks". Also eine gemeinsame Proberaum-Aufnahme, die der Drummer dann statt einer sterilen Klickspur auf die Ohren kriegt.
Bei uns reicht das irgendwie, damit die Dynamik auch auf der Aufnahme ist. Wir spielen aber auch schon seit über 20 Jahren in der Formation zusammen. Wir haben auch schon damit experimentiert, dass der Drummer vom Gitarristen begleitet wird (Gitarre dann direkt in den PC).

Und ja ... der fehlende Klick macht bei manchen Nachbearbeitungsschritten dann auch Probleme. Du kannst dich nicht am Raster der DAW orientieren und ein Delay in "ms" so einzustellen, dass das dann "Achtel" sind ist echt Frickelei ... (was KI dann mit solchen Spuren anstellt, ist nochmal eine ganz gruselige Geschichte).

PS:
Wir waren auch noch nie in einem echten Studio.
 
Zuletzt bearbeitet:
  • #208
der fehlende Klick macht bei manchen Nachbearbeitungsschritten dann auch Probleme. Du kannst dich nicht am Raster der DAW orientieren
Ich weiß. Als ich während Corona mit der ex-Band nicht in den Proberaum konnte, habe ich Songs mit den Jungs im Heimverfahren produziert. Zuerst eine simple Drumspur als besseres Metronom erstellt, dann Bass, Harmonien und Leads soweit eingespielt, dass der Ablauf leicht erkennbar war. Das hat dann - ohne Drumspur, mit Klick - unser Drummer gekriegt, um dazu seinen Part zu trommeln. Das Ergebnis bekamen dann Basser und Gitarrero - ohne Klick, aber mit Drums und minus ihrem Part - zu Hause auf die Ohren, um ihren Teil einzuspielen. Das hat ganz gut funktioniert, das größte Problem war, bis ich die Kerle soweit hatte, ihre Spur im richtigen Audioformat abzuliefern. Der Drummer musste zu Hause auf E-Drums spielen, da waren Zoom-Sitzungen nötig, bis sein PC/Software/Plugin soweit eingerichtet war. Rechter Aufwand, hat aber Spaß gemacht. wenn man das Endergebnis sieht.
 
  • #209
Spass macht das eigentlich immer.
Und auch wenn das Endergebnis nicht ganz so ist, wie man es sich vorgestellt hat, hat man dabei doch auch was gelernt.
Ohne die Aufnahmen mit der Band würde ich mich jetzt wohl nicht einfach so hinsetzen können, um zuhause ein bisschen Klavier oder Gitarre aufzunehmen.
Da ich in der Band aber erlebt habe, wie viel Aufwand man betreiben kann (wir sind nur zu dritt, hatten aber regelmäßig Projekte (einzelne Songs) mit 32 und mehr Spuren) ist eigentlich fast alles OK.
Ich habe kein Problem damit, Stunden oder sogar Tage lang nichts anderes zu machen, als Microfone anders zu positionieren und den immer gleichen Schnipsel aufzunehmen, bis ich die Positionen im Raum habe, bei denen mir das Klangbild der Aufnahme am besten gefällt.
Am liebsten würde ich die Micros da jetzt einfach stehen lassen ... leider stünden sie mir dann ständig im Weg.
 
Zuletzt bearbeitet:
  • #210
Sorry ... im Faden vertan.
 
Zuletzt bearbeitet:
  • #211
Warum?
Aus meinem Blickwinkel fand ich es durchaus passend, um etwas vergleichen zu können. Eigene Aufnahmen oder eine Band lassen sich letztendlich nicht einfach durch eine KI ersetzen. Da sehe ich auch nicht die Zukunft von KI.

Nur dort, wo heute bereits virtuelle Instrumente eingesetzt werden, oder Loops aus anderen Quellen, ist der Ausgangspunkt und Abstand zur KI ein anderer. Dabei fällt mir als erstes Old Town Road ein, die Loops (oder was auch immer) stammten aus den Niederlanden, die Nutzungsrechte wurden von Lil Nas X für lediglich 30 Dollar erworben, dann einige Remixe, dann über Monate auf Platz 1 in den Bill Bords Charts. Videos und Bühnenpräsenz trugen sicherlich mit zur Beliebtheit mit bei, auch daran dürfte sich kaum etwas ändern. Aber ob ein paar Loops nun von anderen für wenig Geld gekauft wurden oder von einer KI gefertigt sind, das dürfte wohl mittelfristig kaum noch jemanden interessieren.
 
  • #212
Ich glaube, dass wir schon lange eine KI-Blase haben ... und ich hoffe, dass sie bald platzt. Denn jeder Tag, den sie sich weiter bläht, macht den Knall am Ende nur lauter.
Ich fürchte, da wirst Du endlos warten müssen, denn im Gegensatz zur Dotcomblase handelt es sich bei den heutigen Akteuren um stinkreiche global player, die die immensen Kosten aus der Portokasse finanzieren können. Der ROI ist nice to have, aber nicht zwingend, weil allein die PR-Wirkung den finanziellen Aufwand rechtfertigt.
 
  • #213
KI-Blasen, nicht eine und nicht allgemein, nehme ich an. Doch wie sieht es in Bereichen aus, in denen der Markt durch KI viel schneller gesättigt und übersättigt wird, wie bei Musik für Spotify und ähnlichen Plattformen? Auch für YouTube hörte ich, dass sich der Markt in den nächsten Jahren verändern wird, wenn es mehr Videos als Nutzer gibt. Bei Webseiten ist es schon lange der Fall, dass viele kaum noch Besucher bekommen.
 
  • #214
Zwischen Udio und UMG gab es vor einigen Wochen eine Einigung, nun haben Suno und Warner Music eine Partnerschaft geschlossen.
Das bedeutet, dass wir neue, leistungsfähigere Funktionen für die Musikproduktion einführen und Möglichkeiten zur Zusammenarbeit und Interaktion mit einigen der talentiertesten Musiker:innen der Welt schaffen werden,[...]

[...]haben die WMG und Suno zudem quasi als Fußnote vereinbart, dass das KI-Unternehmen die Konzertplattform Songkick übernimmt,[...]
musikwoche.de
 
  • #215
ch fürchte, da wirst Du endlos warten müssen, denn im Gegensatz zur Dotcomblase handelt es sich bei den heutigen Akteuren um stinkreiche global player, die die immensen Kosten aus der Portokasse finanzieren können. Der ROI ist nice to have, aber nicht zwingend, weil allein die PR-Wirkung den finanziellen Aufwand rechtfertigt.
Trotzdem handelt es sich bei allen großen Playern um börsennotierte Unternehmen, die extrem hoch bewertet sind. Eine scharfe Kurskorrektur ist allemal denkbar - und das betrifft dann nicht nur die Aktionäre dieser Unternehmen, sondern auch alle US-Pensionsfonds und Millionen von Kleinsparern, die ETFs auf betroffene Indices halten.

Das hat einen Kaufkraftverlust zur Folge, der sich dann auch auf Konsumwerte auswirken wird und in Folge auch auf praktisch alle Konzerne, die Investitionsgüter herstellen. Sollten also die KI-Werte um beispielsweise 50% abstürzen (womit sie immer noch ein überaus hohes KGV hätten), wird der gesamte Aktienmarkt erheblich leiden. Mutige Anleger tätigen jetzt Leerverkäufe...
 
  • #216
Ich finde es spannend, wie sich die KI entwickeln wird, vor allem weil ja immer mehr KI mit KI trainiert wird. So haben Biologen gewarnt, dass Tiere von denen es überschaubares Bildmaterial gibt, von KI erzeugt werden, dabei macht die KI natürlich Fehler, dann wird das Bild wieder genommen um die KI zu trainieren und die generierten Bilder entfernen sich immer weiter vom Original.

Bei Musik gibt es jetzt keine Fehler in dem Sinne, doch dort spielt die Regression zur Mitte eine bedeutende Rolle. Wenn eine KI Text erzeugt, dann hat sie ja keine Ahnung was sie tut, sie reiht einfach Wörter aneinander, immer das was am Wahrscheinlichsten ist. Also das was sie in dem Zusammenhang am häufigsten gesehen hat. Das ist bei Musik genau so, da werden Noten nach dieser Logik aneinandergereiht. Vereinzelt wird es vorkommen, dass durch geschicktes Prompting, etwas Interessantes entsteht, aber in der Masse wird die Musik immer einheitlicher werden.

Mein Verdacht (meine Hoffnung) ist, dass immer mehr Musikhörer von dieser Entwicklung genervt sein werden und echte Musik dadurch aufgewertet wird.

Auf jeden Fall mehren sich die Stimmen der Experten, die davon ausgehen, dass die KIs, die nicht für Spezialfälle trainiert wurden, sondern alle Daten fressen, die ihnen unter kommen sich am Ende quasi selbst auffressen, weil sie unbrauchbar werden, wenn der Anteil der echter Trainingsdaten zu gering wird.
 
  • #217
Mein Verdacht (meine Hoffnung) ist, dass immer mehr Musikhörer von dieser Entwicklung genervt sein werden und echte Musik dadurch aufgewertet wird.
Das halte ich für Unwahrscheinlich, wenn ich mir ansehe, wie die Leute auf Autotune statt richtiger Stimmen abfahren.

Auf jeden Fall mehren sich die Stimmen der Experten, die davon ausgehen, dass die KIs, die nicht für Spezialfälle trainiert wurden, sondern alle Daten fressen, die ihnen unter kommen sich am Ende quasi selbst auffressen, weil sie unbrauchbar werden, wenn der Anteil der echter Trainingsdaten zu gering wird.
Ich bin erstaunt, wie schnell das geht. Ich hatte das als Langzeitfolge erwartet, aber es ist schon länger der Fall, dass LLMs merklich an AI-Slop trainieren.
 
  • #218
die extrem hoch bewertet sind
richtig. Aber - nochmals: Diese Unternehmen erzeugen Gewinne, und zwar verdammt hohe
Eine scharfe Kurskorrektur ist allemal denkbar
Absolut. Aber eine scharfe Korrektur verursacht üblicherweise ein V im Chart, die Erholung geht also schnell, zumal KI nicht das Kerngeschäft betrifft, sondern nur für (ungerechtfertigte) Kursfantasie sorgt. Meta, amazon & Co. werden weiterhin höchst erfolgreich sein, ob mit oder ohne KI.
sondern auch alle US-Pensionsfonds und Millionen von Kleinsparern, die ETFs auf betroffene Indices halten.
die hoffentlich alle ordentlich diversifiziert sind.
Das hat einen Kaufkraftverlust zur Folge, der sich dann auch auf Konsumwerte auswirken wird und in Folge auch auf praktisch alle Konzerne, die Investitionsgüter herstellen. Sollten also die KI-Werte um beispielsweise 50% abstürzen (womit sie immer noch ein überaus hohes KGV hätten), wird der gesamte Aktienmarkt erheblich leiden.
Yep. Aber auch hier gilt: V-förmige Korrekturen sollten strategische Anleger nicht irritieren.
Ganz ehrlich: Ich würde mich ja über eine Korrektur freuen, weil sie den Bullenmarkt (der immer „die Mauer der Angst emporklettern“ muss) nochmals deutlich verlängern würde.
Ich fürchte aber, dass es nicht dazu kommt: Bullenmärkte enden normalerweise in der Euphorie - und davon sind wir noch weit entfernt, wie die allgemeine Skepsis bzgl. der KI-Bewertungen zeigt.

Dennoch: Ein Reduzieren des US-Übergewichts (incl. M7) zugunsten europäischer Werte ist sicherlich sinnvoll.
 
  • #219
Das bezog sich auf einen Beitrag, der eigentlich in einen anderen Thread gehört hätte ... daher habe ich ihn hier gelöscht, und mich entschuldigt, falls schon jemand das gelesen haben sollte.
 
  • #220
Aber - nochmals: Diese Unternehmen erzeugen Gewinne, und zwar verdammt hohe
Das stimmt nicht. OpenAI beispielsweise verbrennt massenweise Geld, momentan etwa 12 Milliarden Dollar pro Quartal und braucht bis 2030 etwa 200 Milliarden frisches Kapital zum Überleben. Das zahlt auch Microsoft nicht aus der Portokasse und die Microsoft-Aktionäre werden irgendwann ungeduldig. Zudem hat ChatGPT inzwischen sehr starke Konkurrenz durch Gemini und ClaudeAI - die ebenfalls riesige Verluste schreiben. Die LLMs werden sich gegenseitig kannibalisieren, umso mehr, als keines von denen bisher über ein funktionierendes Geschäftsmodell verfügt. Eine gewisse Parallele zur Dotcom-Blase kann man da durchaus sehen.
 

Zurück
Oben Unten