@Warden Also was man mit Open Source lokal auf seinem Rechner macht, mit eigenen Texten, gehört einem, hab ich soweit schon recht sicher abgeklärt. Es kann natürlich aber auch mal Probleme geben, wenn ein Riff wo bekannt ist, die KI bestimmte Tonfolgen nutzt und eine Melodie einer anderen sehr ähnlich ist. Ganz sicher sollte sie nicht gleich sein, und dann kommt es auf den Erfolg an, wenn man ein Stück hat und das geht durch die Decke, und es klingt wo einem anderen ähnlich, ist die Wahrscheinlichkeit sicher größer, dass da wer mal schaut.
Und doch es gibt einige Programme, für Musik, mit der man so was wie hier lokal erzeugen kann, ist etwas Aufwand das zu installieren, gibt es aber.
@Negev Von 10.000 € glaub ich nicht, dass ich davon schrieb, bin mehr so mit 3.500 € in Planung. Dann hab ich einen i7 für 1200 Socket hier liegen, 64 GB RAM und eine RTX 3060 mit 12 GB VRAM, also das ist so schon da, mit zusammenschrauben meinte ich diese Teile.
Das Andere war die Überlegung einen Server mit EPYC CPUs aufzubauen, bin aktuell aber froh, nicht diesen Weg gegangen zu sein. Das braucht so auch viel Strom und so viel bringt es nicht, wie Du sagst, VRAM ist - noch - alles.
Aktuell versuche ich auch die Stücke von mir zu zerlegen, Gesang und Instrumente, heute Nacht noch viel recherchieren lassen, einige Programme gefunden, mit denen das geht, ich teste aktuell schon, die brauchen aber wohl sehr lange und scheitern, mal abwarten.
Hab ich die Instrumente geht es weiter, da ich ja im Grunde nur eine Gitarre drin habe, sollte es nicht ganz so schwer sein, die zu greifen, wenn der Gesang raus ist und dann die Noten zu bestimmen, auch dafür will ich natürlich eine KI nutzen.
Dann kann man das mit anderen Programmen wieder neu aufbauen und experimentieren, sich eine Sängerin suchen, ich kenne schon ein paar Mädels die singen und toll klingen, Lagerfeuer, Gitarre und so, es gibt viele die machen so etwas Musik.
Aktuell spucken die KIs eben nicht gleich noch Lyrics und Notenblätter aus, kommt vermutlich noch.
Ich hatte das ja nun erstmal nur von
@Negev gehört und ich mag diese Richtung, von meinen Experimenten gestern bin ich auch recht angetan, aber nun einfach nur meine Text durch ein paar KIs drücken und dann raushauen, ich glaube da geht mir zu viel Kreativität verloren. Wenn man mit Freunden ein Stück macht, dann kommt ja von jedem etwas, der einige hat eine Idee für Gitarre und ein Solo, der am Schlagzeug bringt was, und auch am Text kann man gemeinsam was machen.
In dem Sinne würde ich hier eine KI nur als Bandmitglied sehen, sie sollte nicht alles dominieren.
Und ja, was Google aktuell so vorstellt, ist der Hammer, und es geht so was von schnell:

Gamechanger im Bereich Video-KI: Googles Veo 3 erzeugt KI-Videos mit Audio
Externer Inhalt
Durch das Abspielen werden Daten an Youtube übermittelt und ggf. Cookies gesetzt.
Aber das ist ja meine Rede, die ganze Zeit, aktuell leben wir im Umbruch, eine Revolution, Feuer, Rad, Dampfmaschine, Industrialisierung, PC, Handy, alles zusammen wird wohl dennoch gegen das was aktuell passiert verblassen. Es explodiert, es wird einen exponentiellen Wachstum geben, es fehlt nicht mehr viel und die Modelle optimieren sich nicht nur selber, nein sie werden sich entwickeln, ich glaube nicht, dass einer wirklich abschätzen kann, wie weit die Entwicklung in den nächsten 15 Jahren fortgeschritten sein wird.