Mit Gemini bringt sich Google immer wieder ins Gespräch. Gemini schwimmt im KI-Business ganz oben mit. Spätestens mit Nano Banana hat Google gezeigt, dass sie gar nicht abgelöst wurden und sie immer noch ganz weit oben mitmischen können. Google hat unter anderem mit DeepMind sich schon ganz früh der Künstlichen Intelligenz verschrieben. Nach Text, Video und Bildern bringt Alphabet, der Mutterkonzern hinter der KI ein weiteres Stück vom KI-Kuchen auf ein neues Level. Mit Lyria 3 kommt bekommt die Musikgenerierungs Ecke in Gemini ein spannendes Update spendiert.
Der nächste Chartstürmer aus der KI?
Lyria 3 ist ein generatives Musikmodell womit eine jede Person Musik generieren können. Dazu ist weder reimen noch Texten, geschweige dann Notenlesen nötig. Schon ein selbstgerechtes Bild oder ein kurzer Film dient als Grundlage für das Modell um einen Song zu komponieren.
In Gemini kannst du unterhalb von der Texteingabe auf «Musik erstellen» wechseln und dann einen entsprechenden Promt absetzen (oder eben mit Bild/Video arbeiten) und schon legt die KI los.
«schreibe mir einen lustigen Country-Song mit Bezug auf das Berner Oberland und lass Tina Turner darin auftreten»
Natürlich ists auch hier, wie bei der KI generell. Du kannst mit einem guten und umfangreichen Promt sehr viel mehr beeinflussen, als du es mit einem solch einfachen, wie oben tust. Du kannst der KI vorgeben was genau im Text vorkommen soll und auf was du wert legst, oder du holst es einfach globaler und lässt die Künstliche Intelligenz die Arbeit übernehmen.
Google beschreibt das folgendermassen in ihrem Blog:
- Text zu Tracks: Beschreibt ein bestimmtes Genre, eine Stimmung, einen Insider-Witz oder eine Erinnerung, um einzigartige Tracks mit Text oder Instrumentals zu erstellen, die zu eurem Vibe passen. „Erstelle einen Track über mein Lieblingsessen, das meine Mutter immer gemacht hat, es bestand aus Reis, Kochbananen und Bohnen. Nutze einen Afrobeats-Vibe und der Sänger sollte westafrikanisch klingen.“
- Von Fotos und Videos zum Track: Ladet ein Foto oder Video hoch und seht zu, wie Gemini den Inhalt nutzt, um einen Track mit Text zu komponieren, der perfekt zur Stimmung passt. „Verwende diese Fotos, um einen Track über meinen Hund Mylo bei einer Wanderung im Wald zu erstellen.“

Integriert in YouTube für die Creator da draussen
Die passende Musik rauszusuchen ist für viele YouTuber immer wieder eine Qual! Auch hier möchte Google eine erleichterung bieten. In den USA bereits ausgerollt will die Funktion Lyria 3 in Europa bald mal starten.
Hier bin ich gespannt wie das ganze Funktionieren wird. Ich werde dies auf jeden Fall mal ausprobieren, sobald die Möglichkeit dazu besteht.
Mehr Sichtbarkeit für die KI und mögliches verifizieren
In einer Welt, in der KI-generierte Bilder und Videos immer wie weniger von realen Content zu unterscheiden sind, liefert Google mit SynthID eine technologische Antwort auf die Frage nach der Authentizität. SynthID ist ein Wasserzeichen welche die das KI-Modell in seine Bilder/Audios oder in Videos einbindet. Auch bei erstelltem Audio-Inhalt mit Lyria3 verbaut Google ein Wasserzeichen mit ein.
Dies ist wichtig, wichtig zum:
– Schutz vor Desinformation
– Manipulationssicherheit
– schafft vertrauen
Was klar ist, der nächste Star kommt nicht aus der KI, auch Songs werden wir nicht so schnell in der offiziellen Chartsliste sehen. Aber ja, gelegentliches Hintergrundgeplänkel in Videos und sonstige seichte Musik, da könnte das neue KI-Modelll von Google sicherlich punkten.
Header-Bild generiert mit Nano-Banana von Google's Gemini

