Podcast: Let’s Make Lemonade #46/Wie AI Audio den Markt revolutionieren wird – so klingt die Zukunft
Im aktuellen Podcast #46 von Let’s Make Lemonade gehen Raphael Fix, Senior Project Manager Digital Innovation der Omnicom Media Group Germany, Sara Artis, Director AI Audio Solutions der Omnicom Media Group Germany, und Benjamin Becker, Managing Partner Business Development der Omnicom Media Group Germany, der Frage nach, wie Künstliche Intelligenz den Audio-Markt verändert und zukünftig mit Innovationen beflügeln wird.
Der aktuelle Audio-Markt zeigt massive Innovationsbewegungen
Audio erlebt gerade einen Innovations-Boom, der sich insbesondere in den Bereichen Künstliche Intelligenz und synthetische Kreationen zeigt. Anfang des Jahres erschien das Unternehmen Sonantic (https://www.sonantic.io/) in der Fachpresse, da es die Stimme des Schauspielers Val Kilmer erfolgreich klonte und im neuen Film Top Gun Maverick einsetzte.
Hintergrund war, dass Val Kilmer an Kehlkopfkrebs erkrankte und durch die Folgen dieser Krankheit teilweise seine Stimme verloren hat. Raphael erklärt, dass das Software-Unternehmen Sonantic daraufhin ein digitales Modell der Stimme erstellt und mit einer KI trainiert hat. Kurze Zeit später gab Spotify die Übernahme von Sonantic bekannt, um diese Technologie für eine personalisierte Ansprache der Benutzer*innen einzusetzen.
Anhand dieses Beispiels lässt sich aufzeigen, wie fortgeschritten die Audiotechnologie bereits im englischsprachigen Markt ist. Auch das Klonen von Stimmen ist dort bereits auf einem höheren Level aufzufinden. Aus diesem Grund sind wir als Agenturgruppe stolz darüber berichten zu können, dass wir mit unseren Partnern eines der ersten Unternehmen sind, die diese Technologie jetzt auch mit deutschen Stimmen für den DACH-Raum etablieren.
Audio ist nicht nur Voice, sondern auch Atmosphäre, Musik und Mixing
Raphael ist sich sicher: KI & Audio werden neue Kommunikationsfelder rasant erobern. Das belegen insbesondere die neuen Anwendungsfelder mit synthetischen Stimmen in der Unterhaltungsbranche. Sara ergänzt, dass man Innovation im Audio-Markt nicht nur mit synthetischen Stimmen gleichsetzen sollte, sondern ganzheitlich mit weiteren Komponenten wie Musik, Atmosphäre und Mixing sehen muss.
Das zeigt sich auch an der Übernahme des britischen StartUps AI Music durch Apple im Frühjahr 2022. AI Music ist ein Software-Unternehmen, das an verschiedenen Tools rund um die dynamische Anpassung von Musik arbeitet und sich dabei besonders auf den Audio-Werbemarkt konzentriert. Neben dem Use Case „Stimme“ wird folglich deutlich, welche Lösungen es bereits im Bereich synthetische und dynamische Musik gibt.
Audio-Innovation muss alle auditiven Komponenten verbessern
Die verschiedenen Komponenten wie Text-to-Speech, Voice Cloning und KI-gesteuertes Audio-Mixing wurden im Laufe dieses Jahres mit neuen zukunftsweisenden Use Cases und Kooperationen aufgezeigt. Doch erst die Kombination aller einzelnen Lösungen eröffnen insbesondere für den Agenturmarkt neue innovative Produkt- und Lösungsfelder – wie der folgende von Raphael aufgezeigte Use Case eines Audio DCO Produkts.
DCO wird nun auch im Audio-Markt ermöglicht
Was bereits seit Jahren im Online Display-Bereich Standard ist, wird nun auch für den Audio-Markt immer relevanter. Im Projekt „S.A.R.A.“ (Speech & Audio Real-Time Automation) kombiniert die Omnicom Media Group Germany Lösungen des Technologieunternehmens Aflorithmic (https://www.aflorithmic.ai/) mit Media-Aktivierung und ihren hauseigenen Softwarelösungen im Bereich Smart Data und Händlermarketing. Somit setzt die Agenturgruppe Dynamic Creative Optimization (DCO) nun auch für Audiospots ein und kann diese dynamisch in Echtzeit kreieren und optimieren. Die mit Künstlicher Intelligenz und Voice Cloning generierten Audio-Dateien können nun in grenzenloser Vielfalt erstellt und via Programmatic Advertising aktiviert werden.
Durch KI werden neue Audio Use Cases ermöglicht
Insbesondere Unternehmen mit einer Filialstruktur können durch Audio DCO neue effiziente Wege gehen. Laut Raphael besteht für unsere Kunden mit der neu kreierten KI-Lösung der Omnicom Media Group Germany die Möglichkeit, nun bis zu 500.000 verschiedene Audio-Ads im Jahr kreieren und aktivieren. Sara gibt hier den wichtigen Hinweis, dass diese Innovation die Kosten zudem um mindestens 50 % reduzieren.
Von weiteren Use Cases und wie Projekt „S.A.R.A“ genau funktioniert, hört ihr in der aktuellen Folge!
AI Audio wird zum hyperlokalen Marketing-Werkzeug
Unternehmen suchen neue Wege, um regionales Marketing innovativ zu gestalten. Das zeigt sich beispielweise an der Reduktion von Marketing-Printerzeugnissen wie dem Handzettel bei REWE oder dem Katalog von IKEA. Zudem ist der Audio-Markt inzwischen via Programmatic Advertising flächendeckend erschlossen. Zeitgleich nimmt das Thema synthetische Stimmen & Sound eine immer wichtigere Rolle ein und hat bereits in der Unterhaltungsbranche mit mehreren Use Cases Nutzen gefunden. Umso wichtiger ist es, sich darüber Gedanken zu machen, wie die eigene Marke klingen soll und welche Stimme zu Marke und Zielgruppe passt. Laut Sara ist das Stichwort hier „Sonic Branding“, denn jede Marke kann sich nun via Knopfdruck eine KI-Stimme klonen und damit dynamische Audio-Files erstellen. In unserem Podcast gehen wir auf diese Thematik nochmal genauer ein und sprechen darüber, wie genau eine Stimme geklont werden kann. Wenn Marken jetzt schnell sind, diese Innovation für sich selbst und ihre Kommunikationsziele zu erkennen, gibt es echte Chancen, sich auditiv in neuen Kommunikationskanälen zu etablieren und deutlich von der Konkurrenz abzuheben.
The Sweetest Lemon
Raphael verdeutlicht, dass man Innovationen wie Projekt „S.A.R.A“ aus allen Unternehmensbereichen leben und aktiv mitgestalten muss. Er hat eine klare Haltung: „Innovationskultur ist etwas, das eine KI allein noch nicht schaffen kann“.
Benjamin ist sich sicher: Die Rolle von Künstlicher Intelligenz und Audio wird weiterwachsen und die Entwicklung wird auch von den Agenturen getrieben. Die Zukunft von Audio bleibt spannend und innovativ. Das zeigt sich auch an Beispielen wie dem des fiktiven Gesprächs zwischen dem 2011 verstorbenen Steve Jobs und dem Podcast-Macher Joe Rogan. Die Plattform Podcast.ai konnte mithilfe des Sprachgenerators Play.ht beide Stimmen künstlich erzeugen und so ein nachgeahmtes, aber echt klingendes Gespräch erzeugen. Die Plattform erzeugt diese Art von Podcasts jede Woche auf Basis von Wunschgästen/ -themen, die sich die Hörer*innen wünschen können.
Über Aflorithmic
Aflorithmic Labs, Ltd (https://www.aflorithmic.ai/) ist ein Technologieunternehmen mit Sitz in London und Barcelona. Die api.audio Plattform ermöglicht eine vollautomatische, skalierbare Audioproduktion mit Hilfe von Text-to-Speech, Voice Cloning und KI-gesteuerter Nachbearbeitung. Das Team besteht aus hochqualifizierten Spezialist*innen für maschinelles Lernen, Softwareentwicklung, Sprachsynthese, KI-Forschung, Audiotechnik und Produktentwicklung.
Gemeinsam mit der Omnicom Media Group Germany wurde die KI-Stimme Sara entwickelt, welche nun im Podcast erstmals zu hören war.
Autor*in: Raphael Fix / Omnicom Media Group Germany
20.10.2022