Microsoft kündigte kürzlich das Text-to-Speech-KI-Modell VALL-E an, das die Stimme einer Person genau simulieren und dabei sowohl den emotionalen Ton als auch die akustische Umgebung beachten kann. Im Marketing-Kontext bieten sich damit vielerlei spannende, kreative und effiziente Möglichkeiten - zum Beispiel im Podcast- oder Videobereich! Seitdem das erste Text-to-Speech (TTS)-Modell veröffentlicht wurde, suchen Forscher nach Möglichkeiten, die Art und Weise, wie solche Systeme Sprache erzeugen, zu verbessern. VALL-E, das neueste Modell von Microsoft, ist dabei ein großer Schritt nach vorn. VALL-E ist ein transformatorbasiertes TTS-Modell, das Sprache in jeder beliebigen Stimme erzeugen kann, nachdem es nur ein drei Sekunden langes Sample dieser Stimme gehört hat. Das ist eine bedeutende Verbesserung gegenüber früheren Modellen, die eine viel längere Trainingszeit benötigten, um eine neue Stimme zu erzeugen.
Der Schutz Ihrer Daten ist uns wichtig!
Wir verwenden Cookies und Third-Party-Tools, um die Leistung der Website zu verbessern, Analysen durchzuführen und Ihnen Inhalte bereitzustellen, die für Sie relevant sind. Hier finden Sie unsere Datenschutzerklärung
Technisch erforderlich
Komfortfunktionen
Statistik & Tracking
Wählen Sie nach Ihren individuellen Bedürfnissen Cookies & Services aus:
Technisch erforderlich
Diese Cookies sind für die Grundfunktionen des Shops notwendig.
"Alle Cookies ablehnen" Cookie
"Alle Cookies annehmen" Cookie
Ausgewählter Shop
CSRF-Token
Cookie-Einstellungen
Individuelle Preise
Kunden-Wiedererkennung
Kundenspezifisches Caching
Session
Währungswechsel
Komfortfunktionen
Diese Cookies werden genutzt um das Einkaufserlebnis noch ansprechender zu gestalten, beispielsweise für die Wiedererkennung des Besuchers.
Merkzettel
Statistik & Tracking
Endgeräteerkennung
Google Tag Manager
Partnerprogramm
Sie können Ihre Einwilligungsentscheidungen jederzeit in Ihren Datenschutzeinstellungen ändern.