DeepMind A.I. Überbrückt die Lücke zwischen Roboter- und Menschenstimmen

$config[ads_kvadrat] not found

DeepMind Scholars: Benedetta's story

DeepMind Scholars: Benedetta's story
Anonim

Künstliche Intelligenz hat die Roboterstimmen gerade realistischer klingen lassen.

DeepMind, das zuvor die Stärke von A.I. Indem Sie im März einen menschlichen Spieler bei Go besiegen und im Juli die Stromrechnung halbieren, konzentriert sich die Sprachsynthese nun auf das Wesentliche.

Die A.I-Forschungsgruppe, die Teil der Google-Muttergesellschaft Alphabet ist, gab heute Morgen bekannt, dass sie eine neue Technologie namens WaveNet entwickelt hat, mit der Sprache, Musik und andere Klänge genauer als zuvor erzeugt werden können.

DeepMind erklärt, dass viele bestehende Sprachsynthesemethoden darauf angewiesen sind, dass „eine sehr große Datenbank von kurzen Sprachfragmenten von einem einzelnen Sprecher aufgenommen und dann zu vollständigen Äußerungen zusammengefügt wird“. WaveNet dagegen verwendet die „rohe Wellenform des Audiosignals“ ”, Um realistischere Stimmen und Klänge zu erzeugen.

Das bedeutet, dass WaveNet mit den einzelnen Tönen arbeitet, die beim Sprechen eines Menschen erzeugt werden, anstatt vollständige Silben oder ganze Wörter zu verwenden. Diese Sounds durchlaufen dann einen „rechenaufwändigen“ Prozess, den DeepMind als „wesentlich für die Erzeugung komplexer, realistisch klingender Audiodaten“ mit Maschinen bezeichnet hat.

Das Ergebnis all dieser zusätzlichen Arbeit ist eine Verbesserung der synthetisierten Sprache in US-Englisch und Chinesisch (Mandarin) um 50 Prozent. Hier ist ein Beispiel für Sprache, die mithilfe von parametrischem Text-to-Speech-Verfahren erzeugt wurde, das heute üblich ist und von DeepMind verwendet wird, um zu zeigen, wie diese Sprachsynthesemethode fehlt:

Und hier ist ein Beispiel für denselben Satz, der von WaveNet generiert wurde:

Da Unternehmen ihre Arbeit an Schnittstellen für natürliche Sprachen fortsetzen, wird es immer wichtiger, realistischere Antworten zu bieten. WaveNet kann dieses Problem lösen.

$config[ads_kvadrat] not found