News
Neues aus der Welt der Wissenschaft
 
ORF ON Science :  News :  Technologie 
 
Computer spricht: "Was hams g'sagt?"  
  "He, Nudlaug, wos is?" - Die Zeit der ausschließlich hochdeutsch sprechenden Computerstimmen ist zu Ende. Ab nun wandeln die künstlich generierten Sprecher auch auf H.C. Artmanns Spuren.  
Das berichteten Wissenschaftler des Forschungszentrums Telekommunikation Wien (ftw) kürzlich bei einer Pressekonferenz in Wien. Dort war auch zu erfahren, was mit dem Satz "He, Nudlaug, wos is?" bezweckt werden soll: Es handelt sich um eine Eingabeaufforderung.
Phonem-Datenbank
Die Forscher haben im Rahmen eines Forschungsprojekts verschiedene Varianten des Wienerischen kreiert und dafür unter anderem Schauspieler und Moderatoren wie Hanno Pöschl, Helma Gautier oder Stephan Pokorny als Stimmenspender gewonnen. Diese mussten jeweils mehrere Stunden einfache Redewendungen bis hin zu Gedichten von H. C. Artmann vortragen. Im Computer werden die Aufnahmen dann in kleinste Einheiten der Sprache, sogenannte Phoneme, zerlegt und daraus eine Datenbank angelegt.

Für die Synthese der Sprache greift die Maschine dann blitzschnell auf die Bausteine der Datenbank zurück. Neben dem klassischen Wienerisch, für dass Pöschl seine Stimme zur Verfügung stellte, entstanden so auch eine Art österreichisches Hochdeutsch (Pokorny), eine Wiener Standardsprache (Gautier) und eine Jugendsprache.
...
Hanno Pöschl 2.0
Hörproben vom selben Forschungsprojekt gibt es in folgendem Beitrag:
->   Erster Computer, der Wienerisch spricht
...
Rechner agiert selbständig
Die Forscher haben in Zusammenarbeit mit dem Österreichischen Forschungsinstitut für Artificial Intelligence (OFAI), dem Institut für Schallforschung (ARI) und dem Centre for Speech Technology Researchin Edinburgh einen neuen Ansatz gewählt. Bei der sogenannten adaptiven Sprachsynthese bedarf es keiner menschlichen Paten mehr, der Computer selbst ahmt sämtliche Aufgaben von Kehlkopf, Mund und Zunge nach. "Dabei ist es sogar möglich, die Intensität des Dialekts stufenlos zu verstellen", erklärte Projektleiter Michael Pucher vom ftw.

Derzeit laufen Gespräche, eine Stimme der gesprochenen Version in ein kommerzielles Produkt umzuwandeln, so Pucher. Es soll sich um ein Dialogsystem handeln, das etwa als Restaurant- oder Fremdenführer einsetzbar ist. In Zukunft könnte es daher nicht mehr heißen "Eingabe nicht zulässig, bitte wiederholen" sondern "T'schuldigung, was hams g'sagt?" - wenngleich noch etwas abgehackt und computerartig.

[science.ORF.at/APA, 30.4.09]
->   ftw
->   OFAI
->   ARI
->   Centre for Speech Technology Research
Mehr zu diesem Thema in science.ORF.at:
->   Computer lernt das Lippenlesen
->   Wie kommt das Unbewusste in die Maschine?
 
 
 
ORF ON Science :  News :  Technologie 
 

 
 Übersicht: Alle ORF-Angebote auf einen Blick
01.01.2010