News
Neues aus der Welt der Wissenschaft
 
ORF ON Science :  News :  Wissen und Bildung .  Technologie 
 
Google gewinnt Wettbewerb von Übersetzer-Software  
  Computergenerierte Übersetzungen sind bisher vor allem eines: ungenau und im besten Falle komisch. Bei einem Wettbewerb verschiedener Methoden hat nun eine Technik gewonnen, die von Google verwendet wird und als besonders zukunftsweisend gilt. Das Besondere: Ihre Hersteller haben von den beteiligten Sprachen keine Ahnung. Die Software beruht auf Textvergleichen.  
Gemessen wurde die Software an der Übersetzung aus dem Englischen in zwei besonders schwierige Sprachen - ins Chinesische sowie Arabische - und wieder zurück.

Von den Ergebnissen des Wettbewerbs, der alljährlich vom amerikanischen National Institute of Standards and Technology (NIST) durchgeführt wird, berichtete die Online-Ausgabe von "Nature".
Lernen durch logische Verknüpfungen
Ein beträchtlicher Teil herkömmlicher Übersetzungs-Software greift auf ein bestimmtes Vokabel- und Grammatikwissen zurück. So auch die führenden Arabisch-Englisch-Programme der ägyptischen Firma Sakhr.

Das von Google verwendete Programm hingegen "kennt" keine der verwendeten Sprache, sondern lernt durch Vergleiche von gleichen Zeitungstexten verschiedener Herkunft.

Aus dem anfänglichen Wissen ergeben sich im Laufe der Zeit immer mehr "logische" Verknüpfungen zwischen Buchstaben bzw. Schriftzeichen. Aus ersten Rohübersetzungen versucht die Software dann in einem zweiten Schritt, ein flüssigeres und realeres Englisch zu erstellen.
->   Firma Sakhr
Google bei fast allen Aufgaben voran
Wie gut der Google-Translator funktioniert, hat er vorige Woche bei der "NIST 2006 Machine Translation Evaluation" unter Beweis gestellt. 40 Bewerber kämpften um die Plätze, mit einer Ausnahme belegte die Google-Software bei allen 36 Übersetzungsaufgaben einen der ersten Plätze.

Der NIST-Test misst den Grad der Übereinstimmung, den die Software-Übersetzung mit dem Referenztext eines menschlichen Dolmetschers aufweist.

Im besten Fall - bei der Übersetzung eines Nachrichtentextes aus dem Arabischen ins Englisch - ergab sich eine Ähnlichkeit von 50 Prozent.
->   NIST 2006 Machine Translation Evaluation Official Results
...
Die Bundeshymne nach dem Google-Translator
Um die aktuelle Leistungsfähigkeit des Google-Übersetzers zu überprüfen, hier ein Test mit der österreichischen Bundeshymne. Zur Erinnerung, das Original:

"Land der Berge, Land am Strome, Land der Äcker, Land der Dome, Land der Hämmer, zukunftsreich! Heimat bist du großer Söhne, Volk, begnadet für das Schöne, Vielgerühmtes Österreich, Vielgerühmtes Österreich."

Hier die Übersetzung ins Englische:
Country of the mountains, country at the river, country of the fields, country of the cathedrals, country of the hammers, promising! Homeland are highly gifted you large sons, people, for the beautiful, much-praised Austria, much-praised Austria.

Und hier die Rückübersetzung:
Land der Berge, Land am Fluß, Land von fängt, Land der Kathedralen, das Land der Hammer auf und verspricht! Heimat sind du große Söhne, Leute, für das schöne, viel-gepriesene Österreich, viel-gepriesenes Österreich in hohem Grade begabt.
->   Google Translator
...
Größere Rechenleistung, mehr Dokumente
Wie die Online-Ausgabe von "Nature" schreibt, liegt die Dominanz von Google nicht zuletzt an der Praxis, die besten Köpfe des Fachs zu gewinnen. Franz Och etwa war ursprünglich an der University of Southern California in Los Angeles beschäftigt, wo er mit einigen zig Rechenmaschinen gearbeitet hat.

Bei seinem aktuellen Arbeitgeber Google seien es einige tausend. Und auch der Zugang zu einer großen Anzahl übersetzter Dokumente sei viel besser gegeben.

[science.ORF.at, 9.11.06]
->   Nature
Mehr zu dem Thema in science.ORF.at:
->   Deutsche Wörter wandern um die Welt (28.9.06)
->   Mehrsprachigkeit ist gut für das Gehirn (23.6.06)
->   Schottische Gedichte ins Wienerische übersetzt (6.9.05)
 
 
 
ORF ON Science :  News :  Wissen und Bildung .  Technologie 
 

 
 Übersicht: Alle ORF-Angebote auf einen Blick
01.01.2010