News
Neues aus der Welt der Wissenschaft
 
ORF ON Science :  News :  Gesellschaft 
 
Startschuss für Wörterbuch des 20. Jahrhunderts  
  Die Österreichische Akademie der Wissenschaften wird mit Deutschland und der Schweiz das erste digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderts erstellen. Der Startschuss fiel heute bei einer gemeinsamen Erklärung der drei Akademien in Wien.  
Zunächst haben sich die Wissenschafter über den inhaltlichen und technischen Aufbau jener Texte geeinigt, auf deren Basis das digitale Wörterbuch in weiterer Folge entstehen wird. Die Texte sollen jeweils autonom in den drei Akademien ausgewählt werden.
...
Die Zeit drängt
Die Zeit drängt, denn die Digitalisierung von literarischen Texten wird zur Zeit nur von zwei amerikanischen Großkonzernen, Thomson Corporation/Gale-Group sowie Bell&Howell/Chadwyck-Healey, durchgeführt. So sind etwa die gesicherten Ausgaben von Schiller, Luther, Kafka längst im Besitz von Chadwyck-Healey, ebenso die verbindlichen französische Ausgaben von Voltaire, Montaigne und auch der 9-bändige Grand Robert de la langue Française.
...
Gefahr für Europa
"Das ist eine Gefahr und eine große Herausforderung für Europa", so der Präsident der Österreichischen Akademie der Wissenschaften, Werner Welzig. Man muss verhindern, dass digitale Technik dazu eingesetzt wird, künftig im kulturellen Bereich Monopole zu bilden. Dies könne dazu führen, dass schließlich auch literaturwissenschaftliche Informationen wie auf dem freien Markt nur gegen bares Geld ver- und gekauft werden.

Deshalb, so Welzig, ist es insbesondere die Aufgabe der akademischen Institutionen, dieses Wissen aufzuarbeiten und kostenfrei zur Verfügung zu stellen.
Dringender Aufholbedarf
Ein weiterer Grund für die dringende Notwendigkeit eines digitalen Wörterbuches: Es gibt derzeit kein Wörterbuch der deutschen Sprache, das den Wortschatz unseres Jahrhunderts ausreichend darstellt. Besonders deutlich wird dieses Defizit im Vergleich mit den Kultursprachen Französisch und Englisch.

Während das umfassendste deutsche Werk, das Grimmsche Wörterbuch, die deutsche Sprache unseres Jahrhunderts fast nicht berücksichtig, bleiben im Duden Sprachentwicklung und Texte der ersten Jahrhunderthälfte weitgehend im Dunklen. Das neue digitale Wörterbuch hingegen soll neben dem 19. auch das gesamte 20. Jahrhundert berücksichtigen.
In zwei Jahren abrufbar
In zwei Jahren sollen die, von allen drei Akademien ausgewählten Texte online abrufbar sein. Laut Arbeitsplan sollen in der ersten Phase an die 100 Millionen "running words" erfasst sein. In einem zweiten Schritt wird der Textumfang um das Fünffache erweitert. Zum Schluss wird das Projekt eine Milliarde Textwörter enthalten.

Basierend auf dieser umfassenden Textsammlung aufbauend soll dann schließlich das digitale Wörterbuch der deutschen Sprache im Internet aufgebaut werden. Dies jedenfalls ist das erklärte Ziel der Wissenschafter.
...
Erweiterte Informationen
Neben Aussprache, Grammatik und Morphologie wird es im digitalen Wörterbuch erweiterte Informationen geben. So kann der Benützer erfahren, wann und wo das gesuchte Wort erstmals erschienen ist. Zudem wird die Bedeutung und Anwendung eines Wortes durch Zusatztexte, in die man hineinklicken und darin blättern kann, deutlich. Die Belege werden aber nicht wie bei den großen gedruckten Wörterbüchern ausschließlich aus Weltliteratur bestehen. Anspruch der drei Akademien ist es, die Texte ausgewogen auszuwählen. Das bedeutet, dass zum Beispiel auch Zeitungstexte oder Gebrauchsanweisungen berücksichtig werden.
...
Wie kommt der Text in den Computer?
Die meisten wissenschaftlich ausgewählten Texte liegen in Buch- und Zeitungsform vor und müssen eingescannt werden. Dabei entstehen Textbilder. Mit der sogenannten OCR-Software [OCR-Optical Character Recognition]- werden die Texte "computerlesbar" gemacht.

Bei sehr schlechter Qualität der gedruckten Vorlage, müssen diese manuell eingegeben werden. Dies jedoch wird nicht in Europa, sondern in China durchgeführt. In erster Linie nicht aus Kostengründen sondern im Sinne möglichst großer Genauigkeit. Folgend der Erkenntnis, dass Menschen, die eine fremde Sprache weder in Schrift noch Wort beherrschen, die entsprechenden Texte wie eine Kaligraphie zeichentreu übertragen.
Probleme mit der gesprochenen Sprache
Zur Diskussion steht noch, inwieweit das geplante digitale Wörterbuch der deutschen Sprache auch mit gesprochenen Texten angereichert und vervollständigt werden soll und kann.

Transkription und Digitalisierung von Tondokumenten sind jedoch mit hohem Aufwand verbunden. Deshalb ist zunächst nur im Gespräch, ob im Rahmen des digitalen Wörterbuches Sprache nicht nur lesbar sondern auch hörbar sein wird. Folgend der Wittgenstein¿schen Maxime: "Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache."

Elke Weiss
->   Österreichische Akademie der Wissenschaften
->   Berlin Brandenburgische Akademie der Wissenschaften - Digitales Wörterbuch des 20. Jahrhunderts.
 
 
 
ORF ON Science :  News :  Gesellschaft 
 

 
 Übersicht: Alle ORF-Angebote auf einen Blick
01.01.2010