European Language Resource Coordination

European Language Resource Coordination

Im Fokus der European Language Resource Coordination (ELRC) steht die Sammlung von Sprachdaten, sogenannten Sprachressourcen, um das maschinelle Übersetzungssystem der Europäischen Kommission zu verbessern.

Ziel von ELRC

Der Schwerpunkt liegt im Ausfindigmachen, Sammeln und Aufbereitung von Sprachressourcen in allen an der Förderinitiative Connecting Europe Facility teilnehmenden Ländern, d.h. allen EU-Mitgliedsstaaten sowie Island und Norwegen. Diese Sprachressourcen werden zur Verbesserung von eTranslation, dem maschinellen Übersetzungsservice innerhalb der CEF Automated Translation-Plattform der Europäischen Kommission, verwendet. Durch eTranslation soll die grenzüberschreitende, mehrsprachige Kommunikation zwischen öffentlichen Einrichtungen, Ministerien und EU-BürgerInnen unterstützt werden. Die Qualität einer automatisch erstellten Übersetzung hängt allerdings wesentlich von der Qualität und Quantität der Sprachressourcen, die zum Trainieren des Systems verwendet wurden, ab. Daher ist die Bereitstellung von Daten für eine gute fachspezifische Übersetzung in der jeweiligen Sprache von entscheidender Bedeutung.

Sprachressourcen

Gesammelt werden zwei- oder mehrsprachige Inhalte in digitalen und bearbeitbaren Formaten. Diese bieten die beste Grundlage zur Erweiterung der Themenabdeckung und Leistungsverbesserung von eTranslation. Im Idealfall beinhalten Datenspenden Translation Memorys, z.B. als TMX-Datei, oder alternativ Dokumente im Originalformat mit Quellenangaben sowie mindestens einem übersetzten Dokument.

Folgende Sprachdaten sind besonders hilfreich:

Interne Berichte und andere Dokumente
Veröffentlichungen und andere Informationsmaterialien für den externen Gebrauch
Webinhalte und Broschüren
Terminologiedatenbanken und Glossare

Qualität ist der Schlüssel und Quantität der Weg zum Erfolg

Die von ELRC gesammelten und von öffentlichen Verwaltungen zur Verfügung gestellten zwei- und mehrsprachigen Daten, stammen in erster Linie von professionellen Übersetzer*innen. Dadurch wird die Qualität der Inhalte, die im sogenannten ELRC-SHARE Repository bereitgestellt werden, sichergestellt. Eine große Menge von Sprachdaten trägt zur inhaltlichen Abdeckung wesentlicher Themengebiete bei und fördert zudem die Konsistenz der generierten Übersetzung. Je häufiger bestimmte Ausdrücke in einem spezifischen Kontext verwendet werden, desto präziser werden die automatisch übersetzten Texte. Dies verringert den Aufwand für Post-Editing und verbessert gleichzeitig die Qualität der maschinellen Übersetzung.

ELRC-Serviceleistungen

Zur Unterstützung von Datenspendern, die ihre Sprachressourcen zur Verfügung stellen und somit zur Verbesserung maschineller Übersetzungssysteme in CEF eTranslation beitragen möchten, bietet das ELRC-Konsortium für jeden einzelnen Schritt Hilfestellungen an, um den Prozess des Teilens von Daten so einfach wie möglich zu gestalten.

ELRC bietet allen Datenspendern der CEF-Länder folgende Serviceleistungen kostenlos an:

Datenextraktion und -konvertierung
Entfernen von Tags und Neuformatierung
Datenbereinigung und Alignment
Anonymisierung
und vieles mehr.

National Anchor Points

In jedem Land gibt es zwei National Anchor Points (NAPs): einen Technologievertreter (Technological National Anchor Point, Technology NAP) und einen Vertreter des öffentlichen Dienstes und der Verwaltung (Public Services National Anchor Point, Public Services NAP).

Der Technology NAP ist ein renommierter Sprach- oder Sprachtechnologieexperte. Er oder sie haben oft einen ausgezeichneten akademischen Hintergrund oder Forschungshintergrund oder repräsentieren eine nationale Sprachinstitution.

Der Public Services NAP ist ein Vertreter des nationalen öffentlichen Dienstes, der öffentlichen Verwaltung oder eines Ministeriums. Er oder sie handelt als Ansprechpartner der nationalen, regionalen und lokalen Verwaltungen und ist in der Lage, die Bedeutung von Sprachressourcen und der Leistung des ELRC unter den Behörden/Ministerien eines jeden Landes zu verbreiten und diese zu mobilisieren.

Die NAPs in Österreich

Technology NAP (am Zentrum für Translationswissenschaft): Dagmar Gromann
Technology NAP - Stellvertreterin (Zentrum für Translationswissenschaft): Barbara Heinisch
Public Services NAP (am Sprachinstitut des Bundesheeres): Jürgen Kotzian

Weitere Informationen: http://www.lr-coordination.eu/de