Extracting Terminological Concept Systems from Natural Language Text (Text2TCS)

Projektlaufzeit: Juli 2020 bis Juli 2021

Kurzbeschreibung: Terminologie ist die Grundlage jeder Fachkommunikation. Da sie dem Wissenserwerb und der erfolgreichen Kommunikation in einem Fachgebiet dient, können terminologische Inkonsistenzen in der (mehrsprachigen) Fachkommunikation zu Missverständnissen führen.

Automatische Terminologieextraktion war bisher nur auf die Ausgabe von Listen von Termkandidaten beschränkt. Um Beziehungen zwischen Benennungen explizit darstellen zu können, wird die Bildung von terminologischen Begriffen und die Abbildung der semantischen Relationen zwischen ihnen benötigt. Text2TCS hat daher das Ziel terminologische Begriffssysteme aus ein- und zweisprachigen Korpora mittels Methoden des Ontology Learning und Machine Learning, der Discourse Representation Theory und Combinatory Categorial Grammar automatisiert zu extrahieren. Diese auf hierarchischen und nicht hierarchischen semantischen Beziehungen basierenden terminologischen Begriffssysteme unterstützen unmissverständliche Kommunikation (über Sprachgrenzen hinweg) vor allem auch in der Krisenkommunikation, wie zum Thema COVID-19 unter verschiedenen Akteuren und Organisationen, wie in der Politik, Medizin und Medienberichterstattung. Das Ergebnis von Text2TCS wird eine einfach zu bedienende Anwendung sein, die auf dem European Language Grid, einer europaweiten Plattform für Sprachtechnologien und Sprachressourcen frei nutzbar zur Verfügung gestellt wird.

Förderung: Pilotprojekt des European Language Grid (ELG; grant agreement 825627)

Ansprechpartnerin: Ass.-Prof. Mag. Dr. Dagmar Gromann, BSc

Website: text2tcs.univie.ac.at

ELG-Logo