Im Themenfeld Knowledge Discovery (Wissenserschließung) werden semi-automatische Methoden zur Analyse, Anreicherung und Verknüpfung von komplexen Wissensbasen erforscht und entwickelt. Ziel ist es, durch einen hohen Grad von Automation in der Wissensverarbeitung AnwenderInnen bei der Lösung von komplexen Aufgabenstellungen zu unterstützen. Eine intelligente Kombination von Such- und Erschließungsverfahren soll garantieren, dass zu jeder Zeit genau die Information zur Verfügung steht, die für die Lösung einer bestimmten Aufgabenstellung benötigt wird. Die verwendeten Methoden umfassen u.a. Suchtechnologien (Information Retrieval), Anreicherungsverfahren (Information Extraction), sprachübergreifende Verfahren (Cross Language Retrieval) und maschinelle Lernverfahren (Machine Learning).
Abbildung 1: Erkennung von in PDF-Dokumenten enthaltenen Informationen; z.B. Autoren, Affiliationen, Textabschnitte.
Thematische Schwerpunkte
Die korrekte Verschlagwortung von Dokumenten ist eine grundlegende Voraussetzung für die Verteilung, Bewertung und Ablage im Kontext von Unternehmensprozessen. Aufgrund immer größerer Volumina und immer kürzerer Durchlaufzeiten wächst der Bedarf an einer zuverlässigen Automatisierung von Verschlagwortung. Bewährt hat sich in diesem Zusammenhang die Anwendung von Lernverfahren, die aus bereits verschlagworteten Beständen Muster lernen und auf neue Dokumente anwenden. In Zusammenarbeit mit Industriepartnern wie LexisNexis oder Siemens konnten entsprechende Methoden etwa für die automatische Klassifikation technischer Anforderungen oder für die automatische Zuordnung von juristischen Dokumenten zu Rechtsgebieten entwickelt werden.
Die Suche nach relevanten Dokumenten stellt eine der Hauptaufgaben am modernen Wissensarbeitsplatz dar. Ein signifikanter Prozentsatz der täglichen Arbeitszeit wird mit Recherche-Aktivitäten zugebracht. Jede Unterstützung in diesen Aktivitäten erhöht daher unmittelbar die Produktivität. In Zusammenarbeit mit dem Industriepartner InfoNova haben wir eine Suchplattform für den größten österreichischen Telekom-Anbieter A1 geschaffen, die fortschrittliche Suchfunktionalitäten wie automatische Anfragevervollständigung und Ergebnisfacettierung bietet und auf quelloffenen Technologien aufsetzt. Damit konnten die Zugriffszeiten bei erweitertem Funktionsumfang erheblich reduziert werden.
Die zunehmende Verbreitung von Online-Medien stellt Anbieter von enzyklopädischen Inhalten vor neue Herausforderungen. Um entsprechende Inhalte online-tauglich und aktuell aufbereiten und präsentieren zu können, sind spezialisierte Infrastrukturen erforderlich, die nicht in Produktform zur Verfügung stehen. Gemeinsam mit unserem Industriepartner WissenMedia haben wir Technologien für die Intelligente Verwaltung und Auslieferung von Inhalten im Online-Umfeld entwickelt. Die Freiheit in der Zusammenstellung von enzyklopädischen Werken aus unterschiedlichen Quellen wurde dadurch erweitert, ebenso wie die Möglichkeit, Quellen semantisch anzureichern.
Wissenschaftliche Exzellenzfelder
- Informationsextraktion – Automatische Erkennung von benannten Entitäten wie Personen oder Orten
- Textklassifikation – Automatische Verschlagwortung von Dokumenten basierend auf inhaltlichen Merkmalen
- Faktenvalidierung – Automatische Erkennung und Validierung von Fakten in Dokumenten basierend auf externen Datenquellen
Weitere Kernkompetenzen
- Erkennung semantischer Entitäten in unstrukturierten Informationsquellen
- Identifikation semantischer Beziehungen in und zwischen Informationsquellen
- Suche in Informationsquellen über Sprach- und Domänengrenzen hinweg
- Automatische Analyse der Struktur und Qualität von Informationsquellen



