Computerlinguistik ist eine Disziplin im Überlappungsbereich von Künstlicher Intelligenz, Kognitionswissenschaft und Sprachwissenschaften, die sich damit beschäftigt, Anwendungen, Verfahren und Formalismen zu entwickeln, um natürliche Sprache automatisch zu analysieren, zu verarbeiten, zu generieren und zu manipulieren (z.B. übersetzen). Die dabei verfolgten Ziele umfassen unter anderem, Informationen aus natürlichsprachlichem Text zu extrahieren, zu verarbeiten, zu aggregieren und nutzbar zu machen, Informationsaustausch über Grenzen bestehender Medien und Sprachen zu ermöglichen und zu unterstützen, aber auch, eine algorithmische Modellierung kognitiver und sprachlicher Prozesse zu erreichen.

Die Angewandte Computerlinguistik beschäftigt sich insbesondere damit, wie solche Technologien genutzt werden können, und wie sie zu gestalten sind, um praktische Probleme zu lösen. Einerseits handelt es sich dabei um Alltagsprobleme, wie z.B.

Auf der anderen Seite stellt sich die Frage, wie moderne computerlinguistische Methoden genutzt werden können, um bei der Lösung konkreter Aufgaben aus Industrie und Wissenschaft behilflich zu sein, z.B. bei der Entwicklung
Die AG Angewandte Computerlinguistik an der Universität Frankfurt (ACoLi) steht in diesen Fragestellungen anderen Gebieten der Informatik nahe, vor allem der Texttechnologie, den Datenbanken und Informationssystemen, sowie der Künstlichen Intelligenz. Ein besonderer Arbeitsschwerpunkt ist des weiteren die Entwicklung von sprachtechnologischen Lösungen für die Geisteswissenschaften, was in enger Zusammenarbeit mit dem LOEWE-Schwerpunkt "Digital Humanities" verfolgt wird.

 

ACoLi Gruppenbild, Juli 2018

 

Wir arbeiten auf den folgenden, ineinander greifenden Gebieten:

Prof. Chiarcos und die Arbeitsgruppe besitzen einen besonderen Schwerpunkt im Bereich der Linguistic Data Science, der diese Gebiete verbindet. Dies beinhaltet die Erforschung skalierbarer Methoden, Prozesse, Verfahren und Formalismen für die Erstellung, Auswertung, Verarbeitung und Integration von Informationen in semistrukturierter und strukturierter, vor allem aber natürlichsprachlicher Form. Wichtige Herausforderungen beinhalten hierbei einerseits die Menge der Daten (Big Data), andererseits ihre Heterogenität (Data Fusion / Rich Data). Wir sind insbesondere an der Entwicklung skalierbarer und generischer Repräsentations- und Transformationsformalismen interessiert, an der Harmonisierung von Annotationen und Metadaten, an Verfahren, heterogene Annotationen in sprachtechnologischen (Natural Language Unterstanding) und sprachwissenschaftlichen (Korpuslinguistik, DH) Verarbeitungsplattformen zu integrieren und an Technologien, diese mit externen Datenquellen zu verknüpfen. Seit 2012 entwickeln wir hierfür und gemeinsam mit internationalen Kooperationspartnern beispielsweise eine Linguistic Linked Open Data cloud sprachtechnologisch relevanter Ressourcen und innovative Technologien, um diese zu nutzen.

Im Rahmen unserer Aktivitäten im Bereich Digital Humanities beherbergt ACoLi seit Dezember 2015 die BMBF-finanzierte Nachwuchsgruppe Linked Open Dictionaries (LiODi), vgl. deren Projektdarstellung. LiODi entwickelt Methodologien und algorithmische Ansätze, um Forschung im Bereich der vergleichenden Lexikographie zu unterstützen, einem wichtigen Aspekt sprach- und kulturwissenschaftlicher, soziologischer und historischer Forschungsfragen. Ein wichtiges Arbeitsgebiet von ACoLi sind Entwicklung und Einsatz von Lösungen aus dem Bereich des (Linguistic) Linked Open Data, in dessen Anwendung auf Fragestellungen dieser Art der zentrale Innovationsaspekt der Nachwuchsgruppe liegt.