Informationslinguistik

Informationslinguistik - auch Natural Language Processing gennant - untersucht sprachliche Probleme der Textanalyse, wie sie typischerweise im Kontext von Information Retrieval (IR)-Systemen auftreten. Informationslinguistik ist eine wissenschaftliche Disziplin zwischen Informationswissenschaft und Computerlinguistik.

Teilgebiete von Informationslinguistik

Folgend werden einige Teilgebiete von Informationslinguistik in Verbindung zu anderen Diziplinen vorgestellt:

Automatische Spracherkennung: Ziel ist, die natürliche Sprache automatisch zu verarbeiten. Damit sind Verfahren gemeint, die helfen, menschliche Sprachverarbeitungsprozesse zu verarbeiten. Erstmal sind aber mit "Automatischer Spracherkennung" Verfahren gemeint, die die gesprochene Darstellung verschriftlichen und maschinell weiter verarbeitbar machen.

Morphologische Analyse: Die Morphologische Analyse beschäftigt sich mit der Strukturierung der Wörter einer Sprache. Im Rahmen der automatischen Indexierung ist sie eines der wichtigsten Verfahren, dadurch wird die Grundlage für die Koordination von Grundformen von Textwörtern als Deskriptoren geschaffen.

Syntaktische Analyse: Sie analysiert die Koordination von Wörtern in Wortgruppen (Nominal-, Präpositional-, Verbalgruppen), Teilsätzen und Sätzen. Die syntaktische Analyse dient so zur Ermittlung der kleinsten Wissenseinheiten (Propositionen) und trägt auch zur Verdeutlichung mehrdeutiger Textwörter bei.

Semantische Analyse: Die semantische Analyse untersucht Bedeutungen im Kontext. Sie bestimmt, ob eine analysierte syntaktische Struktur Sinn macht oder wenn ein Wort mehrere Bedeutungen haben kann, welche in einem Kontext zutrifft.

Pragmatische Analyse: Um eine Darlegung (Äußerung) zu verstehen, reicht es nicht aus, lediglich in einem Text vorhandenes Wissen zu erfassen. Hierfür sind weitere wichtige Faktoren entscheidend: Sprachsituation, Gesprächspartner, Mimik und Gestik, soziale Normen, etc. Durch diese Faktoren geliefertes Wissen, wird in der pragmatischen Analyse verwertet.

Textanalyse (Inhaltserschließung): Die Textanalyse befasst sich mit den Beziehungen, die über die Satzebene hinausgehen. Beziehungen, die einen Text erst zum Text machen. Diese müssen besonders bei der Inhaltserschließung und beim Abstracting berücksichtigt werden.

Maschinelle Übersetzung: Hierunter versteht man die vollautomatische und computergestützte Übersetzung von Sprachen. Es wird immer wichtiger Sprachbarrieren zu überwinden. Texte werden deshalb mithilfe von Computern übersetzt oder es werden Deskriptoren in mehreren Sprachen zugewiesen.

Lexika/Lexikondatenbanken: Linguistische Verfahren basieren auf morphologischem, syntaktischem und semantischem Wissen über die Strukturen der Wörter. Diese Verfahren werden durch Computerwörterbücher unterstützt.

Information Extraction: Information Extraction ist eine Technologie zum automatischen Extrahieren klassifizierter Informationen aus Texten. Diese Technologie wird, z.B. bei der Auswertung von Berichten oder beim Durchsuchen einer Datenbank nach bestimmten Themen, eingesetzt.

Kognitive Linguistik: Die Kognitive Linguistik befasst sich mit der Aufnahme, Verarbeitung, Speicherung und Produktion von Informationen durch den Menschen, die sprachlich dargelegt werden. Die Fähigkeit des Menschen zu sprechen beinhaltet mehrere Komponenten. Darunter fallen: das Wissen über die Sprache und deren Elemente, das mentale Lexikon und die Gabe, Sprachen zu verarbeiten.

Natürliche Sprache und das Internet: Das Internet, als ein neues Informations- und Kommunikationsmedium, hat vor allem unter der jüngeren Generation großen Einfluss auf die Sprache. Man kann dies in den verschiedenen Kommunikationskanälen im Netz (E-Mail, Chat oder Newsgroups,...) feststellen. Es entwickelt sich hier ein eigener Sprachstil.

 

Quellen:
(1) Luckhardt, H./ Harms,I: Virtuelles HandbuchInformationswissenschaften, Teilbereiche der Informationslinguistik und Verbindungen zu anderen Disziplinen, Universität des Saarlands [Stand 2007-12-05]
(2) Kuhlen, R. / Seeger, T. / Strauch, D. (Hrsg.): Grundlagen der praktischen Information und Dokumentation. Band 2: Glossar. 5. Auflage. K. G. Saur Verlag: München 2004, S. 219ff.

Informationen zur Informationslinguistik

Bücher und Beiträge aus Sammelwerken

  • Batori, I.; Lenders, W.; Putschke, W. :Computational Linguistics. An International Handbook on Computer-Oriented Research and Applications. Berlin/New York 1989
  • Bekavac, Bernard: Metainformationsdienste des Internet. In: Kuhlen/Seeger/Strauch, Kap. C3, 399-408
  • Stock, W. G. : Information Retrieval - Informationen suchen und finden. Oldenbourg Verlag: München 2007

Webportale