Countdown

So langsam wird es bei mir ernst, denn der Endspurt auch in Richtung der Magistra Artium mit den letzten beiden Klausuren steht an.

Und ich muss mich dann doch dafür entschuldigen, dass ich lange Zeit keine neuen Beiträge geschrieben habe. Ideen habe ich genug, allerdings soll gerade hier dann auch die Qualität stimmen. Der Preisverleihung folgten viele Dinge, die liegen geblieben waren, ein Praktikum in einer anderen Stadt, schließlich nun eben die letzten beiden Klausuren.

Wen es interessiert: Es sind noch meine beiden Nebenfächer Allgemeine Sprachwissenschaft und Sprachliche Informationsverarbeitung fällig; mein Hauptfach Deutsch ist vom Staatsexamen anerkannt worden.

In der Allgemeinen Sprachwissenschaft lauten meine Themenbereiche “Morphologische Produktivität” und “Fachsprachen” - meiner Ansicht nach auch für computerlinguistische Fragestellungen nicht ganz uninteressant, denn: Wie kann ich unbekannte Wörter bzw. Wortformen behandeln und nach welchen Prinzipien können diese potenziell gebildet werden? Und Fachsprachen sind per se für alle domänenspezifischen Anwendungen interessant.

In der Sprachlichen Informationsverarbeitung kommt zum einen der Bereich Softwaretechnologie dran - mit Java und Prolog. Die zweite Aufgabe darf ich entweder im Bereich POS-Tagging oder im Bereich Text Mining / Information Retrieval lösen.

Und damit das auch klappt, muss ich dann doch noch etwas Zeit ins Lernen investieren. Danach habe ich aber Zeit zum Schreiben - bis zum ersten festen Job!

Bitte hinterlassen Sie Ihren Kommentar zu diesem Eintrag.

4 Kommentare für “Countdown”

Thomas HoppeNo Gravatar

Hallo Frau Kraus,

interpretiere ich das richtig, dass es in der Computerlinguistik Ansätze gibt mit denen man in einem beliebigen Text (natürlich in einer festgelegten Domäne) fachsprachliche Begriffe von natürlichsprachlichen Begriffen unterscheiden kann? Falls ja, benötigt man da neben der Morphologie der Sprache nicht auch Hintergrundwissen?

Ontonym» Blogarchiv » Identifikation von fachsprachlichen Begriffen

[...] Xing-Profil gesehen und gleich im ersten Beitrag stoße ich auf etwas Interessantes (guckst du hier). Das sieht so aus als wenn es Ansätze zur Identifikation von fachsprachlichen Begriffen gibt. Ich [...]

Sonja KrausNo Gravatar

Ähm: nein! Bzw. jein.

Die beiden - übrigens voneinander unabhängigen - Themen “Fachsprachen” und “Morphologische Produktivität” haben in der Form, in der ich dafür lerne, erst einmal rein gar nichts mit Computerlinguistik zu tun - daher ja auch im Fach “Allgemeine Sprachwissenschaft”.

Davon unabhängig sind aber im Bereich des Text Mining durchaus Verfahren etabliert und in der einschlägigen Literatur nachzulesen, mit deren Hilfe ich Abweichungen gegenüber einem allgemeinsprachlichen Referenzkorpus feststellen kann: d.h. überdurchschnittlich häufiges Auftreten bestimmter Termini, wodurch ich a) Texte als relevant für diese Termini erkennen kann und wo ich b) evtl. weitere Rückschlüsse ziehen kann, dass es sich um Fachtermini eines bestimmten Bereichs handelt.

Wenn ich nun noch Wissen über die Charakteristika von (bestimmten) Fachsprachen besitze, könnte solche Schlüsse evtl. leichter zu ziehen oder sogar durch Regeln beschreibbar sein.
Ähnliches könnte für die morphologische Produktivität gelten, wenn ich Wörter verarbeiten will, die nicht bereits im Lexikon vorhanden sind (bspw. für POS-Tagging): Muster, Wahrscheinlichkeiten …

All das sind aber Dinge, die nun fast eher zufällig gleichzeitig meine Klausurthemen sind. Meines Wissens ist da noch nicht allzu viel (ein paar Dinge schon) zusammen gebracht worden; zumindest fällt dies jetzt gerade mal nicht in die für mich ganz aktuell relevanten Teilbereiche hinein.

Inwieweit man diese Bereiche, die ich - neben einigen anderen - für meine zukünftige Arbeit für relevant halte, nun so zusammenbringen kann, dass da tatsächlich der Schuh draus wird, den Sie sich idealerweise vorstellen, da müsste man noch “etwas” dran forschen. Falls ich irgendwann noch promovieren sollte, wäre das sicherlich ein spannendes Thema.

Thomas HoppeNo Gravatar

Sorry, aber so gut kenne ich mich mit Sprachwissenschaft und Computerlinguistik dann doch nicht aus, um gleich den richtigen Unterschied zu treffen :).

Das man da Text Mining einsetzen könnte ist mir klar. Das Problem welches wir z.B. haben ist, dass jeder Korpus den man zusammenstellt immer unvollständig sein muss. Ein Verfahren welches da Begriffsfragmente nutzt um Fachbegriffe zu identifizieren wäre für uns sehr interessant. Beispielsweise gibt es in der Chemie so wunderbar Prefixe und Suffixe wie “Di-” “-hydrat” “-sulfit”. Ein Verfahren welches daraus unbekannte Fachbegriffe chemischer Substanzen identifizieren könnte, wäre da was sehr interessantes. Kennen Sie Ansätze die in dieser Richtung arbeiten ?

Einen Kommentar schreiben

Wichtig: Ihre E-Mail-Adresse wird nicht veröffentlicht.

Der letzte Eintrag wurde hinzugefügt am: Montag, 3 November 2008 um 20:02 in:

Archiv

Sonstiges