<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	>
<channel>
	<title>Kommentare zu: Countdown</title>
	<atom:link href="http://www.kraus-sonja.de/semantik/182008-11/countdown/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.kraus-sonja.de/semantik/182008-11/countdown/</link>
	<description></description>
	<pubDate>Wed, 08 Sep 2010 16:54:49 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.7</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
		<item>
		<title>Von: Thomas Hoppe</title>
		<link>http://www.kraus-sonja.de/semantik/182008-11/countdown/comment-page-1/#comment-583</link>
		<dc:creator>Thomas Hoppe</dc:creator>
		<pubDate>Wed, 05 Nov 2008 12:04:24 +0000</pubDate>
		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=18#comment-583</guid>
		<description>Sorry, aber so gut kenne ich mich mit Sprachwissenschaft und Computerlinguistik dann doch nicht aus, um gleich den richtigen Unterschied zu treffen :). 

Das man da Text Mining einsetzen könnte ist mir klar. Das Problem welches wir z.B. haben ist, dass jeder Korpus den man zusammenstellt immer unvollständig sein muss. Ein Verfahren welches da Begriffsfragmente nutzt um Fachbegriffe zu identifizieren wäre für uns sehr interessant. Beispielsweise gibt es in der Chemie so wunderbar Prefixe und Suffixe wie "Di-" "-hydrat" "-sulfit". Ein Verfahren welches daraus unbekannte Fachbegriffe chemischer Substanzen identifizieren könnte, wäre da was sehr interessantes. Kennen Sie Ansätze die in dieser Richtung arbeiten ?</description>
		<content:encoded><![CDATA[<p>Sorry, aber so gut kenne ich mich mit Sprachwissenschaft und Computerlinguistik dann doch nicht aus, um gleich den richtigen Unterschied zu treffen :). </p>
<p>Das man da Text Mining einsetzen könnte ist mir klar. Das Problem welches wir z.B. haben ist, dass jeder Korpus den man zusammenstellt immer unvollständig sein muss. Ein Verfahren welches da Begriffsfragmente nutzt um Fachbegriffe zu identifizieren wäre für uns sehr interessant. Beispielsweise gibt es in der Chemie so wunderbar Prefixe und Suffixe wie &#8220;Di-&#8221; &#8220;-hydrat&#8221; &#8220;-sulfit&#8221;. Ein Verfahren welches daraus unbekannte Fachbegriffe chemischer Substanzen identifizieren könnte, wäre da was sehr interessantes. Kennen Sie Ansätze die in dieser Richtung arbeiten ?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Sonja Kraus</title>
		<link>http://www.kraus-sonja.de/semantik/182008-11/countdown/comment-page-1/#comment-579</link>
		<dc:creator>Sonja Kraus</dc:creator>
		<pubDate>Tue, 04 Nov 2008 20:43:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=18#comment-579</guid>
		<description>Ähm: nein! Bzw. jein.

Die beiden - übrigens voneinander unabhängigen - Themen "Fachsprachen" und "Morphologische Produktivität" haben in der Form, in der ich dafür lerne, erst einmal rein gar nichts mit Computerlinguistik zu tun - daher ja auch im Fach "Allgemeine Sprachwissenschaft".

Davon unabhängig sind aber im Bereich des Text Mining durchaus Verfahren etabliert und in der einschlägigen Literatur nachzulesen, mit deren Hilfe ich Abweichungen gegenüber einem allgemeinsprachlichen Referenzkorpus feststellen kann: d.h. überdurchschnittlich häufiges Auftreten bestimmter Termini, wodurch ich a) Texte als relevant für diese Termini erkennen kann und wo ich b) evtl. weitere Rückschlüsse ziehen kann, dass es sich um Fachtermini eines bestimmten Bereichs handelt.

Wenn ich nun noch Wissen über die Charakteristika von (bestimmten) Fachsprachen besitze, könnte solche Schlüsse evtl. leichter zu ziehen oder sogar durch Regeln beschreibbar sein.
Ähnliches könnte für die morphologische Produktivität gelten, wenn ich Wörter verarbeiten will, die nicht bereits im Lexikon vorhanden sind (bspw. für POS-Tagging): Muster, Wahrscheinlichkeiten ...

All das sind aber Dinge, die nun fast eher zufällig gleichzeitig meine Klausurthemen sind. Meines Wissens ist da noch nicht allzu viel (ein paar Dinge schon) zusammen gebracht worden; zumindest fällt dies jetzt gerade mal nicht in die für mich ganz aktuell relevanten Teilbereiche hinein.

Inwieweit man diese Bereiche, die ich  - neben einigen anderen - für meine zukünftige Arbeit für relevant halte, nun so zusammenbringen kann, dass da tatsächlich der Schuh draus wird, den Sie sich idealerweise vorstellen, da müsste man noch "etwas" dran forschen. Falls ich irgendwann noch promovieren sollte, wäre das sicherlich ein spannendes Thema.</description>
		<content:encoded><![CDATA[<p>Ähm: nein! Bzw. jein.</p>
<p>Die beiden - übrigens voneinander unabhängigen - Themen &#8220;Fachsprachen&#8221; und &#8220;Morphologische Produktivität&#8221; haben in der Form, in der ich dafür lerne, erst einmal rein gar nichts mit Computerlinguistik zu tun - daher ja auch im Fach &#8220;Allgemeine Sprachwissenschaft&#8221;.</p>
<p>Davon unabhängig sind aber im Bereich des Text Mining durchaus Verfahren etabliert und in der einschlägigen Literatur nachzulesen, mit deren Hilfe ich Abweichungen gegenüber einem allgemeinsprachlichen Referenzkorpus feststellen kann: d.h. überdurchschnittlich häufiges Auftreten bestimmter Termini, wodurch ich a) Texte als relevant für diese Termini erkennen kann und wo ich b) evtl. weitere Rückschlüsse ziehen kann, dass es sich um Fachtermini eines bestimmten Bereichs handelt.</p>
<p>Wenn ich nun noch Wissen über die Charakteristika von (bestimmten) Fachsprachen besitze, könnte solche Schlüsse evtl. leichter zu ziehen oder sogar durch Regeln beschreibbar sein.<br />
Ähnliches könnte für die morphologische Produktivität gelten, wenn ich Wörter verarbeiten will, die nicht bereits im Lexikon vorhanden sind (bspw. für POS-Tagging): Muster, Wahrscheinlichkeiten &#8230;</p>
<p>All das sind aber Dinge, die nun fast eher zufällig gleichzeitig meine Klausurthemen sind. Meines Wissens ist da noch nicht allzu viel (ein paar Dinge schon) zusammen gebracht worden; zumindest fällt dies jetzt gerade mal nicht in die für mich ganz aktuell relevanten Teilbereiche hinein.</p>
<p>Inwieweit man diese Bereiche, die ich  - neben einigen anderen - für meine zukünftige Arbeit für relevant halte, nun so zusammenbringen kann, dass da tatsächlich der Schuh draus wird, den Sie sich idealerweise vorstellen, da müsste man noch &#8220;etwas&#8221; dran forschen. Falls ich irgendwann noch promovieren sollte, wäre das sicherlich ein spannendes Thema.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Ontonym&#187; Blogarchiv &#187; Identifikation von fachsprachlichen Begriffen</title>
		<link>http://www.kraus-sonja.de/semantik/182008-11/countdown/comment-page-1/#comment-576</link>
		<dc:creator>Ontonym&#187; Blogarchiv &#187; Identifikation von fachsprachlichen Begriffen</dc:creator>
		<pubDate>Tue, 04 Nov 2008 07:57:21 +0000</pubDate>
		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=18#comment-576</guid>
		<description>[...] Xing-Profil gesehen und gleich im ersten Beitrag stoße ich auf etwas Interessantes (guckst du hier). Das sieht so aus als wenn es Ansätze zur Identifikation von fachsprachlichen Begriffen gibt. Ich [...]</description>
		<content:encoded><![CDATA[<p>[...] Xing-Profil gesehen und gleich im ersten Beitrag stoße ich auf etwas Interessantes (guckst du hier). Das sieht so aus als wenn es Ansätze zur Identifikation von fachsprachlichen Begriffen gibt. Ich [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Thomas Hoppe</title>
		<link>http://www.kraus-sonja.de/semantik/182008-11/countdown/comment-page-1/#comment-575</link>
		<dc:creator>Thomas Hoppe</dc:creator>
		<pubDate>Tue, 04 Nov 2008 07:56:00 +0000</pubDate>
		<guid isPermaLink="false">http://www.kraus-sonja.de/semantik/?p=18#comment-575</guid>
		<description>Hallo Frau Kraus,

interpretiere ich das richtig, dass es in der Computerlinguistik Ansätze gibt mit denen man in einem beliebigen Text (natürlich in einer festgelegten Domäne) fachsprachliche Begriffe von natürlichsprachlichen Begriffen unterscheiden kann? Falls ja, benötigt man da neben der Morphologie der Sprache nicht auch Hintergrundwissen?</description>
		<content:encoded><![CDATA[<p>Hallo Frau Kraus,</p>
<p>interpretiere ich das richtig, dass es in der Computerlinguistik Ansätze gibt mit denen man in einem beliebigen Text (natürlich in einer festgelegten Domäne) fachsprachliche Begriffe von natürlichsprachlichen Begriffen unterscheiden kann? Falls ja, benötigt man da neben der Morphologie der Sprache nicht auch Hintergrundwissen?</p>
]]></content:encoded>
	</item>
</channel>
</rss>
