112128

Wie aus Texten Informationen werden

02.09.2009 | 10:01 Uhr |

In einfachen E-Mails, Berichten oder Präsentationen liegen für Unternehmen oft wahre Wissensschätze vergraben. Text Mining soll helfen, diese Schätze auszuheben und die Mitarbeiter eines Unternehmens klüger zu machen.

Das meiste Wissen innerhalb von Unternehmen ist im einen oder anderen Textformat gespeichert – als E-Mails, Berichte, Studien oder Präsentationen. Die Marktforscher von IDC schätzen das weltweite Datenvolumen im Jahr 2011 auf 1,8 Billionen Gigabyte und damit auf das zehnfache im Vergleich zu 2006. Könnte man auf einem einfachen Weg aus diesen unstrukturierten Daten strukturierte Informationen gewinnen, würden diese einer viel größeren Zahl von Mitarbeitern zur Verfügung gestellt werden können und Firmen wären auf einen Schlag wesentlich "klüger".

Doch wie lassen sich diese ständig wachsenden Datenberge durchforsten und relevante Informationen daraus extrahieren? Die Antwort liefern Methoden wie Data Mining oder Text Mining. Data Mining durchsucht dabei strukturierte Daten, wie sie in Datenbanken vorhanden sind. Die schwierigere Aufgabe, nämlich aus unstrukturierten Texten unter Verwendung von Sprachanalyse Informationen zu extrahieren , hat Text Mining (auch Text Analytics genannt).

So funktioniert Text Mining

Die Vorgehensweise beim Text Mining beinhaltet generell die folgenden Arbeitsschritte:

  • Der Text wird für die Analyse vorbereitet;

  • das Konzept wird extrahiert;

  • Meinungen und Zusammenhänge werden aufgedeckt;

  • Klassifikation und Aufbau der Text Analytics-Modelle;

  • Zusammenführung der Text Analytics-Modelle mit anderen Datenmodellen;

  • Aufbereitung der Ergebnisse.

Ein beliebtes Einsatzgebiet für Text Mining ist das Customer Relationship Management, in dem Informationen über das Kaufverhalten oder die Gewohnheiten von Kunden eines Unternehmens gewonnen werden sollen. Hierzu filtert eine Software aus freien Texten Konzepte, Zusammenhänger und Stimmungen heraus. Die Einsichten daraus sollen dazu genutzt werden, Kundenbeziehungen zu verbessern. Allerdings sollte man spätestens hier mit einem weit verbreiteten Vorurteil Schluss machen: "Textanalysen funktionieren nicht wie Suchmaschinen", erklärt Michaela Kagerer, SPSS Marketing Manager Central Europe bei der SPSS Software GmbH , die entsprechende Produkte anbietet.

Während Search Engines einen Top-down-Ansatz verfolgten, um Informationen aus Textmaterialien zu filtern, werde bei Textanalysen von unten nach oben gearbeitet: "Bei Suchmaschinen müssen Endanwender genau wissen, wie sie ihre Anfragen strukturieren, um die gewünschten Informationen zu erhalten. Im Bereich Textanalysen hingegen lassen sich die Konzepte und Themen aus einer Mischung an Dokumenten aufdecken." Dann werden Beziehungen und Wechselwirkungen zwischen diesen einzelnen Strukturen hergestellt (ein Vergleich von Suchmaschinen finden Sie im Wiki der Computerwoche ).

0 Kommentare zu diesem Artikel
112128