Künstliche Intelligenz ist in allen Lebensbereichen auf dem Vormarsch. Bilder werden verarbeitet, Texte richtig ausgewertet und Roboter beginnen damit zu lernen wie man sich mit Menschen sinnvoll unterhält. Während aber Künstliche Intelligenz in aller Munde ist, haben Sie vermutlich von Text Classification noch nie etwas gehört, obwohl auch sie ein Teil der Revolution durch Künstliche Intelligenz ist. Genauer gesagt ist Text Classification, wie auch Named Entity Recognition, ein Teil von Natural Language Processing. In diesem Artikel werden wir die wichtigsten Eckdaten zu Text Classification abstecken, erklären was genau sie eigentlich ist und wo Sie möglicherweise damit schon in Kontakt getreten sind, vielleicht sogar, ohne es wirklich zu bemerken.
Definition von Text Classification
Text Classification bedeutet zu Deutsch etwa Text Klassifizierung, also die Klassifizierung eines ganzen Textes. Häufig werden anstatt Text Classification auch die Bezeichnungen Text Tagging oder Text Kategorisierung verwendet. All diese Namen geben ein sehr klares Bild davon, was Text Classification tut: Sie kategorisiert Texte anhand gewisser Kriterien in eine bestimmte organisierte Gruppe von Texten. Mittels NLP können Text Classifiers automatisch Texte analysieren und ihnen (anhand vorgegebener Kriterien) die richtigen Tags oder Kategorien basierend auf dem Inhalt des Textes zugewiesen werden.
Was ist Text Classification und wie funktioniert es?
Wem ob dieser langen Definition nun der Kopf raucht, keine Sorge, wir machen es gleich einfacher verständlich und damit auch deutlich greifbarer. Texte werden einer Maschine vorgelegt und die Maschine sortiert diese Texte dann in unterschiedliche (vorgegebene) Kategorien. Welche Kategorien das sind und welche Arten von Text verarbeitet werden, sind abhängig von der Verwendung und dem erwarteten Ergebnis der Text Classification. Darum haben wir gleich einige Beispiele für Sie vorbereitet, anhand welcher Sie erkennen, wie Text Classification funktioniert und wo sie beispielsweise angewendet wird.
Beispiele für Text Classification im Alltag
Sentiment Analysis
Das erste Beispiel ist Sentiment Analysis. Das bedeutet auf Deutsch etwa Gefühlsanalyse. Das Ziel ist hier die Texte in zwei Kategorien zu unterteilen: Positives Gefühl oder negatives Gefühl. Das kann beispielsweise bei Reviews oder Feedback sehr nützlich sein. Wenn Sie beispielsweise wissen möchten, wie Sie Ihr Produkt weiter verbessern können, kann es sehr hilfreich sein, wenn Sie sich alle negativen Rezensionen ansehen. Dadurch können Sie die Schwierigkeiten oder Probleme herausfinden, mit denen Ihre Kunden zu kämpfen haben.
Anstatt jedoch sich durch sämtliche Reviews durchlesen zu müssen, kann es hier sehr hilfreich sein, einen Text Classifier zu verwenden. Hier können Sie ganz einfach nach den Texten suchen, die sich negativ über Ihre Produkte äußern und können sich dadurch auch auf die Probleme fokussieren um sie zu beheben.
Topic Detection
Eine weitere Möglichkeit für Text Classification ist Topic Detection. Damit können Sie die Maschine erkennen lassen, um welches Thema es sich in dem Text handelt. Um beim Produktreview von vorhin zu bleiben, könnten wir darauf schließen, ob es sich in dem Kundenfeedback um ein Feedback zu den Themen Kundensupport, Preise oder Nützlichkeit des Produktes handelt, oder vielleicht zu ganz anderen Themen Feedback gegeben wird. Damit kann in weiterer Folge das Review an die jeweils richtigen Sachbearbeiter zugewiesen werden, die sich dann um beispielsweise die Verbesserung des Kundensupports kümmern können.
Language Detection
Die Erkennung von Sprache kann auch bei den Kundenreviews sehr interessant sein, insbesondere, wenn Sie ein international oder global agierendes Unternehmen haben, das viele Kunden in Ländern mit unterschiedlichsten Sprachen haben. Natürlich könnten Sie nun für jedes dieser Länder einen ganz eigenen Kundensupport einrichten, mit jeweils eigenen Review- oder Ticket Tools. Allerdings wäre das sehr viel Geld, das hinausgeworfen wird, wenn stattdessen die Reviews oder Tickets zentral in ein einziges globales Tool übertragen werden. Dann kann hier die Text Classification weiterhelfen und die eingehenden Reviews anhand der jeweiligen Sprache erkennen, und diese dann den jeweiligen Support Mitarbeitern zu teilen.
Fraud Detection
Ein weiteres Anwendungsgebiet von Text Classifiern ist die Fraud Detection, also die Erkennung von missbräuchlicher Verwendung der Kommentar oder Review Funktion. Mit derartigen Detektoren können beispielsweise in Social Media wie FAcebook Texte erkennen, die beispielsweise rassistisch sind oder die auf Cyber Mobbing oder Trolling hinweisen. Außerdem kann weiterer unerwünschter Inhalt in den Texten (wie nicht jugendfreie Inhalte) erkannt werden und damit die Möglichkeit schaffen, solche Texte oder Kommentare automatisch zu sperren oder zu löschen.
Urgency Detection im Kundensupport
Auch bei der Erkennung der Wichtigkeit von Kundenreviews kann Text Classification sehr hilfreich sein. Beispielsweise kann sie dabei helfen, besonders sensible Themen als hoch Prior zu setzen, wenn ein Kunde zweimal für dieselbe Leistung bezahlen musste und sein Geld zurück möchte. Ein anderes Szenario wäre, dass der Kunde das Produkt längst zurück geschickt hat, das Geld aber noch nicht retour überwiesen wurde. Dies wären Punkte, die Kunden sehr verärgern und mit hoher Wahrscheinlichkeit dazu führen, dass sich die Kunden gegen Ihr Unternehmen entscheiden, und lieber anderswo nach ähnlichen Services suchen. Wenn Sie jedoch die besonders gravierenden Kundenreviews sehr rasch erkennen und bearbeiten können, dann hilft das sowohl Ihnen als auch Ihrem Unternehmen enorm, da sich die Wartezeiten der Kunden bei sehr heiklen Themen wie Geld deutlich verringern.
Trend Detection
Anstatt Mitarbeiter damit zu beauftragen manuell die Reviews der Kunden auszusortieren, kann ein Text Classifier helfen, Trends zu erkennen. Die Reviews werden dafür nach unterschiedlichen Kategorien unterteilt, beispielsweise Preisgestaltung, Produkt Qualität oder Kunden Support. Wenn sich nun in einem Thema - sagen wir Preisgestaltung - die Reviews im Vergleich zu den anderen Themen deutlich erhöhen, dann kann dieser Trend einerseits relativ simpel erkannt werden, andererseits kann aber auch sehr bald erkannt werden, welche Probleme sich im Thema Preisgestaltung ergeben haben, so zum Beispiel die Reaktion der Kunden auf eine zu hohe Preissteigerung.
Fazit
Auch, wenn Text Classification bestimmt nicht immer sofort auf den ersten Blick ins Auge fällt, sie hat definitiv bereits in vielen Firmen und Services Einzug gehalten. Sie hilft in zahllosen Geschäftsfällen die Mitarbeiter im Support zu entlasten, oder auch dabei rasch einen Überblick zu erlangen, wie glücklich oder unglücklich Mitarbeiter sind, und das alles innerhalb sehr kurzer Zeitspannen.
Außerdem hilft sie dabei, dass sich die Mitarbeiter auf die wirklich wichtigen Themen fokussieren können, und nicht ihre Zeit mit mühsamen manuellen Tasks vergeuden.