Data Mining

1. Data Mining als Teilbereich der Knowledge Discovery
2. Anwendungsgebiete
3. Aufgaben
4. Spezialisierung nach Datentypen
5. Grenzen des Data Mining

Grundsätzlich bezeichnet der Begriff Data Mining (DM) die systematische Analyse großer Datenbestände unter Anwendung statistischer Methoden bzw. spezifischer Algorithmen, um nicht offenkundig ersichtliche Zusammenhänge, Muster und/oder Trends aufzudecken, wobei ein möglicher Erkenntnisgewinn dabei vorab nicht immer absehbar ist. Die auf diese Weise gewonnenen Daten müssen den Gütekriterien Validität, Verständlichkeit, Neuheit und Nützlichkeit entsprechen.

1. Data Mining als Teilbereich der Knowledge Discovery

Data Mining ist folglich der konkrete Analyseschritt im Verfahren der sogenannten Knowledge Discovery in Databases (KDD), womit der übergeordnete Prozess der strukturierten Wissensentdeckung bezeichnet wird, der sich in folgende fünf Schritte untergliedern lässt:

  • Auswahl: Bestimmung und Bereitstellung des zu analysierenden Teilbereichs der Datensammlung
     
  • Vorbearbeitung: Datenbereinigung, im Sinne einer Beseitigung von Inkonsistenzen sowie Entfernung überflüssiger bzw. Ergänzung unvollständiger Datensätzen
     
  • Transformation: Umwandlung in das für die Analyse passende Datenformat
     
  • Data Mining: Durchführung der eigentlichen Analyse
     
  • Interpretation/Evaluation der ermittelten Zusammenhänge und Kontrolle der Zielerreichung

Bei der Knowledge Discovery handelt es sich um einen iterativen Prozess, sodass die hierbei gewonnenen Ergebnisse verwendet werden können, um in weiteren Analysedurchläufen zusätzliche oder präzisere Ergebnisse zu liefern.

2. Anwendungsgebiete

Die Haupteinsatzgebiete von Data Mining-Technologien sind derzeit im Controlling und Marketing von Unternehmen zu verorten. Darüber hinaus findet Data Mining auch häufig Anwendung in informationsintensiven Tätigkeitsfeldern, wie dem Finanz- und  Versicherungswesen, der Telekommunikation und dem Handel. Beispiele für solche Anwendungsszenarien sind:

Im Marketing:

  • Warenkorbanalyse zur Preisoptimierung und Produktplatzierung
  • Payback-Systeme
  • Marktsegmentierung
  • Kundenbeziehungen in Customer-Relationship-Management Systemen
  • Business Intelligence

Im Finanzsektor:

  • Rechnungsprüfung zur Betrugserkennung
  • Bonitätsprüfung

Im Digital Business:

  • Netzwerkanalysen in Social Media
  • Web-Usage-Mining zur Analyse des Nutzerverhaltens
  • Textmining zur Analyse großer Textbestände
  • Spamfilter

3. Aufgaben

Zu den Aufgabenstellung des Data Mining zählen:

  • Erkennung von Ausreißern: Identifizierung ungewöhnlicher Datenentwicklungen
  • Klassifikation: Ermittlung von Elementklassen und Zuordnung der entsprechenden Elemente
  • Clusteranalyse: Gruppierung von Objekten durch Ermittlung von Ähnlichkeiten
  • Assoziationsanalyse: Ermittlung von Zusammenhängen und Abhängigkeiten in den Daten durch Aufstellung von Assoziationsregeln wie „Aus A und B folgt normalerweise C“
  • Regressionsanalyse:  Aufdeckung von Beziehungen zwischen (mehreren) abhängigen und unabhängigen Variablen
  • Zusammenfassung der Datenbestände möglichst ohne Verlust von Informationen

4. Spezialisierung nach Datentypen

Während die meisten Data-Mining-Verfahren allgemein einsetzbar sind, gibt es auch Spezialisierungen für bestimmte Datentypen.

  • Textmining: Hierbei handelt es sich um ein Verfahren zur Erschließung Textbestände. Ein bekanntes Beispiel sind Methoden zur Plagiats-Erkennung.
  • Webmining: Beim Webmining geht es um die Analyse webbezogenen Daten. Für die Ermittlung von Clustern und Ausreißern werden nicht nur die Seiten selbst, sondern ebenso auch die Beziehungen zwischen den Seiten (Hyperlinks) betrachtet. Die permanente Dynamik der Datensätze ist in diesem Zusammenhang eine zentrale Herausforderung.
  • Zeitreihenanalyse: Ziel der Zeitreihenanalyse ist es Prognosen über den zukünftigen Zeitenreihenverlauf zu ermitteln, um z.B. Vorhersagen über künftige Trends abzuleiten.

5. Grenzen des Data Mining

Unter dem Begriff Data Mining wird eine Vielzahl effektiver Analysetechniken zur Erschließung großer Datenmengen summiert, die bei korrekter Ausführung gewinnbringende Erkenntnisse und mitunter auch Wettbewerbsvorteile liefern können. Ein zentrales Problem beim Einsatz von Data Mining-Verfahren ist es, dass die methodische Vorgehensweise vorab vom Menschen definiert werden muss, so dass die Ergebnisse der Untersuchungen durch eigene Vorstellungen und Zielsetzungen verfälscht werden können. Ein möglicher Schritt dieses Problem zu umgehen, wäre z.B., Analyseprozesse an externe Agenturen oder Mitarbeiter auszulagern.

Marketing Data Mining Knowledge Discovery Controlling Klassifikation Clusteranalyse Assoziationsanalyse Regressionsanalyse Textmining Webmining Zeitreihenanalyse
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Das könnte Sie auch interessieren

Abschöpfungspreispolitik

Affiliate Marketing

Eintrittspreis

Marktforschung

Unsere neuesten Vertriebsjobs

Aktuell online: 170 Jobangebote

Jetzt Vertriebsjobs finden

Unsere neuesten Handelsvertreter

Aktuell online: 21 Vertrieblerprofile

Jetzt Handelsvertreter finden

Der DIPEO Vertriebsnewsletter

Unser Info-Newsletter mit den neuesten Trends, Tipps und Tricks rund um das Thema Vertrieb!


Kontakt & Über uns