Data Mining mit der Support Vektor Maschine

Lessmann, Stefan

Titel:	Data Mining mit der Support Vektor Maschine
Sonstige Titel:	Data Mining with Support Vector Machines
Sprache:	Deutsch
Autor*in:	Lessmann, Stefan
GND-Schlagwörter:	Data Mining Kundenmanagement Maschinelles LernenGND Support-Vektor-Maschine
Erscheinungsdatum:	2007
Tag der mündlichen Prüfung:	2007-12-21
Zusammenfassung:	Die kumulative Dissertation beschreibt in 14 Fachartikeln die sogenannte Support Vektor Maschine als eine aktuell diskutierte Methodik zur Lösung betriebswirtschaftlicher Klassifikationsprobleme. Die Klassifikation wird dabei als eine Aufgabenstellung des Data Minings verstanden, welches die Aufdeckung nicht-trivialer, geschäftsrelevanter Muster und Zusammenhänge in großen Datenbeständen zum Ziel hat. Die Verfügbarkeit großer Datenmengen in der betrieblichen Praxis folgt unmittelbar aus dem umfassenden Einsatz von Informations- und Kommunikationssystemen in sämtlichen Unternehmensbereichen. Damit steigt die Bedeutung von Data Mining, um diese Daten zu analysieren und im Sinne einer Wissensentdeckung zur Verbesserung von Geschäftsprozessen oder allgemein der Erzielung von Wettbewerbsvorteilen zu nutzen. Von besonderer Relevanz ist in diesem Zusammenhang das Kundenbeziehungsmanagement, welches sich als Konzept zur Reaktion auf verschärfte Wettbewerbsbedingungen sowie voranschreitende Marktsättigung und tendenziell abnehmende Kundenloyalität etabliert hat. Eine wesentliche Zielsetzung dieser Managementphilosophie besteht in dem Aufbau, beziehungsweise dem Ausbau, langfristiger und profitabler Kundenbeziehungen. Data Mining liefert hierzu das nötige analytische Instrumentarium, um Kundenwünsche und -potentiale zu erkennen, zu verstehen und in geeignete Produkte und Dienstleistungen umzusetzen. Vor diesem Hintergrund entstammen die in der vorliegenden Arbeit zur Evaluation des Support Vektor Verfahrens untersuchten Planungs- und Entscheidungsprobleme vornehmlich dem Kundenbeziehungsmanagement. Dabei werden ausschließlich operative Planungsaufgaben betrachtet, die als Klassifikationsproblem modelliert werden können. Das heißt, eine Entscheidung ist jeweils durch die Einordnung eines Objektes (eines Kunden) in eine von mehreren vordefinierten Gruppen repräsentiert. Hierzu gehören beispielsweise Klassifikationsprobleme in den Bereichen Direktmarketing, Kreditwürdigkeitsprüfung, Stornoprophylaxe und Betrugserkennung. Um einen engen Bezug zur betrieblichen Praxis herzustellen, wurde nicht nur die eigentliche Klassifikation sondern auch die im Sinne eines strukturierten Prozesses zur Wissensentdeckung in Datenbanken vor- und nachgelagerten Analyseschritte betrachtet. So werden in der Arbeit zum Beispiel der Einfluss verschiedener Datenvorverarbeitungstechniken auf die Prognosegüte, verschiedene Gütemaße zur Bewertung von Klassifikatoren sowie statistische Testverfahren für den Vergleich alternativer Algorithmen untersucht. Neben einer Bewertung der Effektivität der Support Vektor Maschine zur Lösung der genannten Problemstellungen, wurden in der kumulativen Dissertation algorithmische Erweiterungen und Modifikationen des Verfahrens vorgeschlagen, um charakteristische Anforderungen des Anwendungsgebietes angemessen zu berücksichtigen. Hierzu zählen das Problem stark asymmetrischer Klassenverteilungen und die kostensensitive Klassifikation sowie allgemein die Herausforderung große Datenmengen zu verarbeiten. Beispielsweise wurde in einem Aufsatz das der Support Vektor Maschine zugrunde liegende Optimierungsproblem in ein gemischt-ganzzahliges Programm transformiert, um explizit die mit einer Fehlklassifikation assoziierten Kosten zu minimieren. In anderen Aufsätzen wurde eine Kombination aus Support Vektor Maschine und Genetischem Algorithmus entwickelt, um automatisch geeignete Parametereinstellungen für den Support Vektor Klassifikator zu bestimmen. Die Eignung der resultierenden modifizierten Support Vektor Maschinen wurde jeweils im Rahmen von breit angelegten empirischen Studien untersucht und bestätigt. Neben einer reinen Prognose gebietet der dem Kundenbeziehungsmanagement inhärente Lernzyklus eine Explizierung der in Data Mining Modellen gespeicherten Muster, damit diese in operativen Entscheidungsprozessen sowie im Sinne eines organisationalen Lernens, verwertet werden können. Diese Anforderung aufgreifend, wurde ein ganzheitliches Vorgehensmodell entworfen, welches ausschließlich auf Support Vektor Technologien beruht und sowohl hinsichtlich Prognosegenauigkeit als auch hinsichtlich Transparenz und Verständlichkeit viel versprechende Ergebnisse liefert. Zusammenfassend ergibt sich ein wesentlicher Beitrag zum derzeitigen Stand der Forschung durch den Einsatz eines noch wenig beachteten Verfahrens zur Lösung praxisrelevanter Planungs- und Entscheidungsprobleme sowie methodischer Erweiterungen, welche aus den besonderen Anforderungen der betrachteten Anwendungen abgeleitet wurden. Ferner ist der prozessorientierte Data Mining Analyseansatz in dieser Form innerhalb der Literatur zu Support Vektor Maschinen neuartig. Im Speziellen stellt der Entwurf eines ganzheitlichen, methodisch konsistenten Vorgehensmodells zur Lösung betriebswirtschaftlicher Klassifikationsprobleme mittels Support Vektor Verfahren einen signifikanten wissenschaftlichen Erkenntnisgewinn dar.
URL:	https://ediss.sub.uni-hamburg.de/handle/ediss/2087
URN:	urn:nbn:de:gbv:18-36534
Dokumenttyp:	Dissertation
Betreuer*in:	Preßmar, Dieter B. (Prof. Dr. Dr. h.c.)
Enthalten in den Sammlungen:	Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:

Datei	Beschreibung	Prüfsumme	Größe	Format
Data_Mining_mit_SVM.pdf		f9336ac7d7ac1a571b8c95a3919af99d	4.12 MB	Adobe PDF	Öffnen/Anzeigen

Zur Langanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

347

Letzte Woche

Letzten Monat

geprüft am 25.04.2024

Download(s)

479

Letzte Woche

Letzten Monat

geprüft am 25.04.2024

Werkzeuge

Google Scholar^TM

Prüfe

Dateien zu dieser Ressource:

Seitenansichten

Download(s)

Google ScholarTM

Google Scholar^TM