FAQ
© 2015 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-36534
URL: http://ediss.sub.uni-hamburg.de/volltexte/2008/3653/


Data Mining mit der Support Vektor Maschine

Data Mining with Support Vector Machines

Lessmann, Stefan

pdf-Format:
 Dokument 1.pdf (4.124 KB) 


SWD-Schlagwörter: Data Mining , Kundenmanagement , Maschinelles Lernen , Support-Vektor-Maschine
Basisklassifikation: 54.72 , 85.20
Institut: Wirtschaftswissenschaften
DDC-Sachgruppe: Wirtschaft
Dokumentart: Dissertation
Hauptberichter: Preßmar, Dieter B. (Prof. Dr. Dr. h.c.)
Sprache: Deutsch
Tag der mündlichen Prüfung: 21.12.2007
Erstellungsjahr: 2007
Publikationsdatum: 28.04.2008
Kurzfassung auf Deutsch: Die kumulative Dissertation beschreibt in 14 Fachartikeln die sogenannte Support Vektor Maschine als eine aktuell diskutierte Methodik zur Lösung betriebswirtschaftlicher Klassifikationsprobleme. Die Klassifikation wird dabei als eine Aufgabenstellung des Data Minings verstanden, welches die Aufdeckung nicht-trivialer, geschäftsrelevanter Muster und Zusammenhänge in großen Datenbeständen zum Ziel hat. Die Verfügbarkeit großer Datenmengen in der betrieblichen Praxis folgt unmittelbar aus dem umfassenden Einsatz von Informations- und Kommunikationssystemen in sämtlichen Unternehmensbereichen. Damit steigt die Bedeutung von Data Mining, um diese Daten zu analysieren und im Sinne einer Wissensentdeckung zur Verbesserung von Geschäftsprozessen oder allgemein der Erzielung von Wettbewerbsvorteilen zu nutzen. Von besonderer Relevanz ist in diesem Zusammenhang das Kundenbeziehungsmanagement, welches sich als Konzept zur Reaktion auf verschärfte Wettbewerbsbedingungen sowie voranschreitende Marktsättigung und tendenziell abnehmende Kundenloyalität etabliert hat. Eine wesentliche Zielsetzung dieser Managementphilosophie besteht in dem Aufbau, beziehungsweise dem Ausbau, langfristiger und profitabler Kundenbeziehungen. Data Mining liefert hierzu das nötige analytische Instrumentarium, um Kundenwünsche und
-potentiale zu erkennen, zu verstehen und in geeignete Produkte und Dienstleistungen umzusetzen.
Vor diesem Hintergrund entstammen die in der vorliegenden Arbeit zur Evaluation des Support Vektor Verfahrens untersuchten Planungs- und Entscheidungsprobleme vornehmlich dem Kundenbeziehungsmanagement. Dabei werden ausschließlich operative Planungsaufgaben betrachtet, die als Klassifikationsproblem modelliert werden können. Das heißt, eine Entscheidung ist jeweils durch die Einordnung eines Objektes (eines Kunden) in eine von mehreren vordefinierten Gruppen repräsentiert. Hierzu gehören beispielsweise Klassifikationsprobleme in den Bereichen Direktmarketing, Kreditwürdigkeitsprüfung, Stornoprophylaxe und Betrugserkennung. Um einen engen Bezug zur betrieblichen Praxis herzustellen, wurde nicht nur die eigentliche Klassifikation sondern auch die im Sinne eines strukturierten Prozesses zur Wissensentdeckung in Datenbanken vor- und nachgelagerten Analyseschritte betrachtet. So werden in der Arbeit zum Beispiel der Einfluss verschiedener Datenvorverarbeitungstechniken auf die Prognosegüte, verschiedene Gütemaße zur Bewertung von Klassifikatoren sowie statistische Testverfahren für den Vergleich alternativer Algorithmen untersucht.
Neben einer Bewertung der Effektivität der Support Vektor Maschine zur Lösung der genannten Problemstellungen, wurden in der kumulativen Dissertation algorithmische Erweiterungen und Modifikationen des Verfahrens vorgeschlagen, um charakteristische Anforderungen des Anwendungsgebietes angemessen zu berücksichtigen. Hierzu zählen das Problem stark asymmetrischer Klassenverteilungen und die kostensensitive Klassifikation sowie allgemein die Herausforderung große Datenmengen zu verarbeiten. Beispielsweise wurde in einem Aufsatz das der Support Vektor Maschine zugrunde liegende Optimierungsproblem in ein gemischt-ganzzahliges Programm transformiert, um explizit die mit einer Fehlklassifikation assoziierten Kosten zu minimieren. In anderen Aufsätzen wurde eine Kombination aus Support Vektor Maschine und Genetischem Algorithmus entwickelt, um automatisch geeignete Parametereinstellungen für den Support Vektor Klassifikator zu bestimmen. Die Eignung der resultierenden modifizierten Support Vektor Maschinen wurde jeweils im Rahmen von breit angelegten empirischen Studien untersucht und bestätigt.
Neben einer reinen Prognose gebietet der dem Kundenbeziehungsmanagement inhärente Lernzyklus eine Explizierung der in Data Mining Modellen gespeicherten Muster, damit diese in operativen Entscheidungsprozessen sowie im Sinne eines organisationalen Lernens, verwertet werden können. Diese Anforderung aufgreifend, wurde ein ganzheitliches Vorgehensmodell entworfen, welches ausschließlich auf Support Vektor Technologien beruht und sowohl hinsichtlich Prognosegenauigkeit als auch hinsichtlich Transparenz und Verständlichkeit viel versprechende Ergebnisse liefert.
Zusammenfassend ergibt sich ein wesentlicher Beitrag zum derzeitigen Stand der Forschung durch den Einsatz eines noch wenig beachteten Verfahrens zur Lösung praxisrelevanter Planungs- und Entscheidungsprobleme sowie methodischer Erweiterungen, welche aus den besonderen Anforderungen der betrachteten Anwendungen abgeleitet wurden. Ferner ist der prozessorientierte Data Mining Analyseansatz in dieser Form innerhalb der Literatur zu Support Vektor Maschinen neuartig. Im Speziellen stellt der Entwurf eines ganzheitlichen, methodisch konsistenten Vorgehensmodells zur Lösung betriebswirtschaftlicher Klassifikationsprobleme mittels Support Vektor Verfahren einen signifikanten wissenschaftlichen Erkenntnisgewinn dar.


Zugriffsstatistik

keine Statistikdaten vorhanden
Legende