Dr. Stefan Rüping Fraud Mining als Instrument der Betrugsprävention

Compliance Management Kompendium

Fraunhofer Institut

 

Dr. Stefan Rüping in Einkaufsprozessen, Vergabeverfahren, Zahlungsverkehr von Banken, bei Insiderverhalten im Aktienhandel an den Börsen oder bei Massenverträgen im Internet, ist eine wirksame Betrugsprävention heute nur mittels Einsatzes von hoch spezialisierten Programmen effizient möglich. Verfahren des Data Mining können dabei im Bereich der Betrugserkennung und –prävention eingesetzt werden, um mittels einer automatischen Datenanalyse aus bekannten, historischen Betrugsfällen neue, unbekannte Betrugsfälle zu identifizieren und um allgemeine Muster in den Daten zu finden, die einen Einblick in potentielle neue Betrugsmuster geben können. Es können hierbei in kürzester Zeit mehrere hundert Millionen Datensätze evaluiert werden. Dies können sehr einfache Verfahren wie etwa die Berechnung einer statistischen Korrelation, aber auch sehr komplexe, vielstufige Verfahren sein.


  Data Mining ist dabei als ein Schritt in einer langen Prozesskette zu sehen, die sich von der Definition des Ziels der Analyse über die Suche und Vorbereitung der Daten bis hin zur Evaluierung und dem praktischen Einsatz der Lösung erstreckt. Dieser Gesamtprozess aus Daten gezielt nützliches, neuartiges Wissen zu extrahieren wird auch als Wissensentdeckungsprozess bezeichnet. Für einen effektiven Einsatz von Data Mining müssen alle Schritte dieses Prozesses optimal ineinander greifen.


  Im Folgenden wird ein Überblick über die wichtigsten Einsatzmöglichkeiten des Fraud Mining, d.h. des Data Mining für die Betrugserkennung, gegeben. Dabei wird nicht auf die einzelnen Data-Mining-Verfahren eingegangen; von diesen stehen Hunderte verschiedener Alternativen in Softwarelösungen zur Verfügung. Stattdessen werden die wesentlichen tragenden Prinzipien vorgestellt, die darüber entscheiden ob ein Fraud Mining in einer konkreten Problemstellung gewinnbringend eingesetzt werden kann.


Lernen aus bekannten Betrugsfällen

Unter dem Begriff überwachtes Lernen versteht man im Data Mining das Szenario, aus gegebenen Beispielen für und gegen ein Zielmerkmal ein allgemeines Modell zu erstellen, das für neue Daten dieses Zielmerkmal vorhersagen kann. Beispielsweise könnte in einer Anwendung zur Erkennung von Bestellbetrug die Daten durch Informationen über den Besteller, die Zahlungsart und das bestellte Produkt gegeben sein und das Zielmerkmal besteht in der ordnungsgemäßen Bezahlung (oder Rückgabe) der Ware. Nach einer ausreichend langen Zeit ist dann also zu jeder Bestellung der Bezahlstatus bekannt, so dass im Nachhinein vollständig zwischen korrekten Bestellungen und Betrugsfällen unterschieden werden kann. Aus diesen Informationen soll nun ein Modell gefunden werden, dass für neue Bestellungen a priori prognostizieren soll, ob diese korrekt bezahlt werden oder betrugsverdächtig sind. Kennzeichnend für dieses Einsatzszenario von Data Mining sind also


Dr. Stefan Rüping Fraud Mining als Instrument der Betrugsprävention

Compliance Management Kompendium

Fraunhofer Institut

© Blue Marlin Verlag 2011Copyright.html