Evaluation von Random Forest und Oblique Forest für einen Vergleich in Bezug auf ihre Performance

Mit dem aktuell steigendem Internetverkehr und der damit einhergehenden Speicherung und Verarbeitung von Daten, wird dem Data Mining mehr an Bedeutung zugeordnet. Unternehmen setzen vermehrt auf Prognoseverfahren, um Sicherheitsrisiken zu identifizieren oder kaufverhalten vorherzusagen. Durch dieses steigende Interesse gilt es zunehmen die Forschung an aktuellen und die Analyse vorhandener Klassifikationsverfahren voran-zutreiben. In seiner ursprünglichen Arbeit über Random Forests schlug Breiman zwei verschiedene Entscheidungsbaum-Ensembles vor. Eines aus orthogonalen Bäumen mit Schwellenwerten für einzelne Features in jedem Split, und eines aus schrägen Bäumen, die den Feature-Raum durch zufällig orientierte Hyperebenen trennen. Die vorliegende Arbeit untersucht jeweils ein Verfahren mit diesen Eigenschaften, namentlich Random Forest und Oblique Forest, auf ihre Performance. Unter Verwendung von Standardparameter überzeugte der Oblique Forest auf einem Großteil der getesteten Datensätze, wobei die Rechenzeit in vielen Fällen, über dem des Random Forest lag. Bei der Erstellung der Klassifikationsmodelle konnte zudem eine größere Varianz der Ergebnisse bei dem Random Forest beobachtet werden. Im Vergleich konnte der Random Forest mit einem deutlich geringeren zeitlichen Aufwand implementiert werden. Zudem stellen aktuelle Bibliotheken für den Random Forest viele Optimierungs-möglichkeiten zu Verfügung, wodurch sich die Genauigkeit mit einem hohen Maß an Rechenzeit zum Teil anpassen lässt.

Cite

Citation style:
Could not load citation form.

Rights

Use and reproduction: