Analysis of anomalies in permutations using recurrent neural networks and clustering algorithms after feature extraction with autoencoders

Masterarbeit Fabian Fries - Sommersemester 2022

Maschinelles Lernen wurde in den letzten Jahren immer mehr eingesetzt, unter anderem auch, da es ein sehr gutes Werkzeug zur Mustererkennung in Daten ist. Zufällige Daten zeichnen sich aber durch das Fehlen definierter Muster in ihren Daten aus. Andrej Kolmogorow schrieb als Definition für den Zufall, dass eine Sequenz zufällig ist, wenn es nicht möglich ist, die Sequenz in ein Programm zu komprimieren, welches kürzer ist als die Sequenz selbst. Eine Zufallsfolge hat somit den höchstmöglichen Betrag von Informationen für eine Sequenz dieser Länge. Permutationen ohne Wiederholungen haben ebenfalls die höchste Entropiemenge für eine Sequenz ihrer Länge, was den Zufallsdaten ähnlich ist. Daher geht es in dieser Arbeit um das Clustering zwischen zufälligen Permutationen und gut gemischten Permutationen, die einige Restmuster übrig haben. Als lebensnahes Beispiel für Permutationen wurde in dieser Arbeit ein Deck von Spielkarten genommen, dessen Mischverfahren wie z.B. das Riffle-Shuffle sich auch gut mathematisch beschreiben lassen.

Das Clustering geschieht in den ersten Schritten mit dem K-Mean Algorithmus. Da dieser aber nicht anhand der sequenziellen Abfolge der Permutationen clustert, kommt er schnell an seine Limits. Daher wird das Clustering des K-Means über einen recurrenten Autoencoder erst verbessert und dann wird das Clustering nur durch den Autoencoder ermöglicht.

Im letzten Schritt wird zwischen zufälligen und gemischten Kartendecks unterschieden, indem man sich anschaut, wie gut ein Predictor die Abfolge der Karten vorhersehen kann.

Infos zum Projekt

Studierender Fabian Fries    
Semester Sommersemester 2022    
Studiengang Elektrotechnik (M.Sc.)    
Art der Arbeit Abschlussarbeit Master    
back-to-top nach oben