Malwareerkennung durch KI, Ömer Dölek
Ömer Dölek
Kurzfassung
Das Erkennen von Malware wird heutzutage immer schwieriger, zumal Malware-Autoren immer häufiger Tricks anwenden, um deren Erkennung zu erschweren. Die manuelle Untersuchung eines Programmes und die darauf folgende Signaturerstellung ist zeitaufwendig, vor Allem da die Menge an Malware immer weiter zunimmt. Tausende Computer könnten zum Zeitpunkt der Erkennung schon infiziert worden sein. Um die Malware-Analyse zu vereinfachen existieren zwar bereits Verfahren, wie z.B. die heuristische Analyse, dennoch genügen auch diese nicht.
Aus diesem Grund beschäftigt sich diese Arbeit mit der statischen Untersuchung von Programmen anhand des maschinellen Lernens, ohne jegliche Malware-Signaturen zu nutzen. Mithilfe von zwei Datensätzen, welche öffentlich im Internet verfügbar sind, wurden sowohl überwachte als auch unüberwachte und semiüberwachte Verfahren betrachtet.
Schlagwörter: Malware, Maschinelles Lernen, Neuronale Netze, Statische Analyse
Abstract
Nowadays malware authors make use of sophisticated mechanisms to make malware detection more difficulty. Furthermore the manual analysis and the signature creation are very time consuming tasks while the number of new malware samples rises rapidly. Thousands of computers can already be infected until the malware is detected. Because of that, antimalware vendors introduced heuristic methods which are able to classify new samples quite accurately. Unfortunately those methods are not sufficient enough.
This thesis is about the static investigation of malware with the help of machine learning methods without any usage of signatures. With the help of two publicly available datasets supervised methods have been investigated together with unsupervised and semi-supervised methods.
Keywords: malware, machine learning, neuronal networks, static analysis