Ontologie und Semantik in der Auswertung von Texten im forensischen Umfeld

Authors: Dirk Labudde

Abstract:

Die heutige Polizeiarbeit ist längst von Phänomen wie Massendaten und Big Data überschattet. Im Rahmen von Ermittlungen stehen den Ermittlern digitale Texte, Protokolle von Chatdiensten, SMS-Protokolle, Bilder, Videos und Audiodateien zur Auswertung zur Verfügung. Forensische Texte unterscheiden sich in ihren Merkmalen oft von Texten des alltäglichen Lebens. Klassische Ansätze aus dem Feld Big Data und Text Mining müssen für das forensische Umfeld angepasst und neue Strategien entwickelt werden. Die Auswertung von SMS und Chatprotokollen aus Sozialen Netzwerken stellt hier große Herausforderungen dar. Klassische Ansätze aus dem Bereich Text Mining führen nicht zum erhofften Ziel. Mit Hilfe von Domänspezifischen Ontologien, die mit Expertenbasierten Semantiken angereichert werden, können Werkzeuge geschaffen werden, welche die Anforderungen an eine zeitnahe und effektive Auswertung erfüllen. Dieses Konzept bildet die Grundlage für neuartige Auswertesoftware. Während der Demonstration des Programms SemanTA (Semantic Text ANALYZER) erfolgt die Vorstellung eines geschlossenen Ansatzes für die Informationsextraktion aus digitalen Texten. Am Beispiel von Pegida werden Algorithmen für eine Meinungsanalyse und deren Auswertung mit dem Programm SoNS (Social Network ANALYZER) vorgestellt. Anhand eines ausgewählten Falles wird mittels MoNa (Mobile Message ANALYZER) die Analyse von SMS demonstriert und die Kombination aus einer textuellen und phonetischen Analyse vorgeführt. Ontologien eignen sich ebenfalls für die Auswertung von Fotos in einer abgeschlossenen Domäne und für die computergestützte Weichteilgesichtsrekonstruktion, sowie für die Rekonstruktion von Tatorten und Abläufen. Anhand von fallrelevanten Rekonstruktionen werden auch diese Ontologien präsentiert.


Year: 2016
In session: Hauptvortrag
Pages: 14 to 14