Die KI
Im Mittelpunkt der Features des GUIDE-Walk steht die künstliche Intelligenz zur Objekterkennung, welche von den anderen Sensoren ergänzt wird. Die KI erkennt 10 verschiedene Klassen in den Bildern der Kamera (Fußgänger, Autos, Fahrräder, Motorräder, Busse, Stühle, Bänke, Mülleimer, rote und grüne Fußgängerampeln) und ordnet sie nach ihrer Position und Wichtigkeit. Wenn etwas zu nahe kommt, kann das Gerät den Träger entsprechend durch eine Sprachausgabe vorwarnen.
Ich habe mich für das moderne Objekterkennungsnetzwerk MobileNetV2 entschieden, da es von vergleichbaren Lightweight-Modellen die höchste Genauigkeit besitzt. Dieses wird kombiniert mit einem sogenannten SSD-Zusatz, der auf ein Paper von Wei Liu zurückgeht und der es ermöglicht, Bilder viel schneller und effizienter zu verarbeiten.
Bild: SSD: Single Shot MultiBox Detector - Liu et al. S. 4 (arXiv)
Ein solches SSD-Netzwerk besteht aus einem Stütznetzwerk und dem SSD-Zusatz. Das Stütznetzwerk generiert aus dem Input eine Feature Map, welches vom SSD-Zusatz in ein Raster aufgeteilt wird. Für jede Kachel wird eine bestimmte Anzahl an Bounding Boxes mit festgelegten Seitenverhältnissen erzeugt, die dann auf Genauigkeit geprüft werden. Nach einer weiteren Filterung durch non-maxima-Supression und der Entfernung von Duplikaten werden die besten 100 Detections ausgegeben.
Demonstration:
In diesem Video ist die Funktionsweise der KI visuell dargestellt. Die Aufnahmen stammen von der Kamera im Gehäuse des Geräts, die dann durch die KI, die im Programm implementiert ist, ausgewertet werden: