banner

Blog

Dec 05, 2023

1000-mal schnellere Verarbeitung: Innovativer Detektor für Groß

Von Optica 26. August 2023

Forscher haben ein SNPD genutzt, um die Geschwindigkeit und Effizienz optischer neuronaler Netze zu steigern, und zeigten eine potenzielle Steigerung der Verarbeitungsgeschwindigkeit um das Tausendfache im Vergleich zu herkömmlichen Kamerasensoren. Dieser Fortschritt läutet eine neue Ära für KI-gesteuerte Bildverarbeitungssysteme ein.

Schnellere, energieeffiziente diffraktive ONN könnten für die Bild- und Videoverarbeitung verwendet werden.

Zum ersten Mal haben Forscher die Leistung eines nichtlinearen Oberflächennormal-Fotodetektors (SNPD) genutzt, um die Geschwindigkeit und Energieeffizienz eines diffraktiven optischen neuronalen Netzwerks (ONN) zu verbessern. Dieses innovative Gerät ebnet den Weg für die Entwicklung großer ONNs, die Hochgeschwindigkeitsverarbeitung mit Lichtgeschwindigkeit auf äußerst energieeffiziente Weise durchführen können.

Farshid Ashtiani von Nokia Bell Labs wird diese Forschung auf der Frontiers in Optics + Laser Science (FiO LS) vorstellen, die vom 9. bis 12. Oktober 2023 im Greater Tacoma Convention Center in Tacoma (Großraum Seattle), Washington, stattfindet.

„Künstliche Intelligenz (KI) spielt in unserem Leben eine immer wichtigere Rolle. Von großen Sprachmodellen bis hin zu autonomen Autos sehen wir erhebliche Verbesserungen durch KI“, erklärt Ashtiani. „Neuronale Netze, die von der Art und Weise inspiriert sind, wie das menschliche Gehirn verschiedene Aufgaben lernt und ausführt, sind das Herzstück des Fortschritts in der KI. Eine der weitverbreiteten Anwendungen neuronaler Netze ist die Erkennung von Mustern und Objekten, die Maschinen das Sehen ermöglichen. Zum Beispiel muss jedes autonome Auto, oder sogar halbautonome Auto, seine Umgebung verstehen, indem es Dinge sehen kann.“

Array von Detektoren. Bildnachweis: Farshid Ashtiani, Nokia Bell Labs

„Konventionell werden Bilder von Kameras aufgenommen, in elektrische Signale umgewandelt und mithilfe elektronischer Prozessoren wie CPUs oder GPUs zur Objekterkennung verarbeitet“, sagte Mohamad Hossein Idjadi von Nokia Bell Labs.

„Da die Bilder jedoch ursprünglich im optischen Bereich (also Licht) vorliegen, kann es schneller und energieeffizienter sein, sie optisch mit ONN zu verarbeiten. Unter anderem ermöglichen ONNs auf Basis räumlicher Lichtmodulatoren die optische Verarbeitung hochauflösender Bilder und Videos. Diese Verarbeitung erfordert nichtlineare Module und üblicherweise werden Kamerasensoren verwendet, um diese erforderliche Nichtlinearität einzuführen, was mehrere Millisekunden dauert.

„Unser neuartiges Detektorgerät macht diese nichtlineare Verarbeitung 1000-mal schneller und energieeffizienter als solche Kameras. Dies ist für die nächste Generation von Bildverarbeitungssystemen von entscheidender Bedeutung, da wir alle noch schnellere intelligente Geräte benötigen, die nicht viel Energie verbrauchen.“

Beugungs-ONNs im freien Raum verwenden räumliche Lichtmodulatoren und sind besonders vielversprechend für die Schaffung großräumiger Netzwerke von Neuronen, die für die Bild- und Videoverarbeitung erforderlich sind. Die Geschwindigkeit und Energieeffizienz dieses ONN-Typs wird jedoch normalerweise durch den Bildsensor begrenzt, der zur Implementierung der nichtlinearen Aktivierungsfunktion verwendet wird, die mehrere Schichten von Neuronen implementiert, um ein tiefes neuronales Netzwerk zu erstellen.

Einzeldetektor. Bildnachweis: Farshid Ashtiani, Nokia Bell Labs

In der neuen Arbeit schlugen die Forscher die Verwendung eines SNPD, den sie zuvor als elektrooptischer Hochgeschwindigkeitsmodulator demonstriert hatten, in hochauflösenden diffraktiven ONNs vor. Tests ergaben, dass das SNPD eine 3-dB-Bandbreite von 61 kHz hatte, was weniger als 6 Mikrosekunden entspricht – etwa 1000-mal schneller als die typische Reaktionszeit von Kamerasensoren, die herkömmlicherweise in solchen ONNs verwendet werden. Der Sensor verbraucht außerdem nur etwa 10 nW/Pixel, was drei Größenordnungen effizienter ist als eine typische Kamera.

To gauge the sensor’s efficacy within an ONN, the researchers input images into the convolution layer – the primary building block of the neural network. The convolution layer had 32 parallel 3 × 3 kernels with a stride of one and used the actually measured SNPD response as its activation function instead of the standard rectified linear activation function. With this simulation setup, the network achieved a test classification accuracyHow close the measured value conforms to the correct value." data-gt-translate-attributes="[{"attribute":"data-cmtooltip", "format":"html"}]">Genauigkeit von etwa 97 %, was der gleichen Leistung entspricht wie die Verwendung einer idealen gleichgerichteten linearen Aktivierungsfunktion im selben Netzwerk.

Die Forschung zeigt das Potenzial der Verwendung eines SNPD in diffraktiven ONNs im freien Raum. Die Tatsache, dass der Detektor drei Größenordnungen schneller und effizienter ist als eine Kamera, macht ihn zu einem vielversprechenden Kandidaten für den Einsatz in groß angelegten ONN-Aufbauten im Freiraum.

„Wir müssen eine große Anzahl unserer Detektorgeräte herstellen, möglicherweise Millionen, um ein vollständiges Bildverarbeitungssystem aufzubauen und mit der hohen Auflösung herkömmlicher Kameras zu konkurrieren“, fügte Stefano Grillanda von Nokia Bell Labs hinzu. „Die gute Nachricht ist, dass dies technologisch möglich ist. Ein weiterer zu prüfender Weg besteht darin, den Platzbedarf, den Energieverbrauch und die Reaktionszeit des Detektors weiter zu reduzieren, um ihn zu einer noch besseren Lösung für zukünftige KI-Bildverarbeitungssysteme zu machen.“

Treffen: Grenzen in der Optik + Laserwissenschaft

Schnellere, energieeffiziente diffraktive ONN könnten für die Bild- und Videoverarbeitung verwendet werden.
AKTIE