Volltextdatei(en) vorhanden
Titel: Action-Driven Perception : Neural Architectures Based On Sensorimotor Principles
Sonstige Titel: Handlungsgetriebene Wahrnehmung : Künstliche Neuronale Netze basierend auf sensomotorischen Design-Prinzipien
Sprache: Englisch
Autor*in: Kleesiek, Jens Philipp
Schlagwörter: Sensorimotor Learning; Artificial Neural Networks; Reinforcement Learning; Robotics; Embodied Cognition
GND-Schlagwörter: RobotikGND
Sensomotorik
Bestärkendes Lernen
Maschinelles LernenGND
Erscheinungsdatum: 2012
Tag der mündlichen Prüfung: 2012-08-13
Zusammenfassung: 
The active nature of perception and the intimate relation of action and cognition has been emphasized in philosophy and cognitive science for a long time. However, most of the current approaches do not consider the fundamental role of action for perception. Inspired by theories rooted in the research field of embodied cognition we have designed artificial neural architectures for the learning of sensorimotor laws. All our models have in common that the agent actually needs to act to perceive. This core principle is exploited for the design of a series of computational studies, including simulations and real-world robot experiments. In a first experiment, a virtual robot learns to navigate towards a target region. For this purpose, it learns sensorimotor laws and visual features simultaneously, using the world as an outside memory. The control laws are trained using a two-layer network consisting of a feature (sensory) layer that feeds into an action (reinforcement learning) layer. The prediction error modulates the learning of both layers. In a second experiment, we introduce a novel bio-inspired neural architecture that combines reinforcement learning and Sigma-Pi neurons. In a simulation we verify that a virtual agent successfully learns to reach for an object while discovering invariant hand-object relations simultaneously. Again, the prediction error of the action layer is used to modulate all the weights in the network. In a third experiment we extend a recurrent architecture with an adaptive learning regime and use this algorithm for an object categorization task with a real humanoid robot. Based on self-organized dynamic multi-modal sensory perceptions, the robot is able to ‘feel’ different objects and discriminate them with a very low error rate. All these experiments are inspired by the same sensorimotor design principles. Further, they are united by the idea that actively acquired sensorimotor knowledge enhances perception and results in goal-directed behavior.

In der Philosophie und in den Kognitionswissenschaften wird schon seit längerer Zeit auf die besonders enge Verknüpfung, die Handlungen und kognitive Prozesse haben, hingewiesen. Leider berücksichtigen die meisten der gegenwärtigen Studien aus dem Bereich der Robotik diesen fundamentalen Einfluss von Handlungen auf die Wahrnehmung nicht. Inspiriert durch Theorien, die ihren Ursprung in einem Forschungsfeld haben, das unter dem Begriff des Embodiments zusammengefasst wird, einer These nach der Intelligenz die physikalische Interaktion des Körpers voraussetzt, haben wir verschiedene künstliche neuronale Netzwerkarchitekturen entwickelt, die in der Lage sind, sensomotorische Zusammenhänge zu erlernen. Allen unseren Modellen ist gemein, dass der Agent handeln muss, um überhaupt etwas wahrzunehmen. Dieses Kernprinzip nutzen wir für verschiedene Computerexperimente aus, die Simulationen sowie Studien mit echten Robotern umfassen.
Die erste Studie befasst sich mit der Navigation zu einer Zielregion. Ein virtueller Roboter erlernt sensomotorische Gesetzmäßigkeiten und extrahiert dabei gleichzeitig visuelle Merkmale aus seiner Umwelt. Hierfür ist der Agent mit einem zwei-schichtigen künstlichen neuronalen Netz ausgerüstet, das aus einer sensorischen und einer Handlungs-Schicht besteht. Der Vorhersagefehler der Handlungs-Schicht, realisiert durch verstärkendes Lernen, dient hierbei nicht nur zur Anpassung der Synapsen dieser Schicht, sondern moduliert gleichzeitig auch noch die Synapsen der sensorischen Neuronen.
In einem zweiten Experiment stellen wir eine neu entwickelte bio-inspirierte Netzwerkarchitektur vor, die verstärkendes Lernen mit Sigma-Pi Neuronen verbindet. Es wird in einer Simulation gezeigt, dass ein virtueller Agent mit Hilfe dieser Architektur in der Lage ist, invariante Situationen zu erkennen. Gleichzeitig erlernt er auch noch das erfolgreiche Greifen nach Objekten. Auch in diesem Fall beeinflusst der Vorhersagefehler der Handlungs-Schicht alle synaptischen Gewichte des Netzwerks.
In der dritten Studie erlernt ein echter humanoider Roboter, Bauklötze durch multisensorische Wahrnehmung zu kategorisieren. Zu diesem Zweck haben wir den Algorithmus einer speziellen rekurrenten Netzwerkarchitektur um eine adaptive Lernregel erweitert. Das rekurrente Netz speichert und gruppiert die multisensorischen Eindrücke, die durch die Interaktion mit den Objekten entstehen. Hierdurch ist der Roboter später in der Lage, verschiedene Objekte zu ‘erfühlen’ und erfolgreich voneinander zu diskriminieren.
Alle drei Studien sind durch die selben sensomotorischen Design-Prinzipien motiviert. Außerdem verbindet sie die Idee, dass aktiv erworbene sensomotorische Zusammenhänge die Wahrnehmung erweitern und dadurch zu zielgerichtetem und erfolgreichem Handeln führen können.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/4608
URN: urn:nbn:de:gbv:18-58275
Dokumenttyp: Dissertation
Betreuer*in: Engel, Andreas K. (Prof. Dr.)
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung Prüfsumme GrößeFormat  
Dissertation.pdfe9b4f1da35d9f4768ad857e4228134d816.01 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

699
Letzte Woche
Letzten Monat
geprüft am 27.03.2024

Download(s)

169
Letzte Woche
Letzten Monat
geprüft am 27.03.2024
Werkzeuge

Google ScholarTM

Prüfe