Volltextdatei(en) vorhanden
Titel: A Generic Middle Layer for Image Understanding
Sonstige Titel: Eine generische Mittelschicht für höhere Bilddeutung
Sprache: Englisch
Autor*in: Terzic, Kasim
Schlagwörter: Computer Vision; Image Understanding; Object Recognition
GND-Schlagwörter: BildverarbeitungGND
Artificial Intelligence: AI
Künstliche IntelligenzGND
Maschinelles Sehen
InformatikGND
Objekterkennung
Erscheinungsdatum: 2011
Tag der mündlichen Prüfung: 2011-07-11
Zusammenfassung: 
Although humans can understand complex scenes with apparent ease, the problem remains difficult for artificial scene interpretation systems. A central problem facing such systems is reliable detection of objects present in a scene from raw image data. This thesis presents a probabilistic middle-layer architecture which can make use of high-level scene context to improve the detection and recognition of scene objects. The main features of the proposed middle layer are a novel contextual classification scheme, an intermediate-level representation of the scene in terms of object views, and accurate modelling of detection certainty. The architecture is generic and can be applied to any low-level algorithm which delivers class probabilities and any high-level reasoning system which implements the needed interface. The performance is evaluated on images from the facade domain using a wide range of low-level detectors and several high-level interpretation systems.

Das Verstehen von komplexen Szenen ist eine leichte Aufgabe für Menschen, bleibt aber nach wie vor schwierig für künstliche Szeneninterpretationssysteme. Dabei ist die zuverlässige Erkennung von Szenenobjekten in Bilddaten ein zentrales Problem. Diese Arbeit stellt eine probabilistische Architektur vor, die wissensbasierten Szenenkontext benutzen kann, um die Detektion und Erkennung von Szenenobjekten zu verbessern. Sie funktioniert dabei als Schnitstelle zwischen der Bildverarbeitungsalgorithmen und höheren Szenenmodellen. Die Hauptmerkmale der vorgestellten Architektur sind ein neuer kontextbasierter Klassifikationsmechanismus, eine Zwischenrepräsentation der Szene basierend auf Object Views und genaue Modellierung der Detektionsungenauigkeit. Die Architektur ist generisch aufgebaut und kann durch generische Schnittstellen mit verschiedenen probabilistischen Bildverarbeitungsalgorithmen kombiniert werden, sowie mit verschiedenen Systemen für höhere Bilddeutung. Die Evaluierung der Architektur in der Kombination mit verschiedenen Bildverarbeitungs- und Bilddeutungsmodulen wurde auf Bilddaten aus der Fassadendomäne durchgeführt.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/4263
URN: urn:nbn:de:gbv:18-54129
Dokumenttyp: Dissertation
Betreuer*in: Neumann, Bernd (Prof. Dr.)
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung Prüfsumme GrößeFormat  
Dissertation.pdf4078d9a15028e85fc0cf7d2d3fecefd89.27 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

402
Letzte Woche
Letzten Monat
geprüft am 14.11.2024

Download(s)

88
Letzte Woche
Letzten Monat
geprüft am 14.11.2024
Werkzeuge

Google ScholarTM

Prüfe