FAQ
© 2015 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-54129
URL: http://ediss.sub.uni-hamburg.de/volltexte/2011/5412/


A Generic Middle Layer for Image Understanding

Eine generische Mittelschicht für höhere Bilddeutung

Terzic, Kasim

pdf-Format:
 Dokument 1.pdf (9.268 KB) 


SWD-Schlagwörter: Bildverarbeitung , Artificial Intelligence: AI , Künstliche Intelligenz , Maschinelles Sehen , Informatik , Objekterkennung
Freie Schlagwörter (Englisch): Computer Vision , Image Understanding , Object Recognition
Basisklassifikation: 54.74
Institut: Informatik
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Neumann, Bernd (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 11.07.2011
Erstellungsjahr: 2011
Publikationsdatum: 05.12.2011
Kurzfassung auf Englisch: Although humans can understand complex scenes with apparent ease, the problem remains difficult for artificial scene interpretation systems. A central problem facing such systems is reliable detection of objects present in a scene from raw image data. This thesis presents a probabilistic middle-layer architecture which can make use of high-level scene context to improve the detection and recognition of scene objects. The main features of the proposed middle layer are a novel contextual classification scheme, an intermediate-level representation of the scene in terms of object views, and accurate modelling of detection certainty. The architecture is generic and can be applied to any low-level algorithm which delivers class probabilities and any high-level reasoning system which implements the needed interface. The performance is evaluated on images from the facade domain using a wide range of low-level detectors and several high-level interpretation systems.
Kurzfassung auf Deutsch: Das Verstehen von komplexen Szenen ist eine leichte Aufgabe für Menschen, bleibt aber nach wie vor schwierig für künstliche Szeneninterpretationssysteme. Dabei ist die zuverlässige Erkennung von Szenenobjekten in Bilddaten ein zentrales Problem. Diese Arbeit stellt eine probabilistische Architektur vor, die wissensbasierten Szenenkontext benutzen kann, um die Detektion und Erkennung von Szenenobjekten zu verbessern. Sie funktioniert dabei als Schnitstelle zwischen der Bildverarbeitungsalgorithmen und höheren Szenenmodellen. Die Hauptmerkmale der vorgestellten Architektur sind ein neuer kontextbasierter Klassifikationsmechanismus, eine Zwischenrepräsentation der Szene basierend auf Object Views und genaue Modellierung der Detektionsungenauigkeit. Die Architektur ist generisch aufgebaut und kann durch generische Schnittstellen mit verschiedenen probabilistischen Bildverarbeitungsalgorithmen kombiniert werden, sowie mit verschiedenen Systemen für höhere Bilddeutung. Die Evaluierung der Architektur in der Kombination mit verschiedenen Bildverarbeitungs- und Bilddeutungsmodulen wurde auf Bilddaten aus der Fassadendomäne durchgeführt.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende