FAQ
© 2016 Staats- und Universitätsbibliothek
Hamburg, Carl von Ossietzky

Öffnungszeiten heute09.00 bis 24.00 Uhr alle Öffnungszeiten

Eingang zum Volltext in OPUS

Hinweis zum Urheberrecht

Dissertation zugänglich unter
URN: urn:nbn:de:gbv:18-78448
URL: http://ediss.sub.uni-hamburg.de/volltexte/2016/7844/


Persistent Identifiers for Earth Science Data Management

Persistente Identifikatoren für die geowissenschaftliche Datenverwaltung

Weigel, Tobias

pdf-Format:
 Dokument 1.pdf (3.230 KB) 


SWD-Schlagwörter: Daten , Geowissenschaften , Datenverwaltung , Langzeitarchivierung , Perseveration , Metadaten , E-Science
Freie Schlagwörter (Deutsch): Persistenter Identifikator , PID , Datenwissenschaft , Forschungsdaten
Freie Schlagwörter (Englisch): Persistent Identifier , PID , data-intensive science , research data
Basisklassifikation: 06.74 , 54.61 , 38.00 , 06.35 , 54.80
Institut: Informatik
DDC-Sachgruppe: Informatik
Dokumentart: Dissertation
Hauptberichter: Ludwig, Thomas (Prof. Dr.)
Sprache: Englisch
Tag der mündlichen Prüfung: 19.10.2015
Erstellungsjahr: 2015
Publikationsdatum: 18.04.2016
Kurzfassung auf Englisch: The advent of widespread developments colloquially subsumed under the notion of data-intensive science poses challenges for data management and end-user applications. The observed increase in volume, variety and number of data objects requires large data infrastructures used for research data management today to further automate their operating workflows. Not only in the Earth sciences, data infrastructures typically rely on distributed middleware services, which must become more scalable and provide more trustworthy and precise information. A widely discussed approach for addressing these challenges is to employ persistent identifiers, traditionally used in the library sciences and scholarly publishing. Such identifiers give globally unique names to digital objects, making them referenceable and possibly accessible independent from their actual storage location. They can also be used by both human and machine agents to retrieve essential state information about the objects.

However, the concept of persistent identification has so far not evolved enough to adequately address data infrastructure challenges. Therefore, this thesis presents a conceptual framework for understanding persistent identifiers in this new context, facilitating solutions that unify access to state information and increase interoperability between distributed identifier systems. Based on a formal model, the conceptual framework defines distinct classification criteria that clarify the differences between identifier usage scenarios and can shape suitable policies of identifier providers. To facilitate interoperability and support scenarios geared towards machine agents, the framework further advocates the use of types to structure state information and to construct digital object collections with unified operations. Existing solutions are shown to partially match the conceptual framework or be adequately extendable, and exemplary Earth science data management usage scenarios can be enabled through its mechanisms. The framework contributes to ongoing international efforts to establish a coherent digital object infrastructure driven by practical needs. In the context of Linked Data, the framework can provide a foundational unification layer and foster the adoption of persistent identifiers for web-based applications.
Kurzfassung auf Deutsch: Im Rahmen von Entwicklungen unter dem Schlagwort der datenintensiven Wissenschaften ergeben sich neue Herausforderungen an die Verwaltung von Forschungsdaten. Die beobachtete Zunahme an Volumen, Vielfalt und Anzahl von Datenobjekten verlangt von den heutzutage verwendeten Dateninfrastrukturen, ihre Arbeitsabläufe stärker zu automatisieren. Nicht nur in den Geowissenschaften setzen Dateninfrastrukturen typischerweise auf verteilte Dienste, welche skalierbarer werden müssen und dem Nutzer zuverlässigere und präzisere Informationen bereitstellen müssen. Ein vielfach diskutierter Lösungsansatz hierfür beruht auf der Verwendung von persistenten Identifikatoren, welche als global eindeutige Namen für digitale Objekte dienen und für ihre dauerhafte Referenzierbarkeit und potentielle Zugreifbarkeit unabhängig vom tatsächlichen Speicherort sorgen. Darüber hinaus können Nutzer und Software-Agenten gleichermaßen essentielle Zustandsinformationen über Objekte abrufen.

Das Konzept persistenter Identifikatoren ist jedoch bisher nicht umfassend genug gewesen, um den Anforderungen von Dateninfrastrukturen angemessen zu begegnen. Diese Arbeit stellt daher ein konzeptionelles Rahmenwerk vor, welches Identifikatoren in diesem neuen Einsatzgebiet definiert sowie Lösungsansätze unterstützt, die den Zugriff auf Zustandsinformationen vereinheitlichen und zur Interoperabilität zwischen Identifikationssystemen beitragen. Ausgehend von einem formalen Modell werden Klassifikationskriterien entwickelt, welche die Unterschiede zwischen Einsatzszenarien von Identifikatoren verdeutlichen und zur Entwicklung von angemessenen Richtlinien für Identifikationssysteme beitragen können. Um Interoperabilität zu fördern und Einsatzszenarien für Software-Agenten zu unterstützen setzt das Rahmenwerk auf die Typisierung von Zustandsinformationen und den Aufbau von Objektkollektionen mit einheitlichen Operationen. Bestehende Lösungen passen auf das Rahmenwerk mindestens teilweise oder lassen sich entsprechend erweitern, und die vorgestellten Mechanismen erlauben die Umsetzung beispielhafter Anwendungsfälle in der geowissenschaftlichen Datenverwaltung. Das Rahmenwerk trägt zu fortschreitenden internationalen Bemühungen um eine einheitliche Infrastruktur für digitale Objekte bei, die in der Praxis umgesetzt wird. Im Zusammenhang mit Linked Data kann das Rahmenwerk ferner zu einer stabilen Basisschicht beitragen und den Einsatz von persistenten Identifikatoren in Webanwendungen erleichtern.

Zugriffsstatistik

keine Statistikdaten vorhanden
Legende