DC ElementWertSprache
dc.contributor.advisorSeifert, Stephan-
dc.contributor.authorWenck, Soeren Hendrik-
dc.date.accessioned2025-09-25T10:53:20Z-
dc.date.available2025-09-25T10:53:20Z-
dc.date.issued2025-03-30-
dc.identifier.urihttps://ediss.sub.uni-hamburg.de/handle/ediss/11925-
dc.description.abstractIm Rahmen dieser Arbeit wurden große analytische Datensätze des Metaboloms mit random forest (RF) Verfahren untersucht. Dabei wurden ausgewählte Lebensmittel hinsichtlich verschiedener Eigenschaften klassifiziert, relevante Variablen mit Variablenselektionsmethoden ausgewählt und deren gemeinsamer Einfluss auf das Klassifikationsmodell analysiert. Die auf diese Weise gefundenen Zusammenhänge wurden bezüglich des analytischen und biologischen Hintergrunds interpretiert und damit gezeigt, dass anhand der hier angewendeten Methoden eine detaillierte Analyse der untersuchten Proben, die weit über die bei machine learning-Verfahren häufig angewendete „black box“ Untersuchung hinaus geht, ermöglicht wird. Die Untersuchungen erfolgten an Metabolom-Daten aus 1H Kernspinresonanz-spektroskopie (engl.: nuclear magnetic resonance, NMR-Spektroskopie) und gekoppelter Flüssigchromatographie mit Massenspektrometrie (engl.: liquid chromatography coupled with mass spectrometry, LC-MS) von Apfel-, Spargel- und Trüffelproben. Die Daten wurden dabei zuerst mit der oft eingesetzten Hauptkomponentenanalyse (principal component analysis, PCA) untersucht, um die Hauptunterschiede in den Datensätzen zu analysieren. Dabei zeigte sich, dass diese meistens keine klare Unterscheidung der analysierten Klassen ermöglichte und somit überwachte Verfahren angewendet werden sollten. RF zeigte sich als sehr gut geeignet, um die Datensätze mit teilweise recht geringen Stichprobengrößen einzelner Klassen zu klassifizieren, da durch die interne Validierung in Kombination mit dem Verzicht auf eine Optimierung der Modellparameter ein unabhängiger Validierungsfehler erhalten werden konnte, ohne zusätzliche Daten zu benötigen. Dabei konnten Klassifizierungsgenauigkeiten über 70 %, meist zwischen 80-100 %, erreicht werden. Die Anwendung von surrogate minimal depth (SMD) zur Selektion relevanter Variablen und deren Beziehungsanalyse, zusammen mit der anschließenden Identifizierung mit Datenbankabgleich und LC-MS-MS Analyse, bzw. der zusätzlichen Analyse mit weiteren Methoden der NMR-Spektroskopie und spike-in-Experimenten erwies sich als ein leistungsfähiger Ansatz zur Untersuchung der Wirkung von Variablen in den RF Modellen und damit deren Beitrag zur erfolgreichen Klassifizierung von Lebensmitteln. Dabei konnten sowohl Signale der gleichen Metabolite als auch biologisch sinnvolle Beziehungen zwischen einzelnen Metaboliten aufgedeckt werden.de
dc.language.isomulde_DE
dc.publisherStaats- und Universitätsbibliothek Hamburg Carl von Ossietzkyde
dc.relation.haspartdoi: 10.3390/metabo13101075de_DE
dc.relation.haspartdoi: 10.3390/metabo12010005de_DE
dc.relation.haspartdoi: 10.1016/j.foodcont.2024.110817de_DE
dc.rightshttp://purl.org/coar/access_right/c_abf2de_DE
dc.subjectLebensmittelde
dc.subjectMetabolomicsen
dc.subjectMachine Learningen
dc.subjectRandom Foresten
dc.subjectVariablenselektionde
dc.subjectVariablenbeziehungende
dc.subject.ddc004: Informatikde_DE
dc.titleKlassifizierung und Charakterisierung des Metaboloms von Lebensmitteln mit Random Forest Methodende
dc.title.alternativeClassification and Characterization of the Metabolome of foods with Random Forest Methodsen
dc.typedoctoralThesisen
dcterms.dateAccepted2025-07-18-
dc.rights.cchttps://creativecommons.org/licenses/by/4.0/de_DE
dc.rights.rshttp://rightsstatements.org/vocab/InC/1.0/-
dc.type.casraiDissertation-
dc.type.dinidoctoralThesis-
dc.type.driverdoctoralThesis-
dc.type.statusinfo:eu-repo/semantics/publishedVersionde_DE
dc.type.thesisdoctoralThesisde_DE
tuhh.type.opusDissertation-
thesis.grantor.departmentChemiede_DE
thesis.grantor.placeHamburg-
thesis.grantor.universityOrInstitutionUniversität Hamburgde_DE
dcterms.DCMITypeText-
dc.identifier.urnurn:nbn:de:gbv:18-ediss-131371-
item.creatorOrcidWenck, Soeren Hendrik-
item.fulltextWith Fulltext-
item.creatorGNDWenck, Soeren Hendrik-
item.grantfulltextopen-
item.languageiso639-1other-
item.advisorGNDSeifert, Stephan-
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen
Dateien zu dieser Ressource:
Datei Beschreibung Prüfsumme GrößeFormat  
Soeren Wenck - kumulative Dissertation.pdf410b249353b9be3afaa0de7303dd645417.01 MBAdobe PDFMiniaturbild
Öffnen/Anzeigen
Zur Kurzanzeige

Info

Seitenansichten

Letzte Woche
Letzten Monat
geprüft am null

Download(s)

Letzte Woche
Letzten Monat
geprüft am null
Werkzeuge

Google ScholarTM

Prüfe