Volltextdatei(en) vorhanden
Titel: Metabolomics-basierte Herkunftsbestimmung von weißem Spargel mittels NMR-Spektroskopie
Sonstige Titel: Metabolomics based determination of the geographical origin of white asparagus using NMR spectroscopy
Sprache: Deutsch
Autor*in: Klare, Juliane
Schlagwörter: geographische Herkunft; geographical origin; multivariate Analyse; 1H NMR; Metabolomics
GND-Schlagwörter: NMR-Spektroskopie; Metabolomik; Maschinelles Lernen; Spargel; Authentizität
Erscheinungsdatum: 2021
Tag der mündlichen Prüfung: 2021-02-05
Zusammenfassung: 
Die erzielten Ergebnisse und Schlussfolgerungen der Methodenentwicklung, der multivariaten Datenauswertung sowie der targeted Analyse mit anschließender Strukturaufklärung werden im Folgenden zusammengefasst.

Methodenentwicklung:

Die Entwicklung einer Methode zur kernresonanzspektroskopischen Untersuchung des Metaboloms von weißem Spargel umfasst sowohl die Probenahme, die Probenvorbereitung als auch die Probenaufarbeitung. Auf die Entwicklung und Optimierung der Probenaufar-beitungsmethode wurde besonderes Augenmerk gelegt, um den bestmöglichen Extraktions-erfolg zu bewirken sowie den Anforderungen der NMR-Analytik gerecht zu werden.
Die Methodenoptimierung basiert auf einzelnen Methoden, welche in der Literatur bereits an mehreren ähnlichen Biofluid- oder Lebensmittelmatrices angewandt wurden (Le Gall et al., 2003; Fatma et al., 2012; Mannina et al., 2012; Beckonert et al., 2007; Consonni et al., 2009; Wu et al., 2008). Als bestes Extraktionsgemisch für die Probenaufarbeitung und vermessung von weißem Spargel eignet sich eine Kombination aus deuteriertem Methanol und einem deuterierten Kaliumhydrogenphosphatpuffer (100 mM im Gemisch) im Verhältnis 1:2. Die Zugabe von Methanol-d4 zur Denaturierung der in Lösung befindlichen Proteine erfolgt zuerst, worauf ein Extraktionsschritt (BeadRuptor 24) folgt; sodann wird die Pufferlösung hinzugefügt und zwei weitere Extraktionsschritte werden angeschlossen. Weiterhin stellt das Methanol-d4 eine sehr gute Lösungsmittelwahl dar, da es eine äußerst effektive Extraktion ermöglicht (Punkt 5.1.3.1.1). Mit Hinblick auf die Spektrenauswertung liefert der Einsatz von Methanol-d4 den Vorteil, dass es nur zwei Signale hervorruft: das Signal der Hydroxygruppe, welches unter dem Signal des Wassers liegt sowie ein Quintett bei 3.3 ppm. Die Wahl des Puffers fiel auf einen Kaliumhydrogenphosphatpuffer, da dessen Puffer-Bereich im neutralen Bereich (pH 6-8) liegt und somit für die meisten Metabolomics-basierten Studien mit entsprechenden pH-Bereichen anwendbar ist. Hinsichtlich der Vergleichbarkeit von NMR-Spektren in Metabolomics Datenbanken kann dies auf lange Sicht von Vorteil sein. Weiterhin ermöglicht der Puffer eine sehr hohe Stabilität der Probenextrakte. Als Additive werden dem Puffer Natriumazid zur Verhinderung des biologischen Verderbs und TMSP als Referenzierungsreagenz hinzugefügt.
Die optimierte Extraktionsmethode erweist sich als eine schnelle, effiziente, einfache und reproduzierbare Methode für die Anwendbarkeit probenzahlintensiver Metabolomics-basierter Studien, wenn auch Anpassungen in Abhängigkeit von der Probenmatrix notwendig sein können. Durch die Abtrennung der Proteine im ersten Extraktionsschritt mit Hilfe des zusätzlich konservierend wirkenden Lösungsmittels Methanol und aufgrund des Natriumazid-Zusatzes sind die Proben bis zu zwei Tage lagerbar, bevor sie vermessen werden. Diese Vorteile kommen insbesondere der Routineanalytik in stark ausgelasteten Laboratorien zugute.

Statistische Auswertung:

Die statistische Auswertung der 279 Spargelproben wurde im Wesentlichen mit Hilfe der Hauptkomponentenanalyse (PCA) sowie zweier Klassifikationsmodelle, der PLS-DA und random forest, durchgeführt.
Zur Unterscheidung von Spargel aus unterschiedlichen Gebieten innerhalb Deutschlands wurden die nord- und süddeutschen Spargelproben untersucht. Die biologische Diversität dieser beiden Gruppen infolge klimatischer Unterschiede wurde am höchsten eingeschätzt und sollte der Präzisierung und Erhöhung der Aussagegenauigkeit der Ergebnisse dienen; darüber hinaus standen hier die größten Probengruppen zur Verfügung, was die statistische Aussagekraft unterstützt. Die Trennungsfrage nord- und süddeutscher Spargelproben musste aufgrund der noch unzureichenden Genauigkeit (explained variance der PCA: 42.5 %; accuracies der PLS-DA und der random forrest Klassifikation: 88.2 % und 83.8 %) verfeinert werden. Erst nach schrittweiser Eliminierung einzlener Einflussfaktoren (Erntejahr und Sorte) konnte die Trennung der beiden Gruppen verbessert werden. Die Klassifikation mittels PLS-DA erreichte eine accuracy rate von 95.0 % bei Einbezug der nord- und süddeutschen Spargelproben der Sorte Gijnlim aus dem Erntejahr 2015. Aus mathematischer Sicht stellt dies in Anbetracht der limitierten Probenanzahl ein sehr gutes Ergebnis dar; das Ergebnis kann in der Graphik der PLS-DA gut verbildlicht werden.
Nach der Auswertung der Proben auf nationaler Ebene folgte selbiges Vorgehen auf internationaler Ebene. Die Länder-Differenzierung ließ mit Hilfe der Hauptkomponenten-analyse bereits sehr gute Ergebnisse zu. Der Zusammenhang der externen Bedingungen eines Anbaugebietes (Klima, Bodenbeschaffenheit und -zusammensetzung, pH-Wert, der Gebrauch von Düngern und Pflanzenbehandlungsmittel, etc.) und der graphischen Trennbarkeit kann um die Vermutung erweitert werden, dass sich Regionen mit größerer geographischer Distanz auch in der statistischen Analyse einfacher unterscheiden lassen. Mit Hilfe der Klassifizierungsmodelle wurden der Separierungserfolg und die Qualität der Vorhersagemethoden erhöht. Mit einer 100 %igen Vorhersagegenauigkeit in der random forest Klassifizierung der Gruppe „Oversea“, einer accuracy rate von 97.2 % deutscher Spargelproben gegenüber den Probengruppen „Neighbours“, „Mediterranean“ und „Oversea“ und einer Gesamt-accuracy von 91.1 % dieser vier Probengruppen (DE, NB, MT, OS) konnten sehr gute Ergebnisse erzielt werden. Bei der Unterscheidung deutscher und ausländischer Spargelproben wird eine 92.4 %ige Vorhersagegenauigkeit des Gesamtmodells mittels random forest erreicht. Die Werte können als verlässliche Nachweise für das Funktionieren der Methode und die korrekte Herangehensweise interpretiert werden.

Targeted Analyse:

Die Herangehensweise zur statistischen Identifizierung chemischer Markersubstanzen konnte ausgehend von einer random forest Vorhersage über den importance plot, den boruta plot und den box plot veranschaulicht werden. Anhand dieser Werkzeuge lässt sich sehr gut veranschaulichen, welche buckets für die Trennung von besonderer Relevanz sind, ob sie miteinander korrelieren und mit welcher Signifikanz sich eine Gruppe von den übrigen Gruppen anhand dieses/r buckets unterscheidet. Zwei buckets, welche für die targeted Analyse beispielhaft untersucht wurden, konnten identifiziert werden (6.84 ppm, 7.17 ppm); sie scheinen von besonderer statistischer Relevanz zu sein und sind auch aus chemischer Sicht für die Trennungsfrage deutscher und peruanischer Proben spezifisch genug.
Auf analytischer Ebene finden sich mit Hilfe der Informationen aus dem Protonenspektrum (Kopplungskonstanten, chemische Verschiebung, Peakformen), dem J-RES-Experiment (Aufspaltung der beobachteten Signale im Mischspektrum) und dem TOCSY-Spektrum (Korrelation verschiedener Kernsignale innerhalb eines Moleküls) wichtige Hinweise zur Aufklärung der gesuchten Struktur/en. Der Abgleich der statistisch ermittelten buckets bei 6.84 ppm und 7.17 ppm konnte spektroskopisch nachvollzogen, Korrelationen untereinander nachgewiesen und anhand von Datenbanken (HMDB) eine vermutete Struktur abgeglichen werden. Der postulierte Analyt L Tyrosin, eine Aminosäure, welche in höheren Konzentrationen in peruanischem Spargel vorzukommen scheint und daher für diese Gruppe spezifisch ist, konnte in einem Dotierungsexperiment nachgewiesen werden. Eine erste Erklärung für die höhere Konzentration des Stoffes könnte die Adapation der peruanischen Pflanzen an die intensivere Sonneneinstrahlung aufgrund der Höhenlage der Anbaugebiete sein. Diese Vermutung wäre in einer weiterführenden Arbeit näher zu untersuchen.

The achieved results and conclusions of the method development, the multivariate data analysis as well as the targeted analysis with subsequent structure elucidation are summarized in the following.

Method development:

The method development for Metabolomics-based research of white asparagus using nuclear magnetic resonance spectroscopy includes sample acquisition, sample preparation and sample extraction. Special attention was paid to the development and optimization of the sample extraction method to achieve the best possible extraction results and to meet the NMR-associated requirements.
The method optimization is based on individual methods that have already been applied to a number of similar biofluid or food matrices in the literature (Le Gall et al., 2003; Fatma et al., 2012; Mannina et al., 2012; Beckonert et al., 2007; Consonni et al., 2009; Wu et al., 2008). The best extraction results achieved were obtained using a combination of deuterated methanol and a deuterated potassium hydrogen phosphate buffer (100 mM in mixture) in a ratio of 1:2. For protein precipitation methanol-d4 is added first followed by an extraction step (BeadRuptor 24), then the buffer solution is added and two further extraction steps are applied. Methanol-d4 not only serves as a very good solvent as it allows an extremely effective extraction (5.1.3.1.1); with regard to full spectra analysis the use of methanol-d4 has also the advantage showing only two signals: the signal of the hydroxy group which is covered by the water signal and a quintet at 3.3 ppm. A potassium hydrogen phosphate buffer was chosen due to its neutral buffer range (pH 6-8) why it is applicable for most Metabolomics-based studies with the respective pH ranges. Consequently, this is an advantage regarding comparability of NMR spectra in Metabolomics databases. Furthermore, the buffer allows high stability of the sample extracts. Sodium azide was added to the buffer to prevent biological spoilage and TMSP was added as reference substance.
The optimized extraction method proves to be a fast, efficient, simple and reproducible method suitable for the application of a high-throughput Metabolomics-based study, though minor changes might be neccessary depending on the investigation matrix. Resulting from the precipitation of the proteins during extraction using the preservative solvent methanol and due to the addition of sodium azide the samples can be stored for up to two days before they are measured. These advantages are especially beneficial for routine analysis in laboratories with high workloads.

Statistical analysis:

Statistical analysis of 279 asparagus samples was primarily performed using principal component analysis (PCA) and the classification models PLS-DA and random forest.
In order to distinguish asparagus from different areas within Germany, the northern and southern German asparagus samples were investigated. The biological diversity of the two groups was estimated to be the highest due to the largest climatic differences which was intended to result in more precision and to increase the accuracy rate; furthermore, these groups represent the largest sample group which supports the statistical power. The separation of northern and southern German asparagus samples had to be refined due to insufficient accuracy rates (explained variance of PCA: 42.5 %; accuracies of PLS-DA and random forrest classification: 88.2 % and 83.8 %). After elimination of influencing factors such as harvest year and variety the separation of the two groups could be improved. Classification using PLS-DA achieved an accuracy rate of 95.0 % including northern and southern German asparagus samples of the variety Gijnlim from the harvest year 2015. From a mathematical point of view, this is a very good result considering the limited number of samples, results can be illustrated well in the PLS-DA.
After evaluation of samples at national level the international level was investigated. Country differentiation allowed very good results using principal component analysis. The correlation between external conditions of a cultivation area (climate, soil properties and composition, pH-value, the use of fertilizers and plant protection products, etc.) and the statistical separability can be extended. It can be assumed statistical separation to be easier with increasing geographical distances of two regions. Using the classification models separation results improve and the quality of the prediction methods increase. With a 100 % prediction accuracy in the random forest classification of the group "Oversea", an accuracy rate of 97.2 % German asparagus samples compared to the sample groups "Neighbors", "Mediterranean" and "Oversea" and a total accuracy of 91.1 % of these four sample groups (DE, NB, MT, OS), very good results were achieved. For the differentiation of German and foreign asparagus samples a 92.4 % prediction accuracy of the overall model using random forest classification was achieved. The values can be interpreted as reliable evidence for the functioning of the method and the correct approach. All results are summarized in.

Targeted analysis:

Statistical identification of chemical markers was conducted using a random forest-based importance plot, a boruta plot and a box plot. Using these tools, buckets of particular relevance for separation can be illustrated very well, also whether they correlate with each other or how strong a group differs from other groups based on this/these bucket(s). Two buckets which were exemplarily examined for targeted analysis could be identified (6.84 ppm, 7.17 ppm); they seem to be of particular statistical relevance and are also specific enough for separation of German and Peruvian samples from a chemical point of view.
On the analytical level, the information from the proton spectrum (coupling constants, chemical shift, peak shapes), the J-RES experiment (splitting of the observed signals in the mixed full spectra) and the TOCSY spectrum (correlation of different nuclear signals within a molecule) provide important hints elucidating the structure(s) sought. Spectroscopical assignment of the statistically determined buckets at 6.84 ppm and 7.17 ppm could be conducted, correlations among each other could be proven and a suspected structure could be matched by means of databases (HMDB). The postulated analyte L-tyrosine, an amino acid which seems to occur in higher concentrations in Peruvian asparagus and is therefore specific for this group, could be detected and assigned in a spike-in-experiment. A first explanation for the higher concentration of the substance could be the adaptation of Peruvian plants to the more intense solar radiation due to the altitude of the growing areas. This assumption should be investigated in detail in a further work.
URL: https://ediss.sub.uni-hamburg.de/handle/ediss/9153
URN: urn:nbn:de:gbv:18-ediss-94479
Dokumenttyp: Dissertation
Bemerkung: Alle Rohdaten sind auf einem separaten Datenträger mit der Printversion erhältlich.
Betreuer*in: Fischer, Markus
Hackl, Thomas
Enthalten in den Sammlungen:Elektronische Dissertationen und Habilitationen

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat  
Dissertation.pdfDissertation9.75 MBAdobe PDFÖffnen/Anzeigen
Zur Langanzeige

Diese Publikation steht in elektronischer Form im Internet bereit und kann gelesen werden. Über den freien Zugang hinaus wurden durch die Urheberin / den Urheber keine weiteren Rechte eingeräumt. Nutzungshandlungen (wie zum Beispiel der Download, das Bearbeiten, das Weiterverbreiten) sind daher nur im Rahmen der gesetzlichen Erlaubnisse des Urheberrechtsgesetzes (UrhG) erlaubt. Dies gilt für die Publikation sowie für ihre einzelnen Bestandteile, soweit nichts Anderes ausgewiesen ist.

Info

Seitenansichten

42
Letzte Woche
Letzten Monat
geprüft am 20.09.2021

Download(s)

47
Letzte Woche
Letzten Monat
geprüft am 20.09.2021
Werkzeuge

Google ScholarTM

Prüfe