Vielen Dank für Ihren Besuch auf Nature.com. Die von Ihnen verwendete Browserversion unterstützt CSS nur eingeschränkt. Für ein optimales Erlebnis empfehlen wir Ihnen, einen aktualisierten Browser zu verwenden (oder den Kompatibilitätsmodus in Internet Explorer zu deaktivieren). Um eine kontinuierliche Unterstützung zu gewährleisten, zeigen wir die Site in der Zwischenzeit ohne Stile und JavaScript an.
Bodenverschmutzung ist ein großes, durch menschliche Aktivitäten verursachtes Problem. Die räumliche Verteilung potenziell toxischer Elemente (PTEs) variiert in den meisten städtischen und stadtnahen Gebieten. Daher ist es schwierig, den PTE-Gehalt solcher Böden räumlich vorherzusagen. Insgesamt wurden 115 Proben aus Frydek Mistek in der Tschechischen Republik entnommen. Die Konzentrationen von Calcium (Ca), Magnesium (Mg), Kalium (K) und Nickel (Ni) wurden mittels induktiv gekoppelter Plasmaemissionsspektrometrie bestimmt. Die Antwortvariable ist Ni, die Prädiktoren sind Ca, Mg und K. Die Korrelationsmatrix zwischen der Antwortvariablen und der Prädiktorvariablen zeigt eine zufriedenstellende Korrelation zwischen den Elementen. Die Vorhersageergebnisse zeigten, dass die Support Vector Machine Regression (SVMR) gut funktionierte, obwohl der geschätzte mittlere quadratische Fehler (RMSE) (235,974 mg/kg) und der mittlere absolute Fehler (MAE) (166,946 mg/kg) höher waren als bei den anderen angewandten Methoden. Gemischte Modelle für Empirical Bayesian Kriging-Multiple Linear Regression (EBK-MLR) schneiden schlecht ab, wie durch Bestimmtheitsmaße von weniger als 0,1 belegt wird. Das Modell Empirical Bayesian Kriging-Support Vector Machine Regression (EBK-SVMR) war das beste Modell mit niedrigen RMSE- (95,479 mg/kg) und MAE-Werten (77,368 mg/kg) und einem hohen Bestimmtheitsmaß (R2 = 0,637). Die Ausgabe der EBK-SVMR-Modellierungstechnik wird mithilfe einer selbstorganisierenden Karte visualisiert. Clustered Neuronen in der Ebene der Hybridmodellkomponente CakMg-EBK-SVMR zeigen mehrere Farbmuster, die Ni-Konzentrationen in städtischen und vorstädtischen Böden vorhersagen. Die Ergebnisse zeigen, dass die Kombination von EBK und SVMR eine effektive Technik zur Vorhersage von Ni-Konzentrationen in städtischen und vorstädtischen Böden ist.
Nickel (Ni) gilt als Mikronährstoff für Pflanzen, da es zur atmosphärischen Stickstofffixierung (N) und zum Harnstoffstoffwechsel beiträgt, die beide für die Samenkeimung erforderlich sind. Neben seinem Beitrag zur Samenkeimung kann Ni als Pilz- und Bakterienhemmer wirken und die Pflanzenentwicklung fördern. Ein Mangel an Nickel im Boden ermöglicht es der Pflanze, es aufzunehmen, was zu Blattchlorose führt. Beispielsweise benötigen Augenbohnen und grüne Bohnen die Anwendung von nickelbasierten Düngemitteln, um die Stickstofffixierung zu optimieren.2 Die fortgesetzte Anwendung von nickelbasierten Düngemitteln zur Anreicherung des Bodens und zur Verbesserung der Fähigkeit von Hülsenfrüchten, Stickstoff im Boden zu fixieren, erhöht kontinuierlich die Nickelkonzentration im Boden. Obwohl Nickel ein Mikronährstoff für Pflanzen ist, kann eine übermäßige Aufnahme im Boden mehr schaden als nützen. Die Toxizität von Nickel im Boden minimiert den pH-Wert des Bodens und behindert die Aufnahme von Eisen als essentiellem Nährstoff für das Pflanzenwachstum.1 Laut Liu3 wurde Ni als 17. wichtiges Element für die Entwicklung und das Wachstum von Pflanzen festgestellt. Neben der Rolle von Nickel bei der Pflanzenentwicklung und Wachstum, der Mensch benötigt es für eine Vielzahl von Anwendungen. Galvanisieren, die Herstellung von Nickellegierungen sowie die Herstellung von Zündgeräten und Zündkerzen in der Automobilindustrie erfordern allesamt die Verwendung von Nickel in verschiedenen Industriezweigen. Darüber hinaus werden Nickellegierungen und galvanisierte Artikel häufig in Küchengeschirr, Ballsaalzubehör, Lebensmittelbedarf, Elektrogeräten, Drähten und Kabeln, Düsenturbinen, chirurgischen Implantaten, Textilien und im Schiffsbau verwendet5. Ni-reiche Werte in Böden (d. h. Oberflächenböden) werden sowohl anthropogenen als auch natürlichen Quellen zugeschrieben, aber in erster Linie ist Ni eine natürliche und nicht anthropogene Quelle4,6. Zu den natürlichen Nickelquellen zählen Vulkanausbrüche, Vegetation, Waldbrände und geologische Prozesse; zu den anthropogenen Quellen zählen jedoch Nickel-/Cadmium-Batterien in der Stahlindustrie, Galvanisieren, Lichtbogenschweißen, Diesel und Heizöl sowie atmosphärische Emissionen aus der Kohleverbrennung und der Abfall- und Schlammverbrennung. Nickelansammlung7,8. Laut Freedman und Hutchinson9 und Manyiwa et al. 10. Die Hauptquellen der Verschmutzung des Mutterbodens in der unmittelbaren und angrenzenden Umgebung sind vor allem Nickel-Kupfer-Hütten und Minen. Der Mutterboden rund um die Nickel-Kupfer-Raffinerie Sudbury in Kanada wies mit 26.000 mg/kg die höchste Nickelbelastung auf11. Im Gegensatz dazu hat die Verschmutzung durch die Nickelproduktion in Russland zu höheren Nickelkonzentrationen im norwegischen Boden geführt11. Laut Alms et al. 12, die Menge an HNO3-extrahierbarem Nickel im wichtigsten Ackerland der Region (Nickelproduktion in Russland) lag zwischen 6,25 und 136,88 mg/kg, was einem Mittelwert von 30,43 mg/kg und einer Basiskonzentration von 25 mg/kg entspricht. Laut Kabata 11 kann die Anwendung von Phosphordüngern in landwirtschaftlichen Böden in städtischen oder vorstädtischen Böden während aufeinanderfolgender Ernteperioden den Boden durchdringen oder verunreinigen. Die potenziellen Auswirkungen von Nickel auf den Menschen können durch Mutagenese, Chromosomenschäden, Z-DNA-Bildung, blockierte DNA-Exzisionsreparatur oder epigenetische Prozesse zu Krebs führen13. In Tierversuchen wurde festgestellt, dass Nickel das Potenzial hat, eine Vielzahl von Tumoren zu verursachen, und krebserregende Nickelkomplexe können solche Tumoren verschlimmern.
Die Beurteilung von Bodenkontaminationen hat in letzter Zeit aufgrund einer Vielzahl gesundheitsbezogener Probleme, die sich aus den Beziehungen zwischen Boden und Pflanze, den Beziehungen zwischen Boden und biologischen Bodenverhältnissen, der ökologischen Verschlechterung und der Umweltverträglichkeitsprüfung ergeben, floriert. Bislang war die räumliche Vorhersage potenziell toxischer Elemente (PTEs) wie Ni im Boden mit herkömmlichen Methoden mühsam und zeitaufwändig. Die Einführung der digitalen Bodenkartierung (DSM) und ihr aktueller Erfolg15 haben die prädiktive Bodenkartierung (PSM) erheblich verbessert. Laut Minasny und McBratney16 hat sich die prädiktive Bodenkartierung (DSM) als eine wichtige Unterdisziplin der Bodenkunde erwiesen. Lagacherie und McBratney definieren DSM (2006) als „die Erstellung und Befüllung räumlicher Bodeninformationssysteme durch den Einsatz von Beobachtungsmethoden vor Ort und im Labor sowie räumlicher und nicht-räumlicher Bodeninferenzsysteme“. McBratney et al. 17 skizzieren, dass das moderne DSM oder PSM die effektivste Technik zum Vorhersagen oder Kartieren der räumlichen Verteilung von PTEs, Bodentypen und Bodeneigenschaften ist. Geostatistik und maschinelle Lernalgorithmen (MLA) sind DSM-Modellierungstechniken, die mit Hilfe von Computern unter Verwendung signifikanter und minimaler Daten digitalisierte Karten erstellen.
Deutsch18 und Olea19 definieren Geostatistik als „die Sammlung numerischer Techniken, die sich mit der Darstellung räumlicher Attribute befassen und dabei hauptsächlich stochastische Modelle verwenden, beispielsweise wie Zeitreihenanalysen zeitliche Daten charakterisieren.“ In erster Linie umfasst die Geostatistik die Auswertung von Variogrammen, die es ermöglichen, die Abhängigkeiten räumlicher Werte aus jedem Datensatz zu quantifizieren und zu definieren20.Gumiaux et al. 20 veranschaulichen weiter, dass die Auswertung von Variogrammen in der Geostatistik auf drei Prinzipien basiert, darunter (a) Berechnung des Maßstabs der Datenkorrelation, (b) Identifizierung und Berechnung der Anisotropie in der Datensatzdisparität und (c) zusätzlich zur Berücksichtigung des inhärenten Fehlers der Messdaten getrennt von den lokalen Effekten werden auch die Flächeneffekte geschätzt. Aufbauend auf diesen Konzepten werden in der Geostatistik viele Interpolationstechniken verwendet, darunter allgemeines Kriging, Co-Kriging, gewöhnliches Kriging, empirisches Bayesianisches Kriging, einfaches Kriging-Verfahren und andere bekannte Interpolationstechniken, um PTE, Bodeneigenschaften und Bodentypen abzubilden oder vorherzusagen.
Algorithmen des maschinellen Lernens (MLA) sind eine relativ neue Technik, die größere nichtlineare Datenklassen verwendet. Sie basieren auf Algorithmen, die hauptsächlich für das Data Mining und die Erkennung von Mustern in Daten verwendet werden und immer wieder zur Klassifizierung in wissenschaftlichen Bereichen wie Bodenkunde und Renditeaufgaben eingesetzt werden. Zahlreiche Forschungsarbeiten basieren auf MLA-Modellen zur Vorhersage des PTE in Böden, wie etwa Tan et al. 22 (Random Forests zur Abschätzung von Schwermetallen in landwirtschaftlichen Böden), Sakizadeh et al. 23 (Modellierung von Bodenverschmutzung mithilfe von Support Vector Machines und künstlichen neuronalen Netzwerken). Darüber hinaus haben Vega et al. 24 (CART zur Modellierung der Schwermetallretention und -adsorption im Boden), Sun et al. 25 (Anwendung von CART zur Messung der Cd-Verteilung im Boden) und andere Algorithmen wie k-Nearest-Neighbor, verallgemeinerte Boosted-Regression und Boosted-Regression Trees MLA ebenfalls zur Vorhersage des PTE im Boden angewendet.
Die Anwendung von DSM-Algorithmen bei Vorhersagen oder Kartierungen ist mit mehreren Herausforderungen verbunden. Viele Autoren sind der Ansicht, dass MLA der Geostatistik überlegen ist und umgekehrt. Obwohl das eine besser ist als das andere, verbessert die Kombination beider die Genauigkeit der Kartierung oder Vorhersage in DSM15. Woodcock und Gopal26 Finke27; Pontius und Cheuk28 und Grunwald29 kommentieren Mängel und einige Fehler bei der prognostizierten Bodenkartierung. Bodenkundler haben verschiedene Techniken ausprobiert, um die Wirksamkeit, Genauigkeit und Vorhersagbarkeit der DSM-Kartierung und -Prognose zu optimieren. Die Kombination von Unsicherheit und Verifizierung ist einer von vielen verschiedenen Aspekten, die in DSM integriert wurden, um die Wirksamkeit zu optimieren und Mängel zu reduzieren. Agyeman et al.15 weisen jedoch darauf hin, dass das Validierungsverhalten und die Unsicherheit, die durch Kartenerstellung und -vorhersage entstehen, unabhängig validiert werden sollten, um die Kartenqualität zu verbessern. Die Einschränkungen des DSM sind auf die geografisch verteilte Bodenqualität zurückzuführen, die eine Unsicherheitskomponente mit sich bringt. Die mangelnde Sicherheit des DSM kann jedoch auf mehrere Fehlerquellen zurückzuführen sein, nämlich Kovariatenfehler, Modellfehler, Standortfehler und analytische Fehler 31. Modellierungsungenauigkeiten in MLA- und geostatistischen Prozessen sind auf ein mangelndes Verständnis zurückzuführen, was letzten Endes zu einer Vereinfachung des tatsächlichen Prozesses führt 32. Unabhängig von der Art der Modellierung können Ungenauigkeiten auf Modellierungsparameter, Vorhersagen mathematischer Modelle oder Interpolation zurückzuführen sein 33. Vor Kurzem ist ein neuer DSM-Trend entstanden, der die Integration von Geostatistik und MLA in Kartierung und Prognose fördert. Mehrere Bodenkundler und Autoren wie Sergeev et al. 34; Subbotina et al. 35; Tarasov et al. 36 und Tarasov et al. 37 haben die genaue Qualität der Geostatistik und des maschinellen Lernens ausgenutzt, um Hybridmodelle zu erstellen, die die Effizienz von Prognosen und Kartierungen verbessern. Qualität. Einige dieser hybriden oder kombinierten Algorithmusmodelle sind Artificial Neural Network Kriging (ANN-RK), Multilayer Perceptron Residual Kriging (MLP-RK), Generalized Regression Neural Network Residual Kriging (GR-NNRK)36, Artificial Neural Network Kriging-Multilayer Perceptron (ANN-K-MLP)37 und Co-Kriging und Gaussian Process Regression38.
Laut Sergeev et al. kann die Kombination verschiedener Modellierungstechniken Fehler beseitigen und die Effizienz des resultierenden Hybridmodells steigern, anstatt ein einzelnes Modell zu entwickeln. In diesem Zusammenhang argumentiert diese neue Arbeit, dass es notwendig ist, einen kombinierten Algorithmus aus Geostatistik und MLA anzuwenden, um optimale Hybridmodelle zur Vorhersage der Ni-Anreicherung in städtischen und stadtnahen Gebieten zu erstellen. Diese Studie basiert auf Empirical Bayesian Kriging (EBK) als Basismodell und kombiniert es mit Support Vector Machine (SVM) und Multiple Linear Regression (MLR)-Modellen. Eine Hybridisierung von EBK mit MLA ist nicht bekannt. Die betrachteten multiplen Mischmodelle sind Kombinationen aus gewöhnlichem, residualem, Regressions-Kriging und MLA. EBK ist eine geostatistische Interpolationsmethode, die einen räumlich stochastischen Prozess verwendet, der als nichtstationäres/stationäres Zufallsfeld mit definierten Lokalisierungsparametern über das Feld lokalisiert ist und räumliche Variationen ermöglicht39. EBK wurde in einer Vielzahl von Studien verwendet, darunter zur Analyse der Verteilung von organischem Kohlenstoff in landwirtschaftlichen Böden40, zur Bewertung Verschmutzung41 und Kartierung der Bodeneigenschaften42.
Andererseits ist Self-Organizing Graph (SeOM) ein Lernalgorithmus, der in verschiedenen Artikeln wie Li et al. 43, Wang et al. 44, Hossain Bhuiyan et al. 45 und Kebonye et al. 46 angewendet wurde. Bestimmen Sie die räumlichen Attribute und die Gruppierung von Elementen. Wang et al. 44 betonen, dass SeOM eine leistungsstarke Lerntechnik ist, die für ihre Fähigkeit bekannt ist, nichtlineare Probleme zu gruppieren und sich vorzustellen. Im Gegensatz zu anderen Mustererkennungstechniken wie Hauptkomponentenanalyse, Fuzzy-Clustering, hierarchischem Clustering und multikriterieller Entscheidungsfindung ist SeOM besser darin, PTE-Muster zu organisieren und zu identifizieren. Laut Wang et al. 44 kann SeOM die Verteilung verwandter Neuronen räumlich gruppieren und eine hochauflösende Datenvisualisierung bereitstellen. SeOM visualisiert Ni-Vorhersagedaten, um das beste Modell zur Charakterisierung der Ergebnisse für die direkte Interpretation zu erhalten.
Ziel dieser Arbeit ist die Entwicklung eines robusten Kartierungsmodells mit optimaler Genauigkeit zur Vorhersage des Nickelgehalts in städtischen und stadtnahen Böden. Wir gehen von der Hypothese aus, dass die Zuverlässigkeit des Mischmodells hauptsächlich vom Einfluss anderer Modelle abhängt, die an das Basismodell angehängt sind. Wir sind uns der Herausforderungen bewusst, vor denen das DSM steht. Obwohl diese Herausforderungen an mehreren Fronten angegangen werden, scheint die Kombination von Fortschritten in der Geostatistik und MLA-Modellen nur schrittweise zu erfolgen. Daher werden wir versuchen, Forschungsfragen zu beantworten, die zu Mischmodellen führen könnten. Wie genau ist das Modell jedoch bei der Vorhersage des Zielelements? Und wie hoch ist die Effizienzbewertung basierend auf Validierung und Genauigkeitsbewertung? Daher waren die spezifischen Ziele dieser Studie (a) die Erstellung eines kombinierten Mischmodells für SVMR oder MLR unter Verwendung von EBK als Basismodell, (b) der Vergleich der resultierenden Modelle, (c) die Entwicklung des besten Mischmodells zur Vorhersage der Nickelkonzentrationen in städtischen oder stadtnahen Böden und (d) die Anwendung von SeOM zur Erstellung einer hochauflösenden Karte der räumlichen Nickelvariation.
Die Studie wird in der Tschechischen Republik durchgeführt, genauer gesagt im Bezirk Frydek Mistek in der Region Mährisch-Schlesien (siehe Abbildung 1). Die Geographie des Untersuchungsgebiets ist sehr zerklüftet und liegt größtenteils in der Region Mährisch-Schlesische Beskiden, die zum äußeren Rand der Karpaten gehören. Das Untersuchungsgebiet liegt zwischen 49° 41′ 0′ N und 18° 20′ 0′ E und die Höhe beträgt zwischen 225 und 327 m; Das Klima der Region wird jedoch nach dem Koppen-Klassifikationssystem als Cfb (gemäßigtes ozeanisches Klima) eingestuft. Selbst in den trockenen Monaten gibt es viel Niederschlag. Die Temperaturen schwanken im Jahresverlauf leicht zwischen -5 °C und 24 °C und fallen selten unter -14 °C oder über 30 °C. Die durchschnittliche jährliche Niederschlagsmenge liegt zwischen 685 und 752 mm47. Die geschätzte Untersuchungsfläche des gesamten Gebiets beträgt 1.208 Quadratkilometer, wobei 39,38 % des Ackerlandes und 49,36 % der Waldfläche bedeckt sind. Die in dieser Studie verwendete Fläche beträgt hingegen etwa 889,8 Quadratkilometer. In und um Ostrava sind die Stahlindustrie und die Metallwerke sehr aktiv. Metallwerke, die Stahlindustrie, in der Nickel in rostfreien Stählen (z. B. zur Beständigkeit gegen atmosphärische Korrosion) und legierten Stählen verwendet wird (Nickel erhöht die Festigkeit der Legierung bei gleichzeitiger Beibehaltung ihrer guten Duktilität und Zähigkeit), sowie intensive Landwirtschaft wie die Anwendung von Phosphatdünger und Viehzucht Die Bodenproduktion ist ein Forschungsgebiet für potentielle Nickelquellen in der Region (z. B. die Zugabe von Nickel zu Lämmern, um das Wachstum von Lämmern und unterernährtem Vieh zu steigern). Weitere industrielle Einsatzgebiete von Nickel in der Forschung sind die Verwendung in der Galvanik, darunter die galvanische Vernickelung und chemische Vernickelung. Die Bodeneigenschaften lassen sich leicht anhand der Farbe, Struktur und des Karbonatgehalts des Bodens erkennen. Die Bodentextur ist mittel bis fein und leitet sich vom Ausgangsmaterial ab. Die Böden sind kolluvialer, alluvialer oder äolischer Natur. Einige Bodenbereiche erscheinen an der Oberfläche und im Untergrund gesprenkelt, oft mit Zement und Bleiche. Allerdings sind Braunerden und Stagnosole die häufigsten Bodenarten in der Region48. Mit Höhenlagen zwischen 455,1 und 493,5 m dominieren in der Tschechischen Republik49 Braunerden.
Karte des Untersuchungsgebiets [Die Karte des Untersuchungsgebiets wurde mit ArcGIS Desktop (ESRI, Inc, Version 10.7, URL: https://desktop.arcgis.com) erstellt.]
Insgesamt wurden 115 Oberbodenproben aus städtischen und stadtnahen Böden im Bezirk Frydek Mistek entnommen. Das verwendete Probenmuster bestand aus einem regelmäßigen Raster mit Bodenproben im Abstand von 2 × 2 km. Der Oberboden wurde in einer Tiefe von 0 bis 20 cm mit einem tragbaren GPS-Gerät (Leica Zeno 5 GPS) gemessen. Die Proben wurden in Ziploc-Beuteln verpackt, ordnungsgemäß beschriftet und an das Labor versandt. Die Proben wurden luftgetrocknet, um pulverisierte Proben zu erhalten, mit einem mechanischen System (Fritsch-Scheibenmühle) pulverisiert und gesiebt (Siebgröße 2 mm). 1 Gramm der getrockneten, homogenisierten und gesiebten Bodenproben wurde in deutlich beschriftete Teflonflaschen gegeben. In jedes Teflongefäß wurden 7 ml 35%ige HCl und 3 ml 65%ige HNO3 gegeben (mithilfe eines automatischen Spenders – einer für jede Säure), leicht abgedeckt und die Proben über Nacht zur Reaktion stehen gelassen (Königswasser-Programm). Heiße Metallplatte (Temperatur: 100 W und 160 °C) für 2 Stunden, um den Verdauungsprozess der Proben zu erleichtern, dann abkühlen lassen. Den Überstand in einen 50-ml-Messkolben überführen und mit deionisiertem Wasser auf 50 ml verdünnen. Anschließend den verdünnten Überstand mit deionisiertem Wasser in ein 50-ml-PVC-Röhrchen filtrieren. Zusätzlich wurde 1 ml der Verdünnungslösung mit 9 ml deionisiertem Wasser verdünnt und in ein 12-ml-Röhrchen filtriert, das für die PTE-Pseudokonzentration vorbereitet wurde. Die Konzentrationen der PTEs (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) wurden mittels ICP-OES (Inductively Coupled Plasma Optical Emission Spectroscopy) (Thermo Fisher Scientific, USA) gemäß Standardmethoden und Vereinbarungen bestimmt. Qualitätssicherungs- und -kontrollverfahren (QA/QC) sicherstellen (SRM NIST 2711a Montana II Boden).PTEs mit Nachweisgrenzen unter der Hälfte wurden von dieser Studie ausgeschlossen.Die Nachweisgrenze des in dieser Studie verwendeten PTE betrug 0,0004.(Sie).Darüber hinaus wird der Qualitätskontroll- und Qualitätssicherungsprozess für jede Analyse durch die Analyse von Referenzstandards sichergestellt.Um sicherzustellen, dass Fehler minimiert werden, wurde eine Doppelanalyse durchgeführt.
Empirical Bayesian Kriging (EBK) ist eine von vielen geostatistischen Interpolationstechniken, die in der Modellierung in verschiedenen Bereichen wie der Bodenkunde verwendet werden. Im Gegensatz zu anderen Kriging-Interpolationstechniken unterscheidet sich EBK von herkömmlichen Kriging-Methoden dadurch, dass der vom Semivariogramm-Modell geschätzte Fehler berücksichtigt wird. Bei der EBK-Interpolation werden während der Interpolation mehrere Semivariogramm-Modelle berechnet, anstatt nur ein einziges Semivariogramm. Interpolationstechniken machen Platz für die Unsicherheit und Programmierung, die mit dieser Darstellung des Semivariogramms verbunden sind, die einen hochkomplexen Teil einer ausreichenden Kriging-Methode darstellt. Der Interpolationsprozess von EBK folgt den drei von Krivoruchko50 vorgeschlagenen Kriterien: (a) Das Modell schätzt das Semivariogramm aus dem Eingabedatensatz, (b) den neuen vorhergesagten Wert für jeden Eingabedatensatzstandort basierend auf dem generierten Semivariogramm und (c) das endgültige A-Modell wird aus einem simulierten Datensatz berechnet. Die Bayes-Gleichungsregel wird als Posterior angegeben
Wobei \(Prob\left(A\right)\) die Vorhersage darstellt, \(Prob\left(B\right)\) die Randwahrscheinlichkeit wird in den meisten Fällen ignoriert, \(Prob (B,A)\ ). Die Berechnung des Semivariogramms basiert auf der Bayes-Regel, die die Neigung von Beobachtungsdatensätzen zeigt, die aus Semivariogrammen erstellt werden können. Der Wert des Semivariogramms wird dann mithilfe der Bayes-Regel bestimmt, die angibt, wie wahrscheinlich es ist, aus dem Semivariogramm einen Beobachtungsdatensatz zu erstellen.
Eine Support Vector Machine ist ein Algorithmus für maschinelles Lernen, der eine optimale trennende Hyperebene generiert, um identische, aber nicht linear unabhängige Klassen zu unterscheiden. Vapnik51 hat den Algorithmus zur Absichtsklassifizierung entwickelt, der jedoch kürzlich zur Lösung regressionsorientierter Probleme verwendet wurde. Laut Li et al.52 ist SVM eine der besten Klassifizierungstechniken und wurde in verschiedenen Bereichen eingesetzt. In dieser Analyse wurde die Regressionskomponente von SVM (Support Vector Machine Regression – SVMR) verwendet. Cherkassky und Mulier53 haben SVMR als kernelbasierte Regression entwickelt, deren Berechnung mithilfe eines linearen Regressionsmodells mit räumlichen Funktionen für mehrere Länder durchgeführt wurde. John et al.54 berichten, dass bei der SVMR-Modellierung eine lineare Hyperebenenregression verwendet wird, die nichtlineare Beziehungen erzeugt und räumliche Funktionen ermöglicht. Laut Vohland et al. 55, Epsilon (ε)-SVMR verwendet den trainierten Datensatz, um ein Darstellungsmodell als Epsilon-unempfindliche Funktion zu erhalten, die angewendet wird, um die Daten unabhängig mit der besten Epsilon-Verzerrung aus dem Training mit korrelierten Daten abzubilden. Der voreingestellte Distanzfehler wird vom tatsächlichen Wert ignoriert, und wenn der Fehler größer als ε(ε) ist, wird er durch die Bodeneigenschaften ausgeglichen. Das Modell reduziert auch die Komplexität der Trainingsdaten auf eine breitere Teilmenge von Unterstützungsvektoren. Die von Vapnik51 vorgeschlagene Gleichung ist unten dargestellt.
wobei b den skalaren Schwellenwert darstellt, \(K\left({x}_{,}{ x}_{k}\right)\) die Kernelfunktion darstellt, \(\alpha\) den Lagrange-Multiplikator darstellt, N einen numerischen Datensatz darstellt, \({x}_{k}\) die Dateneingabe darstellt und \(y\) die Datenausgabe ist. Einer der wichtigsten verwendeten Kernel ist die SVMR-Operation, eine Gaußsche radiale Basisfunktion (RBF). Der RBF-Kernel wird angewendet, um das optimale SVMR-Modell zu bestimmen, was entscheidend ist, um den subtilsten Strafsatzfaktor C und Kernelparameter Gamma (γ) für die PTE-Trainingsdaten zu erhalten. Zuerst haben wir den Trainingssatz ausgewertet und dann die Modellleistung am Validierungssatz getestet. Der verwendete Steuerungsparameter ist Sigma und der Methodenwert ist svmRadial.
Ein multiples lineares Regressionsmodell (MLR) ist ein Regressionsmodell, das die Beziehung zwischen der Antwortvariablen und einer Reihe von Prädiktorvariablen mithilfe linearer gepoolter Parameter darstellt, die mit der Methode der kleinsten Quadrate berechnet werden. Bei MLR ist ein Modell der kleinsten Quadrate eine Vorhersagefunktion der Bodeneigenschaften nach Auswahl erklärender Variablen. Es ist notwendig, die Antwort zu verwenden, um eine lineare Beziehung mithilfe erklärender Variablen herzustellen. PTE wurde als Antwortvariable verwendet, um eine lineare Beziehung mit den erklärenden Variablen herzustellen. Die MLR-Gleichung lautet
Dabei ist y die Antwortvariable, \(a\) der Achsenabschnitt, n die Anzahl der Prädiktoren, \({b}_{1}\) die partielle Regression der Koeffizienten, \({x}_{ i}\) stellt einen Prädiktor oder eine erklärende Variable dar und \({\varepsilon }_{i}\) stellt den Fehler im Modell dar, der auch als Residuum bezeichnet wird.
Gemischte Modelle wurden durch die Kombination von EBK mit SVMR und MLR erhalten. Dies geschieht durch Extrahieren der vorhergesagten Werte aus der EBK-Interpolation. Die aus den interpolierten Ca-, K- und Mg-Werten gewonnenen vorhergesagten Werte werden durch einen kombinatorischen Prozess ermittelt, um neue Variablen wie CaK, CaMg und KMg zu erhalten. Die Elemente Ca, K und Mg werden dann kombiniert, um eine vierte Variable, CaKMg, zu erhalten. Insgesamt ergeben sich die Variablen Ca, K, Mg, CaK, CaMg, KMg und CaKMg. Diese Variablen wurden zu unseren Prädiktoren und helfen bei der Vorhersage der Nickelkonzentrationen in städtischen und stadtnahen Böden. Der SVMR-Algorithmus wurde auf die Prädiktoren angewendet, um ein gemischtes Modell der Empirical Bayesian Kriging-Support Vector Machine (EBK_SVM) zu erhalten. Ebenso werden Variablen durch den MLR-Algorithmus geleitet, um ein gemischtes Modell der Empirical Bayesian Kriging-Multiple Linear Regression (EBK_MLR) zu erhalten. Typischerweise sind die Variablen Ca, K, Mg, CaK, CaMg, KMg und CaKMg werden als Kovariate zur Prädiktoren des Ni-Gehalts in städtischen und vorstädtischen Böden verwendet. Das am besten geeignete Modell (EBK_SVM oder EBK_MLR) wird dann mithilfe eines selbstorganisierenden Graphen visualisiert. Der Arbeitsablauf dieser Studie ist in Abbildung 2 dargestellt.
Die Verwendung von SeOM hat sich zu einem beliebten Tool zum Organisieren, Auswerten und Prognostizieren von Daten im Finanzsektor, im Gesundheitswesen, in der Industrie, in der Statistik, in der Bodenkunde und mehr entwickelt. SeOM wird mithilfe künstlicher neuronaler Netzwerke und unüberwachter Lernmethoden zum Organisieren, Auswerten und Prognostizieren erstellt. In dieser Studie wurde SeOM verwendet, um Ni-Konzentrationen basierend auf dem besten Modell zum Vorhersagen von Ni in städtischen und vorstädtischen Böden zu visualisieren. Die in der SeOM-Auswertung verarbeiteten Daten werden als n eingabedimensionale Vektorvariablen verwendet43,56.Melssen et al. 57 beschreibt die Verbindung eines Eingabevektors in ein neuronales Netzwerk über eine einzelne Eingabeschicht zu einem Ausgabevektor mit einem einzelnen Gewichtsvektor. Die von SeOM generierte Ausgabe ist eine zweidimensionale Karte, die aus verschiedenen Neuronen oder Knoten besteht, die je nach ihrer Nähe zu hexagonalen, kreisförmigen oder quadratischen topologischen Karten verwoben sind. Beim Vergleich der Kartengrößen basierend auf Metrik, Quantisierungsfehler (QE) und topografischem Fehler (TE) wird das SeOM-Modell mit 0,086 bzw. 0,904 ausgewählt, was einer 55-Karten-Einheit (5 × 11) entspricht. Die Neuronenstruktur wird entsprechend der Anzahl der Knoten in der empirischen Gleichung bestimmt
Die in dieser Studie verwendete Datenmenge beträgt 115 Proben. Die Daten wurden nach dem Zufallsprinzip in Testdaten (25 % zur Validierung) und Trainingsdatensätze (75 % zur Kalibrierung) aufgeteilt. Der Trainingsdatensatz wird zur Generierung des Regressionsmodells (Kalibrierung) verwendet, und der Testdatensatz dient zur Überprüfung der Generalisierungsfähigkeit58. Damit sollte die Eignung verschiedener Modelle zur Vorhersage des Nickelgehalts in Böden beurteilt werden. Alle verwendeten Modelle durchliefen einen zehnfachen Kreuzvalidierungsprozess, der fünfmal wiederholt wurde. Die durch die EBK-Interpolation erzeugten Variablen werden als Prädiktoren oder erklärende Variablen zur Vorhersage der Zielvariable (PTE) verwendet. Die Modellierung erfolgt in RStudio mit den Paketen library(Kohonen), library(caret), library(modelr), library(„e1071“), library(„plyr“), library(„caTools“), library(„prospectr“) und libraries(„Metrics“).
Verschiedene Validierungsparameter wurden verwendet, um das beste Modell zur Vorhersage von Nickelkonzentrationen im Boden zu bestimmen und die Genauigkeit des Modells und seiner Validierung zu bewerten. Hybridisierungsmodelle wurden anhand des mittleren absoluten Fehlers (MAE), des mittleren quadratischen Fehlers (RMSE) und R-Quadrat oder Koeffizientenbestimmung (R2) bewertet. R2 definiert die Varianz der Anteile in der Antwort, dargestellt durch das Regressionsmodell. RMSE und Varianzbetrag in unabhängigen Maßen beschreiben die Vorhersagekraft des Modells, während MAE den tatsächlichen quantitativen Wert bestimmt. Der R2-Wert muss hoch sein, um mithilfe der Validierungsparameter das beste Mischungsmodell zu bewerten. Je näher der Wert bei 1 liegt, desto höher ist die Genauigkeit. Laut Li et al. 59 gilt ein R2-Kriteriumswert von 0,75 oder höher als guter Prädiktor; 0,5 bis 0,75 ist eine akzeptable Modellleistung, und unter 0,5 ist eine inakzeptable Modellleistung. Bei der Auswahl eines Modells mithilfe der Bewertungsmethoden für die Validierungskriterien RMSE und MAE waren die erhaltenen niedrigeren Werte ausreichend und wurden als beste Wahl angesehen. Die folgende Gleichung beschreibt die Überprüfungsmethode.
wobei n die Größe des beobachteten Wertes darstellt, \({Y}_{i}\) die gemessene Antwort darstellt und \({\widehat{Y}}_{i}\) auch den vorhergesagten Antwortwert darstellt, also für die ersten i Beobachtungen.
Statistische Beschreibungen der Prädiktor- und Antwortvariablen sind in Tabelle 1 dargestellt und zeigen Mittelwert, Standardabweichung (SD), Variationskoeffizient (CV), Minimum, Maximum, Kurtosis und Schiefe. Die Minimal- und Maximalwerte der Elemente sind in absteigender Reihenfolge Mg < Ca < K < Ni bzw. Ca < Mg < K < Ni. Die Konzentrationen der Antwortvariablen (Ni), die im Untersuchungsgebiet entnommen wurden, lagen zwischen 4,86 und 42,39 mg/kg. Der Vergleich von Ni mit dem Weltdurchschnitt (29 mg/kg) und dem europäischen Durchschnitt (37 mg/kg) zeigte, dass der insgesamt berechnete geometrische Mittelwert für das Untersuchungsgebiet innerhalb des tolerierbaren Bereichs lag. Dennoch zeigt, wie Kabata-Pendias11 zeigt, ein Vergleich der durchschnittlichen Nickelkonzentration (Ni) in der vorliegenden Studie mit landwirtschaftlichen Böden in Schweden, dass die aktuelle durchschnittliche Nickelkonzentration höher ist. Ebenso ist die mittlere Konzentration von Frydek Mistek in städtischen und stadtnahen Böden in der vorliegenden Studie (Ni 16,15 mg/kg) lag über dem zulässigen Grenzwert von 60 (10,2 mg/kg) für Nickel in polnischen Stadtböden, der von Różański et al. berichtet wurde. Darüber hinaus stellten Bretzel und Calderisi61 im Vergleich zur vorliegenden Studie sehr niedrige mittlere Nickelkonzentrationen (1,78 mg/kg) in städtischen Böden in der Toskana fest. Jim62 fand auch eine niedrigere Nickelkonzentration (12,34 mg/kg) in städtischen Böden in Hongkong, die niedriger ist als die aktuelle Nickelkonzentration in dieser Studie. Birke et al.63 berichteten von einer durchschnittlichen Nickelkonzentration von 17,6 mg/kg in einem alten Bergbau- und städtischen Industriegebiet in Sachsen-Anhalt, Deutschland, die 1,45 mg/kg höher war als die durchschnittliche Nickelkonzentration in diesem Gebiet (16,15 mg/kg). Aktuelle Forschung. Der übermäßige Nickelgehalt in Böden in einigen städtischen und vorstädtischen Gebieten des Untersuchungsgebiets kann hauptsächlich auf die Eisen- und Stahlindustrie sowie die Metallindustrie zurückgeführt werden. Dies steht im Einklang mit der Studie von Khodadoust et al. 64, dass die Stahlindustrie und die Metallverarbeitung die Hauptquellen der Nickelverunreinigung in Böden sind. Allerdings lagen die Prädiktoren auch für Ca zwischen 538,70 mg/kg und 69.161,80 mg/kg, für K zwischen 497,51 mg/kg und 3535,68 mg/kg und für Mg zwischen 685,68 mg/kg und 5970,05 mg/kg. Jakovljevic et al. 65 untersuchten den Gesamt-Mg- und K-Gehalt von Böden in Zentralserbien. Sie fanden heraus, dass die Gesamtkonzentrationen (410 mg/kg bzw. 400 mg/kg) niedriger waren als die Mg- und K-Konzentrationen in der vorliegenden Studie. Ununterscheidbar untersuchten Orzechowski und Smolczynski66 in Ostpolen den Gesamtgehalt an Ca, Mg und K und zeigten durchschnittliche Konzentrationen von Ca (1100 mg/kg), Mg (590 mg/kg) und K (810 mg/kg). Der Gehalt im Oberboden ist niedriger als das einzelne Element in dieser Studie. Eine aktuelle Studie von Pongrac et al. 67 zeigte, dass der gesamte Ca-Gehalt, der in 3 verschiedenen Böden in Schottland, Großbritannien (Mylnefield-Boden, Balruddery-Boden und Hartwood-Boden) analysiert wurde, in dieser Studie auf einen höheren Ca-Gehalt hindeutete.
Aufgrund der unterschiedlichen gemessenen Konzentrationen der untersuchten Elemente weisen die Datensatzverteilungen der Elemente unterschiedliche Schiefe auf. Die Schiefe und die Wölbung der Elemente lagen zwischen 1,53 und 7,24 bzw. zwischen 2,49 und 54,16. Alle berechneten Elemente weisen Schiefe- und Wölbungsgrade über +1 auf, was darauf hindeutet, dass die Datenverteilung unregelmäßig, in die richtige Richtung schief und spitz ist. Die geschätzten CVs der Elemente zeigen auch, dass K, Mg und Ni eine moderate Variabilität aufweisen, während Ca eine extrem hohe Variabilität aufweist. Die CVs von K, Ni und Mg erklären ihre gleichmäßige Verteilung. Darüber hinaus ist die Ca-Verteilung ungleichmäßig und externe Quellen können ihren Anreicherungsgrad beeinflussen.
Die Korrelation der Prädiktorvariablen mit den Antwortelementen deutete auf eine zufriedenstellende Korrelation zwischen den Elementen hin (siehe Abbildung 3). Die Korrelation ergab, dass CaK eine moderate Korrelation mit einem R-Wert von 0,53 aufwies, ebenso wie CaNi. Obwohl Ca und K nur moderate Assoziationen zueinander aufweisen, haben Forscher wie Kingston et al. 68 und Santo69 legen nahe, dass ihre Bodenwerte umgekehrt proportional sind. Ca und Mg wirken jedoch antagonistisch zu K, während CaK gut korreliert. Dies kann auf die Anwendung von Düngemitteln wie Kaliumcarbonat zurückzuführen sein, das einen um 56 % höheren Kaliumgehalt aufweist. Kalium korrelierte mäßig mit Magnesium (KM r = 0,63). In der Düngemittelindustrie sind diese beiden Elemente eng miteinander verbunden, da Kaliummagnesiumsulfat, Kaliummagnesiumnitrat und Kali auf Böden ausgebracht werden, um deren Mangel zu erhöhen. Nickel korreliert mäßig mit Ca, K und Mg mit r-Werten von 0,52, 0,63 bzw. 0,55. Die Beziehungen zwischen Calcium, Magnesium und PTEs wie Nickel sind komplex, dennoch hemmt Magnesium die Calciumaufnahme, Calcium reduziert die Auswirkungen von überschüssigem Magnesium und sowohl Magnesium als auch Calcium reduzieren die toxischen Wirkungen von Nickel im Boden.
Korrelationsmatrix für Elemente, die die Beziehung zwischen Prädiktoren und Antworten zeigt (Hinweis: Diese Abbildung enthält ein Streudiagramm zwischen Elementen, Signifikanzniveaus basieren auf p < 0,001).
Abbildung 4 veranschaulicht die räumliche Verteilung der Elemente. Laut Burgos et al. 70 ist die Anwendung der räumlichen Verteilung eine Technik zur Quantifizierung und Hervorhebung von Hotspots in verschmutzten Gebieten. Die Anreicherungsgrade von Ca in Abbildung 4 sind im nordwestlichen Teil der räumlichen Verteilungskarte zu sehen. Die Abbildung zeigt Hotspots mit mittlerer bis hoher Ca-Anreicherung. Die Calciumanreicherung im Nordwesten der Karte ist wahrscheinlich auf die Verwendung von Branntkalk (Calciumoxid) zur Reduzierung des Bodensäuregehalts und dessen Verwendung in Stahlwerken als alkalischer Sauerstoff im Stahlherstellungsprozess zurückzuführen. Andererseits bevorzugen andere Landwirte die Verwendung von Calciumhydroxid in sauren Böden, um den pH-Wert zu neutralisieren, was ebenfalls den Calciumgehalt des Bodens erhöht. 71 Auch für Kalium gibt es Hotspots im Nordwesten und Osten der Karte. Der Nordwesten ist eine stark landwirtschaftlich geprägte Gemeinde, und das mittlere bis hohe Kaliummuster könnte auf die Anwendung von NPK und Kali zurückzuführen sein. Dies steht im Einklang mit anderen Studien, wie z. B. von Madaras und Lipavský 72, Madaras et al. 73, Pulkrabová et al.74, Asare et al.75, die beobachteten, dass Bodenstabilisierung und Behandlung mit KCl und NPK zu einem hohen K-Gehalt im Boden führten. Die räumliche Kaliumanreicherung im Nordwesten der Verbreitungskarte könnte auf die Verwendung kaliumhaltiger Düngemittel wie Kaliumchlorid, Kaliumsulfat, Kaliumnitrat, Pottasche und Pottasche zur Erhöhung des Kaliumgehalts in armen Böden zurückzuführen sein. Zádorová et al. 76 und Tlustoš et al. 77 erläuterte, dass die Anwendung von Kalium-basierten Düngemitteln den Kaliumgehalt im Boden erhöht und den Nährstoffgehalt des Bodens langfristig deutlich steigern würde, wobei insbesondere K und Mg einen Hotspot im Boden aufweisen. Relativ moderate Hotspots im Nordwesten und Südosten der Karte. Kolloidale Fixierung im Boden verringert die Magnesiumkonzentration im Boden. Sein Mangel im Boden führt bei Pflanzen zu gelblicher Chlorose zwischen den Blattadern. Magnesium-basierte Düngemittel wie Kaliummagnesiumsulfat, Magnesiumsulfat und Kieserit behandeln Mangelerscheinungen (Pflanzen erscheinen violett, rot oder braun, was auf Magnesiummangel hinweist) in Böden mit einem normalen pH-Bereich6. Die Anreicherung von Nickel auf städtischen und vorstädtischen Bodenoberflächen kann auf anthropogene Aktivitäten wie die Landwirtschaft und die Bedeutung von Nickel bei der Edelstahlproduktion zurückzuführen sein78.
Räumliche Verteilung der Elemente [Die räumliche Verteilungskarte wurde mit ArcGIS Desktop (ESRI, Inc., Version 10.7, URL: https://desktop.arcgis.com) erstellt.]
Die Ergebnisse des Modellleistungsindex für die in dieser Studie verwendeten Elemente sind in Tabelle 2 dargestellt. Andererseits liegen RMSE und MAE von Ni beide nahe Null (0,86 RMSE, -0,08 MAE). Andererseits sind sowohl die RMSE- als auch die MAE-Werte von K akzeptabel. Die RMSE- und MAE-Ergebnisse waren für Calcium und Magnesium höher. Die MAE- und RMSE-Ergebnisse für Ca und K sind aufgrund unterschiedlicher Datensätze höher. Die RMSE- und MAE-Ergebnisse dieser Studie unter Verwendung von EBK zur Vorhersage von Ni waren besser als die Ergebnisse von John et al. 54, die synergistisches Kriging zur Vorhersage der S-Konzentrationen im Boden unter Verwendung derselben gesammelten Daten verwendeten. Die von uns untersuchten EBK-Ergebnisse korrelieren mit denen von Fabijaczyk et al. 41, Yan et al. 79, Beguin et al. 80, Adhikary et al. 81 und John et al. 82, insbesondere K und Ni.
Die Leistung einzelner Methoden zur Vorhersage des Nickelgehalts in städtischen und stadtnahen Böden wurde anhand der Leistung der Modelle bewertet (Tabelle 3). Die Modellvalidierung und Genauigkeitsbewertung bestätigten, dass der Ca_Mg_K-Prädiktor in Kombination mit dem EBK-SVMR-Modell die beste Leistung lieferte. Kalibrierungsmodell Ca_Mg_K-EBK_SVMR-Modell R2, mittlerer quadratischer Fehler (RMSE) und mittlerer absoluter Fehler (MAE) betrugen 0,637 (R2), 95,479 mg/kg (RMSE) und 77,368 mg/kg (MAE). Ca_Mg_K-SVMR betrug 0,663 (R2), 235,974 mg/kg (RMSE) und 166,946 mg/kg (MAE). Dennoch wurden gute R2-Werte für Ca_Mg_K-SVMR (0,663 mg/kg R2) und Ca_Mg-EBK_SVMR erzielt (0,643 = R2); Ihre RMSE- und MAE-Ergebnisse waren höher als die für Ca_Mg_K-EBK_SVMR (R2 0,637) (siehe Tabelle 3). Darüber hinaus betragen die RMSE- und MAE-Ergebnisse des Ca_Mg-EBK_SVMR-Modells (RMSE = 1664,64 und MAE = 1031,49) 17,5 bzw. 13,4 und sind damit höher als die des Ca_Mg_K-EBK_SVMR. Ebenso sind die RMSE- und MAE-Ergebnisse des Ca_Mg-K-SVMR-Modells (RMSE = 235,974 und MAE = 166,946) 2,5 bzw. 2,2 höher als die des Ca_Mg_K-EBK_SVMR-RMSE bzw. -MAE. Die berechneten RMSE-Ergebnisse zeigen, wie konzentriert der Datensatz mit der Linie der besten Anpassung ist. Es wurden höhere RSME- und MAE-Ergebnisse beobachtet. Laut Kebonye et al. 46 und John et al. 54: Je näher RMSE und MAE bei Null liegen, desto besser sind die Ergebnisse. SVMR und EBK_SVMR weisen höhere quantisierte RSME- und MAE-Werte auf. Es wurde beobachtet, dass die RSME-Schätzungen durchweg höher waren als die MAE-Werte, was auf das Vorhandensein von Ausreißern hindeutet. Laut Legates und McCabe83 wird das Ausmaß, in dem der RMSE den mittleren absoluten Fehler (MAE) überschreitet, als Indikator für das Vorhandensein von Ausreißern empfohlen. Das bedeutet, je heterogener der Datensatz, desto höher die MAE- und RMSE-Werte. Die Genauigkeit der Kreuzvalidierungsbewertung des Ca_Mg_K-EBK_SVMR-Mischmodells zur Vorhersage des Ni-Gehalts in städtischen und vorstädtischen Böden betrug 63,70 %. Laut Li et al. 59 ist diese Genauigkeit eine akzeptable Modellleistungsrate. Die vorliegenden Ergebnisse werden mit einer früheren Studie von Tarasov et al. verglichen. 36, dessen Hybridmodell MLPRK (Multilayer Perceptron Residual Kriging) erstellt hat, bezogen auf den in der aktuellen Studie gemeldeten EBK_SVMR-Genauigkeitsbewertungsindex, RMSE (210) und MAE (167,5) waren höher als unsere Ergebnisse in der aktuellen Studie (RMSE 95,479, MAE 77,368). Beim Vergleich des R2 der aktuellen Studie (0,637) mit dem von Tarasov et al. 36 (0,544) ist deutlich, dass der Bestimmtheitskoeffizient (R2) in diesem gemischten Modell höher ist. Die Fehlerspanne (RMSE und MAE) (EBK SVMR) für das gemischte Modell ist halb so hoch. Ebenso verzeichneten Sergeev et al. 34 0,28 (R2) für das entwickelte Hybridmodell (Multilayer Perceptron Residual Kriging), während Ni in der vorliegenden Studie 0,637 (R2) verzeichnete. Die Vorhersagegenauigkeit dieses Modells (EBK SVMR) beträgt 63,7 %, während die von Sergeev et al. 34 erzielte Vorhersagegenauigkeit 28 % beträgt. Die endgültige Karte (Abb. 5), die mit dem EBK_SVMR-Modell und Ca_Mg_K als Prädiktor erstellt wurde, zeigt Vorhersagen von Hotspots und moderater Nickelkonzentration für das gesamte Untersuchungsgebiet. Dies bedeutet, dass die Nickelkonzentration im Untersuchungsgebiet hauptsächlich moderat ist
Die endgültige Vorhersagekarte wird mithilfe des Hybridmodells EBK_SVMR und Ca_Mg_K als Prädiktor dargestellt. [Die räumliche Verteilungskarte wurde mit RStudio (Version 1.4.1717: https://www.rstudio.com/) erstellt.]
Abbildung 6 stellt die PTE-Konzentrationen als Kompositionsebene dar, die aus einzelnen Neuronen besteht. Keine der Komponentenebenen wies das gezeigte Farbmuster auf. Die entsprechende Anzahl von Neuronen pro gezeichneter Karte beträgt jedoch 55. SeOM wird mithilfe einer Vielzahl von Farben erstellt. Je ähnlicher die Farbmuster, desto vergleichbarer sind die Eigenschaften der Proben. Gemäß ihrer präzisen Farbskala zeigten einzelne Elemente (Ca, K und Mg) ähnliche Farbmuster wie einzelne hohe Neuronen und die meisten niedrigen Neuronen. CaK und CaMg weisen daher Ähnlichkeiten mit Neuronen sehr hoher Ordnung und niedrigen bis mittleren Farbmustern auf. Beide Modelle sagen die Ni-Konzentration im Boden voraus, indem sie mittlere bis hohe Farbtöne wie Rot, Orange und Gelb anzeigen. Das KMg-Modell zeigt viele hohe Farbmuster basierend auf präzisen Proportionen und niedrige bis mittlere Farbfelder. Auf einer präzisen Farbskala von niedrig bis hoch zeigte das planare Verteilungsmuster der Modellkomponenten ein hohes Farbmuster, das die potenzielle Nickelkonzentration im Boden anzeigt (siehe Abbildung 4). Die Komponentenebene des CakMg-Modells zeigt ein vielfältiges Farbmuster von niedrig bis hoch gemäß einer genauen Farbskala. Darüber hinaus ähnelt die Vorhersage des Nickelgehalts (CakMg) durch das Modell der räumlichen Verteilung von Nickel in Abbildung 5. Beide Grafiken zeigen hohe, mittlere und niedrige Anteile von Nickelkonzentrationen in städtischen und vorstädtischen Böden. Abbildung 7 zeigt die Konturmethode in der K-Means-Gruppierung auf der Karte, unterteilt in drei Cluster basierend auf dem in jedem Modell vorhergesagten Wert. Die Konturmethode stellt die optimale Anzahl von Clustern dar. Von den 115 gesammelten Bodenproben erhielt Kategorie 1 die meisten Bodenproben (74). Cluster 2 erhielt 33 Proben, während Cluster 3 8 Proben erhielt. Die Kombination der sieben Komponenten der planaren Prädiktoren wurde vereinfacht, um eine korrekte Clusterinterpretation zu ermöglichen. Aufgrund der zahlreichen anthropogenen und natürlichen Prozesse, die die Bodenbildung beeinflussen, ist es schwierig, in einer verteilten SeOM-Karte richtig differenzierte Clustermuster zu erhalten78.
Komponentenebene, die von jeder Variable der Empirical Bayesian Kriging Support Vector Machine (EBK_SVM_SeOM) ausgegeben wird. [SeOM-Karten wurden mit RStudio (Version 1.4.1717: https://www.rstudio.com/) erstellt.]
Verschiedene Cluster-Klassifizierungskomponenten [SeOM-Karten wurden mit RStudio (Version 1.4.1717: https://www.rstudio.com/) erstellt.]
Die vorliegende Studie veranschaulicht anschaulich Modellierungstechniken für Nickelkonzentrationen in städtischen und stadtnahen Böden. Dabei wurden verschiedene Modellierungstechniken getestet, wobei Elemente mit Modellierungstechniken kombiniert wurden, um die beste Methode zur Vorhersage von Nickelkonzentrationen im Boden zu finden. Die kompositorischen planaren räumlichen Merkmale der SeOM-Modellierungstechnik zeigten ein starkes Farbmuster von niedrig bis hoch auf einer präzisen Farbskala, was auf Nickelkonzentrationen im Boden hinweist. Die räumliche Verteilungskarte bestätigt jedoch die planare räumliche Verteilung der Komponenten, die EBK_SVMR aufweist (siehe Abbildung 5). Die Ergebnisse zeigen, dass das Support Vector Machine Regression-Modell (Ca Mg K-SVMR) die Nickelkonzentration im Boden als Einzelmodell vorhersagt, die Validierungs- und Genauigkeitsbewertungsparameter jedoch sehr hohe Fehler in Bezug auf RMSE und MAE aufweisen. Andererseits ist die mit dem EBK_MLR-Modell verwendete Modellierungstechnik aufgrund des niedrigen Determinationskoeffizienten (R2) ebenfalls fehlerhaft. Gute Ergebnisse wurden mit EBK SVMR und kombinierten Elementen (CaKMg) mit niedrigen RMSE- und MAE-Fehlern und einer Genauigkeit von 63,7 %. Es zeigt sich, dass die Kombination des EBK-Algorithmus mit einem Algorithmus für maschinelles Lernen einen Hybridalgorithmus erzeugen kann, der die PTE-Konzentration im Boden vorhersagen kann. Die Ergebnisse zeigen, dass die Verwendung von Ca, Mg und K als Prädiktoren zur Vorhersage der Ni-Konzentrationen im Untersuchungsgebiet die Vorhersage von Ni in Böden verbessern kann. Dies bedeutet, dass die kontinuierliche Anwendung von nickelbasierten Düngemitteln und die industrielle Verschmutzung des Bodens durch die Stahlindustrie dazu neigen, die Nickelkonzentration im Boden zu erhöhen. Diese Studie hat gezeigt, dass das EBK-Modell die Fehlerquote reduzieren und die Genauigkeit des Modells der räumlichen Bodenverteilung in städtischen oder vorstädtischen Böden verbessern kann. Generell schlagen wir vor, das EBK-SVMR-Modell zur Bewertung und Vorhersage von PTE im Boden anzuwenden; darüber hinaus schlagen wir vor, EBK zur Hybridisierung mit verschiedenen Algorithmen für maschinelles Lernen zu verwenden. Die Ni-Konzentrationen wurden unter Verwendung von Elementen als Kovariaten vorhergesagt; Die Verwendung von mehr Kovariaten würde die Leistung des Modells jedoch erheblich verbessern, was jedoch als Einschränkung der vorliegenden Arbeit angesehen werden kann. Eine weitere Einschränkung dieser Studie besteht darin, dass die Anzahl der Datensätze 115 beträgt. Daher kann die Leistung der vorgeschlagenen optimierten Hybridisierungsmethode verbessert werden, wenn mehr Daten bereitgestellt werden.
PlantProbs.net.Nickel in Pflanzen und Böden https://plantprobs.net/plant/nutrientImbalances/sodium.html (Zugriff am 28. April 2021).
Kasprzak, KS Nickel – Fortschritte in der modernen Umwelttoxikologie. Surroundings.toxicology.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: Eine Überprüfung seiner Quellen und Umwelttoxikologie.Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Schadstoffeintrag aus der Atmosphäre und Ansammlung in Boden und Vegetation in der Nähe einer Nickel-Kupfer-Hütte in Sudbury, Ontario, Kanada.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Schwermetalle in Böden, Pflanzen und Risiken im Zusammenhang mit grasenden Wiederkäuern in der Nähe der Kupfer-Nickel-Mine Selebi-Phikwe in Botswana.surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Spurenelemente im Boden und … – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (Zugriff am 24. November 2020).
Almås, A., Singh, B., Landwirtschaft, TS-NJ von & 1995, nicht definiert. Auswirkungen der russischen Nickelindustrie auf die Schwermetallkonzentrationen in landwirtschaftlichen Böden und Gräsern in Sør-Varanger, Norwegen.agris.fao.org.
Nielsen, GD et al. Nickelabsorption und -retention im Trinkwasser stehen in Zusammenhang mit der Nahrungsaufnahme und der Nickelempfindlichkeit. Toxikologie.Anwendung.Pharmakodynamik.154, 67–75 (1999).
Costa, M. & Klein, CB Nickelkarzinogenese, Mutation, Epigenetik oder Selektion. Umgebung. Gesundheitsperspektive. 107, 2 (1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, NM; Trendanalyse potenziell toxischer Elemente: eine bibliometrische Überprüfung. Umweltgeochemie und Gesundheit. Springer Science & Business Media BV 2020.https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Digitale Bodenkartierung: Eine kurze Geschichte und einige Lehren.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Zur digitalen Bodenkartierung.Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistische Reservoirmodellierung, … – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Zugriff am 28. April 2021).
Veröffentlichungszeit: 22. Juli 2022


