Voorspelling van nikkelconcentraties in voorstedelijke en stedelijke bodems met behulp van gemengde empirische Bayesiaanse Kriging en ondersteunende vectormachineregressie

Bedankt voor uw bezoek aan Nature.com. De browserversie die u gebruikt, biedt beperkte ondersteuning voor CSS. Voor de beste ervaring raden we u aan een bijgewerkte browser te gebruiken (of de compatibiliteitsmodus in Internet Explorer uit te schakelen). In de tussentijd geven we de site weer zonder stijlen en JavaScript, om ondersteuning te blijven bieden.
Bodemverontreiniging is een groot probleem dat wordt veroorzaakt door menselijke activiteiten. De ruimtelijke distributie van potentieel toxische elementen (PTE's) varieert in de meeste stedelijke en voorstedelijke gebieden. Daarom is het moeilijk om het gehalte aan PTE's in dergelijke bodems ruimtelijk te voorspellen. In totaal werden 115 monsters verkregen van Frydek Mistek in Tsjechië. De concentraties calcium (Ca), magnesium (Mg), kalium (K) en nikkel (Ni) werden bepaald met behulp van inductief gekoppelde plasma-emissiespectrometrie. De responsvariabele is Ni en de predictoren zijn Ca, Mg en K. De correlatiematrix tussen de responsvariabele en de predictorvariabele toont een bevredigende correlatie tussen de elementen. De voorspellingsresultaten lieten zien dat Support Vector Machine Regression (SVMR) goed presteerde, hoewel de geschatte root mean square error (RMSE) (235,974 mg/kg) en de gemiddelde absolute fout (MAE) (166,946 mg/kg) hoger waren dan de andere toegepaste methoden. Gemengde modellen voor empirische Bayesiaanse Kriging-meervoudige lineaire regressie (EBK-MLR) presteren slecht, zoals blijkt uit de determinatiecoëfficiënten van minder dan 0,1. Het Empirical Bayesian Kriging-Support Vector Machine Regression (EBK-SVMR)-model was het beste model, met lage RMSE- (95,479 mg/kg) en MAE-waarden (77,368 mg/kg) en een hoge determinatiecoëfficiënt (R2 = 0,637). De uitvoer van de EBK-SVMR-modelleringstechniek wordt gevisualiseerd met behulp van een zelf-organiserende kaart. Geclusterde neuronen in het vlak van de hybride model CakMg-EBK-SVMR-component vertonen meerdere kleurpatronen die Ni-concentraties in stedelijke en peri-urbane bodems voorspellen. De resultaten tonen aan dat de combinatie van EBK en SVMR een effectieve techniek is voor het voorspellen van Ni-concentraties in stedelijke en peri-urbane bodems.
Nikkel (Ni) wordt beschouwd als een micronutriënt voor planten omdat het bijdraagt ​​aan de stikstofbinding (N) in de atmosfeer en het ureummetabolisme, die beide nodig zijn voor zaadkieming. Naast zijn bijdrage aan zaadkieming kan Ni fungeren als een schimmel- en bacterieremmer en de ontwikkeling van planten bevorderen. Het gebrek aan nikkel in de bodem zorgt ervoor dat de plant het kan opnemen, wat resulteert in chlorose van bladeren. Bijvoorbeeld, cowpeas en sperziebonen vereisen de toepassing van meststoffen op basis van nikkel om de stikstofbinding te optimaliseren2. Voortdurende toepassing van meststoffen op basis van nikkel om de bodem te verrijken en het vermogen van peulvruchten om stikstof in de bodem te binden te vergroten, verhoogt voortdurend de nikkelconcentratie in de bodem. Hoewel nikkel een micronutriënt is voor planten, kan een overmatige inname in de bodem meer kwaad dan goed doen. De toxiciteit van nikkel in de bodem minimaliseert de pH van de bodem en belemmert de opname van ijzer als essentiële voedingsstof voor plantengroei1. Volgens Liu3 is gebleken dat Ni het 17e belangrijke element is dat nodig is voor de ontwikkeling en groei van planten. Naast de rol van nikkel in de ontwikkeling en groei van planten, hebben mensen het nodig voor een verscheidenheid aan toepassingen. Galvaniseren, de productie van nikkelgebaseerde legeringen en de vervaardiging van ontstekingsinrichtingen en bougies in de auto-industrie vereisen allemaal het gebruik van nikkel in verschillende industriële sectoren. Daarnaast worden nikkelgebaseerde legeringen en gegalvaniseerde artikelen op grote schaal gebruikt in keukengerei, balzaalaccessoires, benodigdheden voor de voedingsmiddelenindustrie, elektriciteit, draad en kabel, straalturbines, chirurgische implantaten, textiel en scheepsbouw5. Ni-rijke niveaus in bodems (d.w.z. oppervlaktebodems) zijn toegeschreven aan zowel antropogene als natuurlijke bronnen, maar in de eerste plaats is Ni een natuurlijke bron en niet antropogeen4,6. Natuurlijke bronnen van nikkel zijn onder meer vulkaanuitbarstingen, vegetatie, bosbranden en geologische processen; antropogene bronnen zijn echter nikkel/cadmiumbatterijen in de staalindustrie, galvaniseren, booglassen, diesel- en stookolie en atmosferische emissies door de verbranding van kolen en de verbranding van afval en slib Nikkelaccumulatie7,8. Volgens Freedman en Hutchinson9 en Manyiwa et al. 10. De belangrijkste bronnen van verontreiniging van de bovengrond in de directe en aangrenzende omgeving zijn voornamelijk nikkel-koper-smelterijen en mijnen. De bovengrond rond de nikkel-koperraffinaderij van Sudbury in Canada had de hoogste nikkelverontreiniging, namelijk 26.000 mg/kg11. Daarentegen heeft verontreiniging door de nikkelproductie in Rusland geleid tot hogere nikkelconcentraties in de Noorse bodem11.Volgens Alms et al. 12. De hoeveelheid HNO3-extraheerbaar nikkel in de belangrijkste landbouwgronden van de regio (nikkelproductie in Rusland) varieerde van 6,25 tot 136,88 mg/kg, wat overeenkomt met een gemiddelde van 30,43 mg/kg en een basisconcentratie van 25 mg/kg. Volgens kabata 11 kan het gebruik van fosforhoudende meststoffen in landbouwgronden in stedelijke of voorstedelijke gronden tijdens opeenvolgende teeltseizoenen de grond verontreinigen. De potentiële effecten van nikkel bij mensen kunnen leiden tot kanker door mutagenese, chromosomale schade, Z-DNA-generatie, geblokkeerde DNA-excisiereparatie of epigenetische processen13. Bij dierproeven is gebleken dat nikkel diverse tumoren kan veroorzaken en dat kankerverwekkende nikkelcomplexen deze tumoren kunnen verergeren.
Nederlands Beoordelingen van bodemverontreiniging hebben de laatste tijd een grote bloei doorgemaakt vanwege een breed scala aan gezondheidsgerelateerde problemen die voortvloeien uit de relaties tussen bodem en plant, de relaties tussen bodem en bodembiologie, ecologische degradatie en milieueffectbeoordeling. Tot op heden was de ruimtelijke voorspelling van potentieel toxische elementen (PTE's) zoals Ni in de bodem arbeidsintensief en tijdrovend met behulp van traditionele methoden. De komst van digitale bodemkartering (DSM) en het huidige succes15 ervan hebben de voorspellende bodemkartering (PSM) aanzienlijk verbeterd. Volgens Minasny en McBratney16 heeft voorspellende bodemkartering (DSM) zich bewezen als een prominente subdiscipline van de bodemkunde. Lagacherie en McBratney, 2006 definiëren DSM als "het creëren en invullen van ruimtelijke bodeminformatiesystemen door het gebruik van in-situ- en laboratoriumobservatiemethoden en ruimtelijke en niet-ruimtelijke bodeminferentiesystemen". McBratney et al. 17 schetsen dat de hedendaagse DSM of PSM de meest effectieve techniek is voor het voorspellen of in kaart brengen van de ruimtelijke verdeling van PTE's, bodemsoorten en bodemeigenschappen. Geostatistiek en machine learning-algoritmen (MLA) zijn DSM-modelleringstechnieken waarmee met behulp van computers gedigitaliseerde kaarten worden gemaakt op basis van significante en minimale gegevens.
Deutsch18 en Olea19 definiëren geostatistiek als "de verzameling numerieke technieken die zich bezighouden met de representatie van ruimtelijke kenmerken, waarbij voornamelijk gebruik wordt gemaakt van stochastische modellen, zoals hoe tijdreeksanalyse temporele gegevens karakteriseert." Geostatistiek omvat in de eerste plaats de evaluatie van variogrammen, waarmee de afhankelijkheden van ruimtelijke waarden uit elke dataset kunnen worden gekwantificeerd en gedefinieerd. Gumiaux et al. 20 illustreren verder dat de evaluatie van variogrammen in de geostatistiek is gebaseerd op drie principes, waaronder (a) het berekenen van de schaal van gegevenscorrelatie, (b) het identificeren en berekenen van anisotropie in datasetdispariteit en (c) naast het in aanmerking nemen van de inherente fout van de meetgegevens gescheiden van de lokale effecten, worden ook de gebiedseffecten geschat. Voortbouwend op deze concepten worden veel interpolatietechnieken gebruikt in de geostatistiek, waaronder algemene kriging, co-kriging, gewone kriging, empirische Bayesiaanse kriging, eenvoudige kriging-methode en andere bekende interpolatietechnieken om PTE, bodemkenmerken en bodemtypen in kaart te brengen of te voorspellen.
Machine Learning Algorithms (MLA) zijn een relatief nieuwe techniek die gebruikmaakt van grotere, niet-lineaire gegevensklassen. Deze worden aangestuurd door algoritmen die voornamelijk worden gebruikt voor data mining, het identificeren van patronen in gegevens en die herhaaldelijk worden toegepast op classificatie in wetenschappelijke vakgebieden zoals bodemkunde en retourtaken. Talrijke onderzoeksartikelen vertrouwen op MLA-modellen om PTE in bodems te voorspellen, zoals Tan et al. 22 (willekeurige bossen voor het schatten van zware metalen in landbouwbodems), Sakizadeh et al. 23 (modellering met behulp van ondersteunende vectormachines en kunstmatige neurale netwerken) bodemverontreiniging). Daarnaast hebben Vega et al. 24 (CART voor het modelleren van de retentie en adsorptie van zware metalen in bodems), Sun et al. 25 (toepassing van kubist is de verdeling van Cd in bodem) en andere algoritmen zoals k-nearest neighbor, generalized boosted regression en boosted regression Trees ook MLA toegepast om PTE in bodems te voorspellen.
De toepassing van DSM-algoritmen bij voorspellingen of kartering kent verschillende uitdagingen. Veel auteurs zijn van mening dat MLA superieur is aan geostatistiek en vice versa. Hoewel de ene beter is dan de andere, verbetert de combinatie van de twee de nauwkeurigheid van kartering of voorspelling in DSM15. Woodcock en Gopal26 Finke27; Pontius en Cheuk28 en Grunwald29 geven commentaar op tekortkomingen en enkele fouten in voorspelde bodemkartering. Bodemwetenschappers hebben verschillende technieken geprobeerd om de effectiviteit, nauwkeurigheid en voorspelbaarheid van DSM-kartering en -voorspelling te optimaliseren. De combinatie van onzekerheid en verificatie is een van de vele verschillende aspecten die in DSM zijn geïntegreerd om de effectiviteit te optimaliseren en fouten te verminderen. Agyeman et al.15 schetsen echter dat het validatiegedrag en de onzekerheid die worden geïntroduceerd door het maken en voorspellen van kaarten onafhankelijk gevalideerd moeten worden om de kaartkwaliteit te verbeteren. De beperkingen van de DSM zijn te wijten aan geografisch verspreide bodemkwaliteit, wat een component van onzekerheid met zich meebrengt; het gebrek aan zekerheid in de DSM kan echter voortkomen uit meerdere bronnen van fouten, namelijk covariaatfout, modelfout, locatiefout en analytische fout 31.Modelleringsonnauwkeurigheden die worden veroorzaakt in MLA en geostatistische processen worden geassocieerd met een gebrek aan begrip, wat uiteindelijk leidt tot een te grote vereenvoudiging van het werkelijke proces32.Ongeacht de aard van de modellering kunnen onnauwkeurigheden worden toegeschreven aan modelleringsparameters, wiskundige modelvoorspellingen of interpolatie33.Onlangs is er een nieuwe DSM-trend ontstaan ​​die de integratie van geostatistiek en MLA in kartering en prognoses bevordert.Verschillende bodemwetenschappers en auteurs, zoals Sergeev et al. 34; Subbotina et al. 35; Tarasov et al. 36 en Tarasov et al. 37 hebben de nauwkeurige kwaliteit van geostatistiek en machinaal leren benut om hybride modellen te genereren die de efficiëntie van prognoses en kartering verbeteren. kwaliteit. Enkele van deze hybride of gecombineerde algoritmemodellen zijn Artificial Neural Network Kriging (ANN-RK), Multilayer Perceptron Residual Kriging (MLP-RK), Generalized Regression Neural Network Residual Kriging (GR-NNRK)36, Artificial Neural Network Kriging-Multilayer Perceptron (ANN-K-MLP)37 en Co-Kriging en Gaussian Process Regression38.
Volgens Sergeev et al. heeft het combineren van verschillende modelleringstechnieken de potentie om defecten te elimineren en de efficiëntie van het resulterende hybride model te verhogen in plaats van één enkel model te ontwikkelen. In deze context betoogt dit nieuwe artikel dat het noodzakelijk is om een ​​gecombineerd algoritme van geostatistiek en MLA toe te passen om optimale hybride modellen te creëren om Ni-verrijking in stedelijke en voorstedelijke gebieden te voorspellen. Deze studie zal vertrouwen op Empirical Bayesian Kriging (EBK) als basismodel en dit mengen met Support Vector Machine (SVM) en Multiple Linear Regression (MLR)-modellen. Hybridisatie van EBK met een MLA is niet bekend. De meerdere gemengde modellen die gezien worden, zijn combinaties van gewone, residuale, regressie-kriging en MLA. EBK is een geostatische interpolatiemethode die gebruikmaakt van een ruimtelijk stochastisch proces dat gelokaliseerd is als een niet-stationair/stationair willekeurig veld met gedefinieerde lokalisatieparameters over het veld, waardoor ruimtelijke variatie mogelijk is39. EBK is gebruikt in verschillende onderzoeken, waaronder het analyseren van de distributie van organische koolstof in landbouwgebieden. bodems40, het beoordelen van bodemverontreiniging41 en het in kaart brengen van bodemeigenschappen42.
Self-Organizing Graph (SeOM) is daarentegen een leer-algoritme dat in verschillende artikelen is toegepast, zoals die van Li et al. 43, Wang et al. 44, Hossain Bhuiyan et al. 45 en Kebonye et al. 46. Bepaal de ruimtelijke kenmerken en groepering van elementen. Wang et al. 44 beschrijven dat SeOM een krachtige leertechniek is die bekendstaat om zijn vermogen om niet-lineaire problemen te groeperen en te visualiseren. In tegenstelling tot andere patroonherkenningstechnieken, zoals principal component analysis, fuzzy clustering, hiërarchische clustering en besluitvorming op basis van meerdere criteria, is SeOM beter in het organiseren en identificeren van PTE-patronen. Volgens Wang et al. 44 kan SeOM de distributie van verwante neuronen ruimtelijk groeperen en visualisatie van gegevens met een hoge resolutie bieden. SeOM visualiseert Ni-voorspellingsgegevens om het beste model te verkrijgen om de resultaten te karakteriseren voor directe interpretatie.
Dit artikel heeft als doel een robuust kaartmodel te genereren met optimale nauwkeurigheid voor het voorspellen van het nikkelgehalte in stedelijke en peri-urbane bodems. Onze hypothese is dat de betrouwbaarheid van het gemengde model voornamelijk afhangt van de invloed van andere modellen die aan het basismodel zijn gekoppeld. We erkennen de uitdagingen waar de DSM voor staat, en hoewel deze uitdagingen op meerdere fronten worden aangepakt, lijkt de combinatie van ontwikkelingen in geostatistiek en MLA-modellen incrementeel te zijn; daarom zullen we proberen onderzoeksvragen te beantwoorden die gemengde modellen kunnen opleveren. Maar hoe nauwkeurig is het model bij het voorspellen van het doelelement? Ook, wat is het niveau van efficiëntie-evaluatie op basis van validatie en nauwkeurigheidsevaluatie? Daarom waren de specifieke doelen van deze studie om (a) een gecombineerd mengselmodel voor SVMR of MLR te creëren met EBK als basismodel, (b) de resulterende modellen te vergelijken, (c) het beste mengselmodel voor te stellen voor het voorspellen van Ni-concentraties in stedelijke of peri-urbane bodems, en (d) de toepassing van SeOM om een ​​hoge-resolutiekaart van ruimtelijke nikkelvariatie te creëren.
Het onderzoek wordt uitgevoerd in Tsjechië, meer specifiek in het district Frydek Mistek in de regio Moravië-Silezië (zie afbeelding 1). De geografie van het onderzoeksgebied is zeer ruig en maakt grotendeels deel uit van de regio Moravië-Silezië Beskidy, dat deel uitmaakt van de buitenrand van de Karpaten. Het onderzoeksgebied ligt tussen 49° 41′ 0′ N en 18° 20′ 0′ E, en de hoogte ligt tussen 225 en 327 m; Het Koppen-classificatiesysteem voor de klimaattoestand van de regio wordt echter beoordeeld als Cfb = gematigd zeeklimaat. Er valt veel neerslag, zelfs in de droge maanden. De temperaturen variëren licht gedurende het jaar tussen -5 °C en 24 °C, en dalen zelden onder -14 °C of boven 30 °C, terwijl de gemiddelde jaarlijkse neerslag tussen 685 en 752 mm47 ligt. Het geschatte onderzoeksgebied van het hele gebied is 1.208 vierkante kilometer, met 39,38% van het landbouwland en 49,36% van de bosbedekking. Aan de andere kant is het gebied dat in deze studie is gebruikt ongeveer 889,8 vierkante kilometer. In en rond Ostrava zijn de staalindustrie en metaalfabrieken zeer actief. Metaalfabrieken, de staalindustrie waar nikkel wordt gebruikt in roestvrij staal (bijvoorbeeld voor weerstand tegen atmosferische corrosie) en gelegeerd staal (nikkel verhoogt de sterkte van de legering terwijl de goede ductiliteit en taaiheid behouden blijven), en intensieve landbouw zoals fosfaat Het gebruik van meststoffen en de veehouderij zijn potentiële bronnen van nikkel voor onderzoek in de regio (bijvoorbeeld het toevoegen van nikkel aan lammeren om de groeisnelheid van lammeren en laagvoedend vee te verhogen). Andere industriële toepassingen van nikkel in onderzoeksgebieden zijn onder meer het gebruik ervan bij galvaniseren, waaronder galvaniseerprocessen voor nikkel en chemisch nikkel. Bodemeigenschappen zijn gemakkelijk te onderscheiden aan de hand van de kleur, structuur en het carbonaatgehalte van de bodem. De bodemtextuur is middelfijn tot fijn, afkomstig van het moedermateriaal. Ze zijn colluviaal, alluviaal of eolisch van aard. Sommige bodemgebieden lijken gevlekt aan het oppervlak en in de ondergrond, vaak met beton en verbleking. Cambisolen en stagnosolen zijn echter de meest voorkomende bodemtypen in de regio48. Met hoogtes variërend van 455,1 tot 493,5 m domineren cambisolen in Tsjechië49.
Kaart van het studiegebied [De kaart van het studiegebied is gemaakt met ArcGIS Desktop (ESRI, Inc, versie 10.7, URL: https://desktop.arcgis.com).]
In totaal werden 115 monsters van de teelaarde verkregen uit stedelijke en peri-urbane bodems in het district Frydek Mistek. Het gebruikte monsterpatroon was een regelmatig raster met bodemmonsters op een afstand van 2 × 2 km van elkaar, en de teelaarde werd gemeten op een diepte van 0 tot 20 cm met behulp van een draagbaar GPS-apparaat (Leica Zeno 5 GPS). De monsters worden verpakt in Ziploc-zakken, correct geëtiketteerd en naar het laboratorium verzonden. De monsters werden aan de lucht gedroogd om verpulverde monsters te produceren, verpulverd door een mechanisch systeem (Fritsch-schijvenmolen) en gezeefd (zeefgrootte 2 mm). Plaats 1 gram gedroogde, gehomogeniseerde en gezeefde bodemmonsters in duidelijk geëtiketteerde teflonflessen. In elk teflonvat 7 ml 35% HCl en 3 ml 65% HNO3 doseren (met behulp van een automatische dispenser - één voor elk zuur), licht afdekken en de monsters een nacht laten staan ​​voor de reactie (aqua regia-programma). Plaats de supernatant op een hete metalen plaat (temperatuur: 100 W en 160 °C) gedurende 2 uur om het verteringsproces van de monsters te vergemakkelijken, en laat het vervolgens afkoelen.Breng de supernatant over naar een maatkolf van 50 ml en verdun tot 50 ml met gedeïoniseerd water.Filter daarna de verdunde supernatant in een PVC-buis van 50 ml met gedeïoniseerd water.Bovendien werd 1 ml van de verdunningsoplossing verdund met 9 ml gedeïoniseerd water en gefiltreerd in een buis van 12 ml die was voorbereid voor PTE-pseudoconcentratie.De concentraties van PTE's (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) werden bepaald door ICP-OES (Inductively Coupled Plasma Optical Emission Spectroscopy) (Thermo Fisher Scientific, VS) volgens standaardmethoden en -overeenkomsten.Zorg voor procedures voor kwaliteitsborging en -controle (QA/QC) (SRM NIST 2711a Montana II Bodem). PTE's met detectielimieten onder de helft werden uitgesloten van deze studie. De detectielimiet van de PTE die in deze studie werd gebruikt, was 0,0004.(u). Bovendien wordt het kwaliteitscontrole- en kwaliteitsborgingsproces voor elke analyse gewaarborgd door het analyseren van referentienormen. Om te garanderen dat fouten tot een minimum werden beperkt, werd een dubbele analyse uitgevoerd.
Empirische Bayesiaanse Kriging (EBK) is een van de vele geostatische interpolatietechnieken die worden gebruikt bij het modelleren in diverse vakgebieden, zoals bodemkunde. In tegenstelling tot andere kriging-interpolatietechnieken verschilt EBK van traditionele krigingmethoden doordat rekening wordt gehouden met de fout die wordt geschat door het semivariogrammodel. Bij EBK-interpolatie worden tijdens de interpolatie meerdere semivariogrammodellen berekend in plaats van één semivariogram. Interpolatietechnieken maken een einde aan de onzekerheid en programmering die gepaard gaan met het plotten van het semivariogram, wat een zeer complex onderdeel vormt van een voldoende krigingmethode. Het interpolatieproces van EBK volgt de drie criteria voorgesteld door Krivoruchko50, (a) het model schat het semivariogram op basis van de invoerdataset, (b) de nieuwe voorspelde waarde voor elke invoerdatasetlocatie op basis van het gegenereerde semivariogram en (c) de uiteindelijke Een model wordt berekend op basis van een gesimuleerde dataset. De Bayesiaanse vergelijkingsregel wordt gegeven als een posterior
Waar \(Prob\left(A\right)\) de prior vertegenwoordigt, wordt de marginale waarschijnlijkheid van \(Prob\left(B\right)\) in de meeste gevallen genegeerd, \(Prob (B,A)\ ) . De berekening van het semivariogram is gebaseerd op de regel van Bayes, die de neiging weergeeft van observatiedatasets die kunnen worden samengesteld op basis van semivariogrammen. De waarde van het semivariogram wordt vervolgens bepaald met behulp van de regel van Bayes, die aangeeft hoe waarschijnlijk het is dat een dataset van observaties wordt samengesteld op basis van het semivariogram.
Een ondersteunende vectormachine is een algoritme voor machinaal leren dat een optimaal scheidend hypervlak genereert om identieke, maar niet lineair onafhankelijke klassen te onderscheiden. Vapnik51 creëerde het algoritme voor intentieclassificatie, maar het wordt recentelijk gebruikt om regressiegerichte problemen op te lossen. Volgens Li et al.52 is SVM een van de beste classificatietechnieken en wordt het in verschillende vakgebieden gebruikt. In deze analyse werd de regressiecomponent van SVM (Support Vector Machine Regression – SVMR) gebruikt. Cherkassky en ​​Mulier53 waren de pioniers van SVMR als een op de kernel gebaseerde regressie, waarvan de berekening werd uitgevoerd met behulp van een lineair regressiemodel met ruimtelijke functies voor meerdere landen. John et al.54 melden dat SVMR-modellering gebruikmaakt van lineaire hypervlakregressie, die niet-lineaire relaties creëert en ruimtelijke functies mogelijk maakt. Volgens Vohland et al. 55, epsilon (ε)-SVMR gebruikt de getrainde dataset om een ​​representatiemodel te verkrijgen als een epsilon-ongevoelige functie die wordt toegepast om de gegevens onafhankelijk in kaart te brengen met de beste epsilon-bias van de training op gecorreleerde gegevens. De vooraf ingestelde afstandsfout wordt genegeerd van de werkelijke waarde en als de fout groter is dan ε(ε), compenseren de bodemeigenschappen dit. Het model reduceert ook de complexiteit van de trainingsgegevens tot een bredere subset van ondersteuningsvectoren. De door Vapnik51 voorgestelde vergelijking wordt hieronder weergegeven.
waarbij b de scalaire drempelwaarde vertegenwoordigt, \(K\left({x}_{,}{ x}_{k}\right)\) de kernelfunctie vertegenwoordigt, \(\alpha\) de Lagrange-multiplier vertegenwoordigt, N een numerieke dataset vertegenwoordigt, \({x}_{k}\) gegevensinvoer vertegenwoordigt en \(y\) gegevensuitvoer is. Een van de belangrijkste gebruikte kernels is de SVMR-bewerking, een radiale basisfunctie van Gauss (RBF). De RBF-kernel wordt toegepast om het optimale SVMR-model te bepalen, wat cruciaal is om de meest subtiele strafsetfactor C en kernelparameter gamma (γ) voor de PTE-trainingsgegevens te verkrijgen. Eerst hebben we de trainingsset geëvalueerd en vervolgens de modelprestaties getest op de validatieset. De gebruikte stuurparameter is sigma en de methodewaarde is svmRadial.
Een meervoudig lineair regressiemodel (MLR) is een regressiemodel dat de relatie tussen de responsvariabele en een aantal voorspellende variabelen weergeeft door gebruik te maken van lineaire gepoolde parameters die zijn berekend met behulp van de kleinste-kwadratenmethode. In MLR is een kleinste-kwadratenmodel een voorspellende functie van bodemeigenschappen na selectie van verklarende variabelen. Het is noodzakelijk om de respons te gebruiken om een ​​lineaire relatie tot stand te brengen met behulp van verklarende variabelen. PTE werd gebruikt als de responsvariabele om een ​​lineaire relatie tot stand te brengen met de verklarende variabelen. De MLR-vergelijking is
waarbij y de responsvariabele is, \(a\) het intercept, n het aantal predictoren, \({b}_{1}\) de partiële regressie van de coëfficiënten, \({x}_{ i}\) een predictor of verklarende variabele vertegenwoordigt en \({\varepsilon }_{i}\) de fout in het model vertegenwoordigt, ook wel het residu genoemd.
Gemengde modellen werden verkregen door EBK te sandwichen met SVMR en MLR. Dit wordt gedaan door voorspelde waarden te extraheren uit EBK-interpolatie. De voorspelde waarden verkregen uit de geïnterpoleerde Ca, K en Mg worden verkregen via een combinatorisch proces om nieuwe variabelen te verkrijgen, zoals CaK, CaMg en KMg. De elementen Ca, K en Mg worden vervolgens gecombineerd om een ​​vierde variabele te verkrijgen, CaKMg. In totaal zijn de verkregen variabelen Ca, K, Mg, CaK, CaMg, KMg en CaKMg. Deze variabelen werden onze voorspellers, die hielpen bij het voorspellen van nikkelconcentraties in stedelijke en peri-urbane bodems. Het SVMR-algoritme werd uitgevoerd op de voorspellers om een ​​gemengd model Empirical Bayesian Kriging-Support Vector Machine (EBK_SVM) te verkrijgen. Op dezelfde manier worden variabelen ook door het MLR-algoritme gesluisd om een ​​gemengd model Empirical Bayesian Kriging-Multiple Linear Regression (EBK_MLR) te verkrijgen. Meestal, De variabelen Ca, K, Mg, CaK, CaMg, KMg en CaKMg worden gebruikt als covariaten ter voorspellers van het Ni-gehalte in stedelijke en peri-urbane bodems. Het meest acceptabele model dat is verkregen (EBK_SVM of EBK_MLR) wordt vervolgens gevisualiseerd met behulp van een zelf-organiserende grafiek. De workflow van deze studie wordt weergegeven in Figuur 2.
SeOM is een populair hulpmiddel geworden voor het organiseren, evalueren en voorspellen van gegevens in de financiële sector, gezondheidszorg, industrie, statistiek, bodemkunde en meer. SeOM is gemaakt met behulp van kunstmatige neurale netwerken en niet-gesuperviseerde leermethoden voor de organisatie, evaluatie en voorspelling. In deze studie werd SeOM gebruikt om Ni-concentraties te visualiseren op basis van het beste model voor het voorspellen van Ni in stedelijke en peri-urbane bodems. De gegevens die in de SeOM-evaluatie worden verwerkt, worden gebruikt als n invoerdimensionale vectorvariabelen43,56.Melssen et al. 57 beschrijven de verbinding van een invoervector in een neuraal netwerk via een enkele invoerlaag naar een uitvoervector met een enkele gewichtsvector. De uitvoer die door SeOM wordt gegenereerd, is een tweedimensionale kaart die bestaat uit verschillende neuronen of knooppunten die op basis van hun nabijheid in hexagonale, cirkelvormige of vierkante topologische kaarten zijn geweven. Door kaartgroottes te vergelijken op basis van metrische gegevens, kwantificeringsfout (QE) en topografische fout (TE), wordt het SeOM-model met respectievelijk 0,086 en 0,904 geselecteerd, wat een eenheid van 55 kaarten is (5 × 11). De neuronstructuur wordt bepaald op basis van het aantal knooppunten in de empirische vergelijking
Het aantal in deze studie gebruikte gegevens is 115 monsters. Er werd een willekeurige benadering gebruikt om de gegevens te splitsen in testgegevens (25% voor validatie) en trainingsdatasets (75% voor kalibratie). De trainingsdataset wordt gebruikt om het regressiemodel (kalibratie) te genereren en de testdataset wordt gebruikt om het generalisatievermogen te verifiëren58. Dit werd gedaan om de geschiktheid van verschillende modellen voor het voorspellen van nikkelgehalte in bodems te beoordelen. Alle gebruikte modellen ondergingen een tienvoudig kruisvalidatieproces, dat vijf keer werd herhaald. De variabelen die door EBK-interpolatie worden geproduceerd, worden gebruikt als voorspellers of verklarende variabelen om de doelvariabele (PTE) te voorspellen. Modellering wordt afgehandeld in RStudio met behulp van de pakketten library(Kohonen), library(caret), library(modelr), library(“e1071″), library(“plyr”), library(“caTools”), library(”prospectr”) en libraries(“Metrics”).
Er werden diverse validatieparameters gebruikt om het beste model te bepalen dat geschikt is voor het voorspellen van nikkelconcentraties in de bodem en om de nauwkeurigheid van het model en de validatie ervan te evalueren. Hybridisatiemodellen werden geëvalueerd met behulp van gemiddelde absolute fout (MAE), root mean square error (RMSE) en R-kwadraat of coëfficiëntbepaling (R2). R2 definieert de variantie van de verhoudingen in het antwoord, weergegeven door het regressiemodel. RMSE en variantiegrootte in onafhankelijke metingen beschrijven de voorspellende kracht van het model, terwijl MAE de werkelijke kwantitatieve waarde bepaalt. De R2-waarde moet hoog zijn om het beste mengselmodel te evalueren met behulp van de validatieparameters; hoe dichter de waarde bij 1 ligt, hoe hoger de nauwkeurigheid. Volgens Li et al. 59 wordt een R2-criteriumwaarde van 0,75 of hoger beschouwd als een goede voorspeller; van 0,5 tot 0,75 zijn acceptabele modelprestaties, en lager dan 0,5 zijn onacceptabele modelprestaties. Bij het selecteren van een model met behulp van de RMSE- en MAE-validatiecriteria-evaluatiemethoden waren de laagste verkregen waarden voldoende en werden deze als de beste keuze beschouwd. De volgende vergelijking beschrijft de verificatiemethode.
waarbij n de grootte van de waargenomen waarde voorstelt, \({Y}_{i}\) de gemeten respons voorstelt, en \({\widehat{Y}}_{i}\) ook de voorspelde responswaarde voorstelt, dus voor de eerste i waarnemingen.
Statistische beschrijvingen van predictor- en responsvariabelen worden gepresenteerd in Tabel 1, met gemiddelde, standaarddeviatie (SD), variatiecoëfficiënt (CV), minimum, maximum, kurtosis en scheefheid. De minimum- en maximumwaarden van de elementen staan ​​in afnemende volgorde van respectievelijk Mg < Ca < K < Ni en Ca < Mg < K < Ni. De concentraties van de responsvariabele (Ni) die in het onderzoeksgebied werden bemonsterd, varieerden van 4,86 ​​tot 42,39 mg/kg. Vergelijking van Ni met het wereldgemiddelde (29 mg/kg) en het Europese gemiddelde (37 mg/kg) toonde aan dat het berekende geometrische gemiddelde voor het onderzoeksgebied binnen het toelaatbare bereik lag. Niettemin, zoals aangetoond door Kabata-Pendias11, laat een vergelijking van de gemiddelde nikkelconcentratie (Ni) in het huidige onderzoek met landbouwgronden in Zweden zien dat de huidige gemiddelde nikkelconcentratie hoger is. Evenzo is de gemiddelde concentratie van Frydek Mistek in stedelijke en peri-urbane gronden in het huidige onderzoek (Ni 16,15 mg/kg) was hoger dan de toegestane grenswaarde van 60 (10,2 mg/kg) voor Ni in Poolse stedelijke bodems gerapporteerd door Różański et al. Bovendien registreerden Bretzel en Calderisi61 zeer lage gemiddelde Ni-concentraties (1,78 mg/kg) in stedelijke bodems in Toscane vergeleken met de huidige studie. Jim62 vond ook een lagere nikkelconcentratie (12,34 mg/kg) in stedelijke bodems in Hongkong, wat lager is dan de huidige nikkelconcentratie in deze studie. Birke et al63 rapporteerden een gemiddelde Ni-concentratie van 17,6 mg/kg in een oud mijn- en stedelijk industrieel gebied in Saksen-Anhalt, Duitsland, wat 1,45 mg/kg hoger was dan de gemiddelde Ni-concentratie in het gebied (16,15 mg/kg). Huidig ​​onderzoek. Het overmatige nikkelgehalte in de bodem in sommige stedelijke en voorstedelijke gebieden van het onderzoeksgebied kan voornamelijk worden toegeschreven aan de ijzer- en staalindustrie en de metaalindustrie. Dit is in overeenstemming met de studie van Khodadoust et al. 64 dat de staalindustrie en metaalbewerking de belangrijkste bronnen van nikkelverontreiniging in de bodem zijn. De voorspellers varieerden echter ook van 538,70 mg/kg tot 69,161,80 mg/kg voor Ca, 497,51 mg/kg tot 3535,68 mg/kg voor K en 685,68 mg/kg tot 5970,05 mg/kg voor Mg. Jakovljevic et al. 65 onderzochten het totale Mg- en K-gehalte van de bodem in centraal Servië. Ze ontdekten dat de totale concentraties (respectievelijk 410 mg/kg en 400 mg/kg) lager waren dan de Mg- en K-concentraties van de huidige studie. Niet te onderscheiden: in oostelijk Polen beoordeelden Orzechowski en Smolczynski66 het totale gehalte aan Ca, Mg en K en lieten gemiddelde concentraties zien van Ca (1100 mg/kg), Mg (590 mg/kg) en K (810 mg/kg). Het gehalte in de bovengrond is lager dan het afzonderlijke element in deze studie. Een recente studie door Pongrac et al.67 toonde aan dat het totale Ca-gehalte dat werd geanalyseerd in 3 verschillende bodems in Schotland, VK (Mylnefield-bodem, Balruddery-bodem en Hartwood-bodem) in deze studie een hoger Ca-gehalte aangaf.
Vanwege de verschillende gemeten concentraties van de bemonsterde elementen vertonen de datasetverdelingen van de elementen een verschillende scheefheid. De scheefheid en kurtosis van de elementen varieerden respectievelijk van 1,53 tot 7,24 en van 2,49 tot 54,16. Alle berekende elementen hebben scheefheids- en kurtosisniveaus boven +1, wat aangeeft dat de dataverdeling onregelmatig, scheef in de goede richting en gepiekt is. De geschatte CV's van de elementen laten ook zien dat K, Mg en Ni een matige variabiliteit vertonen, terwijl Ca een extreem hoge variabiliteit heeft. De CV's van K, Ni en Mg verklaren hun uniforme verdeling. Bovendien is de Ca-verdeling niet uniform en kunnen externe bronnen het verrijkingsniveau beïnvloeden.
De correlatie van de voorspellende variabelen met de responselementen duidde op een bevredigende correlatie tussen de elementen (zie Figuur 3). De correlatie gaf aan dat CaK een matige correlatie vertoonde met r-waarde = 0,53, evenals CaNi. Hoewel Ca en K bescheiden verbanden met elkaar vertonen, hebben onderzoekers zoals Kingston et al. 68 en Santo69 suggereren dat hun niveaus in de bodem omgekeerd evenredig zijn. Ca en Mg zijn echter antagonistisch ten opzichte van K, maar CaK correleert goed. Dit kan te wijten zijn aan de toepassing van meststoffen zoals kaliumcarbonaat, dat 56% meer kalium bevat. Kalium was matig gecorreleerd met magnesium (KM r = 0,63). In de meststoffenindustrie zijn deze twee elementen nauw verwant, omdat kaliummagnesiumsulfaat, kaliummagnesiumnitraat en potas worden toegepast op bodems om hun tekortniveaus te verhogen. Nikkel is matig gecorreleerd met Ca, K en Mg met r-waarden = respectievelijk 0,52, 0,63 en 0,55. De relaties met betrekking tot calcium, magnesium en PTE's zoals nikkel zijn complex, maar desalniettemin remt magnesium de calciumabsorptie, vermindert calcium de effecten van overtollig magnesium en verminderen zowel magnesium als calcium de toxische effecten van nikkel in de bodem.
Correlatiematrix voor elementen die de relatie tussen voorspellers en responsen weergeeft (Opmerking: deze afbeelding bevat een spreidingsdiagram tussen elementen, significantieniveaus zijn gebaseerd op p < 0,001).
Figuur 4 illustreert de ruimtelijke verdeling van elementen.Volgens Burgos et al70 is de toepassing van ruimtelijke verdeling een techniek die wordt gebruikt om hotspots in vervuilde gebieden te kwantificeren en te markeren.De verrijkingsniveaus van Ca in figuur 4 zijn te zien in het noordwestelijke deel van de ruimtelijke verdelingskaart.De afbeelding toont matige tot hoge Ca-verrijkingshotspots.De calciumverrijking in het noordwesten van de kaart is waarschijnlijk te wijten aan het gebruik van ongebluste kalk (calciumoxide) om de zuurgraad van de bodem te verminderen en het gebruik ervan in staalfabrieken als alkalische zuurstof in het staalproductieproces.Aan de andere kant geven andere boeren er de voorkeur aan calciumhydroxide te gebruiken in zure bodems om de pH te neutraliseren, wat ook het calciumgehalte van de bodem verhoogt71.Kalium vertoont ook hotspots in het noordwesten en oosten van de kaart.Het noordwesten is een belangrijke landbouwgemeenschap en het matige tot hoge patroon van kalium kan te wijten zijn aan NPK- en kalitoepassingen.Dit is in overeenstemming met andere onderzoeken, zoals Madaras en Lipavský72, Madaras et al.73, Pulkrabová et al.74, Asare et al.75, die opmerkten dat bodemstabilisatie en -behandeling met KCl en NPK resulteerden in een hoog kaliumgehalte in de bodem. Ruimtelijke kaliumverrijking in het noordwesten van de verspreidingskaart kan te wijten zijn aan het gebruik van kaliumhoudende meststoffen zoals kaliumchloride, kaliumsulfaat, kaliumnitraat, potas en kalium om het kaliumgehalte van arme bodems te verhogen. Zádorová et al.76 en Tlustoš et al. 77 gaf aan dat de toepassing van kaliumhoudende meststoffen het kaliumgehalte in de bodem verhoogt en op de lange termijn het gehalte aan voedingsstoffen in de bodem aanzienlijk zal verhogen, met name K en Mg vertonen een hot spot in de bodem. Relatief gematigde hotspots in het noordwesten en het zuidoosten van de kaart. Colloïdale fixatie in de bodem verlaagt de magnesiumconcentratie in de bodem. Een tekort hieraan in de bodem zorgt ervoor dat planten gelige chlorose tussen de nerven vertonen. Magnesiumhoudende meststoffen, zoals kaliummagnesiumsulfaat, magnesiumsulfaat en kieseriet, behandelen tekorten (planten kleuren paars, rood of bruin, wat wijst op een magnesiumtekort) in bodems met een normale pH-waarde6. De ophoping van nikkel op stedelijke en voorstedelijke bodemoppervlakken kan te wijten zijn aan menselijke activiteiten zoals landbouw en het belang van nikkel bij de productie van roestvrij staal78.
Ruimtelijke distributie van elementen [ruimtelijke distributiekaart is gemaakt met ArcGIS Desktop (ESRI, Inc, versie 10.7, URL: https://desktop.arcgis.com).]
De resultaten van de modelprestatie-index voor de in deze studie gebruikte elementen worden weergegeven in Tabel 2. Anderzijds liggen de RMSE en MAE van Ni beide dicht bij nul (0,86 RMSE, -0,08 MAE). Anderzijds zijn zowel de RMSE- als de MAE-waarden van K acceptabel. De RMSE- en MAE-resultaten waren hoger voor calcium en magnesium. De MAE- en RMSE-resultaten van Ca en K zijn groter vanwege verschillende datasets. De RMSE en MAE van deze studie met EBK om Ni te voorspellen, bleken beter te zijn dan de resultaten van John et al. 54 die synergistische kriging gebruikten om S-concentraties in de bodem te voorspellen met dezelfde verzamelde gegevens. De EBK-resultaten die we hebben bestudeerd, correleren met die van Fabijaczyk et al. 41, Yan et al. 79, Beguin et al. 80, Adhikary et al. 81 en John et al. 82, met name K en Ni.
De prestaties van individuele methoden voor het voorspellen van het nikkelgehalte in stedelijke en peri-urbane bodems werden geëvalueerd met behulp van de prestaties van de modellen (tabel 3). Modelvalidatie en nauwkeurigheidsevaluatie bevestigden dat de Ca_Mg_K-voorspeller in combinatie met het EBK SVMR-model de beste prestaties opleverde. Kalibratiemodel Ca_Mg_K-EBK_SVMR model R2, root mean square error (RMSE) en mean absolute error (MAE) waren 0,637 (R2), 95,479 mg/kg (RMSE) en 77,368 mg/kg (MAE) Ca_Mg_K-SVMR was 0,663 (R2), 235,974 mg/kg (RMSE) en 166,946 mg/kg (MAE). Niettemin werden goede R2-waarden verkregen voor Ca_Mg_K-SVMR (0,663 mg/kg R2) en Ca_Mg-EBK_SVMR (0,643 = R2); hun RMSE- en MAE-resultaten waren hoger dan die voor Ca_Mg_K-EBK_SVMR (R2 0,637) (zie Tabel 3). Bovendien zijn de RMSE en MAE van het Ca_Mg-EBK_SVMR-model (RMSE = 1664,64 en MAE = 1031,49) respectievelijk 17,5 en 13,4, wat groter is dan die van het Ca_Mg_K-EBK_SVMR. Evenzo zijn de RMSE en MAE van het Ca_Mg-K SVMR-model (RMSE = 235,974 en MAE = 166,946) respectievelijk 2,5 en 2,2 groter dan die van het Ca_Mg_K-EBK_SVMR-RMSE en -MAE. De berekende RMSE-resultaten geven aan hoe geconcentreerd de dataset is met de lijn van de beste pasvorm. Hogere RSME en MAE waren waargenomen.Volgens Kebonye et al. 46 en John et al. 54 geldt: hoe dichter de RMSE en MAE bij nul liggen, hoe beter de resultaten.SVMR en EBK_SVMR hebben hogere gekwantificeerde RSME- en MAE-waarden.Er werd waargenomen dat de RSME-schattingen consistent hoger waren dan de MAE-waarden, wat wijst op de aanwezigheid van uitschieters.Volgens Legates en McCabe83 wordt de mate waarin de RMSE de gemiddelde absolute fout (MAE) overschrijdt aanbevolen als indicator voor de aanwezigheid van uitschieters.Dit betekent dat hoe heterogener de dataset, hoe hoger de MAE- en RMSE-waarden.De nauwkeurigheid van de kruisvalidatiebeoordeling van het gemengde model Ca_Mg_K-EBK_SVMR voor het voorspellen van het Ni-gehalte in stedelijke en voorstedelijke bodems was 63,70%.Volgens Li et al. 59 is dit nauwkeurigheidsniveau een acceptabele modelprestatieratio.De huidige resultaten worden vergeleken met een eerdere studie van Tarasov et al. 36 waarvan het hybride model MLPRK (Multilayer Perceptron Residual Kriging) creëerde, gerelateerd aan de EBK_SVMR nauwkeurigheidsevaluatie-index gerapporteerd in de huidige studie, RMSE (210) en De MAE (167,5) was hoger dan onze resultaten in de huidige studie (RMSE 95,479, MAE 77,368). Echter, bij vergelijking van de R2 van de huidige studie (0,637) met die van Tarasov et al. 36 (0,544), het is duidelijk dat de determinatiecoëfficiënt (R2) hoger is in dit gemengde model. De foutmarge (RMSE en MAE) (EBK SVMR) voor het gemengde model is twee keer lager. Evenzo registreerden Sergeev et al.34 0,28 (R2) voor het ontwikkelde hybride model (Multilayer Perceptron Residual Kriging), terwijl Ni in de huidige studie 0,637 (R2) registreerde. De voorspellingsnauwkeurigheid van dit model (EBK SVMR) is 63,7%, terwijl de voorspellingsnauwkeurigheid verkregen door Sergeev et al.34 28% is. De uiteindelijke kaart (Fig. 5) die is gemaakt met behulp van het EBK_SVMR-model en Ca_Mg_K als voorspeller, toont voorspellingen van hot spots en matige tot nikkelconcentraties over het gehele onderzoeksgebied. Dit betekent dat de concentratie van nikkel in het onderzoeksgebied voornamelijk matig is, met hogere concentraties in sommige specifieke gebieden.
De uiteindelijke voorspellingskaart wordt weergegeven met behulp van het hybride model EBK_SVMR en met Ca_Mg_K als voorspeller. [De ruimtelijke distributiekaart is gemaakt met RStudio (versie 1.4.1717: https://www.rstudio.com/).]
In figuur 6 worden de PTE-concentraties weergegeven als een compositievlak bestaande uit individuele neuronen. Geen van de componentvlakken vertoonde hetzelfde kleurpatroon als afgebeeld. Het juiste aantal neuronen per getekende kaart is echter 55. SeOM wordt geproduceerd met behulp van een verscheidenheid aan kleuren, en hoe meer de kleurpatronen op elkaar lijken, hoe vergelijkbaarder de eigenschappen van de monsters. Volgens hun precieze kleurenschaal vertoonden individuele elementen (Ca, K en Mg) vergelijkbare kleurpatronen met individuele hoge neuronen en de meeste lage neuronen. CaK en CaMg delen dus enige overeenkomsten met neuronen van zeer hoge orde en lage tot gemiddelde kleurpatronen. Beide modellen voorspellen de concentratie van Ni in de bodem door middel van het weergeven van gemiddelde tot hoge kleurtinten zoals rood, oranje en geel. Het KMg-model toont veel hoge kleurpatronen op basis van precieze verhoudingen en lage tot gemiddelde kleurvlakken. Op een precieze kleurenschaal van laag naar hoog vertoonde het vlakke distributiepatroon van de componenten van het model een hoog kleurpatroon, wat de potentiële concentratie van nikkel in de bodem aangeeft (zie figuur 4). De CakMg Het modelcomponentvlak toont een divers kleurenpatroon van laag tot hoog volgens een nauwkeurige kleurenschaal. Bovendien is de voorspelling van het model van het nikkelgehalte (CakMg) vergelijkbaar met de ruimtelijke verdeling van nikkel die in Afbeelding 5 wordt getoond. Beide grafieken tonen hoge, gemiddelde en lage verhoudingen van nikkelconcentraties in stedelijke en peri-urbane bodems. Afbeelding 7 toont de contourmethode in de k-means-groepering op de kaart, verdeeld in drie clusters op basis van de voorspelde waarde in elk model. De contourmethode vertegenwoordigt het optimale aantal clusters. Van de 115 verzamelde bodemmonsters ontving categorie 1 de meeste bodemmonsters, 74. Cluster 2 ontving 33 monsters, terwijl cluster 3 8 monsters ontving. De combinatie van zeven componenten in het planaire predictor werd vereenvoudigd om een ​​correcte interpretatie van de clusters mogelijk te maken. Vanwege de vele antropogene en natuurlijke processen die de bodemvorming beïnvloeden, is het moeilijk om goed gedifferentieerde clusterpatronen te hebben in een gedistribueerde SeOM-kaart78.
Componentvlakuitvoer per Empirical Bayesian Kriging Support Vector Machine (EBK_SVM_SeOM) variabele. [SeOM-kaarten zijn gemaakt met RStudio (versie 1.4.1717: https://www.rstudio.com/).]
Verschillende componenten voor clusterclassificatie [SeOM-kaarten zijn gemaakt met RStudio (versie 1.4.1717: https://www.rstudio.com/).]
De huidige studie illustreert duidelijk modelleringstechnieken voor nikkelconcentraties in stedelijke en peri-urbane bodems. In de studie werden verschillende modelleringstechnieken getest, waarbij elementen met modelleringstechnieken werden gecombineerd, om de beste manier te verkrijgen om nikkelconcentraties in de bodem te voorspellen. De SeOM-compositievlakke ruimtelijke kenmerken van de modelleringstechniek vertoonden een hoog kleurenpatroon van laag naar hoog op een nauwkeurige kleurenschaal, wat de Ni-concentraties in de bodem aangeeft. De ruimtelijke distributiekaart bevestigt echter de vlakke ruimtelijke distributie van componenten die werd vertoond door EBK_SVMR (zie Afbeelding 5). De resultaten tonen aan dat het support vector machine regressiemodel (Ca Mg K-SVMR) de concentratie van Ni in de bodem voorspelt als een enkel model, maar de validatie- en nauwkeurigheidsevaluatieparameters vertonen zeer hoge fouten in termen van RMSE en MAE. Aan de andere kant is de modelleringstechniek die met het EBK_MLR-model wordt gebruikt ook gebrekkig vanwege de lage waarde van de determinatiecoëfficiënt (R2). Goede resultaten werden verkregen met EBK SVMR en gecombineerde elementen (CaKMg) met lage RMSE- en MAE-fouten met een nauwkeurigheid van 63,7%. Het blijkt dat het combineren van het EBK-algoritme met een algoritme voor machinaal leren een hybride algoritme kan genereren dat de concentratie van PTE's in de bodem kan voorspellen. De resultaten tonen aan dat het gebruik van Ca Mg K als voorspellers om Ni-concentraties in het onderzoeksgebied te voorspellen, de voorspelling van Ni in de bodem kan verbeteren. Dit betekent dat de continue toepassing van nikkelhoudende meststoffen en industriële vervuiling van de bodem door de staalindustrie de neiging heeft om de concentratie van nikkel in de bodem te verhogen. Deze studie toonde aan dat het EBK-model het foutenpercentage kan verminderen en de nauwkeurigheid van het model van de ruimtelijke verdeling van de bodem in stedelijke of peri-urbane bodems kan verbeteren. Over het algemeen stellen we voor om het EBK-SVMR-model toe te passen om PTE in de bodem te beoordelen en te voorspellen; daarnaast stellen we voor om EBK te gebruiken om te hybridiseren met verschillende algoritmen voor machinaal leren. Ni-concentraties werden voorspeld met behulp van elementen als covariaten; het gebruik van meer covariaten zou echter de prestaties van het model aanzienlijk verbeteren, wat kan worden beschouwd als een beperking van het huidige werk. Een andere beperking van deze studie is dat het aantal datasets 115 is. Als er meer gegevens worden verstrekt, kunnen de prestaties van de voorgestelde geoptimaliseerde hybridisatiemethode dus worden verbeterd.
PlantProbs.net.Nikkel in planten en bodem https://plantprobs.net/plant/nutrientImbalances/sodium.html (geraadpleegd op 28 april 2021).
Kasprzak, KS Nikkelvoortgang in de moderne milieutoxicologie.omgeving.toxicologie.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: een overzicht van de bronnen en de milieutoxicologie. Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Invoer van verontreinigende stoffen vanuit de atmosfeer en accumulatie in bodem en vegetatie in de buurt van een nikkel-koperfabriek in Sudbury, Ontario, Canada.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Zware metalen in de bodem, planten en risico's in verband met grazende herkauwers in de buurt van de koper-nikkelmijn Selebi-Phikwe in Botswana.surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Sporenelementen in de bodem en… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (geraadpleegd op 24 november 2020).
Almås, A., Singh, B., Landbouw, TS-NJ van & 1995, undefined.Effecten van de Russische nikkelindustrie op de concentraties van zware metalen in landbouwgronden en grassen in Soer-Varanger, Noorwegen.agris.fao.org.
Nielsen, GD et al.Nikkelabsorptie en -retentie in drinkwater zijn gerelateerd aan voedselconsumptie en nikkelgevoeligheid.toxicology.application.Pharmacodynamics.154, 67–75 (1999).
Costa, M. & Klein, CB Nikkelcarcinogenese, mutatie, epigenetica of selectie. Omgeving. Gezondheidsperspectief. 107, 2 (1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, ​​​​NM; Trendanalyse van potentieel toxische elementen: een bibliometrisch overzicht. Milieugeochemie en gezondheid. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Digitale Bodemkartering: Een korte geschiedenis en enkele lessen. Geoderma 264, 301–311. https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Over digitale bodemkartering.Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistische reservoirmodellering,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (geraadpleegd op 28 april 2021).


Plaatsingstijd: 22-07-2022