Predikcia koncentrácií niklu v prímestských a mestských pôdach pomocou zmiešaného empirického Bayesovského krigingu a regresie Support Vector Machine

Ďakujeme za návštevu stránky Nature.com. Verzia prehliadača, ktorú používate, má obmedzenú podporu pre CSS. Pre dosiahnutie čo najlepšieho zážitku odporúčame používať aktualizovaný prehliadač (alebo vypnúť režim kompatibility v prehliadači Internet Explorer). Medzitým budeme stránku zobrazovať bez štýlov a JavaScriptu, aby sme zabezpečili nepretržitú podporu.
Znečistenie pôdy je veľký problém spôsobený ľudskou činnosťou. Priestorové rozloženie potenciálne toxických prvkov (PTE) sa líši vo väčšine mestských a prímestských oblastí. Preto je ťažké priestorovo predpovedať obsah PTE v takýchto pôdach. Celkovo bolo z Frýdku Místku v Českej republike získaných 115 vzoriek. Koncentrácie vápnika (Ca), horčíka (Mg), draslíka (K) a niklu (Ni) boli stanovené pomocou emisnej spektrometrie s indukčne viazanou plazmou. Odpoveďovou premennou je Ni a prediktormi sú Ca, Mg a K. Korelačná matica medzi odpoveďovou premennou a prediktorovou premennou vykazuje uspokojivú koreláciu medzi prvkami. Výsledky predikcie ukázali, že regresia podporných vektorov (SVMR) fungovala dobre, hoci jej odhadovaná stredná kvadratická chyba (RMSE) (235,974 mg/kg) a stredná absolútna chyba (MAE) (166,946 mg/kg) boli vyššie ako u iných použitých metód. Zmiešané modely pre empirickú Bayesovskú krigingovú viacnásobnú lineárnu regresiu (EBK-MLR) fungujú slabo, o čom svedčí... koeficienty determinácie menšie ako 0,1. Model empirickej Bayesovskej Krigingovej-Support Vector Machine Regression (EBK-SVMR) bol najlepším modelom s nízkymi hodnotami RMSE (95,479 mg/kg) a MAE (77,368 mg/kg) a vysokým koeficientom determinácie (R2 = 0,637). Výstup modelovacej techniky EBK-SVMR je vizualizovaný pomocou samoorganizujúcej sa mapy. Klastrované neuróny v rovine hybridného modelu komponentu CakMg-EBK-SVMR vykazujú viacero farebných vzorov, ktoré predpovedajú koncentrácie Ni v mestských a prímestských pôdach. Výsledky ukazujú, že kombinácia EBK a SVMR je účinnou technikou na predpovedanie koncentrácií Ni v mestských a prímestských pôdach.
Nikel (Ni) sa považuje za mikroživinu pre rastliny, pretože prispieva k fixácii atmosférického dusíka (N) a metabolizmu močoviny, ktoré sú potrebné pre klíčenie semien. Okrem svojho príspevku ku klíčeniu semien môže Ni pôsobiť ako inhibítor húb a baktérií a podporovať vývoj rastlín. Nedostatok niklu v pôde umožňuje rastline absorbovať ho, čo vedie k chloróze listov. Napríklad vigna a zelená fazuľa vyžadujú aplikáciu hnojív na báze niklu na optimalizáciu fixácie dusíka2. Pokračujúca aplikácia hnojív na báze niklu na obohatenie pôdy a zvýšenie schopnosti strukovín fixovať dusík v pôde neustále zvyšuje koncentráciu niklu v pôde. Hoci je nikel mikroživinou pre rastliny, jeho nadmerný príjem do pôdy môže spôsobiť viac škody ako úžitku. Toxicita niklu v pôde minimalizuje pH pôdy a bráni príjmu železa ako základnej živiny pre rast rastlín1. Podľa Liu3 sa zistilo, že Ni je 17. dôležitým prvkom potrebným pre vývoj a rast rastlín. Okrem úlohy niklu vo vývoji a raste rastlín ho ľudia potrebujú pre rôzne aplikácie. Galvanické pokovovanie, výroba zliatin na báze niklu, a výroba zapaľovacích zariadení a zapaľovacích sviečok v automobilovom priemysle vyžadujú použitie niklu v rôznych priemyselných odvetviach. Okrem toho sa zliatiny na báze niklu a galvanicky pokovované výrobky široko používajú v kuchynskom riade, doplnkoch do tanečných sál, potravinárskom priemysle, elektrických zariadeniach, drôtoch a kábloch, prúdových turbínach, chirurgických implantátoch, textíliách a stavbe lodí5. Hladiny bohaté na nikl v pôdach (t. j. povrchových pôdach) sa pripisujú antropogénnym aj prírodným zdrojom, ale nikl je primárne skôr prírodným ako antropogénnym zdrojom4,6. Medzi prírodné zdroje niklu patria sopečné erupcie, vegetácia, lesné požiare a geologické procesy; medzi antropogénne zdroje však patria nikel/kadmiové batérie v oceliarskom priemysle, galvanické pokovovanie, oblúkové zváranie, nafta a vykurovacie oleje a atmosférické emisie zo spaľovania uhlia a spaľovania odpadu a kalov7,8. Podľa Freedmana a Hutchinsona9 a Manyiwy a kol. 10, hlavnými zdrojmi znečistenia ornice v bezprostrednom a susediacom prostredí sú najmä taviarne a bane na báze niklu a medi. Ornica okolo rafinérie niklu a medi Sudbury v Kanade mala najvyššiu úroveň kontaminácie niklom, a to 26 000 mg/kg11. Naproti tomu znečistenie z výroby niklu v Rusku viedlo k vyšším koncentráciám niklu v nórskej pôde11. Podľa Almsa a kol. 12 sa množstvo niklu extrahovateľného HNO3 v najvýznamnejšej ornej pôde regiónu (produkcia niklu v Rusku) pohybovalo od 6,25 do 136,88 mg/kg, čo zodpovedá priemeru 30,43 mg/kg a základnej koncentrácii 25 mg/kg. Podľa Kabaty 11 môže aplikácia fosforových hnojív v poľnohospodárskych pôdach v mestských alebo prímestských pôdach počas po sebe nasledujúcich pestovateľských období presiaknuť alebo kontaminovať pôdu. Potenciálne účinky niklu na ľudí môžu viesť k rakovine prostredníctvom mutagenézy, poškodenia chromozómov, tvorby Z-DNA, blokovanej excíznej opravy DNA alebo epigenetických procesov 13. V pokusoch na zvieratách sa zistilo, že nikel má potenciál spôsobiť rôzne nádory a karcinogénne komplexy niklu môžu takéto nádory zhoršiť.
Hodnotenia kontaminácie pôdy v poslednom období prekvitajú kvôli širokej škále problémov súvisiacich so zdravím vyplývajúcich zo vzťahov medzi pôdou a rastlinami, vzťahov medzi pôdou a pôdnymi biologickými vzťahmi, ekologickej degradácie a hodnotenia vplyvov na životné prostredie. Doteraz bola priestorová predikcia potenciálne toxických prvkov (PTE), ako je Ni, v pôde s použitím tradičných metód prácna a časovo náročná. Príchod digitálneho mapovania pôdy (DSM) a jeho súčasný úspech15 výrazne zlepšili prediktívne mapovanie pôdy (PSM). Podľa Minasnyho a McBratneyho16 sa prediktívne mapovanie pôdy (DSM) ukázalo ako prominentná poddisciplína pôdnej vedy. Lagacherie a McBratney, 2006 definujú DSM ako „vytváranie a napĺňanie priestorových informačných systémov o pôde prostredníctvom použitia in situ a laboratórnych pozorovacích metód a priestorových a nepriestorových inferenčných systémov pôdy“. McBratney a kol. 17 načrtávajú, že súčasný DSM alebo PSM je najefektívnejšou technikou na predpovedanie alebo mapovanie priestorového rozloženia PTE, typov pôdy a vlastností pôdy. Geostatistika a algoritmy strojového učenia (MLA) sú modelovacie techniky DSM, ktoré vytvárajú digitalizované mapy pomocou počítačov s použitím významných a minimálnych údajov.
Deutsch18 a Olea19 definujú geoštatistiku ako „súbor numerických techník, ktoré sa zaoberajú reprezentáciou priestorových atribútov, pričom využívajú najmä stochastické modely, napríklad to, ako analýza časových radov charakterizuje časové dáta.“ Geostatistika zahŕňa predovšetkým vyhodnocovanie variogramov, ktoré umožňujú kvantifikovať a definovať závislosti priestorových hodnôt z každého súboru údajov20. Gumiaux a kol.20 ďalej ilustrujú, že vyhodnocovanie variogramov v geoštatistike je založené na troch princípoch, medzi ktoré patrí (a) výpočet mierky korelácie dát, (b) identifikácia a výpočet anizotropie v disparite súborov údajov a (c) okrem toho, že sa okrem zohľadnenia inherentnej chyby nameraných dát oddelenej od lokálnych efektov odhadujú aj plošné efekty. Na základe týchto konceptov sa v geoštatistike používa mnoho interpolačných techník vrátane všeobecného krigingu, ko-krigingu, bežného krigingu, empirického Bayesovského krigingu, metódy jednoduchého krigingu a ďalších známych interpolačných techník na mapovanie alebo predpovedanie PTE, charakteristík pôdy a typov pôdy.
Algoritmy strojového učenia (MLA) sú relatívne novou technikou, ktorá využíva väčšie nelineárne triedy údajov, poháňané algoritmami primárne používanými na dolovanie údajov, identifikáciu vzorcov v údajoch a opakovane aplikovanými na klasifikáciu vo vedeckých oblastiach, ako je pôdna veda a úlohy návratu. Početné výskumné práce sa spoliehajú na modely MLA na predpovedanie PTE v pôde, ako napríklad Tan a kol. 22 (náhodné lesy na odhad ťažkých kovov v poľnohospodárskych pôdach), Sakizadeh a kol. 23 (modelovanie pomocou podporných vektorových strojov a umelých neurónových sietí) znečistenie pôdy). Okrem toho Vega a kol. 24 (CART na modelovanie retencie a adsorpcie ťažkých kovov v pôde), Sun a kol. 25 (aplikácia kubistického modelu na rozloženie Cd v pôde) a ďalšie algoritmy, ako napríklad k-najbližší sused, zovšeobecnená zosilnená regresia a zosilnené regresné stromy, tiež aplikovali MLA na predpovedanie PTE v pôde.
Aplikácia algoritmov DSM v predikcii alebo mapovaní čelí niekoľkým výzvam. Mnohí autori sa domnievajú, že MLA je lepšia ako geoštatistika a naopak. Hoci jeden je lepší ako druhý, kombinácia oboch zlepšuje úroveň presnosti mapovania alebo predikcie v DSM15. Woodcock a Gopal26 Finke27; Pontius a Cheuk28 a Grunwald29 komentujú nedostatky a niektoré chyby v predpovedanom mapovaní pôdy. Pôdovedci vyskúšali rôzne techniky na optimalizáciu efektívnosti, presnosti a predvídateľnosti mapovania a predikcie DSM. Kombinácia neistoty a overovania je jedným z mnohých rôznych aspektov integrovaných do DSM s cieľom optimalizovať efektívnosť a znížiť chyby. Agyeman a kol.15 však naznačujú, že správanie pri validácii a neistota zavedené tvorbou mapy a predikciou by mali byť nezávisle validované, aby sa zlepšila kvalita mapy. Obmedzenia DSM sú spôsobené geograficky rozptýlenou kvalitou pôdy, ktorá zahŕňa zložku neistoty; Nedostatok istoty v DSM však môže vyplývať z viacerých zdrojov chýb, a to z kovariantnej chyby, chyby modelu, chyby lokalizácie a analytickej chyby 31. Nepresnosti modelovania spôsobené MLA a geoštatistickými procesmi sú spojené s nedostatkom pochopenia, čo v konečnom dôsledku vedie k zjednodušeniu skutočného procesu 32. Bez ohľadu na povahu modelovania možno nepresnosti pripísať parametrom modelovania, predpovediam matematického modelu alebo interpolácii 33. Nedávno sa objavil nový trend DSM, ktorý podporuje integráciu geoštatistiky a MLA do mapovania a prognózovania. Niekoľko pôdovedcov a autorov, ako napríklad Sergeev a kol. 34; Subbotina a kol. 35; Tarasov a kol. 36 a Tarasov a kol. 37, využili presnú kvalitu geoštatistiky a strojového učenia na generovanie hybridných modelov, ktoré zlepšujú efektivitu prognózovania a mapovania. kvalita. Niektoré z týchto hybridných alebo kombinovaných algoritmických modelov sú kriging s využitím umelých neurónových sietí (ANN-RK), viacvrstvový perceptrónový reziduálny kriging (MLP-RK), zovšeobecnený regresný neurónový reziduálny kriging s využitím zovšeobecnených regresných neurónových sietí (GR-NNRK)36, kriging s využitím umelých neurónových sietí a viacvrstvového perceptrónu (ANN-K-MLP)37 a ko-kriging a gaussovská procesná regresia38.
Podľa Sergeeva a kol. má kombinácia rôznych modelovacích techník potenciál eliminovať nedostatky a zvýšiť efektivitu výsledného hybridného modelu, a nie vyvíjať jeho jediný model. V tejto súvislosti tento nový článok tvrdí, že je potrebné použiť kombinovaný algoritmus geoštatistiky a MLA na vytvorenie optimálnych hybridných modelov na predpovedanie obohatenia Ni v mestských a prímestských oblastiach. Táto štúdia sa bude opierať o empirický Bayesovský kriging (EBK) ako základný model a skombinovať ho s modelmi Support Vector Machine (SVM) a Multiple Linear Regression (MLR). Hybridizácia EBK s akýmkoľvek MLA nie je známa. Viaceré pozorované zmiešané modely sú kombináciami bežného, ​​reziduálneho, regresného krigingu a MLA. EBK je geoštatistická interpolačná metóda, ktorá využíva priestorovo stochastický proces, ktorý je lokalizovaný ako nestacionárne/stacionárne náhodné pole s definovanými lokalizačnými parametrami nad poľom, čo umožňuje priestorovú variáciu39. EBK sa používa v rôznych štúdiách vrátane analýzy distribúcie organického uhlíka v poľnohospodárskych pôdach40, hodnotenia znečistenia pôdy41 a mapovania vlastností pôdy42.
Na druhej strane, samoorganizujúci sa graf (SeOM) je algoritmus učenia, ktorý bol aplikovaný v rôznych článkoch, ako napríklad Li a kol. 43, Wang a kol. 44, Hossain Bhuiyan a kol. 45 a Kebonye a kol. 46. Určenie priestorových atribútov a zoskupenia prvkov. Wang a kol. 44 načrtávajú, že SeOM je výkonná technika učenia známa svojou schopnosťou zoskupovať a predstavovať si nelineárne problémy. Na rozdiel od iných techník rozpoznávania vzorov, ako je analýza hlavných komponentov, fuzzy klastrovanie, hierarchické klastrovanie a viackriteriálne rozhodovanie, SeOM je lepší v organizovaní a identifikácii PTE vzorov. Podľa Wanga a kol. 44 dokáže SeOM priestorovo zoskupiť rozloženie súvisiacich neurónov a poskytnúť vizualizáciu údajov s vysokým rozlíšením. SeOM vizualizuje predikčné údaje Ni, aby získal najlepší model na charakterizáciu výsledkov pre priamu interpretáciu.
Cieľom tejto práce je vytvoriť robustný mapovací model s optimálnou presnosťou na predpovedanie obsahu niklu v mestských a prímestských pôdach. Predpokladáme, že spoľahlivosť zmiešaného modelu závisí najmä od vplyvu iných modelov pripojených k základnému modelu. Uvedomujeme si výzvy, ktorým čelí DSM, a hoci sa tieto výzvy riešia na viacerých frontoch, kombinácia pokrokov v geoštatistike a modeloch MLA sa javí ako postupná; preto sa pokúsime odpovedať na výskumné otázky, ktoré môžu viesť k zmiešaným modelom. Aký presný je však model pri predpovedaní cieľového prvku? Aká je tiež úroveň hodnotenia účinnosti na základe validácie a hodnotenia presnosti? Preto boli špecifickými cieľmi tejto štúdie (a) vytvoriť kombinovaný zmiešaný model pre SVMR alebo MLR s použitím EBK ako základného modelu, (b) porovnať výsledné modely, (c) navrhnúť najlepší zmiešaný model na predpovedanie koncentrácií Ni v mestských alebo prímestských pôdach a (d) aplikácia SeOM na vytvorenie mapy priestorových variácií niklu s vysokým rozlíšením.
Štúdia sa realizuje v Českej republike, konkrétne v okrese Frýdek Místek v Moravskosliezskom kraji (pozri obrázok 1). Geografia študovanej oblasti je veľmi členitá a prevažne je súčasťou regiónu Moravskosliezske Beskydy, ktorý je súčasťou vonkajšieho okraja Karpát. Študovaná oblasť sa nachádza medzi 49° 41′ 0′ s. š. a 18° 20′ 0′ v. d. a nadmorská výška je medzi 225 a 327 m; Klasifikačný systém Koppena pre klimatický stav regiónu je však hodnotený ako Cfb = mierne oceánske podnebie. Aj v suchých mesiacoch je veľa zrážok. Teploty sa počas roka mierne líšia medzi -5 °C a 24 °C, zriedka klesajú pod -14 °C alebo nad 30 °C, zatiaľ čo priemerný ročný úhrn zrážok je medzi 685 a 752 mm47. Odhadovaná plocha prieskumu celej oblasti je 1 208 kilometrov štvorcových, pričom 39,38 % obrábanej pôdy a 49,36 % lesov. Na druhej strane, plocha použitá v tejto štúdii je približne 889,8 kilometrov štvorcových. V Ostrave a jej okolí je veľmi aktívny oceliarsky priemysel a kovospracujúci závod. Potenciálnymi výskumnými zdrojmi niklu v regióne sú kovospracujúce závody, oceliarsky priemysel, kde sa nikel používa v nehrdzavejúcich oceliach (napr. pre odolnosť voči atmosférickej korózii) a legovaných oceliach (nikel zvyšuje pevnosť zliatiny a zároveň si zachováva jej dobrú ťažnosť a húževnatosť), a intenzívne poľnohospodárstvo, ako je aplikácia fosfátových hnojív a živočíšna výroba. (napr. pridávanie niklu jahňatám na zvýšenie rýchlosti rastu jahniat a dobytka s nízkym kŕmením). Medzi ďalšie priemyselné využitie niklu vo výskumných oblastiach patrí jeho použitie pri galvanickom pokovovaní, vrátane galvanického pokovovania niklom a procesov bezprúdového niklovania. Vlastnosti pôdy sa dajú ľahko odlíšiť od farby, štruktúry a obsahu uhličitanov. Textúra pôdy je stredná až jemná, odvodená od materského materiálu. Pôdy sú koluviálneho, aluviálneho alebo eolického charakteru. Niektoré pôdne oblasti sa javia ako škvrnité na povrchu aj v podloží, často s betónom a bielením. Kambisoly a stagnosoly sú však najbežnejšími typmi pôdy v regióne48. S nadmorskou výškou od 455,1 do 493,5 m dominujú v Českej republike49.
Mapa študijnej oblasti [Mapa študijnej oblasti bola vytvorená pomocou ArcGIS Desktop (ESRI, Inc, verzia 10.7, URL: https://desktop.arcgis.com).]
Celkovo bolo odobratých 115 vzoriek ornice z mestských a prímestských pôd v okrese Frýdek Místek. Použitý vzor vzoriek bol pravidelná mriežka so vzorkami pôdy rozmiestnenými 2 × 2 km od seba a ornica bola meraná v hĺbke 0 až 20 cm pomocou ručného GPS zariadenia (Leica Zeno 5 GPS). Vzorky sú zabalené vo vreckách Ziploc, riadne označené a odoslané do laboratória. Vzorky boli sušené na vzduchu, čím sa získali práškové vzorky, rozomleté ​​mechanickým systémom (kotúčový mlyn Fritsch) a preosiate (veľkosť sita 2 mm). 1 gram sušených, homogenizovaných a preosiatych vzoriek pôdy sa umiestni do jasne označených teflónových fliaš. Do každej teflónovej nádoby sa dávkuje 7 ml 35 % HCl a 3 ml 65 % HNO3 (pomocou automatického dávkovača – jeden pre každú kyselinu), vzorky sa zľahka prikryjú a nechajú sa cez noc stáť, aby došlo k reakcii (program lúčavka kráľovská). Supernatant sa umiestni na horúcu kovovú platňu (teplota: 100 W). a 160 °C) počas 2 hodín, aby sa uľahčil proces trávenia vzoriek, potom sa ochlaďte. Supernatant sa prenesie do 50 ml odmernej banky a zriedi sa na 50 ml deionizovanou vodou. Potom sa zriedený supernatant prefiltruje do 50 ml PVC skúmavky s deionizovanou vodou. Okrem toho sa 1 ml riediaceho roztoku zriedi 9 ml deionizovanej vody a prefiltruje sa do 12 ml skúmavky pripravenej na pseudokoncentráciu PTE. Koncentrácie PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) sa stanovia pomocou ICP-OES (optická emisná spektroskopia s indukčne viazanou plazmou) (Thermo Fisher Scientific, USA) podľa štandardných metód a dohody. Postupy zabezpečenia a kontroly kvality (QA/QC) (SRM NIST 2711a Montana II Soil). PTE s detekčnými limitmi pod polovicou boli z tejto štúdie vylúčené. Detekčný limit PTE použitého v tejto štúdii bol 0,0004 (vy). Okrem toho je proces kontroly a zabezpečenia kvality pre každú analýzu zabezpečený analýzou referenčných štandardov. Aby sa minimalizovali chyby, vykonala sa dvojitá analýza.
Empirický Bayesovský kriging (EBK) je jednou z mnohých geoštatistických interpolačných techník používaných pri modelovaní v rôznych oblastiach, ako je napríklad pôdovedstvo. Na rozdiel od iných krigových interpolačných techník sa EBK líši od tradičných krigových metód tým, že zohľadňuje chybu odhadnutú modelom semivariogramu. Pri interpolácii EBK sa počas interpolácie vypočíta niekoľko modelov semivariogramu, a nie jeden semivariogram. Interpolačné techniky odstraňujú neistotu a programovanie spojené s vykreslením semivariogramu, ktoré predstavuje veľmi zložitú súčasť postačujúcej krigingovej metódy. Interpolačný proces EBK sa riadi tromi kritériami navrhnutými Krivoruchkom50: (a) model odhaduje semivariogram zo vstupného súboru údajov, (b) nová predpovedaná hodnota pre každé umiestnenie vstupného súboru údajov na základe vygenerovaného semivariogramu a (c) konečný model A sa vypočíta zo simulovaného súboru údajov. Bayesovské pravidlo rovnice je dané ako posteriórna
Kde \(Prob\left(A\right)\) predstavuje apriórnu pravdepodobnosť, \(Prob\left(B\right)\) marginálna pravdepodobnosť sa vo väčšine prípadov ignoruje, \(Prob(B,A)\). Výpočet semivariogramu je založený na Bayesovom pravidle, ktoré ukazuje tendenciu vytvárať súbory údajov z pozorovaní zo semivariogramov. Hodnota semivariogramu sa potom určí pomocou Bayesovho pravidla, ktoré uvádza, aká je pravdepodobnosť vytvorenia súboru údajov z pozorovaní zo semivariogramu.
Stroj s podpornými vektormi je algoritmus strojového učenia, ktorý generuje optimálnu oddeľujúcu nadrovinu na rozlíšenie identických, ale nie lineárne nezávislých tried. Vapnik51 vytvoril algoritmus klasifikácie zámerov, ale nedávno sa používa na riešenie problémov orientovaných na regresiu. Podľa Li a kol.52 je SVM jednou z najlepších klasifikačných techník a používa sa v rôznych oblastiach. V tejto analýze bola použitá regresná zložka SVM (Support Vector Machine Regression – SVMR). Cherkassky a Mulier53 boli priekopníkmi SVMR ako regresie založenej na jadre, ktorej výpočet sa vykonal pomocou lineárneho regresného modelu s priestorovými funkciami pre viac krajín. John a kol.54 uvádzajú, že modelovanie SVMR využíva lineárnu regresiu nadroviny, ktorá vytvára nelineárne vzťahy a umožňuje priestorové funkcie. Podľa Vohlanda a kol. 55, epsilon (ε)-SVMR používa trénovaný súbor údajov na získanie modelu reprezentácie ako funkcie necitlivej na epsilon, ktorá sa aplikuje na nezávislé mapovanie údajov s najlepším epsilonovým odchýlením z trénovania na korelovaných údajoch. Prednastavená chyba vzdialenosti sa ignoruje zo skutočnej hodnoty a ak je chyba väčšia ako ε(ε), vlastnosti pôdy ju kompenzujú. Model tiež redukuje zložitosť trénovacích údajov na širšiu podmnožinu podporných vektorov. Rovnica navrhnutá Vapnikom51 je uvedená nižšie.
kde b predstavuje skalárny prah, \(K(x}_{,}{x}_{k})\) predstavuje jadrovú funkciu, \(alpha\) predstavuje Lagrangeov multiplikátor, N predstavuje numerický súbor údajov, \(x}_{k}\) predstavuje vstupné údaje a \(y\) je výstupné údaje. Jedným z kľúčových použitých jadier je operácia SVMR, čo je Gaussova radiálna bázová funkcia (RBF). Jadro RBF sa používa na určenie optimálneho modelu SVMR, ktorý je kritický pre získanie najjemnejšieho faktora penalizácie C a parametra jadra gama (γ) pre trénovacie údaje PTE. Najprv sme vyhodnotili trénovaciu množinu a potom sme otestovali výkon modelu na validačnej množine. Použitý parameter riadenia je sigma a hodnota metódy je svmRadial.
Viacnásobný lineárny regresný model (MLR) je regresný model, ktorý predstavuje vzťah medzi odozvou a viacerými prediktorovými premennými pomocou lineárnych združených parametrov vypočítaných metódou najmenších štvorcov. V MLR je model najmenších štvorcov prediktívnou funkciou vlastností pôdy po výbere vysvetľujúcich premenných. Na stanovenie lineárneho vzťahu s použitím vysvetľujúcich premenných je potrebné použiť odozvu. PTE sa použila ako odozvová premenná na stanovenie lineárneho vzťahu s vysvetľujúcimi premennými. Rovnica MLR je
kde y je odozvová premenná, \(a\) je priesečník, n je počet prediktorov, \({b}_{1}\) je parciálna regresia koeficientov, \({x}_{ i}\) predstavuje prediktor alebo vysvetľujúcu premennú a \({\varepsilon}_{i}\) predstavuje chybu v modeli, tiež známu ako rezíduum.
Zmiešané modely boli získané sendvičovaním EBK s SVMR a MLR. Toto sa dosiahne extrakciou predpovedaných hodnôt z interpolácie EBK. Predpovedané hodnoty získané z interpolovaných Ca, K a Mg sa získajú kombinatorickým procesom, aby sa získali nové premenné, ako napríklad CaK, CaMg a KMg. Prvky Ca, K a Mg sa potom skombinujú, aby sa získala štvrtá premenná, CaKMg. Celkovo sú získané premenné Ca, K, Mg, CaK, CaMg, KMg a CaKMg. Tieto premenné sa stali našimi prediktormi, ktoré pomáhajú predpovedať koncentrácie niklu v mestských a prímestských pôdach. Na prediktoroch bol vykonaný algoritmus SVMR, aby sa získal zmiešaný model empirického Bayesovského krigingu s podpornými vektormi (EBK_SVM). Podobne sa premenné prenášajú aj cez algoritmus MLR, aby sa získal zmiešaný model empirického Bayesovského krigingu s viacnásobnou lineárnou regresiou (EBK_MLR). Premenné Ca, K, Mg, CaK, CaMg, KMg a CaKMg sa používajú ako kovarianty prediktorov obsahu Ni v mestských a prímestských pôdach. Získaný najprijateľnejší model (EBK_SVM alebo EBK_MLR) sa potom vizualizuje pomocou samoorganizujúceho sa grafu. Pracovný postup tejto štúdie je znázornený na obrázku 2.
Používanie SeOM sa stalo populárnym nástrojom na organizáciu, hodnotenie a predpovedanie údajov vo finančnom sektore, zdravotníctve, priemysle, štatistike, pôdovede a ďalších oblastiach. SeOM je vytvorený pomocou umelých neurónových sietí a metód neriadeného učenia na organizáciu, hodnotenie a predpovedanie. V tejto štúdii bol SeOM použitý na vizualizáciu koncentrácií Ni na základe najlepšieho modelu na predpovedanie Ni v mestských a prímestských pôdach. Údaje spracované pri hodnotení SeOM sa používajú ako n vstupných rozmerových vektorových premenných43,56.Melssen a kol. 57 opisuje prepojenie vstupného vektora do neurónovej siete cez jednu vstupnú vrstvu s výstupným vektorom s jedným váhovým vektorom. Výstup generovaný SeOM je dvojrozmerná mapa pozostávajúca z rôznych neurónov alebo uzlov votkaných do šesťuholníkových, kruhových alebo štvorcových topologických máp podľa ich blízkosti. Porovnaním veľkostí máp na základe metriky, chyby kvantizácie (QE) a topografickej chyby (TE) sa vyberie model SeOM s 0,086 a 0,904, čo je jednotka s 55 mapami (5 × 11). Štruktúra neurónov sa určí podľa počtu uzlov v empirickej rovnici.
V tejto štúdii bolo použitých 115 vzoriek údajov. Na rozdelenie údajov na testovacie údaje (25 % na validáciu) a trénovacie súbory údajov (75 % na kalibráciu) bol použitý náhodný prístup. Tréningový súbor údajov sa používa na generovanie regresného modelu (kalibrácia) a testovací súbor údajov sa používa na overenie schopnosti zovšeobecnenia58. Toto sa vykonalo s cieľom posúdiť vhodnosť rôznych modelov na predpovedanie obsahu niklu v pôdach. Všetky použité modely prešli desaťnásobným procesom krížovej validácie, ktorý sa opakoval päťkrát. Premenné vytvorené interpoláciou EBK sa používajú ako prediktory alebo vysvetľujúce premenné na predpovedanie cieľovej premennej (PTE). Modelovanie sa vykonáva v programe RStudio pomocou balíkov library(Kohonen), library(caret), library(modelr), library(„e1071″), library(„plyr“), library(„caTools“), library(„prospectr“) a libraries („Metrics“).
Na určenie najlepšieho modelu vhodného na predpovedanie koncentrácií niklu v pôde a na vyhodnotenie presnosti modelu a jeho validácie boli použité rôzne validačné parametre. Hybridizačné modely boli vyhodnotené pomocou strednej absolútnej chyby (MAE), strednej kvadratickej chyby (RMSE) a R-kvadrát alebo určenia koeficientu (R2). R2 definuje rozptyl podielov vo výsledku, reprezentovaný regresným modelom. RMSE a veľkosť rozptylu v nezávislých mierach opisujú prediktívnu silu modelu, zatiaľ čo MAE určuje skutočnú kvantitatívnu hodnotu. Hodnota R2 musí byť vysoká, aby sa pomocou validačných parametrov dal vyhodnotiť najlepší model zmesi, čím bližšie je hodnota k 1, tým vyššia je presnosť. Podľa Li a kol. 59 sa hodnota kritéria R2 0,75 alebo vyššia považuje za dobrý prediktor; od 0,5 do 0,75 je prijateľný výkon modelu a pod 0,5 je neprijateľný výkon modelu. Pri výbere modelu pomocou metód hodnotenia validačných kritérií RMSE a MAE boli nižšie získané hodnoty postačujúce a považovali sa za najlepšiu voľbu. Nasledujúca rovnica opisuje metódu overovania.
kde n predstavuje veľkosť pozorovanej hodnoty\({Y}_{i}\) predstavuje nameranú odozvu a \({\widehat{Y}}_{i}\) tiež predstavuje predpokladanú hodnotu odozvy, teda pre prvých i pozorovaní.
Štatistické popisy prediktorových a odozvových premenných sú uvedené v tabuľke 1, ktorá zobrazuje priemer, štandardnú odchýlku (SD), variačný koeficient (CV), minimum, maximum, špicatosť a šikmosť. Minimálne a maximálne hodnoty prvkov sú v zostupnom poradí podľa Mg < Ca < K < Ni a Ca < Mg < K < Ni. Koncentrácie odozvovej premennej (Ni) odobraté zo skúmanej oblasti sa pohybovali od 4,86 ​​do 42,39 mg/kg. Porovnanie Ni so svetovým priemerom (29 mg/kg) a európskym priemerom (37 mg/kg) ukázalo, že celkový vypočítaný geometrický priemer pre skúmanú oblasť bol v rámci tolerovateľného rozsahu. Napriek tomu, ako ukázal Kabata-Pendias11, porovnanie priemernej koncentrácie niklu (Ni) v súčasnej štúdii s poľnohospodárskymi pôdami vo Švédsku ukazuje, že súčasná priemerná koncentrácia niklu je vyššia. Podobne bola priemerná koncentrácia Frýdku Místku v mestských a prímestských pôdach v súčasnej štúdii (Ni 16,15 mg/kg) vyššia ako povolená hodnota. limit 60 (10,2 mg/kg) pre Ni v poľských mestských pôdach, ktorý uvádzajú Różański a kol. Okrem toho Bretzel a Calderisi61 zaznamenali veľmi nízke priemerné koncentrácie Ni (1,78 mg/kg) v mestských pôdach v Toskánsku v porovnaní so súčasnou štúdiou. Jim62 tiež zistil nižšiu koncentráciu niklu (12,34 mg/kg) v mestských pôdach Hongkongu, ktorá je nižšia ako súčasná koncentrácia niklu v tejto štúdii. Birke a kol.63 uviedli priemernú koncentráciu Ni 17,6 mg/kg v starej banskej a mestskej priemyselnej oblasti v Sasku-Anhaltsku v Nemecku, ktorá bola o 1,45 mg/kg vyššia ako priemerná koncentrácia Ni v oblasti (16,15 mg/kg). Súčasný výskum. Nadmerný obsah niklu v pôdach v niektorých mestských a prímestských oblastiach študovanej oblasti možno pripísať najmä železiarskemu a oceliarskemu priemyslu a kovospracujúcemu priemyslu. To je v súlade so štúdiou Khodadousta a kol. 64, že oceliarsky priemysel a kovoobrábanie sú hlavnými zdrojmi kontaminácie niklom v pôde. Prediktory sa však pohybovali aj od 538,70 mg/kg do 69 161,80 mg/kg pre Ca, od 497,51 mg/kg do 3 535,68 mg/kg pre K a od 685,68 mg/kg do 5 970,05 mg/kg pre Mg. Jakovljevic a kol. 65 skúmali celkový obsah Mg a K v pôdach v strednom Srbsku. Zistili, že celkové koncentrácie (410 mg/kg a 400 mg/kg) boli nižšie ako koncentrácie Mg a K v súčasnej štúdii. Na rozdiel od toho, vo východnom Poľsku Orzechowski a Smolczynski66 hodnotili celkový obsah Ca, Mg a K a ukázali priemerné koncentrácie Ca (1100 mg/kg), Mg (590 mg/kg) a K (810 mg/kg). Obsah v ornici je nižší ako u jednotlivých prvkov v tejto štúdii. Nedávna štúdia Pongraca a kol.67 ukázala, že celkový obsah Ca analyzovaný v 3 rôznych pôdach v Škótsku, Veľkej Británii (pôda Mylnefield, pôda Balruddery a pôda Hartwood) naznačoval vyšší obsah Ca v tejto štúdii.
V dôsledku rôznych nameraných koncentrácií vzorkovaných prvkov vykazujú distribúcie prvkov v súboroch údajov rôznu skewness (šikmosť). Šikmosť a špicatosť prvkov sa pohybovali od 1,53 do 7,24 a od 2,49 do 54,16. Všetky vypočítané prvky majú úrovne skewness a špicatosti nad +1, čo naznačuje, že distribúcia údajov je nepravidelná, skreslená správnym smerom a má vrcholy. Odhadované variačné koeficienty prvkov tiež ukazujú, že K, Mg a Ni vykazujú miernu variabilitu, zatiaľ čo Ca má extrémne vysokú variabilitu. Variabilné koeficienty K, Ni a Mg vysvetľujú ich rovnomerné rozloženie. Okrem toho je distribúcia Ca nerovnomerná a externé zdroje môžu ovplyvniť úroveň jej obohatenia.
Korelácia prediktorových premenných s prvkami odozvy naznačila uspokojivú koreláciu medzi prvkami (pozri obrázok 3). Korelácia ukázala, že CaK vykazoval miernu koreláciu s hodnotou r = 0,53, rovnako ako CaNi. Hoci Ca a K vykazujú mierne vzájomné súvislosti, výskumníci ako Kingston a kol. 68 a Santo69 naznačujú, že ich hladiny v pôde sú nepriamo úmerné. Avšak Ca a Mg sú antagonistické voči K, ale CaK dobre koreluje. Môže to byť spôsobené aplikáciou hnojív, ako je uhličitan draselný, ktorý má o 56 % vyšší obsah draslíka. Draslík mierne koreloval s horčíkom (KM r = 0,63). V priemysle hnojív sú tieto dva prvky úzko prepojené, pretože síran draselno-horečnatý, dusičnan draselno-horečnatý a potaš sa aplikujú do pôdy na zvýšenie ich nedostatku. Nikel mierne koreluje s Ca, K a Mg s hodnotami r = 0,52, 0,63 a 0,55. Vzťahy medzi vápnikom, horčíkom a PTE, ako je nikel, sú zložité, ale horčík napriek tomu inhibuje absorpciu vápnika, vápnik znižuje účinky nadbytku horčíka a horčík aj vápnik znižujú toxické účinky niklu v pôde.
Korelačná matica pre prvky znázorňujúca vzťah medzi prediktormi a reakciami (Poznámka: tento obrázok obsahuje bodový graf medzi prvkami, hladiny významnosti sú založené na p < 0,001).
Obrázok 4 znázorňuje priestorové rozloženie prvkov. Podľa Burgosa a kol.70 je aplikácia priestorového rozloženia technikou používanou na kvantifikáciu a zvýraznenie horúcich miest v znečistených oblastiach. Úrovne obohatenia Ca na obr. 4 možno vidieť v severozápadnej časti mapy priestorového rozloženia. Obrázok zobrazuje horúce miesta so stredným až vysokým obohatením Ca. Obohatenie vápnikom na severozápade mapy je pravdepodobne spôsobené používaním páleného vápna (oxidu vápenatého) na zníženie kyslosti pôdy a jeho používaním v oceliarňach ako alkalického kyslíka v procese výroby ocele. Na druhej strane, iní poľnohospodári uprednostňujú používanie hydroxidu vápenatého v kyslých pôdach na neutralizáciu pH, čo tiež zvyšuje obsah vápnika v pôde71. Draslík tiež zobrazuje horúce miesta na severozápade a východe mapy. Severozápad je významnou poľnohospodárskou komunitou a stredne vysoký až vysoký obsah draslíka môže byť spôsobený aplikáciou NPK a potaše. To je v súlade s inými štúdiami, ako napríklad Madaras a Lipavský72, Madaras a kol.73, Pulkrabová a kol.74, Asare a kol.75, ktorí pozorovali, že stabilizácia pôdy a Ošetrenie KCl a NPK viedlo k vysokému obsahu K v pôde. Priestorové obohatenie draslíka na severozápade mapy rozšírenia môže byť spôsobené používaním hnojív na báze draslíka, ako je chlorid draselný, síran draselný, dusičnan draselný, potaš a potaš, na zvýšenie obsahu draslíka v chudobných pôdach. Zádorová a kol. 76 a Tlustoš a kol. 77 načrtla, že aplikácia hnojív na báze draslíka zvýšila obsah draslíka v pôde a z dlhodobého hľadiska by významne zvýšila obsah živín v pôde, najmä draslík a horčík, ktoré vykazujú v pôde kritické miesto. Relatívne mierne kritické miesta sa nachádzajú na severozápade mapy a juhovýchode mapy. Koloidná fixácia v pôde znižuje koncentráciu horčíka v pôde. Jeho nedostatok v pôde spôsobuje, že rastliny vykazujú žltkastú medzižilkovú chlorózu. Hnojivá na báze horčíka, ako je síran draselno-horečnatý, síran horečnatý a kieserit, liečia nedostatky (rastliny sa javia fialové, červené alebo hnedé, čo naznačuje nedostatok horčíka) v pôdach s normálnym rozsahom pH6. Hromadenie niklu na povrchu pôdy v mestských a prímestských oblastiach môže byť spôsobené antropogénnymi činnosťami, ako je poľnohospodárstvo, a dôležitosťou niklu pri výrobe nehrdzavejúcej ocele78.
Priestorové rozloženie prvkov [mapa priestorového rozloženia bola vytvorená pomocou ArcGIS Desktop (ESRI, Inc, verzia 10.7, URL: https://desktop.arcgis.com).]
Výsledky indexu výkonnosti modelu pre prvky použité v tejto štúdii sú uvedené v tabuľke 2. Na druhej strane, RMSE a MAE Ni sú blízke nule (0,86 RMSE, -0,08 MAE). Na druhej strane, hodnoty RMSE aj MAE K sú prijateľné. Výsledky RMSE a MAE boli vyššie pre vápnik a horčík. Výsledky MAE a RMSE Ca a K sú vyššie kvôli rôznym súborom údajov. RMSE a MAE tejto štúdie s použitím EBK na predikciu Ni sa ukázali byť lepšie ako výsledky Johna a kol. 54 s použitím synergického krigingu na predikciu koncentrácií S v pôde s použitím rovnakých zozbieraných údajov. Výstupy EBK, ktoré sme študovali, korelujú s výsledkami Fabijaczyka a kol. 41, Yana a kol. 79, Beguina a kol. 80, Adhikaryho a kol. 81 a Johna a kol. 82, najmä K a Ni.
Výkonnosť jednotlivých metód na predpovedanie obsahu niklu v mestských a prímestských pôdach bola vyhodnotená pomocou výkonnosti modelov (Tabuľka 3). Validácia modelu a vyhodnotenie presnosti potvrdili, že prediktor Ca_Mg_K v kombinácii s modelom EBK SVMR priniesol najlepší výkon. Kalibračný model Ca_Mg_K-EBK_SVMR R2, stredná kvadratická chyba (RMSE) a stredná absolútna chyba (MAE) boli 0,637 (R2), 95,479 mg/kg (RMSE) a 77,368 mg/kg (MAE). Ca_Mg_K-SVMR bol 0,663 (R2), 235,974 mg/kg (RMSE) a 166,946 mg/kg (MAE). Napriek tomu boli získané dobré hodnoty R2 pre Ca_Mg_K-SVMR (0,663 mg/kg R2) a Ca_Mg-EBK_SVMR (0,643 = R2); Ich výsledky RMSE a MAE boli vyššie ako výsledky pre Ca_Mg_K-EBK_SVMR (R2 0,637) (pozri tabuľku 3). Okrem toho, RMSE a MAE modelu Ca_Mg-EBK_SVMR (RMSE = 1664,64 a MAE = 1031,49) sú 17,5 a 13,4, čo je viac ako u modelu Ca_Mg_K-EBK_SVMR. Podobne, RMSE a MAE modelu Ca_Mg-K SVMR (RMSE = 235,974 a MAE = 166,946) sú o 2,5 a 2,2 väčšie ako u modelu Ca_Mg_K-EBK_SVMR RMSE a MAE. Vypočítané výsledky RMSE naznačujú, ako koncentrovaný je súbor údajov s čiarou najlepšieho prispôsobenia. Boli pozorované vyššie RSME a MAE. Podľa Kebonye a kol. 46 a john a kol. 54, čím bližšie sú RMSE a MAE k nule, tým lepšie sú výsledky. SVMR a EBK_SVMR majú vyššie kvantované hodnoty RSME a MAE. Bolo pozorované, že odhady RSME boli konzistentne vyššie ako hodnoty MAE, čo naznačuje prítomnosť odľahlých hodnôt. Podľa Legatesa a McCabeho83 sa ako indikátor prítomnosti odľahlých hodnôt odporúča rozsah, v akom RMSE prevyšuje strednú absolútnu chybu (MAE). To znamená, že čím je súbor údajov heterogénnejší, tým vyššie sú hodnoty MAE a RMSE. Presnosť krížovej validácie zmiešaného modelu Ca_Mg_K-EBK_SVMR na predpovedanie obsahu Ni v mestských a prímestských pôdach bola 63,70 %. Podľa Li a kol. 59 je táto úroveň presnosti prijateľnou mierou výkonnosti modelu. Súčasné výsledky sú porovnané s predchádzajúcou štúdiou Tarasova a kol. 36, ktorého hybridný model vytvoril MLPRK (Multilayer Perceptron Residual Kriging), súvisiaci s indexom hodnotenia presnosti EBK_SVMR uvedeným v tejto štúdii, RMSE (210) a MAE (167,5) bol vyšší ako naše výsledky v tejto štúdii (RMSE 95,479, MAE 77,368). Avšak pri porovnaní R2 tejto štúdie (0,637) s výsledkami Tarasova a kol. 36 (0,544) je zrejmé, že koeficient determinácie (R2) je v tomto zmiešanom modeli vyšší. Rozpätie chyby (RMSE a MAE) (EBK SVMR) je pre zmiešaný model dvakrát nižšie. Podobne Sergeev a kol.34 zaznamenali 0,28 (R2) pre vyvinutý hybridný model (Multilayer Perceptron Residual Kriging), zatiaľ čo Ni v súčasnej štúdii zaznamenal 0,637 (R2). Úroveň presnosti predikcie tohto modelu (EBK SVMR) je 63,7 %, zatiaľ čo presnosť predikcie získaná Sergeevom a kol.34 je 28 %. Finálna mapa (obr. 5) vytvorená pomocou modelu EBK_SVMR a Ca_Mg_K ako prediktora ukazuje predpovede horúcich miest a mierneho až niklového obsahu v celej študovanej oblasti. To znamená, že koncentrácia niklu v študovanej oblasti je prevažne mierna, s vyššími koncentráciami v niektorých špecifických oblastiach.
Finálna predikčná mapa je reprezentovaná pomocou hybridného modelu EBK_SVMR a s použitím Ca_Mg_K ako prediktora. [Mapa priestorového rozloženia bola vytvorená pomocou RStudio (verzia 1.4.1717: https://www.rstudio.com/).]
Na obrázku 6 sú znázornené koncentrácie PTE ako rovina zloženia pozostávajúca z jednotlivých neurónov. Žiadna z rovin komponentov nevykazovala rovnaký farebný vzor, ​​ako je znázornené. Avšak príslušný počet neurónov na nakreslenú mapu je 55. SeOM sa vytvára s použitím rôznych farieb a čím podobnejšie sú farebné vzory, tým porovnateľnejšie sú vlastnosti vzoriek. Podľa ich presnej farebnej stupnice jednotlivé prvky (Ca, K a Mg) vykazovali podobné farebné vzory ako jednotlivé neuróny s vysokým rádom a väčšina neurónov s nízkym rádom. CaK a CaMg teda zdieľajú určité podobnosti s neurónmi veľmi vysokého rádu a farebnými vzormi nízkeho až stredného rádu. Oba modely predpovedajú koncentráciu Ni v pôde zobrazením stredných až vysokých odtieňov farieb, ako je červená, oranžová a žltá. Model KMg zobrazuje mnoho vzorov s vysokými farbami na základe presných proporcií a farebných škvŕn s nízkymi až strednými farbami. Na presnej farebnej stupnici od nízkej po vysokú, planárny distribučný vzor komponentov modelu vykazoval vysoký farebný vzor, ​​čo naznačuje potenciálnu koncentráciu niklu v pôde (pozri obrázok 4). Rovina komponentov modelu CakMg zobrazuje rozmanitý farebný vzor od nízkej po vysokú podľa presnej farebnej stupnice. mierka. Okrem toho je predikcia modelu obsahu niklu (CakMg) podobná priestorovému rozloženiu niklu znázornenému na obrázku 5. Oba grafy zobrazujú vysoké, stredné a nízke podiely koncentrácií niklu v mestských a prímestských pôdach. Obrázok 7 znázorňuje kontúrovú metódu v zoskupení k-priemerov na mape, rozdelenú do troch klastrov na základe predpovedanej hodnoty v každom modeli. Kontúrová metóda predstavuje optimálny počet klastrov. Zo 115 odobratých vzoriek pôdy získala kategória 1 najviac vzoriek pôdy, 74. Klaster 2 dostal 33 vzoriek, zatiaľ čo klaster 3 dostal 8 vzoriek. Sedemzložková kombinácia planárnych prediktorov bola zjednodušená, aby sa umožnila správna interpretácia klastrov. Vzhľadom na početné antropogénne a prírodné procesy ovplyvňujúce tvorbu pôdy je ťažké mať správne rozlíšené vzory klastrov v distribuovanej mape SeOM78.
Výstup komponentnej roviny z každej premennej empirického Bayesovského krigingového podporného vektorového stroja (EBK_SVM_SeOM).[Mapy SeOM boli vytvorené pomocou RStudio (verzia 1.4.1717: https://www.rstudio.com/).]
Rôzne komponenty klasifikácie klastrov [Mapy SeOM boli vytvorené pomocou RStudio (verzia 1.4.1717: https://www.rstudio.com/).]
Súčasná štúdia jasne ilustruje techniky modelovania koncentrácií niklu v mestských a prímestských pôdach. Štúdia testovala rôzne techniky modelovania, kombinujúc prvky s modelovacími technikami, aby sa dosiahol najlepší spôsob predpovedania koncentrácií niklu v pôde. Kompozičné rovinné priestorové charakteristiky SeOM modelovacej techniky vykazovali vysoký farebný vzor od nízkej po vysokú na presnej farebnej stupnici, čo naznačuje koncentrácie Ni v pôde. Mapa priestorového rozloženia však potvrdzuje rovinné priestorové rozloženie zložiek, ktoré vykazuje EBK_SVMR (pozri obrázok 5). Výsledky ukazujú, že regresný model podporného vektorového stroja (CaMgK-SVMR) predpovedá koncentráciu Ni v pôde ako jeden model, ale parametre validácie a hodnotenia presnosti vykazujú veľmi vysoké chyby z hľadiska RMSE a MAE. Na druhej strane, modelovacia technika použitá s modelom EBK_MLR je tiež chybná kvôli nízkej hodnote koeficientu determinácie (R2). Dobré výsledky sa dosiahli použitím EBK SVMR a kombinovaných prvkov (CaKMg) s nízkymi chybami RMSE a MAE s presnosťou 63,7 %. Ukazuje sa, že kombinácia algoritmu EBK s Algoritmus strojového učenia dokáže vygenerovať hybridný algoritmus, ktorý dokáže predpovedať koncentráciu PTE v pôde. Výsledky ukazujú, že použitie CaMgK ako prediktorov na predpovedanie koncentrácií Ni v študovanej oblasti môže zlepšiť predikciu Ni v pôde. To znamená, že nepretržitá aplikácia hnojív na báze niklu a priemyselné znečistenie pôdy oceliarskym priemyslom má tendenciu zvyšovať koncentráciu niklu v pôde. Táto štúdia ukázala, že model EBK môže znížiť úroveň chýb a zlepšiť presnosť modelu priestorového rozloženia pôdy v mestských alebo prímestských pôdach. Vo všeobecnosti navrhujeme použiť model EBK-SVMR na posúdenie a predpovedanie PTE v pôde; okrem toho navrhujeme použiť EBK na hybridizáciu s rôznymi algoritmami strojového učenia. Koncentrácie Ni boli predpovedané pomocou prvkov ako kovariátov; použitie väčšieho počtu kovariátov by však výrazne zlepšilo výkon modelu, čo možno považovať za obmedzenie súčasnej práce. Ďalším obmedzením tejto štúdie je, že počet súborov údajov je 115. Preto, ak sa poskytne viac údajov, je možné zlepšiť výkon navrhovanej optimalizovanej hybridizačnej metódy.
PlantProbs.net. Nikel v rastlinách a pôde https://plantprobs.net/plant/nutrientImbalances/sodium.html (prístup 28. apríla 2021).
Kasprzak, KS Nikel pokroky v modernej environmentálnej toxikológii.surroundings.toxicology.11, 145–183 (1987).
Cempel, M. a Nikel, G. Nikel: Prehľad jeho zdrojov a environmentálnej toxikológie. Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. a Hutchinson, TC Vstup znečisťujúcich látok z atmosféry a ich akumulácia v pôde a vegetácii v blízkosti nikel-medenenej huty v Sudbury, Ontário, Kanada.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. a kol. Ťažké kovy v pôde, rastlinách a riziká spojené s pasením prežúvavcov v blízkosti meďno-niklovej bane Selebi-Phikwe v Botswane. Okolie. Geochémia. Zdravie https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Stopové prvky v pôde a… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (prístup 24. novembra 2020).
Almås, A., Singh, B., Poľnohospodárstvo, TS-NJ z a 1995, nedefinované. Vplyv ruského niklového priemyslu na koncentrácie ťažkých kovov v poľnohospodárskych pôdach a trávach v Soer-Varanger, Nórsko. agris.fao.org.
Nielsen, GD a kol. Absorpcia a retencia niklu v pitnej vode súvisí s príjmom potravy a citlivosťou na nikel. toxikológia. aplikácia. farmakodynamika. 154, 67–75 (1999).
Costa, M. a Klein, CB Nikel: Karcinogenéza, mutácia, epigenetika alebo selekcia. Okolie. Zdravotná perspektíva. 107, 2 (1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, ​​​​NM; Trendová analýza potenciálne toxických prvkov: bibliometrický prehľad. Environmentálna geochémia a zdravie. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. a McBratney, AB Digitálne mapovanie pôdy: Stručná história a niekoľko ponaučení. Geoderma 264, 301–311. https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. O digitálnom mapovaní pôdy. Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistické modelovanie rezervoárov,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (prístup 28. apríla 2021).


Čas uverejnenia: 22. júla 2022