Prognozowanie stężeń niklu w glebach podmiejskich i miejskich przy użyciu mieszanego empirycznego krigingu bayesowskiego i regresji maszyny wektorów nośnych

Dziękujemy za odwiedzenie witryny Nature.com. Wersja przeglądarki, której używasz, obsługuje CSS w ograniczonym zakresie. Aby uzyskać najlepsze efekty, zalecamy korzystanie z nowszej wersji przeglądarki (lub wyłączenie trybu zgodności w przeglądarce Internet Explorer). Tymczasem, aby zapewnić ciągłą obsługę, będziemy wyświetlać witrynę bez stylów i JavaScript.
Zanieczyszczenie gleby to duży problem spowodowany działalnością człowieka. Przestrzenny rozkład potencjalnie toksycznych pierwiastków (PTE) jest różny w większości obszarów miejskich i podmiejskich. Dlatego trudno jest przestrzennie przewidzieć zawartość PTE w takich glebach. Łącznie pobrano 115 próbek z Frydek-Mistek w Republice Czeskiej. Stężenia wapnia (Ca), magnezu (Mg), potasu (K) i niklu (Ni) określono za pomocą spektrometrii emisyjnej ze wzbudzeniem plazmą wzbudzoną indukcyjnie. Zmienną odpowiedzi jest Ni, a predyktorami są Ca, Mg i K. Macierz korelacji między zmienną odpowiedzi a zmienną predykcyjną wykazuje zadowalającą korelację między pierwiastkami. Wyniki prognozowania wykazały, że regresja maszyny wektorów nośnych (SVMR) dała dobre wyniki, chociaż jej szacowany średni błąd kwadratowy (RMSE) (235,974 mg/kg) i średni błąd bezwzględny (MAE) (166,946 mg/kg) były wyższe niż w przypadku innych zastosowanych metod. Modele mieszane dla empirycznego bayesowskiego Metoda Kriginga-Multiple Linear Regression (EBK-MLR) daje słabe wyniki, o czym świadczą współczynniki determinacji mniejsze niż 0,1. Najlepszym modelem był empiryczny bayesowski model Kriginga-Support Vector Machine Regression (EBK-SVMR), z niskimi wartościami RMSE (95,479 mg/kg) i MAE (77,368 mg/kg) oraz wysokim współczynnikiem determinacji (R2 = 0,637). Wynik techniki modelowania EBK-SVMR jest wizualizowany za pomocą samouczącej się mapy. Skupione neurony w płaszczyźnie komponentu hybrydowego modelu CakMg-EBK-SVMR wykazują wiele wzorów kolorów, które przewidują stężenia Ni w glebach miejskich i podmiejskich. Wyniki pokazują, że łączenie EBK i SVMR jest skuteczną techniką przewidywania stężeń Ni w glebach miejskich i podmiejskich.
Nikiel (Ni) jest uważany za mikroelement dla roślin, ponieważ przyczynia się do wiązania azotu atmosferycznego (N) i metabolizmu mocznika, które są niezbędne do kiełkowania nasion. Oprócz wkładu w kiełkowanie nasion, Ni może działać jako inhibitor grzybów i bakterii oraz wspomagać rozwój roślin. Brak niklu w glebie pozwala roślinie go wchłaniać, co powoduje chlorozę liści. Na przykład, fasolka szparagowa i zielona fasolka wymagają stosowania nawozów na bazie niklu w celu zoptymalizowania wiązania azotu2. Ciągłe stosowanie nawozów na bazie niklu w celu wzbogacenia gleby i zwiększenia zdolności roślin strączkowych do wiązania azotu w glebie stale zwiększa stężenie niklu w glebie. Chociaż nikiel jest mikroelementem dla roślin, jego nadmierne spożycie w glebie może wyrządzić więcej szkody niż pożytku. Toksyczność niklu w glebie minimalizuje pH gleby i utrudnia wchłanianie żelaza jako niezbędnego składnika odżywczego dla wzrostu roślin1. Według Liu3, Ni został uznany za 17. ważny pierwiastek wymagany do rozwoju i wzrostu roślin. Ponadto ze względu na rolę niklu w rozwoju i wzroście roślin, ludzie potrzebują go do różnych zastosowań. Galwanizacja, produkcja stopów na bazie niklu oraz wytwarzanie urządzeń zapłonowych i świec zapłonowych w przemyśle motoryzacyjnym wymagają użycia niklu w różnych sektorach przemysłu. Ponadto stopy na bazie niklu i artykuły galwanizowane są szeroko stosowane w naczyniach kuchennych, akcesoriach do sal balowych, artykułach spożywczych, urządzeniach elektrycznych, przewodach i kablach, turbinach odrzutowych, implantach chirurgicznych, tekstyliach i budownictwie okrętowym.5. Poziomy niklu bogate w gleby (tj. gleby powierzchniowe) przypisuje się zarówno źródłom antropogenicznym, jak i naturalnym, ale przede wszystkim Ni jest źródłem naturalnym, a nie antropogenicznym.4,6. Naturalne źródła niklu obejmują erupcje wulkanów, roślinność, pożary lasów i procesy geologiczne; Jednakże źródła antropogeniczne obejmują baterie niklowo-kadmowe w przemyśle stalowym, galwanizację, spawanie łukowe, oleje napędowe i opałowe oraz emisje atmosferyczne ze spalania węgla oraz spalania odpadów i osadów. Akumulacja niklu7,8. Według Freedmana i Hutchinsona9 oraz Manyiwy i in. 10, głównymi źródłami zanieczyszczenia wierzchniej warstwy gleby w bezpośrednim i przyległym środowisku są głównie huty i kopalnie niklu i miedzi. Najwyższy poziom zanieczyszczenia niklem stwierdzono w górnej warstwie gleby wokół rafinerii niklu i miedzi w Sudbury w Kanadzie, gdzie stwierdzono 26 000 mg/kg11. Natomiast zanieczyszczenie pochodzące z produkcji niklu w Rosji spowodowało wyższe stężenia niklu w norweskiej glebie11. Według Alms i in. 12, ilość niklu ekstrahowanego za pomocą HNO3 w najlepszych gruntach ornych regionu (produkcja niklu w Rosji) wahała się od 6,25 do 136,88 mg/kg, co odpowiada średniej 30,43 mg/kg i stężeniu bazowemu 25 mg/kg. Według Kabaty 11, stosowanie nawozów fosforowych na glebach rolniczych w glebach miejskich lub podmiejskich w kolejnych sezonach upraw może przesiąknąć lub zanieczyścić glebę. Potencjalne skutki niklu u ludzi mogą prowadzić do raka poprzez mutagenezę, uszkodzenie chromosomów, generację Z-DNA, zablokowaną naprawę wycięcia DNA lub procesy epigenetyczne.13 W eksperymentach na zwierzętach stwierdzono, że nikiel może potencjalnie powodować różne nowotwory, a rakotwórcze kompleksy niklu mogą zaostrzać takie nowotwory.
Oceny skażenia gleby rozkwitły w ostatnich czasach ze względu na szeroki zakres problemów zdrowotnych wynikających z relacji gleba-roślina, relacji biologicznych gleby i gleby, degradacji ekologicznej i oceny wpływu na środowisko. Do tej pory przestrzenne przewidywanie potencjalnie toksycznych pierwiastków (PTE), takich jak Ni w glebie, było pracochłonne i czasochłonne przy użyciu tradycyjnych metod. Pojawienie się cyfrowego mapowania gleby (DSM) i jego obecny sukces15 znacznie poprawiły predykcyjne mapowanie gleby (PSM). Według Minasny'ego i McBratney'a16, predykcyjne mapowanie gleby (DSM) okazało się ważną poddyscypliną gleboznawstwa. Lagacherie i McBratney, 2006 definiują DSM jako „tworzenie i wypełnianie przestrzennych systemów informacji glebowej poprzez stosowanie metod obserwacyjnych in situ i laboratoryjnych oraz przestrzennych i nieprzestrzennych systemów wnioskowania o glebie”. McBratney i in. 17. Przedstawiono zarys współczesnego modelu DSM lub PSM jako najskuteczniejszą technikę przewidywania lub mapowania przestrzennego rozkładu PTE, typów gleby i właściwości gleby. Geostatystyka i algorytmy uczenia maszynowego (MLA) to techniki modelowania modelu DSM, które tworzą zdigitalizowane mapy przy pomocy komputerów, wykorzystując znaczące i minimalne dane.
Deutsch18 i Olea19 definiują geostatystykę jako „zbiór technik numerycznych, które zajmują się reprezentacją atrybutów przestrzennych, głównie wykorzystując modele stochastyczne, takie jak sposób, w jaki analiza szeregów czasowych charakteryzuje dane czasowe”. Przede wszystkim geostatystyka obejmuje ocenę wariogramów, które pozwalają kwantyfikować i definiować zależności wartości przestrzennych z każdego zestawu danych20.Gumiaux i in. 20 dodatkowo ilustrują, że ocena wariogramów w geostatystyce opiera się na trzech zasadach, w tym (a) obliczaniu skali korelacji danych, (b) identyfikowaniu i obliczaniu anizotropii w rozbieżnościach zbiorów danych oraz (c) oprócz uwzględnienia inherentnego błędu danych pomiarowych oddzielonych od efektów lokalnych, szacowane są również efekty obszarowe. Opierając się na tych koncepcjach, w geostatystyce stosuje się wiele technik interpolacji, w tym kriging ogólny, ko-kriging, kriging zwyczajny, empiryczny kriging bayesowski, prostą metodę krigingu i inne dobrze znane techniki interpolacji w celu mapowania lub przewidywania PTE, cech gleby i rodzajów gleby.
Algorytmy uczenia maszynowego (MLA) to stosunkowo nowa technika wykorzystująca większe nieliniowe klasy danych, oparta na algorytmach stosowanych głównie do eksploracji danych, identyfikacji wzorców w danych i wielokrotnie stosowanych do klasyfikacji w dziedzinach naukowych, takich jak gleboznawstwo i zadania zwrotu. Liczne prace badawcze opierają się na modelach MLA w celu przewidywania PTE w glebie, takie jak Tan i in. 22 (losowe lasy do szacowania zawartości metali ciężkich w glebach rolniczych), Sakizadeh i in. 23 (modelowanie przy użyciu maszyn wektorów nośnych i sztucznych sieci neuronowych) zanieczyszczenia gleby). Ponadto Vega i in. 24 (CART do modelowania retencji i adsorpcji metali ciężkich w glebie), Sun i in. 25 (zastosowanie kubisty do rozkładu Cd w glebie) i inne algorytmy, takie jak k-najbliższego sąsiada, uogólniona wzmocniona regresja i wzmocnione drzewa regresji również zastosowały MLA do przewidywania PTE w glebie.
Zastosowanie algorytmów DSM w przewidywaniu lub mapowaniu wiąże się z kilkoma wyzwaniami. Wielu autorów uważa, że MLA jest lepsza od geostatystyki i odwrotnie. Chociaż jedna jest lepsza od drugiej, połączenie obu poprawia poziom dokładności mapowania lub prognozowania w DSM15. Woodcock i Gopal26, Finke27; Pontius i Cheuk28 oraz Grunwald29 komentują niedociągnięcia i pewne błędy w przewidywanym mapowaniu gleby. Gleboznawcy wypróbowali różne techniki w celu optymalizacji skuteczności, dokładności i przewidywalności mapowania i prognozowania DSM. Połączenie niepewności i weryfikacji jest jednym z wielu różnych aspektów zintegrowanych z DSM w celu optymalizacji skuteczności i zmniejszenia błędów. Jednak Agyeman i in. 15 podkreślają, że zachowanie walidacji i niepewność wprowadzane przez tworzenie i prognozowanie map powinny być niezależnie sprawdzane w celu poprawy jakości map. Ograniczenia DSM wynikają z geograficznie rozproszonej jakości gleby, co wiąże się ze składnikiem niepewności; Jednak brak pewności w DSM może wynikać z wielu źródeł błędów, mianowicie błędu współzmiennej, błędu modelu, błędu lokalizacji i błędu analitycznego 31. Niedokładności modelowania wywołane w procesach MLA i geostatystycznych są związane z brakiem zrozumienia, co ostatecznie prowadzi do nadmiernego uproszczenia rzeczywistego procesu 32. Niezależnie od charakteru modelowania, niedokładności można przypisać parametrom modelowania, przewidywaniom modelu matematycznego lub interpolacji 33. Niedawno pojawił się nowy trend w DSM, który promuje integrację geostatystyki i MLA w mapowaniu i prognozowaniu. Kilku gleboznawców i autorów, takich jak Sergeev i in. 34; Subbotina i in. 35; Tarasov i in. 36 i Tarasov i in. 37 wykorzystało dokładną jakość geostatystyki i uczenia maszynowego do generowania modeli hybrydowych, które zwiększają wydajność prognozowania i mapowania. jakość. Niektóre z tych hybrydowych lub łączonych modeli algorytmów to: Kriging sztucznej sieci neuronowej (ANN-RK), Kriging resztkowy perceptronu wielowarstwowego (MLP-RK), Kriging resztkowy sieci neuronowej regresji uogólnionej (GR- NNRK)36, Kriging sztucznej sieci neuronowej-perceptronu wielowarstwowego (ANN-K-MLP)37 oraz ko-Kriging i regresja procesów gaussowskich38.
Według Sergeeva i in. łączenie różnych technik modelowania ma potencjał wyeliminowania defektów i zwiększenia wydajności powstałego modelu hybrydowego zamiast opracowywania jego pojedynczego modelu. W tym kontekście w nowym artykule argumentuje się, że konieczne jest zastosowanie połączonego algorytmu geostatystyki i MLA w celu stworzenia optymalnych modeli hybrydowych do przewidywania wzbogacenia Ni na obszarach miejskich i podmiejskich. Niniejsze badanie będzie opierać się na Empirycznym Bayesowskim Krigingu (EBK) jako modelu bazowym i połączy go z modelami Maszyny Wektorów Wsparcia (SVM) i Wielokrotnej Regresji Liniowej (MLR). Hybrydyzacja EBK z żadnym MLA nie jest znana. Wiele widocznych modeli mieszanych to kombinacje zwykłego, resztkowego, regresyjnego krigingu i MLA. EBK to geostatystyczna metoda interpolacji, która wykorzystuje przestrzennie stochastyczny proces, który jest zlokalizowany jako niestacjonarne/stacjonarne pole losowe o zdefiniowanych parametrach lokalizacji w polu, co pozwala na zmienność przestrzenną39. EBK był używany w różnych badaniach, w tym do analizy rozkładu węgla organicznego w gleb rolniczych40, oceny zanieczyszczenia gleby41 i mapowania właściwości gleby42.
Z drugiej strony, Self-Organizing Graph (SeOM) to algorytm uczenia się, który został zastosowany w różnych artykułach, takich jak Li i in. 43, Wang i in. 44, Hossain Bhuiyan i in. 45 i Kebonye i in.46 Określ atrybuty przestrzenne i grupowanie elementów. Wang i in. 44 podkreślają, że SeOM jest potężną techniką uczenia się, znaną ze swojej zdolności do grupowania i wyobrażania sobie problemów nieliniowych. W przeciwieństwie do innych technik rozpoznawania wzorców, takich jak analiza głównych składowych, klasteryzacja rozmyta, klasteryzacja hierarchiczna i podejmowanie decyzji wielokryterialnych, SeOM lepiej organizuje i identyfikuje wzorce PTE. Według Wang i in. 44, SeOM może grupować przestrzennie rozkład powiązanych neuronów i zapewniać wizualizację danych o wysokiej rozdzielczości. SeOM wizualizuje dane predykcji Ni w celu uzyskania najlepszego modelu do scharakteryzowania wyników do bezpośredniej interpretacji.
Niniejszy artykuł ma na celu wygenerowanie solidnego modelu mapowania o optymalnej dokładności do przewidywania zawartości niklu w glebach miejskich i podmiejskich. Stawiamy hipotezę, że niezawodność modelu mieszanego zależy głównie od wpływu innych modeli dołączonych do modelu bazowego. Uznajemy wyzwania stojące przed DSM i chociaż wyzwania te są rozwiązywane na wielu frontach, połączenie postępów w geostatystyce i modelach MLA wydaje się być przyrostowe; dlatego też spróbujemy odpowiedzieć na pytania badawcze, które mogą zaowocować modelami mieszanymi. Jednak jak dokładny jest model w przewidywaniu elementu docelowego? Ponadto, jaki jest poziom oceny wydajności w oparciu o walidację i ocenę dokładności? Dlatego też, konkretnymi celami tego badania były: (a) stworzenie połączonego modelu mieszanki dla SVMR lub MLR przy użyciu EBK jako modelu bazowego, (b) porównanie otrzymanych modeli, (c) zaproponowanie najlepszego modelu mieszanki do przewidywania stężeń Ni w glebach miejskich lub podmiejskich oraz (d) zastosowanie SeOM do stworzenia mapy o wysokiej rozdzielczości przestrzennej zmienności niklu.
Badania prowadzone są w Republice Czeskiej, a konkretnie w powiecie Frydek-Mistek w regionie morawsko-śląskim (patrz rysunek 1). Geografia obszaru badań jest bardzo nierówna i obejmuje głównie region Beskidu Morawsko-Śląskiego, który jest częścią zewnętrznego obrzeża Karpat. Obszar badań znajduje się pomiędzy 49° 41′ 0′ N a 18° 20′ 0′ E, a wysokość wynosi od 225 do 327 m; jednak system klasyfikacji Köppena dla stanu klimatycznego regionu jest oceniany jako Cfb = umiarkowany klimat oceaniczny, występuje dużo opadów nawet w suchych miesiącach. Temperatury wahają się nieznacznie w ciągu roku między −5 °C a 24 °C, rzadko spadając poniżej −14 °C lub powyżej 30 °C, podczas gdy średnie roczne opady wynoszą od 685 do 752 mm47. Szacunkowy obszar badania całego obszaru wynosi 1208 kilometrów kwadratowych, z czego 39,38% stanowią grunty uprawne, a 49,36% pokrycia leśnego. Z drugiej strony obszar wykorzystany w tym badaniu wynosi około 889,8 kilometrów kwadratowych. W Ostrawie i okolicach bardzo aktywny jest przemysł stalowy i metalowy. Huty metali, przemysł stalowy, w którym nikiel jest stosowany w stalach nierdzewnych (np. w celu zapewnienia odporności na korozję atmosferyczną) i stalach stopowych (nikiel zwiększa wytrzymałość stopu, zachowując jednocześnie jego dobrą ciągliwość i wytrzymałość), oraz intensywne rolnictwo, takie jak stosowanie nawozów fosforanowych i produkcja zwierzęca są potencjalnymi źródłami niklu w regionie (np. dodawanie niklu jagniętom w celu zwiększenia tempa wzrostu jagniąt i bydła karmionego w niskich ilościach). Inne przemysłowe zastosowania niklu w obszarach badawczych obejmują jego wykorzystanie w galwanizacji, w tym w procesach galwanizacji niklem i niklowania bezprądowego. Właściwości gleby można łatwo odróżnić po kolorze gleby, strukturze i zawartości węglanów. Tekstura gleby jest średnia do drobnej, pochodzi od materiału macierzystego. Mają one naturę koluwialną, aluwialną lub eoliczną. Niektóre obszary gleby wydają się plamiste na powierzchni i podglebiu, często z betonem i wybielaczem. Jednak gleby brunatne i stagnosolne są najczęstszymi rodzajami gleb w regionie48. Przy wysokościach od 455,1 do 493,5 m n.p.m., gleby brunatne dominują w Republice Czeskiej49.
Mapa obszaru badań [Mapa obszaru badań została utworzona przy użyciu oprogramowania ArcGIS Desktop (ESRI, Inc, wersja 10.7, adres URL: https://desktop.arcgis.com).]
Łącznie pobrano 115 próbek wierzchniej warstwy gleby z gleb miejskich i podmiejskich w dystrykcie Frydek-Mistek. Zastosowano regularny wzór siatki z próbkami gleby rozmieszczonymi w odstępach 2 × 2 km, a wierzchnią warstwę gleby mierzono na głębokości od 0 do 20 cm za pomocą ręcznego urządzenia GPS (Leica Zeno 5 GPS). Próbki pakowane są w woreczki strunowe, odpowiednio etykietowane i wysyłane do laboratorium. Próbki suszono na powietrzu w celu uzyskania próbek sproszkowanych, sproszkowanych za pomocą układu mechanicznego (młynek tarczowy Fritscha) i przesiewano (wielkość sita 2 mm). Umieść 1 gram wysuszonych, zhomogenizowanych i przesianych próbek gleby w wyraźnie opisanych butelkach teflonowych. Do każdego naczynia teflonowego odmierz 7 ml 35% HCl i 3 ml 65% HNO3 (za pomocą automatycznego dozownika – po jednym dla każdego kwasu), lekko przykryj i odstaw próbki na noc, aby zaszła reakcja (program wody królewskiej). .Umieść supernatant na gorącej metalowej płycie (temperatura: 100 W i 160 °C) na 2 godziny, aby ułatwić proces trawienia próbek, a następnie ostudź.Przenieś supernatant do 50 ml kolby miarowej i rozcieńcz do 50 ml wodą dejonizowaną.Następnie przefiltruj rozcieńczony supernatant do 50 ml probówki PVC z wodą dejonizowaną.Dodatkowo 1 ml roztworu rozcieńczającego rozcieńczono 9 ml wody dejonizowanej i przefiltrowano do 12 ml probówki przygotowanej do pseudo-koncentracji PTE.Stężenia PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) określono metodą ICP-OES (spektroskopia emisyjna ze wzbudzeniem plazmą indukcyjnie sprzężoną) (Thermo Fisher Scientific, USA) zgodnie ze standardowymi metodami i umową.Zapewnij procedury zapewniania i kontroli jakości (QA/QC) (SRM NIST 2711a Montana II Soil). PTE z granicami wykrywalności poniżej połowy zostały wyłączone z tego badania. Granica wykrywalności PTE użytego w tym badaniu wynosiła 0,0004. (ty). Ponadto proces kontroli jakości i zapewnienia jakości dla każdej analizy jest zapewniony poprzez analizę standardów odniesienia. Aby zminimalizować błędy, wykonano podwójną analizę.
Empiryczny kriging bayesowski (EBK) jest jedną z wielu geostatystycznych technik interpolacji stosowanych w modelowaniu w różnych dziedzinach, takich jak gleboznawstwo. W przeciwieństwie do innych technik interpolacji krigingu, EBK różni się od tradycyjnych metod krigingu tym, że uwzględnia błąd szacowany przez model semiwariogramu. W interpolacji EBK podczas interpolacji obliczanych jest kilka modeli semiwariogramów, a nie pojedynczy semiwariogram. Techniki interpolacji torują drogę niepewności i programowaniu związanemu z tym wykreślaniem semiwariogramu, co stanowi wysoce złożoną część wystarczającej metody krigingu. Proces interpolacji EBK jest zgodny z trzema kryteriami zaproponowanymi przez Krivoruchko50, (a) model szacuje semiwariogram z wejściowego zestawu danych, (b) nowa przewidywana wartość dla każdej lokalizacji wejściowego zestawu danych na podstawie wygenerowanego semiwariogramu i (c) ostateczny model jest obliczany z symulowanego zestawu danych. Reguła równania bayesowskiego jest podana jako a posteriori
Gdzie \(Prob\left(A\right)\) oznacza prawdopodobieństwo wcześniejsze, \(Prob\left(B\right)\) prawdopodobieństwo brzegowe jest w większości przypadków ignorowane, \(Prob (B,A)\ ). Obliczenia semiwariogramu opierają się na regule Bayesa, która przedstawia skłonność zestawów danych obserwacyjnych, jakie można utworzyć z semiwariogramów. Wartość semiwariogramu jest następnie określana przy użyciu reguły Bayesa, która określa, jak prawdopodobne jest utworzenie zestawu danych obserwacji z semiwariogramu.
Maszyna wektorów nośnych to algorytm uczenia maszynowego, który generuje optymalną hiperpłaszczyznę rozdzielającą w celu odróżnienia identycznych, ale nieliniowo niezależnych klas. Vapnik51 stworzył algorytm klasyfikacji intencyjnej, ale ostatnio został on użyty do rozwiązania problemów zorientowanych na regresję. Według Li i in.52, SVM jest jedną z najlepszych technik klasyfikacyjnych i była stosowana w różnych dziedzinach. W tej analizie wykorzystano składnik regresji SVM (Support Vector Machine Regression – SVMR). Cherkassky i Mulier53 byli pionierami SVMR jako regresji opartej na jądrze, której obliczenia przeprowadzono przy użyciu modelu regresji liniowej z funkcjami przestrzennymi wielu krajów. John i in.54 podają, że modelowanie SVMR wykorzystuje liniową regresję hiperpłaszczyzny, która tworzy nieliniowe relacje i umożliwia funkcje przestrzenne. Według Vohlanda i in. 55, epsilon (ε)-SVMR wykorzystuje wytrenowany zbiór danych do uzyskania modelu reprezentacyjnego w postaci funkcji niewrażliwej na epsilon, która jest stosowana do niezależnego mapowania danych z najlepszym odchyleniem epsilon wynikającym z treningu na skorelowanych danych. Wstępnie ustawiony błąd odległości jest ignorowany w stosunku do rzeczywistej wartości, a jeśli błąd jest większy niż ε(ε), właściwości gleby go kompensują. Model redukuje również złożoność danych treningowych do szerszego podzbioru wektorów nośnych. Poniżej przedstawiono równanie zaproponowane przez Vapnika51.
gdzie b reprezentuje próg skalarny, \(K\lewy({x}_{,}{ x}_{k}\prawy)\) reprezentuje funkcję jądra, \(\alpha\) reprezentuje mnożnik Lagrange'a, N reprezentuje numeryczny zestaw danych, \({x}_{k}\) reprezentuje dane wejściowe, a \(y\) jest danymi wyjściowymi. Jednym z kluczowych używanych jąder jest operacja SVMR, która jest radialną funkcją bazową Gaussa (RBF). Jądro RBF jest stosowane w celu określenia optymalnego modelu SVMR, co jest krytyczne dla uzyskania najbardziej subtelnego czynnika zestawu kar C i parametru jądra gamma (γ) dla danych treningowych PTE. Najpierw oceniliśmy zestaw treningowy, a następnie przetestowaliśmy wydajność modelu na zestawie walidacyjnym. Użytym parametrem sterującym jest sigma, a wartością metody jest svmRadial.
Wieloraki model regresji liniowej (MLR) to model regresji, który przedstawia związek między zmienną odpowiedzi a szeregiem zmiennych predykcyjnych przy użyciu liniowych parametrów zbiorczych obliczonych metodą najmniejszych kwadratów. W MLR model najmniejszych kwadratów jest funkcją predykcyjną właściwości gleby po doborze zmiennych objaśniających. Konieczne jest użycie odpowiedzi w celu ustalenia liniowej zależności za pomocą zmiennych objaśniających. PTE zostało użyte jako zmienna odpowiedzi w celu ustalenia liniowej zależności ze zmiennymi objaśniającymi. Równanie MLR to
gdzie y jest zmienną odpowiedzi, \(a\) jest przecięciem, n jest liczbą predyktorów, \({b}_{1}\) jest częściową regresją współczynników, \({x}_{i}\) reprezentuje predyktor lub zmienną objaśniającą, a \({\varepsilon }_{i}\) reprezentuje błąd w modelu, znany również jako reszta.
Mieszane modele uzyskano przez połączenie EBK z SVMR i MLR. Odbywa się to poprzez wyodrębnienie przewidywanych wartości z interpolacji EBK. Przewidywane wartości uzyskane z interpolowanych Ca, K i Mg uzyskuje się poprzez proces kombinatoryczny w celu uzyskania nowych zmiennych, takich jak CaK, CaMg i KMg. Następnie pierwiastki Ca, K i Mg łączy się w celu uzyskania czwartej zmiennej, CaKMg. Ogólnie rzecz biorąc, uzyskane zmienne to Ca, K, Mg, CaK, CaMg, KMg i CaKMg. Zmienne te stały się naszymi predyktorami, pomagając w przewidywaniu stężeń niklu w glebach miejskich i podmiejskich. Algorytm SVMR został wykonany na predyktorach w celu uzyskania mieszanego modelu Empirical Bayesian Kriging-Support Vector Machine (EBK_SVM). Podobnie zmienne są również przesyłane przez algorytm MLR w celu uzyskania mieszanego modelu Empirical Bayesian Kriging-Multiple Linear Regression (EBK_MLR). Zwykle zmienne Ca, K, Mg, CaK, CaMg, KMg i CaKMg są używane jako współzmienne jako predyktory zawartości Ni w glebach miejskich i podmiejskich. Najbardziej akceptowalny uzyskany model (EBK_SVM lub EBK_MLR) zostanie następnie zwizualizowany za pomocą samouczącego się grafu. Przebieg prac w tym badaniu pokazano na rysunku 2.
Wykorzystanie SeOM stało się popularnym narzędziem do organizowania, oceniania i prognozowania danych w sektorze finansowym, opieki zdrowotnej, przemyśle, statystyce, gleboznawstwie i innych. SeOM jest tworzony przy użyciu sztucznych sieci neuronowych i metod uczenia się bez nadzoru w celu organizacji, oceny i prognozowania. W tym badaniu SeOM został użyty do wizualizacji stężeń Ni w oparciu o najlepszy model przewidywania Ni w glebach miejskich i podmiejskich. Dane przetworzone w ocenie SeOM są używane jako zmienne wektorowe o n wymiarach wejściowych43,56. Melssen i in. 57 opisują połączenie wektora wejściowego do sieci neuronowej przez pojedynczą warstwę wejściową do wektora wyjściowego z pojedynczym wektorem wagowym. Wyjście generowane przez SeOM jest dwuwymiarową mapą składającą się z różnych neuronów lub węzłów wplecionych w heksagonalne, kołowe lub kwadratowe mapy topologiczne według ich bliskości. Porównując rozmiary map na podstawie metryki, błędu kwantyzacji (QE) i błędu topograficznego (TE), wybierany jest model SeOM z odpowiednio 0,086 i 0,904, co jest jednostką 55 map (5 × 11). Struktura neuronów jest określana zgodnie z liczbą węzłów w równaniu empirycznym
Liczba danych wykorzystanych w tym badaniu wynosi 115 próbek. Zastosowano losowe podejście do podziału danych na dane testowe (25% do walidacji) i zestawy danych treningowych (75% do kalibracji). Zestaw danych treningowych służy do generowania modelu regresji (kalibracji), a zestaw danych testowych służy do weryfikacji zdolności generalizacji58. Zrobiono to w celu oceny przydatności różnych modeli do przewidywania zawartości niklu w glebach. Wszystkie użyte modele przeszły dziesięciokrotny proces walidacji krzyżowej, powtarzany pięć razy. Zmienne wytworzone przez interpolację EBK są używane jako predyktory lub zmienne objaśniające do przewidywania zmiennej docelowej (PTE). Modelowanie jest obsługiwane w RStudio przy użyciu pakietów library(Kohonen), library(caret), library(modelr), library(“e1071″), library(“plyr”), library(“caTools”), library(” prospectr”) i librarys („Metrics”).
Różne parametry walidacyjne zostały wykorzystane do określenia najlepszego modelu odpowiedniego do przewidywania stężeń niklu w glebie oraz do oceny dokładności modelu i jego walidacji. Modele hybrydyzacyjne zostały ocenione przy użyciu średniego błędu bezwzględnego (MAE), pierwiastka średniokwadratowego błędu (RMSE) oraz R-kwadrat lub współczynnika wyznaczania (R2). R2 definiuje wariancję proporcji w odpowiedzi, reprezentowanej przez model regresji. RMSE i wielkość wariancji w niezależnych miarach opisują moc predykcyjną modelu, podczas gdy MAE określa rzeczywistą wartość ilościową. Wartość R2 musi być wysoka, aby ocenić najlepszy model mieszaniny przy użyciu parametrów walidacyjnych, im wartość jest bliższa 1, tym wyższa dokładność. Według Li et al. 59, wartość kryterium R2 wynosząca 0,75 lub więcej jest uważana za dobry predyktor; od 0,5 do 0,75 oznacza akceptowalną wydajność modelu, a poniżej 0,5 oznacza nieakceptowalną wydajność modelu. Przy wyborze modelu przy użyciu metod oceny kryteriów walidacji RMSE i MAE, niższe uzyskane wartości były wystarczające i uznano je za najlepszy wybór. Poniższe równanie opisuje metodę weryfikacji.
gdzie n oznacza rozmiar obserwowanej wartości\({Y}_{i}\) oznacza zmierzoną odpowiedź, a \({\widehat{Y}}_{i}\) oznacza również przewidywaną wartość odpowiedzi, zatem dla pierwszych i obserwacji.
Statystyczne opisy zmiennych predykcyjnych i odpowiedzi przedstawiono w tabeli 1, pokazując średnią, odchylenie standardowe (SD), współczynnik zmienności (CV), minimum, maksimum, kurtozę i skośność. Minimalne i maksymalne wartości pierwiastków są w kolejności malejącej odpowiednio Mg < Ca < K < Ni i Ca < Mg < K < Ni. Stężenia zmiennej odpowiedzi (Ni) pobranej z badanego obszaru wahały się od 4,86 do 42,39 mg/kg. Porównanie Ni ze średnią światową (29 mg/kg) i średnią europejską (37 mg/kg) wykazało, że ogólna obliczona średnia geometryczna dla badanego obszaru mieściła się w dopuszczalnym zakresie. Niemniej jednak, jak wykazali Kabata-Pendias11, porównanie średniego stężenia niklu (Ni) w bieżącym badaniu z glebami rolniczymi w Szwecji pokazuje, że obecne średnie stężenie niklu jest wyższe. Podobnie średnie stężenie Frydek Mistek w glebach miejskich i podmiejskich w bieżącym badaniu (Ni 16,15 mg/kg) było wyższe od dopuszczalnego limitu 60 (10,2 mg/kg) dla Ni w polskich glebach miejskich podanego przez Różańskiego i in. Ponadto Bretzel i Calderisi61 odnotowali bardzo niskie średnie stężenia Ni (1,78 mg/kg) w glebach miejskich w Toskanii w porównaniu z obecnymi badaniami. Jim62 stwierdził również niższe stężenie niklu (12,34 mg/kg) w glebach miejskich Hongkongu, które jest niższe od obecnego stężenia niklu w tym badaniu. Birke i in.63 podali średnie stężenie Ni wynoszące 17,6 mg/kg w starym obszarze górniczym i przemysłowym w Saksonii-Anhalt w Niemczech, które było o 1,45 mg/kg wyższe od średniego stężenia Ni w tym obszarze (16,15 mg/kg). Obecne badania. Nadmierna zawartość niklu w glebach w niektórych obszarach miejskich i podmiejskich badanego obszaru może być przypisana głównie przemysłowi żelaza i stali oraz przemysłowi metalowemu. Jest to zgodne z badaniem przeprowadzonym przez Khodadoust et al. 64, że głównymi źródłami zanieczyszczenia gleb niklem są przemysł stalowy i obróbka metali. Jednakże wartości prognostyczne wahały się również od 538,70 mg/kg do 69 161,80 mg/kg dla Ca, od 497,51 mg/kg do 3535,68 mg/kg dla K i od 685,68 mg/kg do 5970,05 mg/kg dla Mg. Jakovljevic et al. 65 zbadali całkowitą zawartość Mg i K w glebach w centralnej Serbii. Odkryli, że całkowite stężenia (odpowiednio 410 mg/kg i 400 mg/kg) były niższe niż stężenia Mg i K w bieżącym badaniu. Nieodróżnialnie, we wschodniej Polsce, Orzechowski i Smolczynski66 ocenili całkowitą zawartość Ca, Mg i K i wykazali średnie stężenia Ca (1100 mg/kg), Mg (590 mg/kg) i K (810 mg/kg). Zawartość w wierzchniej warstwie gleby jest niższa niż pojedynczego pierwiastka w tym badaniu. Ostatnie badanie przeprowadzone przez Pongrac i in.67 wykazało, że całkowita zawartość Ca analizowana w 3 różnych glebach w Szkocji, Wielka Brytania (gleba Mylnefield, gleba Balruddery i gleba Hartwood) wskazała wyższą zawartość Ca w tym badaniu.
Ze względu na różne zmierzone stężenia badanych pierwiastków, rozkłady danych dla pierwiastków wykazują różną skośność. Skośność i kurtoza pierwiastków wahały się odpowiednio od 1,53 do 7,24 i od 2,49 do 54,16. Wszystkie obliczone pierwiastki mają poziomy skośności i kurtozy powyżej +1, co wskazuje, że rozkład danych jest nieregularny, odchylony we właściwym kierunku i szczytowy. Oszacowane współczynniki zmienności (CV) pierwiastków pokazują również, że K, Mg i Ni wykazują umiarkowaną zmienność, podczas gdy Ca ma wyjątkowo wysoką zmienność. Współczynniki zmienności (CV) K, Ni i Mg wyjaśniają ich równomierny rozkład. Ponadto rozkład Ca jest nierównomierny, a źródła zewnętrzne mogą wpływać na jego poziom wzbogacenia.
Korelacja zmiennych predykcyjnych z elementami odpowiedzi wykazała zadowalającą korelację między elementami (patrz rysunek 3). Korelacja wykazała, że CaK wykazywał umiarkowaną korelację z wartością r = 0,53, podobnie jak CaNi. Chociaż Ca i K wykazują umiarkowane powiązania ze sobą, badacze tacy jak Kingston i in. 68 i Santo69 sugerują, że ich poziomy w glebie są odwrotnie proporcjonalne. Jednak Ca i Mg są antagonistyczne do K, ale CaK dobrze koreluje. Może to wynikać ze stosowania nawozów, takich jak węglan potasu, który ma o 56% więcej potasu. Potas był umiarkowanie skorelowany z magnezem (KM r = 0,63). W przemyśle nawozowym te dwa pierwiastki są ściśle powiązane, ponieważ siarczan potasowo-magnezowy, azotan potasowo-magnezowy i potaż są stosowane do gleb w celu zwiększenia poziomów ich niedoborów. Nikiel jest umiarkowanie skorelowany z Ca, K i Mg, przy czym wartości r = odpowiednio 0,52, 0,63 i 0,55. Zależności obejmujące wapń, magnez i PTE, takie jak nikiel, są złożone, niemniej jednak magnez hamuje wchłanianie wapnia, wapń zmniejsza skutki nadmiaru magnezu, a zarówno magnez, jak i wapń zmniejszają toksyczne działanie niklu w glebie.
Macierz korelacji dla elementów pokazująca związek między predyktorami i odpowiedziami (Uwaga: rysunek ten obejmuje wykres punktowy między elementami, poziomy istotności oparte są na p < 0,001).
Rysunek 4 ilustruje przestrzenny rozkład pierwiastków. Według Burgos et al70, zastosowanie rozkładu przestrzennego jest techniką wykorzystywaną do ilościowego określenia i wyróżnienia punktów zapalnych w zanieczyszczonych obszarach. Poziomy wzbogacenia Ca na rys. 4 można zobaczyć w północno-zachodniej części mapy rozkładu przestrzennego. Rysunek przedstawia punkty zapalne wzbogacenia Ca od umiarkowanego do wysokiego. Wzbogacenie wapnia w północno-zachodniej części mapy jest prawdopodobnie spowodowane użyciem wapna palonego (tlenku wapnia) w celu zmniejszenia kwasowości gleby i jego wykorzystaniem w hutach stali jako zasadowego tlenu w procesie produkcji stali. Z drugiej strony, inni rolnicy wolą używać wodorotlenku wapnia w kwaśnych glebach w celu zneutralizowania pH, co również zwiększa zawartość wapnia w glebie71. Potas również wykazuje punkty zapalne w północno-zachodniej i wschodniej części mapy. Północny zachód to duża społeczność rolnicza, a umiarkowany do wysokiego wzór potasu może być spowodowany zastosowaniem nawozów NPK i potażu. Jest to zgodne z innymi badaniami, takimi jak Madaras i Lipavský72, Madaras et al.73, Pulkrabová et al.74, Asare et al.75, którzy zaobserwowali, że stabilizacja gleby i jej nawożenie KCl i NPK skutkowały wysoką zawartością potasu w glebie. Przestrzenne wzbogacenie potasem w północno-zachodniej części mapy rozmieszczenia może wynikać ze stosowania nawozów na bazie potasu, takich jak chlorek potasu, siarczan potasu, azotan potasu, potaż i potas w celu zwiększenia zawartości potasu w ubogich glebach. Zádorová et al. 76 i Tlustoš et al. 77 podkreślił, że stosowanie nawozów na bazie potasu zwiększyło zawartość potasu w glebie i znacznie zwiększyłoby zawartość składników odżywczych w glebie w dłuższej perspektywie, szczególnie potasu i magnezu, które wykazują gorące punkty w glebie. Stosunkowo umiarkowane gorące punkty na północnym zachodzie mapy i południowym wschodzie mapy. Wiązanie koloidalne w glebie zmniejsza stężenie magnezu w glebie. Jego niedobór w glebie powoduje, że rośliny wykazują żółtawą chlorozę międzyżyłkową. Nawozy na bazie magnezu, takie jak siarczan potasowo-magnezowy, siarczan magnezu i kizeryt, leczą niedobory (rośliny wydają się fioletowe, czerwone lub brązowe, co wskazuje na niedobór magnezu) w glebach o normalnym zakresie pH6. Akumulacja niklu na powierzchniach gleby miejskiej i podmiejskiej może być spowodowana działalnością człowieka, taką jak rolnictwo, i znaczeniem niklu w produkcji stali nierdzewnej78.
Rozkład przestrzenny elementów [mapę rozkładu przestrzennego utworzono przy użyciu oprogramowania ArcGIS Desktop (ESRI, Inc, wersja 10.7, adres URL: https://desktop.arcgis.com).]
Wyniki indeksu wydajności modelu dla pierwiastków użytych w tym badaniu przedstawiono w Tabeli 2. Z drugiej strony, RMSE i MAE Ni są bliskie zera (0,86 RMSE, -0,08 MAE). Z drugiej strony, wartości RMSE i MAE K są akceptowalne. Wyniki RMSE i MAE były większe dla wapnia i magnezu. Wyniki MAE i RMSE Ca i K są większe ze względu na różne zestawy danych. Stwierdzono, że RMSE i MAE tego badania wykorzystującego EBK do przewidywania Ni są lepsze niż wyniki Johna i in. 54 wykorzystujących synergistyczny kriging do przewidywania stężeń S w glebie przy użyciu tych samych zebranych danych. Wyniki EBK, które badaliśmy, korelują z wynikami Fabijaczyka i in. 41, Yana i in. 79, Beguina i in. 80, Adhikarego i in. 81 oraz Johna i in. 82, szczególnie dla K i Ni.
Wydajność poszczególnych metod przewidywania zawartości niklu w glebach miejskich i podmiejskich oceniono przy użyciu wydajności modeli (Tabela 3). Walidacja modelu i ocena dokładności potwierdziły, że predyktor Ca_Mg_K połączony z modelem EBK SVMR dał najlepszą wydajność. Model kalibracyjny Ca_Mg_K-EBK_SVMR model R2, pierwiastek średniego błędu kwadratowego (RMSE) i średni błąd bezwzględny (MAE) wynosiły 0,637 (R2), 95,479 mg/kg (RMSE) i 77,368 mg/kg (MAE) Ca_Mg_K-SVMR wynosił 0,663 (R2), 235,974 mg/kg (RMSE) i 166,946 mg/kg (MAE). Niemniej jednak dobre wartości R2 uzyskano dla Ca_Mg_K-SVMR (0,663 mg/kg R2) i Ca_Mg-EBK_SVMR (0,643 = R2); ich wyniki RMSE i MAE były wyższe niż te dla Ca_Mg_K-EBK_SVMR (R2 0,637) (patrz tabela 3). Ponadto RMSE i MAE modelu Ca_Mg-EBK_SVMR (RMSE = 1664,64 i MAE = 1031,49) wynoszą odpowiednio 17,5 i 13,4, co jest wartością większą niż w przypadku Ca_Mg_K-EBK_SVMR. Podobnie RMSE i MAE modelu Ca_Mg-K SVMR (RMSE = 235,974 i MAE = 166,946) są odpowiednio o 2,5 i 2,2 większe niż w przypadku RMSE i MAE modelu Ca_Mg_K-EBK_SVMR. Obliczone wyniki RMSE wskazują, jak skoncentrowany jest zbiór danych z linią najlepszego dopasowania. Wyższe RSME i MAE były zaobserwowano.Według Kebonye i in. 46 oraz Johna i in. 54, im bliższe zeru są RMSE i MAE, tym lepsze wyniki.SVMR i EBK_SVMR mają wyższe skwantowane wartości RSME i MAE.Zaobserwowano, że oszacowania RSME były stale wyższe niż wartości MAE, co wskazuje na obecność wartości odstających.Według Legatesa i McCabe'a83, zakres, w jakim RMSE przekracza średni błąd bezwzględny (MAE), jest zalecany jako wskaźnik obecności wartości odstających.Oznacza to, że im bardziej heterogeniczny zbiór danych, tym wyższe wartości MAE i RMSE.Dokładność oceny krzyżowej walidacji mieszanego modelu Ca_Mg_K-EBK_SVMR do przewidywania zawartości Ni w glebach miejskich i podmiejskich wyniosła 63,70%.Według Li i in. 59, ten poziom dokładności jest akceptowalnym wskaźnikiem wydajności modelu. Niniejsze wyniki porównano z poprzednim badaniem Tarasova i in. 36, którego hybrydowy model stworzył MLPRK (Multilayer Perceptron Residual Kriging), powiązany z indeksem oceny dokładności EBK_SVMR podanym w bieżącym badaniu, RMSE (210) i MAE (167,5) był wyższy niż nasze wyniki w bieżącym badaniu (RMSE 95,479, MAE 77,368). Jednakże porównując R2 bieżącego badania (0,637) z R2 Tarasova i in. 36 (0,544), widać wyraźnie, że współczynnik determinacji (R2) jest wyższy w tym mieszanym modelu. Margines błędu (RMSE i MAE) (EBK SVMR) dla mieszanego modelu jest dwukrotnie niższy. Podobnie, Sergeev i in.34 odnotowali 0,28 (R2) dla opracowanego modelu hybrydowego (Multilayer Perceptron Residual Kriging), podczas gdy Ni w bieżącym badaniu odnotował 0,637 (R2). Poziom dokładności przewidywania tego modelu (EBK SVMR) wynosi 63,7%, podczas gdy dokładność przewidywania uzyskana przez Sergeeva i in. 34 wynosi 28%. Ostateczna mapa (rys. 5) utworzona przy użyciu modelu EBK_SVMR i Ca_Mg_K jako predyktora pokazuje przewidywania punktów gorących i umiarkowanego do niklu na całym badanym obszarze. Oznacza to, że stężenie niklu na badanym obszarze jest głównie umiarkowane, z wyższymi stężeniami w niektórych określonych obszarach.
Ostateczna mapa predykcyjna została przedstawiona przy użyciu hybrydowego modelu EBK_SVMR i Ca_Mg_K jako predyktora. [Mapa rozkładu przestrzennego została utworzona przy użyciu RStudio (wersja 1.4.1717: https://www.rstudio.com/).]
Na rysunku 6 przedstawiono stężenia PTE jako płaszczyznę kompozycji składającą się z pojedynczych neuronów. Żadna z płaszczyzn składowych nie wykazywała takiego samego wzoru kolorów, jak pokazano. Jednak odpowiednia liczba neuronów na narysowaną mapę wynosi 55. SeOM jest wytwarzany przy użyciu różnych kolorów, a im bardziej podobne wzory kolorów, tym bardziej porównywalne są właściwości próbek. Zgodnie z ich dokładną skalą kolorów, poszczególne pierwiastki (Ca, K i Mg) wykazywały podobne wzory kolorów do pojedynczych neuronów wysokiego poziomu i większości neuronów niskiego poziomu. Tak więc CaK i CaMg mają pewne podobieństwa do neuronów bardzo wysokiego poziomu i wzorów kolorów od niskiego do umiarkowanego. Oba modele przewidują stężenie Ni w glebie, wyświetlając średnie do wysokiego odcienie kolorów, takie jak czerwony, pomarańczowy i żółty. Model KMg wyświetla wiele wzorów kolorów o wysokiej intensywności w oparciu o precyzyjne proporcje i plamy kolorów od niskiego do średniego. Na precyzyjnej skali kolorów od niskiego do wysokiego, wzór rozkładu płaskiego składników modelu wykazał wysoki wzór kolorów, wskazujący na potencjalne stężenie niklu w glebie (patrz rysunek 4). Komponenty modelu CakMg pokazują zróżnicowany wzór kolorów od niskiego do wysokiego zgodnie z dokładną skalą kolorów. Ponadto prognoza modelu dotycząca zawartości niklu (CakMg) jest podobna do rozkładu przestrzennego niklu pokazanego na rysunku 5. Oba wykresy pokazują wysokie, średnie i niskie proporcje stężeń niklu w glebach miejskich i podmiejskich. Rysunek 7 przedstawia metodę konturową w grupowaniu k-średnich na mapie, podzielonej na trzy klastry na podstawie przewidywanej wartości w każdym modelu. Metoda konturowa reprezentuje optymalną liczbę klastrów. Spośród 115 zebranych próbek gleby, kategoria 1 uzyskała najwięcej próbek gleby, 74. Klaster 2 otrzymał 33 próbki, podczas gdy klaster 3 otrzymał 8 próbek. Siedmioskładnikowa kombinacja predyktorów planarnych została uproszczona, aby umożliwić prawidłową interpretację klastrów. Ze względu na liczne procesy antropogeniczne i naturalne wpływające na powstawanie gleby, trudno jest uzyskać prawidłowo zróżnicowane wzorce klastrów na rozproszonej mapie SeOM78.
Dane wyjściowe płaszczyzny komponentu dla każdej zmiennej Empirycznej Bayesowskiej Maszyny Wektorów Nośnych Kriginga (EBK_SVM_SeOM). [Mapy SeOM utworzono przy użyciu programu RStudio (wersja 1.4.1717: https://www.rstudio.com/).]
Różne komponenty klasyfikacji klastrów [mapy SeOM utworzono przy użyciu programu RStudio (wersja 1.4.1717: https://www.rstudio.com/).]
Niniejsze badanie wyraźnie ilustruje techniki modelowania stężeń niklu w glebach miejskich i podmiejskich. W badaniu przetestowano różne techniki modelowania, łącząc elementy z technikami modelowania, aby uzyskać najlepszy sposób przewidywania stężeń niklu w glebie. Składowe płaskie cechy przestrzenne SeOM techniki modelowania wykazały wysoki wzór kolorów od niskiego do wysokiego na dokładnej skali kolorów, wskazując stężenia Ni w glebie. Jednak mapa rozkładu przestrzennego potwierdza płaski rozkład przestrzenny składników wykazywany przez EBK_SVMR (patrz rysunek 5). Wyniki pokazują, że model regresji maszyny wektorów nośnych (Ca Mg K-SVMR) przewiduje stężenie Ni w glebie jako pojedynczy model, ale parametry walidacji i oceny dokładności wykazują bardzo wysokie błędy pod względem RMSE i MAE. Z drugiej strony technika modelowania stosowana w modelu EBK_MLR jest również wadliwa ze względu na niską wartość współczynnika determinacji (R2). Dobre wyniki uzyskano przy użyciu EBK SVMR i połączonych elementów (CaKMg) o niskim Błędy RMSE i MAE z dokładnością 63,7%. Okazuje się, że połączenie algorytmu EBK z algorytmem uczenia maszynowego może wygenerować hybrydowy algorytm, który może przewidywać stężenie PTE w glebie. Wyniki pokazują, że użycie Ca Mg K jako predyktorów do przewidywania stężeń Ni w badanym obszarze może poprawić przewidywanie stężeń Ni w glebie. Oznacza to, że ciągłe stosowanie nawozów na bazie niklu i przemysłowe zanieczyszczenie gleby przez przemysł stalowy ma tendencję do zwiększania stężenia niklu w glebie. Badanie to wykazało, że model EBK może zmniejszyć poziom błędu i poprawić dokładność modelu rozkładu przestrzennego gleby w glebach miejskich lub podmiejskich. Ogólnie rzecz biorąc, proponujemy zastosowanie modelu EBK-SVMR do oceny i przewidywania PTE w glebie; ponadto proponujemy użycie EBK do hybrydyzacji z różnymi algorytmami uczenia maszynowego. Stężenia Ni przewidywano, używając elementów jako współzmiennych; Jednakże użycie większej liczby współczynników znacznie poprawiłoby wydajność modelu, co można uznać za ograniczenie obecnej pracy. Innym ograniczeniem tego badania jest liczba zestawów danych wynosząca 115. Dlatego też dostarczenie większej ilości danych może poprawić wydajność proponowanej zoptymalizowanej metody hybrydyzacji.
PlantProbs.net.Nickel in Plants and Soil https://plantprobs.net/plant/nutrientImbalances/sodium.html (dostęp 28 kwietnia 2021).
Kasprzak, KS Postęp niklu w nowoczesnej toksykologii środowiskowej.otoczenie.toksykologia.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nikiel: przegląd jego źródeł i toksykologii środowiskowej. Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. i Hutchinson, TC Dopływ zanieczyszczeń z atmosfery i ich akumulacja w glebie i roślinności w pobliżu huty niklu i miedzi w Sudbury, Ontario, Kanada.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. i in. Metale ciężkie w glebie, roślinach i zagrożenia związane z wypasaniem przeżuwaczy w pobliżu kopalni miedzi i niklu Selebi-Phikwe w Botswanie.Okolice.Geochemia.Zdrowie https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Pierwiastki śladowe w glebie i… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (Dostęp 24 listopada 2020).
Almås, A., Singh, B., Rolnictwo, TS-NJ z 1995 r., nieokreślone.Wpływ rosyjskiego przemysłu niklowego na stężenie metali ciężkich w glebach uprawnych i trawach w Soer-Varanger w Norwegii.agris.fao.org.
Nielsen, GD i in. Absorpcja i retencja niklu w wodzie pitnej są powiązane z przyjmowaniem pokarmów i wrażliwością na nikiel. Toksykologia. Zastosowanie. Farmakodynamika. 154, 67–75 (1999).
Costa, M. & Klein, CB Karcynogeneza niklu, mutacja, epigenetyka czy selekcja.Otoczenie.Perspektywa zdrowotna.107, 2 (1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, NM; Analiza trendów potencjalnie toksycznych pierwiastków: przegląd bibliometryczny. Geochemia środowiska i zdrowie. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. i McBratney, AB Cyfrowe mapowanie gleby: krótka historia i kilka lekcji. Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML i Minasny, B. O cyfrowym mapowaniu gleby.Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Dostęp 28 kwietnia 2021).

Czas publikacji: 22-07-2022

Prognozowanie stężeń niklu w glebach podmiejskich i miejskich przy użyciu mieszanego empirycznego krigingu bayesowskiego i regresji maszyny wektorów nośnych

Telefon

Telefon

E-mail

E-mail

WhatsApp

WhatsApp

WeChat

WeChat

Szczyt