Прогнозиране на концентрациите на никел в крайградски и градски почви с помощта на смесен емпиричен байесов кригинг и регресия с опорни вектори

Благодарим ви, че посетихте Nature.com. Версията на браузъра, която използвате, има ограничена поддръжка за CSS. За най-добро изживяване ви препоръчваме да използвате актуализиран браузър (или да изключите режима на съвместимост в Internet Explorer). Междувременно, за да осигурим непрекъсната поддръжка, ще показваме сайта без стилове и JavaScript.
Замърсяването на почвата е голям проблем, причинен от човешката дейност. Пространственото разпределение на потенциално токсичните елементи (ПТЕ) варира в повечето градски и крайградски райони. Следователно е трудно да се предвиди пространствено съдържанието на ПТЕ в такива почви. Общо 115 проби са получени от Фридек Мистек в Чехия. Концентрациите на калций (Ca), магнезий (Mg), калий (K) и никел (Ni) са определени с помощта на емисионна спектрометрия с индуктивно свързана плазма. Отзивната променлива е Ni, а предикторите са Ca, Mg и K. Корелационната матрица между отговорната променлива и предикторната променлива показва задоволителна корелация между елементите. Резултатите от прогнозата показват, че регресията с опорни вектори (SVMR) се представя добре, въпреки че нейната оценена средноквадратична грешка (RMSE) (235.974 mg/kg) и средна абсолютна грешка (MAE) (166.946 mg/kg) са по-високи от другите приложени методи. Смесените модели за емпирична байесова кригинг-множествена линейна регресия (EBK-MLR) се представят слабо, както се вижда от коефициенти на детерминация по-малки от 0,1. Моделът емпирична байесова кригинг-машинна регресия с опорни вектори (EBK-SVMR) беше най-добрият модел, с ниски стойности на RMSE (95,479 mg/kg) и MAE (77,368 mg/kg) и висок коефициент на детерминация (R2 = 0,637). Резултатът от техниката на EBK-SVMR моделиране се визуализира с помощта на самоорганизираща се карта. Клъстерираните неврони в равнината на хибридния модел CakMg-EBK-SVMR компонент показват множество цветови модели, които предсказват концентрациите на Ni в градски и крайградски почви. Резултатите показват, че комбинирането на EBK и SVMR е ефективна техника за прогнозиране на концентрациите на Ni в градски и крайградски почви.
Никелът (Ni) се счита за микроелемент за растенията, защото допринася за фиксирането на атмосферния азот (N) и метаболизма на уреята, като и двете са необходими за покълването на семената. В допълнение към приноса си за покълването на семената, Ni може да действа като инхибитор на гъбички и бактерии и да насърчава развитието на растенията. Липсата на никел в почвата позволява на растението да го абсорбира, което води до хлороза на листата. Например, вигненият грах и зеленият фасул изискват прилагането на торове на основата на никел, за да се оптимизира фиксирането на азота2. Продължителното прилагане на торове на основата на никел за обогатяване на почвата и увеличаване на способността на бобовите растения да фиксират азот в почвата непрекъснато увеличава концентрацията на никел в нея. Въпреки че никелът е микроелемент за растенията, прекомерният му прием в почвата може да причини повече вреда, отколкото полза. Токсичността на никела в почвата минимизира pH на почвата и възпрепятства усвояването на желязото като основно хранително вещество за растежа на растенията1. Според Liu3, Ni е установено, че е 17-ият важен елемент, необходим за развитието и растежа на растенията. В допълнение към ролята на никела в развитието и растежа на растенията, хората се нуждаят от него за различни приложения. Галванопластиката, производството на сплави на основата на никел, и производството на запалителни устройства и свещи в автомобилната индустрия изискват използването на никел в различни промишлени сектори. Освен това, сплави на основата на никел и галванизирани изделия са широко използвани в кухненски съдове, аксесоари за бални зали, консумативи за хранително-вкусовата промишленост, електрически, проводници и кабели, реактивни турбини, хирургически импланти, текстил и корабостроене5. Нивата, богати на никел в почвите (т.е. повърхностните почви), се приписват както на антропогенни, така и на природни източници, но предимно никелът е естествен източник, а не антропогенен4,6. Естествените източници на никел включват вулканични изригвания, растителност, горски пожари и геоложки процеси; антропогенните източници обаче включват никелови/кадмиеви батерии в стоманодобивната промишленост, галванопластика, дъгово заваряване, дизелово гориво и горивни масла, както и атмосферни емисии от изгаряне на въглища и изгаряне на отпадъци и утайки. Натрупване на никел7,8. Според Freedman and Hutchinson9 и Manyiwa et al. 10, основните източници на замърсяване на горния почвен слой в непосредствена и съседна околна среда са главно топилни пещи и мини на базата на никел и мед. Горният почвен слой около рафинерията за никел и мед в Съдбъри в Канада е с най-високи нива на замърсяване с никел - 26 000 мг/кг11. За разлика от това, замърсяването от производството на никел в Русия е довело до по-високи концентрации на никел в норвежката почва11. Според Алмс и др. 12, количеството на никел, екстрахируем с HNO3, в най-добре обработваемите земи в региона (производство на никел в Русия) варира от 6,25 до 136,88 mg/kg, което съответства на средна стойност от 30,43 mg/kg и базова концентрация от 25 mg/kg. Според Kabata 11, прилагането на фосфорни торове в земеделски почви в градски или крайградски почви през последователни вегетационни сезони може да доведе до проникване или замърсяване на почвата. Потенциалните ефекти на никела върху хората могат да доведат до рак чрез мутагенеза, хромозомни увреждания, генериране на Z-ДНК, блокиран ексцизионен ремонт на ДНК или епигенетични процеси 13. В опити с животни е установено, че никелът има потенциал да причини различни тумори, а канцерогенните никелови комплекси могат да изострят такива тумори.
Оценките на замърсяването на почвата процъфтяват напоследък поради широк спектър от здравни проблеми, произтичащи от взаимоотношенията почва-растение, почвата и биологичните взаимоотношения в почвата, екологичната деградация и оценката на въздействието върху околната среда. Към днешна дата пространственото прогнозиране на потенциално токсични елементи (PTEs) като Ni в почвата е трудоемко и отнема много време, използвайки традиционни методи. Появата на цифровото картографиране на почвата (DSM) и настоящият му успех15 значително подобриха прогнозното картографиране на почвата (PSM). Според Минасни и Макбратни16, прогнозното картографиране на почвата (DSM) се е доказало като видна поддисциплина на почвознанието. Лагачери и Макбратни, 2006 г. определят DSM като „създаване и попълване на пространствени почвени информационни системи чрез използване на in situ и лабораторни методи на наблюдение и пространствени и непространствени системи за почвен инференциал“. Макбратни и др. 17 очертават, че съвременният DSM или PSM е най-ефективната техника за прогнозиране или картографиране на пространственото разпределение на PTE, почвените типове и почвените свойства. Геостатистиката и алгоритмите за машинно обучение (MLA) са техники за DSM моделиране, които създават дигитализирани карти с помощта на компютри, използващи значителни и минимални данни.
Deutsch18 и Olea19 определят геостатистиката като „съвкупност от числени техники, които се занимават с представянето на пространствени атрибути, използвайки главно стохастични модели, като например как анализът на времевите серии характеризира темпоралните данни“. Геостатистиката включва предимно оценка на вариограми, които позволяват количествено определяне и дефиниране на зависимостите на пространствените стойности от всеки набор от данни20. Gumiaux et al.20 допълнително илюстрират, че оценката на вариограмите в геостатистиката се основава на три принципа, включително (а) изчисляване на мащаба на корелация на данните, (б) идентифициране и изчисляване на анизотропия в несъответствието в набора от данни и (в) в допълнение към... В допълнение към отчитането на присъщата грешка на данните от измерванията, отделена от локалните ефекти, се оценяват и ефектите върху площта. Въз основа на тези концепции в геостатистиката се използват много интерполационни техники, включително общ кригинг, ко-кригинг, обикновен кригинг, емпиричен байесов кригинг, метод на прост кригинг и други добре познати интерполационни техники за картографиране или прогнозиране на PTE, характеристики на почвата и типове почва.
Алгоритмите за машинно обучение (MLA) са сравнително нова техника, която използва по-големи нелинейни класове данни, захранвани от алгоритми, използвани предимно за извличане на данни, идентифициране на модели в данните и многократно прилагани за класификация в научни области като почвознание и задачи за връщане на данни. Многобройни изследователски статии разчитат на MLA модели за прогнозиране на PTE в почвите, като например Tan et al. 22 (случайни гори за оценка на тежки метали в земеделски почви), Sakizadeh et al. 23 (моделиране с помощта на машини за опорни вектори и изкуствени невронни мрежи) замърсяване на почвата). В допълнение, Vega et al. 24 (CART за моделиране на задържане и адсорбция на тежки метали в почвата), Sun et al. 25 (приложение на кубистично разпределение на Cd в почвата) и други алгоритми като k-най-близък съсед, обобщена усилена регресия и усилени регресионни дървета също прилагат MLA за прогнозиране на PTE в почвата.
Приложението на DSM алгоритми в прогнозирането или картографирането е изправено пред няколко предизвикателства. Много автори смятат, че MLA е по-добра от геостатистиката и обратно. Въпреки че едното е по-добро от другото, комбинацията от двете подобрява нивото на точност на картографирането или прогнозирането в DSM15. Woodcock и Gopal26 Finke27; Pontius и Cheuk28 и Grunwald29 коментират недостатъците и някои грешки в прогнозираното картографиране на почвата. Почвознанието е изпробвало различни техники за оптимизиране на ефективността, точността и предвидимостта на DSM картографирането и прогнозирането. Комбинацията от несигурност и проверка е един от многото различни аспекти, интегрирани в DSM, за да се оптимизира ефективността и да се намалят дефектите. Agyeman et al.15 обаче посочват, че поведението при валидиране и несигурността, въведени от създаването и прогнозирането на картата, трябва да бъдат независимо валидирани, за да се подобри качеството на картата. Ограниченията на DSM се дължат на географски разпръснатото качество на почвата, което включва компонент на несигурност; Липсата на сигурност в DSM обаче може да възникне от множество източници на грешки, а именно ковариатна грешка, грешка на модела, грешка в местоположението и аналитична грешка 31. Неточностите при моделирането, предизвикани от MLA и геостатистическите процеси, са свързани с липса на разбиране, което в крайна сметка води до опростяване на реалния процес 32. Независимо от естеството на моделирането, неточностите могат да се дължат на параметри на моделиране, прогнози на математически модели или интерполация 33. Наскоро се появи нова тенденция в DSM, която насърчава интегрирането на геостатистиката и MLA в картографирането и прогнозирането. Няколко почволози и автори, като Sergeev et al. 34; Subbotina et al. 35; Tarasov et al. 36 и Tarasov et al. 37, са използвали точното качество на геостатистиката и машинното обучение, за да генерират хибридни модели, които подобряват ефективността на прогнозирането и картографирането. качество. Някои от тези хибридни или комбинирани алгоритмични модели са Кригинг с изкуствена невронна мрежа (ANN-RK), Многослоен перцептронен остатъчен кригинг (MLP-RK), Обобщен регресионен остатъчен кригинг с невронна мрежа (GR-NNRK)36, Кригинг с изкуствена невронна мрежа - Многослоен перцептрон (ANN-K-MLP)37 и Ко-кригинг и Гаусов процес на регресия38.
Според Sergeev et al., комбинирането на различни техники за моделиране има потенциал да елиминира дефектите и да увеличи ефективността на получения хибриден модел, вместо да се разработва единичен модел. В този контекст, тази нова статия твърди, че е необходимо да се приложи комбиниран алгоритъм от геостатистика и MLA, за да се създадат оптимални хибридни модели за прогнозиране на обогатяването с Ni в градски и крайградски райони. Това проучване ще разчита на емпиричния байесов кригинг (EBK) като базов модел и ще го комбинира с модели на Support Vector Machine (SVM) и Multiple Linear Regression (MLR). Хибридизацията на EBK с който и да е MLA не е известна. Наблюдаваните множество смесени модели са комбинации от обикновен, остатъчен, регресионен кригинг и MLA. EBK е геостатистически метод за интерполация, който използва пространствено стохастичен процес, локализиран като нестационарно/стационарно случайно поле с дефинирани параметри на локализация върху полето, позволявайки пространствена вариация. EBK е използван в различни изследвания, включително анализ на разпределението на органичния въглерод в земеделските почви, оценка на замърсяването на почвата и картографиране на свойствата на почвата.
От друга страна, самоорганизиращият се граф (SeOM) е алгоритъм за обучение, който е прилаган в различни статии като Li et al. 43, Wang et al. 44, Hossain Bhuiyan et al. 45 и Kebonye et al. 46. Определяне на пространствените атрибути и групирането на елементите. Wang et al. 44 посочват, че SeOM е мощна техника за обучение, известна със способността си да групира и представя нелинейни проблеми. За разлика от други техники за разпознаване на образи, като анализ на главните компоненти, размито клъстериране, йерархично клъстериране и многокритериално вземане на решения, SeOM е по-добър в организирането и идентифицирането на PTE модели. Според Wang et al. 44, SeOM може пространствено да групира разпределението на свързани неврони и да осигури визуализация на данни с висока резолюция. SeOM ще визуализира данните за прогнозиране на Ni, за да получи най-добрия модел за характеризиране на резултатите за директна интерпретация.
Тази статия има за цел да генерира надежден модел за картографиране с оптимална точност за прогнозиране на съдържанието на никел в градски и крайградски почви. Предполагаме, че надеждността на смесения модел зависи главно от влиянието на други модели, свързани с базовия модел. Признаваме предизвикателствата, пред които е изправен DSM, и макар че тези предизвикателства се разглеждат на множество фронтове, комбинацията от напредък в геостатистиката и MLA моделите изглежда е постепенна; следователно ще се опитаме да отговорим на изследователски въпроси, които могат да доведат до смесени модели. Колко точен е моделът обаче при прогнозиране на целевия елемент? Също така, какво е нивото на оценка на ефективността, базирано на валидиране и оценка на точността? Следователно, специфичните цели на това проучване бяха (а) да се създаде комбиниран модел на смес за SVMR или MLR, използвайки EBK като базов модел, (б) да се сравнят получените модели, (в) да се предложи най-добрият модел на смес за прогнозиране на концентрациите на Ni в градски или крайградски почви и (г) да се приложи SeOM за създаване на карта с висока резолюция на пространствените вариации на никела.
Проучването се провежда в Чехия, по-специално в област Фридек Мистек в Моравско-силезкия регион (виж Фигура 1). Географията на изследваната област е много неравна и е предимно част от региона Моравско-силезки Бескиди, който е част от външния ръб на Карпатите. Изследваната област е разположена между 49° 41′ 0′ северна ширина и 18° 20′ 0′ и.д., а надморската височина е между 225 и 327 м; Въпреки това, системата за класификация на Koppen за климатичното състояние на региона е оценена като Cfb = умерен океански климат. Има много валежи дори през сухите месеци. Температурите варират леко през годината между -5 °C и 24 °C, рядко падайки под -14 °C или над 30 °C, докато средните годишни валежи са между 685 и 752 мм47. Очакваната площ на изследването на цялата област е 1208 квадратни километра, с 39,38% от обработваемата земя и 49,36% от горското покритие. От друга страна, площта, използвана в това проучване, е около 889,8 квадратни километра. В и около Острава стоманодобивната промишленост и металургичните заводи са много активни. Металургичните заводи, стоманодобивната промишленост, където никелът се използва в неръждаеми стомани (напр. за устойчивост на атмосферна корозия) и легирани стомани (никелът увеличава якостта на сплавта, като същевременно запазва добрата ѝ пластичност и жилавост), и интензивното земеделие, като например прилагането на фосфатни торове и животновъдството, са потенциални източници на никел в региона. (напр. добавяне на никел към агнета за увеличаване на темповете на растеж при агнета и говеда, хранени с ниско съдържание на храна). Други промишлени приложения на никела в изследователски области включват употребата му в галванопластиката, включително процеси на галванопластика с никел и процеси на безтоково никелиране. Свойствата на почвата лесно се различават от цвета, структурата и съдържанието на карбонати на почвата. Текстурата на почвата е средна до фина, произтичаща от основната порода. Те са колувиални, алувиални или еолични по природа. Някои почвени области изглеждат на петна по повърхността и подпочвата, често с бетон и избелване. Камбисолите и стагносолите обаче са най-често срещаните видове почви в региона48. С надморска височина от 455,1 до 493,5 м, камбисолите доминират в Чехия49.
Карта на изследваната област [Картата на изследваната област е създадена с помощта на ArcGIS Desktop (ESRI, Inc, версия 10.7, URL: https://desktop.arcgis.com).]
Общо 115 проби от горния почвен слой са получени от градски и крайградски почви в област Фридек Мистек. Използваната схема на вземане на проби е била правилна мрежа с почвени проби, разположени на разстояние 2 × 2 км една от друга, а горният почвен слой е измерен на дълбочина от 0 до 20 см с помощта на ръчно GPS устройство (Leica Zeno 5 GPS). Пробите са опаковани в торбички Ziploc, правилно етикетирани и изпратени до лабораторията. Пробите са изсушени на въздух, за да се получат пулверизирани проби, пулверизирани от механична система (дискова мелница Fritsch) и пресяти (размер на ситото 2 mm). Поставете 1 грам изсушени, хомогенизирани и пресяти почвени проби в ясно етикетирани тефлонови бутилки. Във всеки тефлонов съд се дозират 7 ml 35% HCl и 3 ml 65% HNO3 (използвайки автоматичен дозатор - по един за всяка киселина), покрийте леко и оставете пробите да престоят една нощ за реакцията (програма aqua regia). Поставете супернатантата върху гореща метална плоча (температура: 100 W) и 160 °C) в продължение на 2 часа, за да се улесни процесът на смилане на пробите, след което се охлажда. Супернатантът се прехвърля в 50 ml мерителна колба и се разрежда до 50 ml с дейонизирана вода. След това разреденият супернатант се филтрира в 50 ml PVC епруветка с дейонизирана вода. Освен това, 1 ml от разтвора за разреждане се разрежда с 9 ml дейонизирана вода и се филтрира в 12 ml епруветка, подготвена за PTE псевдоконцентрация. Концентрациите на PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) са определени чрез ICP-OES (индуктивно свързана плазмена оптична емисионна спектроскопия) (Thermo Fisher Scientific, САЩ) съгласно стандартните методи и споразумение. Осигуряване на процедури за осигуряване и контрол на качеството (QA/QC) (SRM NIST 2711a Montana II Soil). PTE с граници на откриване под половината са изключени от това проучване. Границата на откриване на PTE, използван в това проучване, е... 0.0004.(вие). Освен това, процесът на контрол на качеството и осигуряване на качеството за всеки анализ се осигурява чрез анализ на референтни стандарти. За да се гарантира минимизиране на грешките, е извършен двоен анализ.
Емпиричният байесов кригинг (EBK) е една от многото геостатистически интерполационни техники, използвани в моделирането в различни области, като например почвознанието. За разлика от други техники за кригинг интерполация, EBK се различава от традиционните кригинг методи, като отчита грешката, оценена от модела на полувариограмата. При интерполацията на EBK по време на интерполацията се изчисляват няколко модела на полувариограма, а не само една полувариограма. Интерполационните техники елиминират несигурността и програмирането, свързани с това начертаване на полувариограмата, което представлява силно сложна част от достатъчния кригинг метод. Процесът на интерполация на EBK следва трите критерия, предложени от Криворучко50: (а) моделът оценява полувариограмата от входния набор от данни, (б) новата прогнозирана стойност за всяко местоположение на входния набор от данни въз основа на генерираната полувариограма и (в) крайният модел се изчислява от симулиран набор от данни. Правилото на байесовото уравнение е дадено като апостериорна...
Където \(Prob\left(A\right)\) представлява априорната вероятност, \(Prob\left(B\right)\) граничната вероятност се игнорира в повечето случаи, \(Prob (B,A)\). Изчисляването на полувариограмата се основава на правилото на Байес, което показва вероятността наборите от наблюдения да бъдат създадени от полувариограми. Стойността на полувариограмата след това се определя с помощта на правилото на Байес, което посочва колко е вероятно да се създаде набор от наблюдения от полувариограмата.
Машината с опорни вектори е алгоритъм за машинно обучение, който генерира оптимална разделяща хиперплоскост, за да разграничи идентични, но не линейно независими класове. Vapnik51 създаде алгоритъма за класификация на намеренията, но наскоро той се използва за решаване на регресионно-ориентирани проблеми. Според Li et al.52, SVM е една от най-добрите техники за класифициране и се използва в различни области. Регресионният компонент на SVM (Support Vector Machine Regression – SVMR) е използван в този анализ. Cherkassky и Mulier53 са пионери в SVMR като регресия, базирана на ядро, чието изчисляване е извършено с помощта на линеен регресионен модел с многостранни пространствени функции. John et al.54 съобщават, че SVMR моделирането използва линейна регресия на хиперплоскост, която създава нелинейни връзки и позволява пространствени функции. Според Vohland et al. 55, epsilon (ε)-SVMR използва обучения набор от данни, за да получи модел на представяне като епсилон-нечувствителна функция, която се прилага за независимо картографиране на данните с най-доброто епсилонно отклонение от обучение върху корелирани данни. Зададената грешка в разстоянието се игнорира от действителната стойност и ако грешката е по-голяма от ε(ε), свойствата на почвата я компенсират. Моделът също така намалява сложността на обучителните данни до по-широко подмножество от опорни вектори. Уравнението, предложено от Vapnik51, е показано по-долу.
където b представлява скаларния праг, \(K\left({x}_{,}{x}_{k}\right)\) представлява функцията на ядрото, \(\alpha\) представлява множителя на Лагранж, N представлява числов набор от данни, \({x}_{k}\) представлява входните данни, а \(y\) са изходните данни. Едно от ключовите използвани ядра е SVMR операцията, която е Гаусов радиален базисен функционал (RBF). RBF ядрото се прилага за определяне на оптималния SVMR модел, което е критично за получаване на най-финия фактор на наказателния набор C и параметъра на ядрото гама (γ) за PTE обучителните данни. Първо, оценихме обучителния набор и след това тествахме производителността на модела върху валидационния набор. Използваният параметър за управление е сигма, а стойността на метода е svmRadial.
Моделът на множествена линейна регресия (MLR) е регресионен модел, който представя връзката между променливата на отговора и редица променливи-предиктори, като използва линейни обединени параметри, изчислени по метода на най-малките квадрати. В MLR моделът на най-малките квадрати е предсказваща функция на свойствата на почвата след избор на обяснителни променливи. Необходимо е да се използва отговорът, за да се установи линейна връзка, използвайки обяснителни променливи. PTE беше използван като променлива на отговора, за да се установи линейна връзка с обяснителните променливи. Уравнението на MLR е
където y е променливата на отговора, \(a\) е пресечната точка, n е броят на предикторите, \({b}_{1}\) е частичната регресия на коефициентите, \({x}_{i}\) представлява предиктор или обяснителна променлива, а \({\varepsilon}_{i}\) представлява грешката в модела, известна още като остатък.
Смесени модели бяха получени чрез комбиниране на EBK с SVMR и MLR. Това се прави чрез извличане на прогнозирани стойности от EBK интерполация. Прогнозираните стойности, получени от интерполираните Ca, K и Mg, се получават чрез комбинаторен процес за получаване на нови променливи, като CaK, CaMg и KMg. Елементите Ca, K и Mg след това се комбинират, за да се получи четвърта променлива, CaKMg. Като цяло, получените променливи са Ca, K, Mg, CaK, CaMg, KMg и CaKMg. Тези променливи станаха наши предиктори, помагайки за прогнозиране на концентрациите на никел в градски и крайградски почви. Алгоритъмът SVMR беше изпълнен върху предикторите, за да се получи смесен модел Емпирична Байесовска Кригинг-Машина за Поддържащи Вектори (EBK_SVM). По подобен начин, променливите също се прехвърлят през алгоритъма MLR, за да се получи смесен модел Емпирична Байесовска Кригинг-Множествена линейна регресия (EBK_MLR). Обикновено, променливите Ca, K, Mg, CaK, CaMg, KMg и CaKMg се използват като ковариати за предсказване на съдържанието на Ni в градски и крайградски почви. Най-приемливият получен модел (EBK_SVM или EBK_MLR) ще бъде визуализиран с помощта на самоорганизираща се графика. Работният процес на това проучване е показан на Фигура 2.
Използването на SeOM се превърна в популярен инструмент за организиране, оценка и прогнозиране на данни във финансовия сектор, здравеопазването, промишлеността, статистиката, почвознанието и други. SeOM е създаден с помощта на изкуствени невронни мрежи и методи за самостоятелно обучение за организация, оценка и прогнозиране. В това проучване SeOM е използван за визуализиране на концентрациите на Ni въз основа на най-добрия модел за прогнозиране на Ni в градски и крайградски почви. Данните, обработени при оценката на SeOM, се използват като n входно-мерни векторни променливи43,56.Melssen et al. 57 описват връзката на входен вектор в невронна мрежа чрез един входен слой към изходен вектор с един тегловен вектор. Изходът, генериран от SeOM, е двуизмерна карта, състояща се от различни неврони или възли, вплетени в шестоъгълни, кръгли или квадратни топологични карти според тяхната близост. Сравнявайки размерите на картите въз основа на метрика, грешка на квантуване (QE) и топографска грешка (TE), е избран SeOM моделът със съответно 0,086 и 0,904, който е единица с 55 карти (5 × 11). Структурата на невроните се определя според броя на възлите в емпиричното уравнение.
Броят на използваните в това проучване данни е 115 извадки. Използван е случаен подход за разделяне на данните на тестови данни (25% за валидиране) и набори от обучителни данни (75% за калибриране). Обучителният набор от данни се използва за генериране на регресионен модел (калибриране), а тестовият набор от данни се използва за проверка на способността за обобщаване58. Това е направено, за да се оцени пригодността на различни модели за прогнозиране на съдържанието на никел в почвите. Всички използвани модели са преминали през десеткратен процес на кръстосана валидация, повторен пет пъти. Променливите, получени чрез EBK интерполация, се използват като предиктори или обяснителни променливи за прогнозиране на целевата променлива (PTE). Моделирането се обработва в RStudio с помощта на пакетите library(Kohonen), library(caret), library(modelr), library(“e1071″), library(“plyr”), library(“caTools”), library(”prospectr”) и libraries(“Metrics”).
Различни параметри за валидиране бяха използвани, за да се определи най-добрият модел, подходящ за прогнозиране на концентрациите на никел в почвата, и да се оцени точността на модела и неговата валидация. Моделите за хибридизация бяха оценени с помощта на средна абсолютна грешка (MAE), средноквадратична грешка (RMSE) и R-квадрат или коефициентно определяне (R2). R2 определя дисперсията на пропорциите в отговора, представена от регресионния модел. RMSE и величината на дисперсията в независимите мерки описват предсказващата сила на модела, докато MAE определя действителната количествена стойност. Стойността на R2 трябва да е висока, за да се оцени най-добрият модел на смес, използвайки параметрите за валидиране, като колкото по-близо е стойността до 1, толкова по-висока е точността. Според Li et al. 59, стойност на критерия R2 от 0,75 или по-голяма се счита за добър предиктор; от 0,5 до 0,75 е приемлива производителност на модела, а под 0,5 е неприемлива производителност на модела. При избор на модел, използващ методите за оценка на критериите за валидиране RMSE и MAE, по-ниските получени стойности бяха достатъчни и се считаха за най-добър избор. Следното уравнение описва метода за проверка.
където n представлява размера на наблюдаваната стойност \({Y}_{i}\) представлява измереният отговор, а \({\widehat{Y}}_{i}\) също представлява прогнозираната стойност на отговора, следователно, за първите i наблюдения.
Статистически описания на предсказващите и отговорните променливи са представени в Таблица 1, показващи средна стойност, стандартно отклонение (SD), коефициент на вариация (CV), минимум, максимум, ексцес и асиметрия. Минималните и максималните стойности на елементите са в низходящ ред съответно на Mg < Ca < K < Ni и Ca < Mg < K < Ni. Концентрациите на отговорната променлива (Ni), взети от изследваната област, варират от 4,86 до 42,39 mg/kg. Сравнението на Ni със средната за света (29 mg/kg) и средната за Европа (37 mg/kg) показва, че общата изчислена геометрична средна стойност за изследваната област е в допустимия диапазон. Въпреки това, както е показано от Kabata-Pendias11, сравнението на средната концентрация на никел (Ni) в настоящото проучване със земеделски почви в Швеция показва, че текущата средна концентрация на никел е по-висока. По същия начин, средната концентрация на Фридек Мистек в градски и крайградски почви в настоящото проучване (Ni 16,15 mg/kg) е по-висока от допустимата. граница от 60 (10,2 mg/kg) за Ni в полски градски почви, докладвана от Różański et al. Освен това, Bretzel и Calderisi61 регистрират много ниски средни концентрации на Ni (1,78 mg/kg) в градски почви в Тоскана в сравнение с настоящото проучване. Jim62 също така открива по-ниска концентрация на никел (12,34 mg/kg) в градски почви в Хонконг, която е по-ниска от текущата концентрация на никел в това проучване. Birke et al.63 съобщават за средна концентрация на Ni от 17,6 mg/kg в стара минна и градска индустриална зона в Саксония-Анхалт, Германия, която е с 1,45 mg/kg по-висока от средната концентрация на Ni в района (16,15 mg/kg). Текущи изследвания. Прекомерното съдържание на никел в почвите в някои градски и крайградски райони на изследваната област може да се дължи главно на желязната и стоманодобивна промишленост и металургията. Това е в съответствие с проучването на Khodadoust et al. 64, че стоманодобивната промишленост и металообработването са основните източници на замърсяване с никел в почвите. Предсказващите фактори обаче варират от 538,70 mg/kg до 69 161,80 mg/kg за Ca, 497,51 mg/kg до 3535,68 mg/kg за K и 685,68 mg/kg до 5970,05 mg/kg за Mg.Jakovljevic et al. 65 изследва общото съдържание на Mg и K в почвите в Централна Сърбия. Те установяват, че общите концентрации (съответно 410 mg/kg и 400 mg/kg) са по-ниски от концентрациите на Mg и K в настоящото проучване. В Източна Полша, Оржеховски и Смолчински66 оценяват общото съдържание на Ca, Mg и K и показват средни концентрации на Ca (1100 mg/kg), Mg (590 mg/kg) и K (810 mg/kg). Съдържанието в горния почвен слой е по-ниско от това на отделния елемент в това проучване. Неотдавнашно проучване на Pongrac et al.67 показва, че общото съдържание на Ca, анализирано в 3 различни почви в Шотландия, Великобритания (почва Mylnefield, почва Balruddery и почва Hartwood), показва по-високо съдържание на Ca в това проучване.
Поради различните измерени концентрации на взетите проби от елементи, разпределенията на елементите в набора от данни показват различна асиметрия. Асиметрията и ексцесът на елементите варират съответно от 1,53 до 7,24 и от 2,49 до 54,16. Всички изчислени елементи имат нива на асиметрия и ексцес над +1, което показва, че разпределението на данните е неравномерно, изкривено в правилната посока и с пикове. Оценените коефициенти на вариация (CV) на елементите също показват, че K, Mg и Ni показват умерена вариабилност, докато Ca има изключително висока вариабилност. CV на K, Ni и Mg обясняват тяхното равномерно разпределение. Освен това, разпределението на Ca е неравномерно и външни източници могат да повлияят на нивото му на обогатяване.
Корелацията на предсказващите променливи с отговорните елементи показва задоволителна корелация между елементите (виж Фигура 3). Корелацията показва, че CaK проявява умерена корелация със стойност на r = 0,53, както и CaNi. Въпреки че Ca и K показват скромни връзки помежду си, изследователи като Kingston et al. 68 и Santo69 предполагат, че нивата им в почвата са обратно пропорционални. Ca и Mg обаче са антагонистични на K, но CaK корелира добре. Това може да се дължи на прилагането на торове като калиев карбонат, който е с 56% по-висок в калия. Калият е умерено корелиран с магнезия (KM r = 0,63). В торовата индустрия тези два елемента са тясно свързани, тъй като калиев магнезиев сулфат, калиев магнезиев нитрат и поташ се прилагат в почвите, за да се увеличат нивата им на дефицит. Никелът е умерено корелиран с Ca, K и Mg със стойности на r = 0,52, 0,63 и 0,55, съответно. Връзките, включващи калций, магнезий и PTEs като никел, са сложни, но въпреки това магнезият инхибира абсорбцията на калций, калцият намалява ефектите на излишния магнезий и както магнезият, така и калцият намаляват токсичните ефекти на никела в почвата.
Корелационна матрица за елементи, показваща връзката между предиктори и отговори (Забележка: тази фигура включва диаграма на разсейване между елементите, нивата на значимост са базирани на p < 0,001).
Фигура 4 илюстрира пространственото разпределение на елементите. Според Burgos et al.70, прилагането на пространствено разпределение е техника, използвана за количествено определяне и открояване на горещи точки в замърсени райони. Нивата на обогатяване с Ca на Фиг. 4 могат да се видят в северозападната част на картата за пространствено разпределение. Фигурата показва горещи точки с умерено до високо обогатяване с Ca. Обогатяването с калций в северозападната част на картата вероятно се дължи на използването на негасена вар (калциев оксид) за намаляване на киселинността на почвата и използването ѝ в стоманодобивните заводи като алкален кислород в процеса на производство на стомана. От друга страна, други фермери предпочитат да използват калциев хидроксид в киселинни почви, за да неутрализират pH, което също увеличава съдържанието на калций в почвата71. Калият също показва горещи точки в северозападната и източната част на картата. Северозападът е основна земеделска общност и умереният до висок модел на калий може да се дължи на прилагането на NPK и поташ. Това е в съответствие с други проучвания, като Madaras and Lipavský72, Madaras et al.73, Pulkrabová et al.74, Asare et al.75, които наблюдават, че стабилизирането на почвата и Третирането с KCl и NPK доведе до високо съдържание на K в почвата. Пространственото обогатяване с калий в северозападната част на картата на разпространение може да се дължи на използването на торове на калиева основа, като калиев хлорид, калиев сулфат, калиев нитрат, поташ и калиев хлорид, за да се увеличи съдържанието на калий в бедните почви. Zádorová et al. 76 и Tlustoš et al. 77 посочва, че прилагането на торове на основата на калий (K) увеличава съдържанието на калий в почвата и значително би увеличило съдържанието на хранителни вещества в почвата в дългосрочен план, особено K и Mg, показващи гореща точка в почвата. Сравнително умерени горещи точки в северозападната част на картата и югоизточната част на картата. Колоидната фиксация в почвата намалява концентрацията на магнезий в почвата. Липсата му в почвата кара растенията да проявяват жълтеникава междужилкова хлороза. Торове на основата на магнезий, като калиев магнезиев сулфат, магнезиев сулфат и кизерит, третират дефицитите (растенията изглеждат лилави, червени или кафяви, което показва дефицит на магнезий) в почви с нормален диапазон на pH6. Натрупването на никел върху градските и крайградските почвени повърхности може да се дължи на антропогенни дейности като селското стопанство и значението на никела в производството на неръждаема стомана78.
Пространствено разпределение на елементите [карта на пространственото разпределение е създадена с помощта на ArcGIS Desktop (ESRI, Inc, версия 10.7, URL: https://desktop.arcgis.com).]
Резултатите от индекса на производителност на модела за елементите, използвани в това проучване, са показани в Таблица 2. От друга страна, RMSE и MAE на Ni са близки до нула (0.86 RMSE, -0.08 MAE). От друга страна, както стойностите на RMSE, така и на MAE на K са приемливи. Резултатите от RMSE и MAE са по-високи за калций и магнезий. Резултатите от MAE и RMSE на Ca и K са по-големи поради различните набори от данни. RMSE и MAE на това проучване, използващо EBK за прогнозиране на Ni, се оказаха по-добри от резултатите на John et al. 54, използващи синергичен кригинг за прогнозиране на концентрациите на S в почвата, използвайки същите събрани данни. Изследваните от нас резултати от EBK корелират с тези на Fabijaczyk et al. 41, Yan et al. 79, Beguin et al. 80, Adhikary et al. 81 и John et al. 82, особено K и Ni.
Производителността на отделните методи за прогнозиране на съдържанието на никел в градски и крайградски почви беше оценена с помощта на производителността на моделите (Таблица 3). Валидирането на модела и оценката на точността потвърдиха, че предикторът Ca_Mg_K, комбиниран с модела EBK SVMR, дава най-добри резултати. Калибровъчният модел Ca_Mg_K-EBK_SVMR модел R2, средноквадратичната грешка (RMSE) и средната абсолютна грешка (MAE) бяха 0.637 (R2), 95.479 mg/kg (RMSE) и 77.368 mg/kg (MAE). Ca_Mg_K-SVMR беше 0.663 (R2), 235.974 mg/kg (RMSE) и 166.946 mg/kg (MAE). Въпреки това, добри стойности на R2 бяха получени за Ca_Mg_K-SVMR (0.663 mg/kg R2) и Ca_Mg-EBK_SVMR (0.643 = R2); Резултатите от техните RMSE и MAE бяха по-високи от тези за Ca_Mg_K-EBK_SVMR (R2 0.637) (виж Таблица 3). Освен това, RMSE и MAE на модела Ca_Mg-EBK_SVMR (RMSE = 1664.64 и MAE = 1031.49) са съответно 17.5 и 13.4, което е по-голямо от това на Ca_Mg_K-EBK_SVMR. По подобен начин, RMSE и MAE на модела Ca_Mg-K SVMR (RMSE = 235.974 и MAE = 166.946) са с 2.5 и 2.2 по-големи от тези на RMSE и MAE на Ca_Mg_K-EBK_SVMR, съответно. Изчислените резултати от RMSE показват колко концентриран е наборът от данни с линията на най-добро съвпадение. Наблюдавани са по-високи RSME и MAE. Според Kebonye et al. 46 и john et al. 54, колкото по-близки са RMSE и MAE до нула, толкова по-добри са резултатите. SVMR и EBK_SVMR имат по-високи квантовани стойности на RSME и MAE. Наблюдавано е, че оценките на RSME са постоянно по-високи от стойностите на MAE, което показва наличието на отклонения. Според Legates и McCabe83, степента, до която RMSE надвишава средната абсолютна грешка (MAE), се препоръчва като индикатор за наличието на отклонения. Това означава, че колкото по-хетерогенен е наборът от данни, толкова по-високи са стойностите на MAE и RMSE. Точността на оценката на кръстосаната валидация на смесения модел Ca_Mg_K-EBK_SVMR за прогнозиране на съдържанието на Ni в градски и крайградски почви е 63,70%. Според Li et al. 59, това ниво на точност е приемливо ниво на производителност на модела. Настоящите резултати са сравнени с предишно проучване на Tarasov et al. 36, чийто хибриден модел създаде MLPRK (Multilayer Perceptron Residual Kriging), свързан с индекса за оценка на точността на EBK_SVMR, отчетен в настоящото проучване, RMSE (210) и MAE (167.5) беше по-висок от нашите резултати в настоящото проучване (RMSE 95.479, MAE 77.368). Въпреки това, при сравнение на R2 на настоящото проучване (0.637) с този на Tarasov et al. 36 (0,544), става ясно, че коефициентът на детерминация (R2) е по-висок в този смесен модел. Границата на грешка (RMSE и MAE) (EBK SVMR) за смесения модел е два пъти по-ниска. По подобен начин, Sergeev et al.34 са регистрирали 0,28 (R2) за разработения хибриден модел (Multilayer Perceptron Residual Kriging), докато Ni в настоящото изследване е регистрирал 0,637 (R2). Нивото на точност на прогнозиране на този модел (EBK SVMR) е 63,7%, докато точността на прогнозиране, получена от Sergeev et al.34, е 28%. Крайната карта (фиг. 5), създадена с помощта на модела EBK_SVMR и Ca_Mg_K като предиктор, показва прогнози за горещи точки и умерено до никелово съдържание в цялата изследвана област. Това означава, че концентрацията на никел в изследваната област е предимно умерена, с по-високи концентрации в някои специфични области.
Крайната карта на прогнозите е представена с помощта на хибридния модел EBK_SVMR и Ca_Mg_K като предиктор. [Картата на пространственото разпределение е създадена с помощта на RStudio (версия 1.4.1717: https://www.rstudio.com/).]
На Фигура 6 са представени концентрациите на PTE като композиционна равнина, състояща се от отделни неврони. Нито една от компонентните равнини не показва същия цветен модел, както е показано. Подходящият брой неврони на начертана карта обаче е 55. SeOM се произвежда с помощта на различни цветове и колкото по-сходни са цветовите модели, толкова по-сравними са свойствата на пробите. Според тяхната точна цветова скала, отделните елементи (Ca, K и Mg) показват подобни цветови модели с единични високочестотни неврони и повечето нискочестотни неврони. По този начин, CaK и CaMg споделят някои прилики с много високочестотни неврони и нискочестотни цветови модели. И двата модела предсказват концентрацията на Ni в почвата, като показват средни до високи нюанси на цветове като червено, оранжево и жълто. Моделът KMg показва много високочестотни цветови модели, базирани на точни пропорции и нискочестотни до средни цветови петна. В точна цветова скала от ниско до високо, равнинният модел на разпределение на компонентите на модела показва висок цветен модел, показващ потенциалната концентрация на никел в почвата (вижте Фигура 4). Компонентната равнина на модела CakMg показва разнообразен цветен модел от ниско до високо, според точен цветови... мащаб. Освен това, прогнозата на модела за съдържанието на никел (CakMg) е подобна на пространственото разпределение на никела, показано на Фигура 5. И двете графики показват високи, средни и ниски пропорции на концентрации на никел в градски и крайградски почви. Фигура 7 изобразява контурния метод в k-means групирането на картата, разделени на три клъстера въз основа на прогнозираната стойност във всеки модел. Контурният метод представлява оптималния брой клъстери. От 115 събрани почвени проби, категория 1 е получила най-много почвени проби - 74. Клъстер 2 е получил 33 проби, докато клъстер 3 е получил 8 проби. Комбинацията от седемкомпонентни планарни предсказващи фактори е опростена, за да се позволи правилно тълкуване на клъстерите. Поради многобройните антропогенни и природни процеси, влияещи върху образуването на почвата, е трудно да се имат правилно диференцирани клъстерни модели в разпределена SeOM карта78.
Изход на компонентна равнина от всяка променлива на емпиричната байесова кригингова машина за опорни вектори (EBK_SVM_SeOM).[SeOM картите бяха създадени с помощта на RStudio (версия 1.4.1717: https://www.rstudio.com/).]
Различни компоненти за класификация на клъстери [SeOM картите са създадени с помощта на RStudio (версия 1.4.1717: https://www.rstudio.com/).]
Настоящото изследване ясно илюстрира техники за моделиране на концентрациите на никел в градски и крайградски почви. Изследването тества различни техники за моделиране, комбинирайки елементи с техники за моделиране, за да се получи най-добрият начин за прогнозиране на концентрациите на никел в почвата. Композиционните равнинни пространствени характеристики на SeOM на техниката за моделиране показват висок цветен модел от ниско до високо на точна цветова скала, което показва концентрациите на Ni в почвата. Картата на пространственото разпределение обаче потвърждава равнинното пространствено разпределение на компонентите, показано от EBK_SVMR (виж Фигура 5). Резултатите показват, че регресионният модел с опорни вектори (CaMgK-SVMR) предсказва концентрацията на Ni в почвата като единичен модел, но параметрите за валидиране и оценка на точността показват много високи грешки по отношение на RMSE и MAE. От друга страна, техниката за моделиране, използвана с модела EBK_MLR, също е погрешна поради ниската стойност на коефициента на детерминация (R2). Добри резултати са получени с помощта на EBK SVMR и комбинирани елементи (CaKMg) с ниски RMSE и MAE грешки с точност от 63,7%. Оказва се, че комбинирането на EBK алгоритъма с... Алгоритъм за машинно обучение може да генерира хибриден алгоритъм, който може да предскаже концентрацията на PTE в почвата. Резултатите показват, че използването на CaMgK като предиктори за прогнозиране на концентрациите на Ni в изследваната област може да подобри прогнозирането на Ni в почвите. Това означава, че непрекъснатото прилагане на торове на основата на никел и промишленото замърсяване на почвата от стоманодобивната промишленост имат тенденция да увеличават концентрацията на никел в почвата. Това проучване разкри, че моделът EBK може да намали нивото на грешка и да подобри точността на модела на пространственото разпределение на почвата в градски или крайградски почви. Като цяло предлагаме да се приложи моделът EBK-SVMR за оценка и прогнозиране на PTE в почвата; освен това предлагаме да се използва EBK за хибридизиране с различни алгоритми за машинно обучение. Концентрациите на Ni бяха предсказани с помощта на елементи като ковариати; използването на повече ковариати обаче би подобрило значително производителността на модела, което може да се счита за ограничение на настоящата работа. Друго ограничение на това проучване е, че броят на наборите от данни е 115. Следователно, ако се предоставят повече данни, производителността на предложения оптимизиран метод за хибридизация може да се подобри.
PlantProbs.net. Никел в растенията и почвата https://plantprobs.net/plant/nutrientImbalances/sodium.html (Достъпно на 28 април 2021 г.).
Каспржак, К.С. Никел напредък в съвременната екологична токсикология.surroundings.toxicology.11, 145–183 (1987).
Cempel, M. & Nikel, G. Никел: Преглед на неговите източници и екологична токсикология. Polish J. Environment.Stud.15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Принос на замърсители от атмосферата и натрупване в почвата и растителността близо до никел-медна топилна пещ в Съдбъри, Онтарио, Канада.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Тежки метали в почвата, растенията и рискове, свързани с пашата на преживни животни в близост до медно-никеловата мина Selebi-Phikwe в Ботсвана. surroundings. Geochemistry. Health https://doi.org/10.1007/s10653-021-00918-x (2021).
Кабата-Пендиас.Кабата-Пендиас А. 2011. Микроелементи в почвата и… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (Достъп на 24 ноември 2020 г.).
Алмас, А., Сингх, Б., Земеделие, TS-NJ от & 1995, неопределено. Влияние на руската никелова промишленост върху концентрациите на тежки метали в земеделските почви и треви в Сьор-Варангер, Норвегия. agris.fao.org.
Nielsen, GD et al. Абсорбцията и задържането на никел в питейната вода са свързани с приема на храна и чувствителността към никел. токсикология. приложение. фармакодинамика. 154, 67–75 (1999).
Коста, М. и Клайн, К.Б. Никел канцерогенеза, мутация, епигенетика или селекция. Околна среда. Здравна перспектива. 107, 2 (1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, NM; Анализ на тенденциите на потенциално токсични елементи: библиометричен преглед. Екологична геохимия и здраве. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Цифрово картографиране на почвата: Кратка история и някои поуки. Geoderma 264, 301–311. https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Относно дигиталното картографиране на почвата. Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Геостатистическо моделиране на резервоари,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Достъпно на 28 април 2021 г.).

Време на публикуване: 22 юли 2022 г.

Прогнозиране на концентрациите на никел в крайградски и градски почви с помощта на смесен емпиричен байесов кригинг и регресия с опорни вектори

Телефон

Тел.

Имейл

Имейл

WhatsApp

WhatsApp

WeChat

WeChat

Най-горе