Dự đoán nồng độ niken trong đất ngoại thành và đô thị bằng cách sử dụng Kriging Bayesian thực nghiệm kết hợp và hồi quy máy vectơ hỗ trợ

Cảm ơn bạn đã truy cập Nature.com. Phiên bản trình duyệt bạn đang sử dụng có hỗ trợ hạn chế cho CSS. Để có trải nghiệm tốt nhất, chúng tôi khuyên bạn nên sử dụng trình duyệt đã cập nhật (hoặc tắt chế độ tương thích trong Internet Explorer). Trong thời gian chờ đợi, để đảm bảo hỗ trợ liên tục, chúng tôi sẽ hiển thị trang web mà không có kiểu dáng và JavaScript.
Ô nhiễm đất là một vấn đề lớn do hoạt động của con người gây ra. Sự phân bố không gian của các nguyên tố có khả năng gây độc (PTE) thay đổi ở hầu hết các khu vực đô thị và cận đô thị. Do đó, rất khó để dự đoán về mặt không gian hàm lượng PTE trong các loại đất như vậy. Tổng cộng có 115 mẫu được lấy từ Frydek Mistek tại Cộng hòa Séc. Nồng độ canxi (Ca), magiê (Mg), kali (K) và niken (Ni) được xác định bằng phương pháp quang phổ phát xạ plasma cảm ứng. Biến đáp ứng là Ni và các yếu tố dự báo là Ca, Mg và K. Ma trận tương quan giữa biến đáp ứng và biến dự báo cho thấy mối tương quan thỏa đáng giữa các nguyên tố. Kết quả dự báo cho thấy Hồi quy máy vectơ hỗ trợ (SVMR) hoạt động tốt, mặc dù lỗi bình phương trung bình căn bậc hai (RMSE) ước tính (235,974 mg/kg) và lỗi tuyệt đối trung bình (MAE) (166,946 mg/kg) cao hơn các phương pháp khác được áp dụng. Các mô hình hỗn hợp cho Hồi quy tuyến tính đa biến Bayesian thực nghiệm (EBK-MLR) hoạt động kém, bằng chứng là hệ số xác định nhỏ hơn 0,1. Mô hình hồi quy máy vectơ hỗ trợ Kriging Bayesian theo kinh nghiệm (EBK-SVMR) là mô hình tốt nhất, với các giá trị RMSE thấp (95,479 mg/kg) và MAE (77,368 mg/kg) và hệ số xác định cao (R2 = 0,637). Đầu ra của kỹ thuật mô hình hóa EBK-SVMR được trực quan hóa bằng cách sử dụng bản đồ tự tổ chức. Các tế bào thần kinh cụm trong mặt phẳng của mô hình lai thành phần CakMg-EBK-SVMR cho thấy nhiều mẫu màu dự đoán nồng độ Ni trong đất đô thị và ven đô. Kết quả chứng minh rằng việc kết hợp EBK và SVMR là một kỹ thuật hiệu quả để dự đoán nồng độ Ni trong đất đô thị và ven đô.
Niken (Ni) được coi là một nguyên tố vi lượng cho thực vật vì nó góp phần cố định nitơ trong khí quyển (N) và chuyển hóa urê, cả hai đều cần thiết cho quá trình nảy mầm của hạt. Ngoài việc góp phần vào quá trình nảy mầm của hạt, Ni có thể hoạt động như một chất ức chế nấm và vi khuẩn và thúc đẩy sự phát triển của thực vật. Việc thiếu niken trong đất cho phép thực vật hấp thụ nó, dẫn đến tình trạng lá vàng. Ví dụ, đậu mắt đen và đậu xanh cần bón phân gốc niken để tối ưu hóa quá trình cố định nitơ2. Việc bón phân gốc niken liên tục để làm giàu đất và tăng khả năng cố định nitơ của cây họ đậu trong đất liên tục làm tăng nồng độ niken trong đất. Mặc dù niken là một nguyên tố vi lượng cho thực vật, nhưng việc hấp thụ quá nhiều niken vào đất có thể gây hại nhiều hơn là có lợi. Độc tính của niken trong đất làm giảm độ pH của đất và cản trở quá trình hấp thụ sắt như một chất dinh dưỡng thiết yếu cho sự phát triển của thực vật1. Theo Liu3, Ni được phát hiện là nguyên tố quan trọng thứ 17 cần thiết cho sự phát triển và tăng trưởng của thực vật. Ngoài vai trò của niken trong sự phát triển và tăng trưởng của thực vật, con người cần nó cho nhiều ứng dụng. Mạ điện, sản xuất hợp kim gốc niken và sản xuất thiết bị đánh lửa và bugi trong ngành công nghiệp ô tô đều yêu cầu sử dụng niken trong nhiều ngành công nghiệp khác nhau. Ngoài ra, hợp kim gốc niken và các sản phẩm mạ điện đã được sử dụng rộng rãi trong đồ dùng nhà bếp, phụ kiện phòng khiêu vũ, vật tư ngành công nghiệp thực phẩm, điện, dây và cáp, tua bin phản lực, cấy ghép phẫu thuật, dệt may và đóng tàu5. Mức độ giàu Ni trong đất (tức là đất bề mặt) đã được quy cho cả nguồn nhân tạo và tự nhiên, nhưng chủ yếu, Ni là nguồn tự nhiên chứ không phải do con người4,6. Các nguồn niken tự nhiên bao gồm phun trào núi lửa, thảm thực vật, cháy rừng và các quá trình địa chất; tuy nhiên, các nguồn nhân tạo bao gồm pin niken/cadmium trong ngành công nghiệp thép, mạ điện, hàn hồ quang, dầu diesel và nhiên liệu, và khí thải từ quá trình đốt than và đốt chất thải và bùn Tích tụ niken7,8. Theo Freedman và Hutchinson9 và Manyiwa et al. 10, các nguồn chính gây ô nhiễm lớp đất mặt trong môi trường lân cận và ngay lập tức chủ yếu là các nhà máy luyện kim và khai thác đồng niken. Lớp đất mặt xung quanh nhà máy lọc niken-đồng Sudbury ở Canada có mức độ ô nhiễm niken cao nhất ở mức 26.000 mg/kg11. Ngược lại, ô nhiễm từ sản xuất niken ở Nga đã dẫn đến nồng độ niken cao hơn trong đất Na Uy11. Theo Alms et al. 12, lượng niken có thể chiết xuất bằng HNO3 trong đất canh tác hàng đầu của khu vực (sản xuất niken ở Nga) dao động từ 6,25 đến 136,88 mg/kg, tương ứng với mức trung bình là 30,43 mg/kg và nồng độ ban đầu là 25 mg/kg. Theo kabata 11, việc bón phân lân trong đất nông nghiệp ở đất đô thị hoặc ven đô trong các mùa vụ liên tiếp có thể ngấm hoặc làm ô nhiễm đất. Tác động tiềm tàng của niken ở người có thể dẫn đến ung thư thông qua đột biến, tổn thương nhiễm sắc thể, tạo ra Z-DNA, sửa chữa cắt bỏ DNA bị chặn hoặc các quá trình biểu sinh13. Trong các thí nghiệm trên động vật, niken được phát hiện có khả năng gây ra nhiều loại khối u và các phức hợp niken gây ung thư có thể làm trầm trọng thêm các khối u như vậy.
Đánh giá ô nhiễm đất đã phát triển mạnh trong thời gian gần đây do nhiều vấn đề liên quan đến sức khỏe phát sinh từ mối quan hệ đất-thực vật, đất và mối quan hệ sinh học đất, suy thoái sinh thái và đánh giá tác động môi trường. Cho đến nay, dự đoán không gian các nguyên tố có khả năng gây độc (PTE) như Ni trong đất là công việc tốn nhiều công sức và thời gian khi sử dụng các phương pháp truyền thống. Sự ra đời của bản đồ đất kỹ thuật số (DSM) và thành công hiện tại của nó15 đã cải thiện đáng kể bản đồ đất dự đoán (PSM). Theo Minasny và McBratney16, bản đồ đất dự đoán (DSM) đã chứng tỏ là một phân ngành nổi bật của khoa học đất. Lagacherie và McBratney, 2006 định nghĩa DSM là "việc tạo ra và điền vào các hệ thống thông tin đất không gian thông qua việc sử dụng các phương pháp quan sát tại chỗ và trong phòng thí nghiệm và các hệ thống suy luận đất không gian và phi không gian". McBratney và cộng sự. 17 phác thảo rằng DSM hoặc PSM hiện đại là kỹ thuật hiệu quả nhất để dự đoán hoặc lập bản đồ phân bố không gian của PTE, loại đất và tính chất đất. Thống kê địa chất và thuật toán học máy (MLA) là các kỹ thuật mô hình hóa DSM tạo ra các bản đồ số hóa với sự trợ giúp của máy tính bằng cách sử dụng dữ liệu đáng kể và tối thiểu.
Deutsch18 và Olea19 định nghĩa địa thống kê là “tập hợp các kỹ thuật số liên quan đến việc biểu diễn các thuộc tính không gian, chủ yếu sử dụng các mô hình ngẫu nhiên, chẳng hạn như cách phân tích chuỗi thời gian đặc trưng cho dữ liệu thời gian”. Về cơ bản, địa thống kê liên quan đến việc đánh giá các variogram, cho phép định lượng và xác định sự phụ thuộc của các giá trị không gian từ mỗi tập dữ liệu20.Gumiaux et al. 20 minh họa thêm rằng việc đánh giá các variogram trong địa thống kê dựa trên ba nguyên tắc, bao gồm (a) tính toán thang đo tương quan dữ liệu, (b) xác định và tính toán tính dị hướng trong chênh lệch tập dữ liệu và (c) ngoài việc tính đến lỗi vốn có của dữ liệu đo lường tách biệt khỏi các hiệu ứng cục bộ, các hiệu ứng diện tích cũng được ước tính. Dựa trên các khái niệm này, nhiều kỹ thuật nội suy được sử dụng trong địa thống kê, bao gồm kriging chung, đồng kriging, kriging thông thường, kriging Bayesian theo kinh nghiệm, phương pháp kriging đơn giản và các kỹ thuật nội suy nổi tiếng khác để lập bản đồ hoặc dự đoán PTE, đặc điểm đất và loại đất.
Thuật toán học máy (MLA) là một kỹ thuật tương đối mới sử dụng các lớp dữ liệu phi tuyến tính lớn hơn, được thúc đẩy bởi các thuật toán chủ yếu được sử dụng để khai thác dữ liệu, xác định các mẫu trong dữ liệu và được áp dụng nhiều lần để phân loại trong các lĩnh vực khoa học như khoa học đất và các tác vụ trả về. Nhiều bài báo nghiên cứu dựa vào các mô hình MLA để dự đoán PTE trong đất, chẳng hạn như Tan et al. 22 (rừng ngẫu nhiên để ước tính kim loại nặng trong đất nông nghiệp), Sakizadeh et al. 23 (mô hình hóa bằng máy vectơ hỗ trợ và mạng nơ-ron nhân tạo) ô nhiễm đất). Ngoài ra, Vega et al. 24 (CART để mô hình hóa sự giữ lại và hấp phụ kim loại nặng trong đất) Sun et al. 25 (ứng dụng của lập phương là phân phối Cd trong đất) và các thuật toán khác như k-nearest neighbor, hồi quy tăng cường tổng quát và hồi quy tăng cường Trees cũng áp dụng MLA để dự đoán PTE trong đất.
Việc áp dụng các thuật toán DSM trong dự đoán hoặc lập bản đồ phải đối mặt với một số thách thức. Nhiều tác giả tin rằng MLA vượt trội hơn địa thống kê và ngược lại. Mặc dù cái này tốt hơn cái kia, nhưng sự kết hợp của cả hai sẽ cải thiện mức độ chính xác của việc lập bản đồ hoặc dự đoán trong DSM15. Woodcock và Gopal26 Finke27; Pontius và Cheuk28 và Grunwald29 bình luận về những thiếu sót và một số lỗi trong việc lập bản đồ đất dự đoán. Các nhà khoa học về đất đã thử nhiều kỹ thuật khác nhau để tối ưu hóa hiệu quả, độ chính xác và khả năng dự đoán của việc lập bản đồ và dự báo DSM. Sự kết hợp giữa sự không chắc chắn và xác minh là một trong nhiều khía cạnh khác nhau được tích hợp vào DSM để tối ưu hóa hiệu quả và giảm thiểu khuyết tật. Tuy nhiên, Agyeman et al. 15 phác thảo rằng hành vi xác thực và sự không chắc chắn do việc tạo và dự đoán bản đồ gây ra phải được xác thực độc lập để cải thiện chất lượng bản đồ. Những hạn chế của DSM là do chất lượng đất phân tán về mặt địa lý, bao gồm một thành phần của sự không chắc chắn; tuy nhiên, sự thiếu chắc chắn trong DSM có thể phát sinh từ nhiều nguồn lỗi, cụ thể là lỗi biến phụ thuộc, lỗi mô hình, lỗi vị trí và Lỗi phân tích 31. Sự không chính xác của mô hình gây ra trong MLA và các quy trình địa thống kê có liên quan đến việc thiếu hiểu biết, cuối cùng dẫn đến việc đơn giản hóa quá mức quy trình thực tế32. Bất kể bản chất của mô hình là gì, sự không chính xác có thể được quy cho các tham số mô hình, dự đoán mô hình toán học hoặc nội suy33. Gần đây, một xu hướng DSM mới đã xuất hiện thúc đẩy sự tích hợp của địa thống kê và MLA trong lập bản đồ và dự báo. Một số nhà khoa học và tác giả về đất, chẳng hạn như Sergeev và cộng sự. 34; Subbotina và cộng sự. 35; Tarasov và cộng sự. 36 và Tarasov và cộng sự. 37 đã khai thác chất lượng chính xác của địa thống kê và máy học để tạo ra các mô hình lai giúp cải thiện hiệu quả dự báo và lập bản đồ. chất lượng. Một số mô hình thuật toán kết hợp hoặc lai này là Artificial Neural Network Kriging (ANN-RK), Multilayer Perceptron Residual Kriging (MLP-RK), Generalized Residual Network Neural Network Kriging (GR-NNRK)36, Artificial Neural Network Kriging-Multilayer Perceptron (ANN-K-MLP)37 và Co-Kriging và Gaussian Process Regression38.
Theo Sergeev và cộng sự, việc kết hợp nhiều kỹ thuật mô hình hóa khác nhau có khả năng loại bỏ các khuyết tật và tăng hiệu quả của mô hình lai tạo kết quả thay vì phát triển mô hình đơn lẻ của nó. Trong bối cảnh này, bài báo mới này lập luận rằng cần phải áp dụng thuật toán kết hợp của địa thống kê và MLA để tạo ra các mô hình lai tối ưu nhằm dự đoán sự làm giàu Ni ở các khu vực thành thị và cận thành thị. Nghiên cứu này sẽ dựa trên Kriging Bayesian Empirical (EBK) làm mô hình cơ sở và kết hợp nó với các mô hình Máy vectơ hỗ trợ (SVM) và Hồi quy tuyến tính bội (MLR). Việc lai tạo EBK với bất kỳ MLA nào vẫn chưa được biết đến. Các mô hình hỗn hợp bội được thấy là sự kết hợp của kriging thông thường, dư thừa, hồi quy và MLA. EBK là một phương pháp nội suy địa thống kê sử dụng một quá trình ngẫu nhiên không gian được định vị dưới dạng trường ngẫu nhiên không dừng/đứng yên với các tham số định vị được xác định trên toàn bộ cánh đồng, cho phép thay đổi không gian39. EBK đã được sử dụng trong nhiều nghiên cứu khác nhau, bao gồm phân tích sự phân bố cacbon hữu cơ trong đất nông nghiệp40, đánh giá đất ô nhiễm41 và lập bản đồ tính chất đất42.
Mặt khác, Đồ thị tự tổ chức (SeOM) là một thuật toán học đã được áp dụng trong nhiều bài viết như Li et al. 43, Wang et al. 44, Hossain Bhuiyan et al. 45 và Kebonye et al. 46 Xác định các thuộc tính không gian và nhóm các phần tử. Wang et al. 44 phác thảo rằng SeOM là một kỹ thuật học mạnh mẽ được biết đến với khả năng nhóm và hình dung các vấn đề phi tuyến tính. Không giống như các kỹ thuật nhận dạng mẫu khác như phân tích thành phần chính, phân cụ mờ, phân cụ phân cấp và ra quyết định đa tiêu chí, SeOM tốt hơn trong việc tổ chức và xác định các mẫu PTE. Theo Wang et al. 44, SeOM có thể nhóm theo không gian phân phối của các tế bào thần kinh liên quan và cung cấp hình ảnh hóa dữ liệu có độ phân giải cao. SeOM sẽ hình ảnh hóa dữ liệu dự đoán Ni để có được mô hình tốt nhất nhằm mô tả kết quả để giải thích trực tiếp.
Bài báo này nhằm mục đích tạo ra một mô hình lập bản đồ mạnh mẽ với độ chính xác tối ưu để dự đoán hàm lượng niken trong đất đô thị và ven đô. Chúng tôi đưa ra giả thuyết rằng độ tin cậy của mô hình hỗn hợp chủ yếu phụ thuộc vào ảnh hưởng của các mô hình khác được gắn vào mô hình cơ sở. Chúng tôi thừa nhận những thách thức mà DSM phải đối mặt và trong khi những thách thức này đang được giải quyết trên nhiều mặt trận, thì sự kết hợp giữa những tiến bộ trong mô hình địa thống kê và mô hình MLA dường như là gia tăng; do đó, chúng tôi sẽ cố gắng trả lời các câu hỏi nghiên cứu có thể tạo ra các mô hình hỗn hợp. Tuy nhiên, mô hình dự đoán nguyên tố mục tiêu chính xác đến mức nào? Ngoài ra, mức độ đánh giá hiệu quả dựa trên đánh giá xác thực và độ chính xác là gì? Do đó, các mục tiêu cụ thể của nghiên cứu này là (a) tạo ra một mô hình hỗn hợp kết hợp cho SVMR hoặc MLR bằng cách sử dụng EBK làm mô hình cơ sở, (b) so sánh các mô hình kết quả (c) đề xuất mô hình hỗn hợp tốt nhất để dự đoán nồng độ Ni trong đất đô thị hoặc ven đô và (d) ứng dụng SeOM để tạo bản đồ có độ phân giải cao về sự thay đổi không gian của niken.
Nghiên cứu này được tiến hành tại Cộng hòa Séc, cụ thể là ở quận Frydek Mistek thuộc vùng Moravia-Silesian (xem Hình 1). Địa lý của khu vực nghiên cứu rất hiểm trở và phần lớn là một phần của vùng Beskidy Moravia-Silesian, một phần của vành ngoài của dãy núi Carpathian. Khu vực nghiên cứu nằm giữa 49° 41′ 0′ Bắc và 18° 20′ 0′ Đông, và độ cao từ 225 đến 327 m; Tuy nhiên, hệ thống phân loại Koppen cho tình trạng khí hậu của khu vực được đánh giá là Cfb = khí hậu đại dương ôn đới, Có rất nhiều lượng mưa ngay cả trong những tháng khô. Nhiệt độ thay đổi đôi chút trong suốt cả năm giữa −5 °C và 24 °C, hiếm khi xuống dưới −14 °C hoặc trên 30 °C, trong khi lượng mưa trung bình hàng năm là từ 685 đến 752 mm47. Diện tích khảo sát ước tính của toàn bộ khu vực là 1.208 km2, với 39,38% đất canh tác và 49,36% diện tích rừng che phủ. Mặt khác, diện tích được sử dụng trong nghiên cứu này là khoảng 889,8 km2. Trong và xung quanh Ostrava, ngành công nghiệp thép và các nhà máy kim loại rất sôi động. Các nhà máy kim loại, ngành công nghiệp thép nơi niken được sử dụng trong thép không gỉ (ví dụ để chống ăn mòn trong khí quyển) và thép hợp kim (niken làm tăng độ bền của hợp kim trong khi vẫn duy trì độ dẻo và độ dai tốt), và nông nghiệp thâm canh như bón phân phosphate và chăn nuôi Sản xuất là nguồn niken tiềm năng nghiên cứu trong khu vực (ví dụ, thêm niken vào cừu để tăng tốc độ tăng trưởng ở cừu và gia súc ăn ít). Các ứng dụng công nghiệp khác của niken trong các khu vực nghiên cứu bao gồm sử dụng trong mạ điện, bao gồm các quy trình mạ niken điện và mạ niken không điện. Tính chất của đất dễ dàng phân biệt được qua màu đất, cấu trúc và hàm lượng cacbonat. Kết cấu đất từ ​​trung bình đến mịn, có nguồn gốc từ vật liệu mẹ. Chúng có bản chất là đất phù sa, đất phù sa hoặc đất gió. Một số vùng đất có vẻ loang lổ ở bề mặt và tầng đất bên dưới, thường có bê tông và tẩy trắng. Tuy nhiên, đất cambisol và đất stagnosol là các loại đất phổ biến nhất trong khu vực48. Với độ cao từ 455,1 đến 493,5 m, đất cambisol chiếm ưu thế ở Cộng hòa Séc49.
Bản đồ khu vực nghiên cứu [Bản đồ khu vực nghiên cứu được tạo bằng ArcGIS Desktop (ESRI, Inc, phiên bản 10.7, URL: https://desktop.arcgis.com).]
Tổng cộng có 115 mẫu đất mặt được lấy từ đất đô thị và cận đô thị tại quận Frydek Mistek. Mẫu được sử dụng là lưới đều với các mẫu đất cách nhau 2 × 2 km và đất mặt được đo ở độ sâu từ 0 đến 20 cm bằng thiết bị GPS cầm tay (Leica Zeno 5 GPS). Các mẫu được đóng gói trong túi Ziploc, dán nhãn đúng cách và vận chuyển đến phòng thí nghiệm. Các mẫu được sấy khô trong không khí để tạo ra các mẫu nghiền, nghiền bằng hệ thống cơ học (máy nghiền đĩa Fritsch) và sàng (kích thước sàng 2 mm). Cho 1 gam mẫu đất đã sấy khô, đồng nhất và sàng vào các chai teflon có dán nhãn rõ ràng. Trong mỗi bình Teflon, phân phối 7 ml HCl 35% và 3 ml HNO3 65% (sử dụng máy phân phối tự động - một bình cho mỗi loại axit), đậy nhẹ và để mẫu qua đêm để phản ứng (chương trình nước cường toan). Đặt phần nước trong trên một bình nóng tấm kim loại (nhiệt độ: 100 W và 160 °C) trong 2 giờ để tạo điều kiện cho quá trình tiêu hóa mẫu, sau đó làm mát. Chuyển phần dịch trong vào bình định mức 50 ml và pha loãng đến 50 ml bằng nước khử ion. Sau đó, lọc phần dịch trong đã pha loãng vào ống PVC 50 ml bằng nước khử ion. Ngoài ra, 1 ml dung dịch pha loãng được pha loãng với 9 ml nước khử ion và lọc vào ống 12 ml được chuẩn bị để cô đặc giả PTE. Nồng độ PTE (As, Cd, Cr, Cu, Mn, Ni, Pb, Zn, Ca, Mg, K) được xác định bằng ICP-OES (Phổ phát xạ quang học plasma cảm ứng) (Thermo Fisher Scientific, Hoa Kỳ) theo các phương pháp và thỏa thuận tiêu chuẩn. Đảm bảo các quy trình đảm bảo và kiểm soát chất lượng (QA/QC) (SRM NIST 2711a Montana II Soil). PTE có giới hạn phát hiện dưới một nửa đã bị loại khỏi nghiên cứu này. Phát hiện Giới hạn của PTE được sử dụng trong nghiên cứu này là 0,0004. Ngoài ra, quy trình kiểm soát chất lượng và đảm bảo chất lượng cho mỗi phân tích được đảm bảo bằng cách phân tích các tiêu chuẩn tham chiếu. Để đảm bảo giảm thiểu lỗi, một phân tích kép đã được thực hiện.
Empirical Bayesian Kriging (EBK) là một trong nhiều kỹ thuật nội suy địa thống kê được sử dụng trong mô hình hóa trong nhiều lĩnh vực khác nhau như khoa học đất. Không giống như các kỹ thuật nội suy kriging khác, EBK khác với các phương pháp kriging truyền thống ở chỗ xem xét lỗi ước tính bởi mô hình semivariogram. Trong nội suy EBK, một số mô hình semivariogram được tính toán trong quá trình nội suy, thay vì một semivariogram duy nhất. Các kỹ thuật nội suy mở đường cho sự không chắc chắn và lập trình liên quan đến việc vẽ đồ thị semivariogram này tạo nên một phần cực kỳ phức tạp của phương pháp kriging đầy đủ. Quá trình nội suy của EBK tuân theo ba tiêu chí do Krivoruchko50 đề xuất, (a) mô hình ước tính semivariogram từ tập dữ liệu đầu vào (b) giá trị dự đoán mới cho mỗi vị trí tập dữ liệu đầu vào dựa trên semivariogram đã tạo và (c) mô hình A cuối cùng được tính toán từ tập dữ liệu mô phỏng. Quy tắc phương trình Bayesian được đưa ra dưới dạng hậu nghiệm
Trong đó \(Prob\left(A\right)\) biểu diễn xác suất biên trước đó, \(Prob\left(B\right)\) bị bỏ qua trong hầu hết các trường hợp, \(Prob (B,A)\ ). Tính toán semivariogram dựa trên quy tắc Bayes, quy tắc này cho thấy xu hướng của các tập dữ liệu quan sát có thể được tạo từ semivariogram. Sau đó, giá trị của semivariogram được xác định bằng quy tắc Bayes, quy tắc này nêu rõ khả năng tạo ra một tập dữ liệu quan sát từ semivariogram là bao nhiêu.
Máy vectơ hỗ trợ là một thuật toán học máy tạo ra một siêu phẳng tách biệt tối ưu để phân biệt các lớp giống hệt nhau nhưng không độc lập tuyến tính. Vapnik51 đã tạo ra thuật toán phân loại ý định, nhưng gần đây nó đã được sử dụng để giải quyết các vấn đề hướng hồi quy. Theo Li và cộng sự52, SVM là một trong những kỹ thuật phân loại tốt nhất và đã được sử dụng trong nhiều lĩnh vực khác nhau. Thành phần hồi quy của SVM (Hồi quy máy vectơ hỗ trợ - SVMR) đã được sử dụng trong phân tích này. Cherkassky và ​​Mulier53 đã tiên phong trong SVMR như một hồi quy dựa trên hạt nhân, phép tính được thực hiện bằng cách sử dụng mô hình hồi quy tuyến tính với các hàm không gian đa quốc gia. John và cộng sự54 báo cáo rằng mô hình SVMR sử dụng hồi quy tuyến tính siêu phẳng, tạo ra các mối quan hệ phi tuyến tính và cho phép các hàm không gian. Theo Vohland và cộng sự 55, epsilon (ε)-SVMR sử dụng tập dữ liệu đã được đào tạo để có được mô hình biểu diễn dưới dạng hàm không nhạy cảm với epsilon được áp dụng để ánh xạ dữ liệu độc lập với độ lệch epsilon tốt nhất từ ​​quá trình đào tạo trên dữ liệu có tương quan. Lỗi khoảng cách cài đặt trước bị bỏ qua khỏi giá trị thực và nếu lỗi lớn hơn ε(ε), các đặc tính của đất sẽ bù đắp cho lỗi đó. Mô hình cũng giảm độ phức tạp của dữ liệu đào tạo thành một tập hợp con rộng hơn các vectơ hỗ trợ. Phương trình do Vapnik51 đề xuất được hiển thị bên dưới.
trong đó b biểu diễn ngưỡng vô hướng, \(K\left({x}_{,}{ x}_{k}\right)\) biểu diễn hàm hạt nhân, \(\alpha\) biểu diễn hệ số nhân Lagrange, N biểu diễn tập dữ liệu số, \({x}_{k}\) biểu diễn dữ liệu đầu vào và \(y\) là dữ liệu đầu ra. Một trong những hạt nhân chính được sử dụng là phép toán SVMR, đây là hàm cơ sở xuyên tâm Gauss (RBF). Hạt nhân RBF được áp dụng để xác định mô hình SVMR tối ưu, rất quan trọng để có được hệ số tập phạt tinh tế nhất C và tham số hạt nhân gamma (γ) cho dữ liệu đào tạo PTE. Đầu tiên, chúng tôi đánh giá tập đào tạo và sau đó kiểm tra hiệu suất mô hình trên tập xác thực. Tham số lái được sử dụng là sigma và giá trị phương pháp là svmRadial.
Mô hình hồi quy tuyến tính bội (MLR) là mô hình hồi quy biểu diễn mối quan hệ giữa biến đáp ứng và một số biến dự báo bằng cách sử dụng các tham số gộp tuyến tính được tính toán bằng phương pháp bình phương nhỏ nhất. Trong MLR, mô hình bình phương nhỏ nhất là hàm dự báo các đặc tính đất sau khi lựa chọn các biến giải thích. Cần sử dụng đáp ứng để thiết lập mối quan hệ tuyến tính bằng cách sử dụng các biến giải thích. PTE được sử dụng làm biến đáp ứng để thiết lập mối quan hệ tuyến tính với các biến giải thích. Phương trình MLR là
trong đó y là biến phản hồi, \(a\) là giá trị chặn, n là số biến dự báo, \({b}_{1}\) là hồi quy riêng phần của các hệ số, \({x}_{ i}\) biểu thị biến dự báo hoặc biến giải thích, và \({\varepsilon }_{i}\) biểu thị lỗi trong mô hình, còn được gọi là phần dư.
Các mô hình hỗn hợp thu được bằng cách kẹp EBK với SVMR và MLR. Điều này được thực hiện bằng cách trích xuất các giá trị dự đoán từ nội suy EBK. Các giá trị dự đoán thu được từ Ca, K và Mg nội suy thu được thông qua một quá trình kết hợp để thu được các biến mới, chẳng hạn như CaK, CaMg và KMg. Các nguyên tố Ca, K và Mg sau đó được kết hợp để thu được biến thứ tư, CaKMg. Nhìn chung, các biến thu được là Ca, K, Mg, CaK, CaMg, KMg và CaKMg. Các biến này trở thành các biến dự đoán của chúng tôi, giúp dự đoán nồng độ niken trong đất đô thị và ven đô. Thuật toán SVMR đã được thực hiện trên các biến dự đoán để thu được mô hình hỗn hợp Máy hỗ trợ vectơ Kriging Bayesian theo kinh nghiệm (EBK_SVM). Tương tự như vậy, các biến cũng được đưa qua thuật toán MLR để thu được mô hình hỗn hợp Hồi quy tuyến tính đa biến theo kinh nghiệm (EBK_MLR). Thông thường, các biến Ca, K, Mg, CaK, CaMg, KMg và CaKMg được sử dụng làm biến phụ trợ để dự báo hàm lượng Ni trong đất đô thị và ven đô. Mô hình chấp nhận được nhất thu được (EBK_SVM hoặc EBK_MLR) sau đó sẽ được trực quan hóa bằng biểu đồ tự tổ chức. Quy trình làm việc của nghiên cứu này được thể hiện trong Hình 2.
Sử dụng SeOM đã trở thành một công cụ phổ biến để tổ chức, đánh giá và dự báo dữ liệu trong lĩnh vực tài chính, chăm sóc sức khỏe, công nghiệp, thống kê, khoa học đất, v.v. SeOM được tạo ra bằng cách sử dụng mạng nơ-ron nhân tạo và các phương pháp học không giám sát để tổ chức, đánh giá và dự đoán. Trong nghiên cứu này, SeOM được sử dụng để trực quan hóa nồng độ Ni dựa trên mô hình tốt nhất để dự đoán Ni trong đất đô thị và cận đô thị. Dữ liệu được xử lý trong đánh giá SeOM được sử dụng dưới dạng n biến vectơ chiều đầu vào43,56. Melssen et al. 57 mô tả kết nối của một vectơ đầu vào vào mạng nơ-ron thông qua một lớp đầu vào duy nhất đến một vectơ đầu ra với một vectơ trọng số duy nhất. Đầu ra do SeOM tạo ra là một bản đồ hai chiều bao gồm các nơ-ron hoặc nút khác nhau được dệt thành các bản đồ tôpô lục giác, tròn hoặc vuông theo độ gần của chúng. So sánh kích thước bản đồ dựa trên số liệu, lỗi lượng tử hóa (QE) và lỗi địa hình (TE), mô hình SeOM với lần lượt là 0,086 và 0,904 được chọn, đây là một đơn vị bản đồ 55 (5 × 11). Cấu trúc nơ-ron được xác định theo số lượng nút trong phương trình thực nghiệm
Số lượng dữ liệu được sử dụng trong nghiên cứu này là 115 mẫu. Một phương pháp tiếp cận ngẫu nhiên đã được sử dụng để chia dữ liệu thành dữ liệu thử nghiệm (25% để xác thực) và các tập dữ liệu đào tạo (75% để hiệu chuẩn). Tập dữ liệu đào tạo được sử dụng để tạo mô hình hồi quy (hiệu chuẩn) và tập dữ liệu thử nghiệm được sử dụng để xác minh khả năng khái quát hóa58. Điều này được thực hiện để đánh giá tính phù hợp của các mô hình khác nhau để dự đoán hàm lượng niken trong đất. Tất cả các mô hình được sử dụng đều trải qua quá trình xác thực chéo mười lần, lặp lại năm lần. Các biến do nội suy EBK tạo ra được sử dụng làm biến dự báo hoặc biến giải thích để dự đoán biến mục tiêu (PTE). Mô hình hóa được xử lý trong RStudio bằng các gói thư viện (Kohonen), thư viện (caret), thư viện (modelr), thư viện (“e1071″), thư viện (“plyr”), thư viện (“caTools”), thư viện (” prospectr”) và thư viện (“Metrics”).
Nhiều tham số xác thực khác nhau đã được sử dụng để xác định mô hình tốt nhất phù hợp để dự đoán nồng độ niken trong đất và để đánh giá độ chính xác của mô hình và quá trình xác thực của nó. Các mô hình lai hóa đã được đánh giá bằng cách sử dụng sai số tuyệt đối trung bình (MAE), sai số bình phương trung bình căn bậc hai (RMSE) và xác định R bình phương hoặc hệ số (R2). R2 xác định phương sai của các tỷ lệ trong câu trả lời, được biểu diễn bằng mô hình hồi quy. RMSE và độ lớn phương sai trong các phép đo độc lập mô tả sức mạnh dự đoán của mô hình, trong khi MAE xác định giá trị định lượng thực tế. Giá trị R2 phải cao để đánh giá mô hình hỗn hợp tốt nhất bằng cách sử dụng các tham số xác thực, giá trị càng gần 1 thì độ chính xác càng cao. Theo Li et al. 59, giá trị tiêu chí R2 từ 0,75 trở lên được coi là một yếu tố dự đoán tốt; từ 0,5 đến 0,75 là hiệu suất mô hình có thể chấp nhận được và dưới 0,5 là hiệu suất mô hình không thể chấp nhận được. Khi lựa chọn mô hình bằng phương pháp đánh giá tiêu chí xác thực RMSE và MAE, các giá trị thấp hơn thu được là đủ và được coi là lựa chọn tốt nhất. Phương trình sau đây mô tả phương pháp xác minh.
trong đó n biểu thị kích thước của giá trị quan sát\({Y}_{i}\) biểu thị phản ứng được đo lường và \({\widehat{Y}}_{i}\) cũng biểu thị giá trị phản ứng được dự đoán, do đó, đối với i quan sát đầu tiên.
Mô tả thống kê của các biến dự báo và phản hồi được trình bày trong Bảng 1, cho thấy giá trị trung bình, độ lệch chuẩn (SD), hệ số biến thiên (CV), giá trị tối thiểu, tối đa, độ nhọn và độ lệch chuẩn. Giá trị tối thiểu và tối đa của các nguyên tố theo thứ tự giảm dần là Mg < Ca < K < Ni và Ca < Mg < K < Ni. Nồng độ của biến phản hồi (Ni) lấy mẫu từ khu vực nghiên cứu dao động từ 4,86 ​​đến 42,39 mg/kg. So sánh Ni với giá trị trung bình thế giới (29 mg/kg) và giá trị trung bình châu Âu (37 mg/kg) cho thấy giá trị trung bình hình học được tính toán tổng thể cho khu vực nghiên cứu nằm trong phạm vi cho phép. Tuy nhiên, như Kabata-Pendias11 chỉ ra, khi so sánh nồng độ niken (Ni) trung bình trong nghiên cứu hiện tại với đất nông nghiệp ở Thụy Điển cho thấy nồng độ niken trung bình hiện tại cao hơn. Tương tự như vậy, nồng độ trung bình của Frydek Mistek trong đất đô thị và ven đô trong nghiên cứu hiện tại (Ni 16,15 mg/kg) cao hơn giới hạn cho phép là 60 (10,2 mg/kg) đối với Ni trong đất đô thị Ba Lan do Różański và cộng sự báo cáo. Hơn nữa, Bretzel và Calderisi61 ghi nhận nồng độ Ni trung bình rất thấp (1,78 mg/kg) trong đất đô thị ở Tuscany so với nghiên cứu hiện tại. Jim62 cũng tìm thấy nồng độ niken thấp hơn (12,34 mg/kg) trong đất đô thị Hồng Kông, thấp hơn nồng độ niken hiện tại trong nghiên cứu này. Birke và cộng sự63 đã báo cáo nồng độ Ni trung bình là 17,6 mg/kg trong một khu vực khai thác mỏ và công nghiệp đô thị cũ ở Saxony-Anhalt, Đức, cao hơn 1,45 mg/kg so với nồng độ Ni trung bình trong khu vực (16,15 mg/kg). Nghiên cứu hiện tại. Hàm lượng niken quá mức trong đất ở một số khu vực đô thị và ngoại ô của khu vực nghiên cứu chủ yếu có thể là do ngành công nghiệp sắt thép và công nghiệp kim loại. Điều này phù hợp với nghiên cứu của Khodadoust và cộng sự. 64 rằng ngành công nghiệp thép và gia công kim loại là nguồn chính gây ô nhiễm niken trong đất. Tuy nhiên, các yếu tố dự báo cũng dao động từ 538,70 mg/kg đến 69.161,80 mg/kg đối với Ca, 497,51 mg/kg đến 3535,68 mg/kg đối với K và 685,68 mg/kg đến 5970,05 mg/kg đối với Mg. Jakovljevic et al. 65 đã nghiên cứu tổng hàm lượng Mg và K trong đất ở miền trung Serbia. Họ phát hiện ra rằng tổng nồng độ (lần lượt là 410 mg/kg và 400 mg/kg) thấp hơn nồng độ Mg và K của nghiên cứu hiện tại. Không thể phân biệt được, ở miền đông Ba Lan, Orzechowski và Smolczynski66 đã đánh giá tổng hàm lượng Ca, Mg và K và cho thấy nồng độ trung bình của Ca (1100 mg/kg), Mg (590 mg/kg) và K (810 mg/kg). Hàm lượng trong lớp đất mặt thấp hơn nguyên tố đơn lẻ trong nghiên cứu này. Một nghiên cứu gần đây của Pongrac và cộng sự. 67 cho thấy tổng hàm lượng Ca được phân tích trong 3 loại đất khác nhau ở Scotland, Vương quốc Anh (đất Mylnefield, đất Balruddery và đất Hartwood) cho thấy hàm lượng Ca cao hơn trong nghiên cứu này.
Do nồng độ đo được khác nhau của các nguyên tố lấy mẫu, nên phân phối tập dữ liệu của các nguyên tố biểu hiện độ lệch khác nhau. Độ lệch và độ nhọn của các nguyên tố lần lượt nằm trong khoảng từ 1,53 đến 7,24 và 2,49 đến 54,16. Tất cả các nguyên tố được tính toán đều có mức độ lệch và độ nhọn trên +1, do đó chỉ ra rằng phân phối dữ liệu không đều, lệch theo hướng phải và đạt đỉnh. CV ước tính của các nguyên tố cũng cho thấy K, Mg và Ni biểu hiện độ biến thiên vừa phải, trong khi Ca có độ biến thiên cực cao. CV của K, Ni và Mg giải thích cho sự phân phối đồng đều của chúng. Hơn nữa, phân phối Ca không đồng đều và các nguồn bên ngoài có thể ảnh hưởng đến mức độ làm giàu của nó.
Sự tương quan của các biến dự báo với các yếu tố phản ứng cho thấy có sự tương quan thỏa đáng giữa các yếu tố (xem Hình 3). Sự tương quan cho thấy CaK thể hiện mối tương quan vừa phải với giá trị r = 0,53, tương tự như CaNi. Mặc dù Ca và K thể hiện mối liên hệ khiêm tốn với nhau, các nhà nghiên cứu như Kingston và cộng sự. 68 và Santo69 cho rằng mức độ của chúng trong đất tỉ lệ nghịch. Tuy nhiên, Ca và Mg đối kháng với K, nhưng CaK lại có mối tương quan tốt. Điều này có thể là do việc bón phân như kali cacbonat, loại có hàm lượng kali cao hơn 56%. Kali có mối tương quan vừa phải với magiê (KM r = 0,63). Trong ngành phân bón, hai nguyên tố này có mối quan hệ chặt chẽ vì kali magiê sunfat, kali magiê nitrat và kali được bón vào đất để tăng mức độ thiếu hụt của chúng. Niken có mối tương quan vừa phải với Ca, K và Mg với các giá trị r lần lượt là 0,52, 0,63 và 0,55. Mối quan hệ liên quan đến canxi, magiê và PTE như niken rất phức tạp, nhưng dù sao thì magiê cũng ức chế sự hấp thụ canxi, canxi làm giảm tác động của magiê dư thừa và cả magiê và canxi đều làm giảm tác động độc hại của niken trong đất.
Ma trận tương quan cho các yếu tố thể hiện mối quan hệ giữa các yếu tố dự báo và phản ứng (Lưu ý: hình này bao gồm biểu đồ phân tán giữa các yếu tố, mức ý nghĩa dựa trên p < 0,001).
Hình 4 minh họa sự phân bố không gian của các nguyên tố. Theo Burgos et al70, ứng dụng phân bố không gian là một kỹ thuật được sử dụng để định lượng và làm nổi bật các điểm nóng ở các khu vực ô nhiễm. Mức độ làm giàu Ca trong Hình 4 có thể được nhìn thấy ở phía tây bắc của bản đồ phân bố không gian. Hình này cho thấy các điểm nóng làm giàu Ca từ trung bình đến cao. Sự làm giàu canxi ở phía tây bắc của bản đồ có thể là do sử dụng vôi sống (canxi oxit) để giảm độ chua của đất và sử dụng nó trong các nhà máy thép như oxy kiềm trong quá trình sản xuất thép. Mặt khác, những người nông dân khác thích sử dụng canxi hydroxit trong đất chua để trung hòa độ pH, điều này cũng làm tăng hàm lượng canxi trong đất71. Kali cũng cho thấy các điểm nóng ở phía tây bắc và phía đông của bản đồ. Tây Bắc là một cộng đồng nông nghiệp lớn và mô hình kali từ trung bình đến cao có thể là do các ứng dụng NPK và kali. Điều này phù hợp với các nghiên cứu khác, chẳng hạn như Madaras và Lipavský72, Madaras et al.73, Pulkrabová et al.74, Asare et al.75, người đã quan sát thấy rằng việc ổn định đất và xử lý bằng KCl và NPK dẫn đến hàm lượng K cao trong đất. Sự làm giàu kali theo không gian ở phía tây bắc của bản đồ phân phối có thể là do sử dụng phân bón gốc kali như kali clorua, kali sunfat, kali nitrat, kali và kali để tăng hàm lượng kali trong đất nghèo. Zádorová et al. 76 và Tlustoš et al. 77 đã phác thảo rằng việc bón phân gốc K làm tăng hàm lượng K trong đất và về lâu dài sẽ làm tăng đáng kể hàm lượng dinh dưỡng trong đất, đặc biệt là K và Mg cho thấy một điểm nóng trong đất. Các điểm nóng tương đối vừa phải ở phía tây bắc của bản đồ và phía đông nam của bản đồ. Sự cố định keo trong đất làm cạn kiệt nồng độ magiê trong đất. Sự thiếu hụt magiê trong đất khiến cây biểu hiện bệnh vàng lá xen kẽ gân lá. Phân bón gốc magiê, chẳng hạn như kali magiê sunfat, magiê sunfat và Kieserite, xử lý tình trạng thiếu hụt (cây có màu tím, đỏ hoặc nâu, cho thấy tình trạng thiếu magiê) trong đất có phạm vi pH bình thường6. Sự tích tụ niken trên bề mặt đất đô thị và cận đô thị có thể là do các hoạt động của con người như nông nghiệp và tầm quan trọng của niken trong sản xuất thép không gỉ78.
Phân bố không gian của các yếu tố [bản đồ phân bố không gian được tạo bằng ArcGIS Desktop (ESRI, Inc, Phiên bản 10.7, URL: https://desktop.arcgis.com).]
Kết quả chỉ số hiệu suất mô hình cho các nguyên tố được sử dụng trong nghiên cứu này được thể hiện trong Bảng 2. Mặt khác, RMSE và MAE của Ni đều gần bằng 0 (0,86 RMSE, -0,08 MAE). Mặt khác, cả hai giá trị RMSE và MAE của K đều chấp nhận được. Kết quả RMSE và MAE lớn hơn đối với canxi và magiê. Kết quả MAE và RMSE của Ca và K lớn hơn do các tập dữ liệu khác nhau. RMSE và MAE của nghiên cứu này sử dụng EBK để dự đoán Ni được thấy là tốt hơn kết quả của John et al. 54 sử dụng kriging hiệp đồng để dự đoán nồng độ S trong đất bằng cách sử dụng cùng một dữ liệu đã thu thập. Các đầu ra EBK mà chúng tôi nghiên cứu có tương quan với các đầu ra của Fabijaczyk et al. 41, Yan et al. 79, Beguin et al. 80, Adhikary et al. 81 và John et al. 82, đặc biệt là K và Ni.
Hiệu suất của từng phương pháp riêng lẻ để dự đoán hàm lượng niken trong đất đô thị và ven đô được đánh giá bằng cách sử dụng hiệu suất của các mô hình (Bảng 3). Xác thực mô hình và đánh giá độ chính xác đã xác nhận rằng bộ dự báo Ca_Mg_K kết hợp với mô hình EBK SVMR mang lại hiệu suất tốt nhất. Mô hình hiệu chuẩn Ca_Mg_K-EBK_SVMR mô hình R2, sai số bình phương trung bình (RMSE) và sai số tuyệt đối trung bình (MAE) là 0,637 (R2), 95,479 mg/kg (RMSE) và 77,368 mg/kg (MAE) Ca_Mg_K-SVMR là 0,663 (R2), 235,974 mg/kg (RMSE) và 166,946 mg/kg (MAE). Tuy nhiên, các giá trị R2 tốt đã thu được đối với Ca_Mg_K-SVMR (0,663 mg/kg R2) và Ca_Mg-EBK_SVMR (0,643 = R2); Kết quả RMSE và MAE của chúng cao hơn so với kết quả của Ca_Mg_K-EBK_SVMR (R2 0,637) (xem Bảng 3). Ngoài ra, RMSE và MAE của mô hình Ca_Mg-EBK_SVMR (RMSE = 1664,64 và MAE = 1031,49) lần lượt là 17,5 và 13,4, lớn hơn so với kết quả của Ca_Mg_K-EBK_SVMR. Tương tự như vậy, RMSE và MAE của mô hình Ca_Mg-K SVMR (RMSE = 235,974 và MAE = 166,946) lớn hơn lần lượt là 2,5 và 2,2 so với kết quả của Ca_Mg_K-EBK_SVMR RMSE và MAE. Kết quả RMSE được tính toán cho biết tập dữ liệu tập trung như thế nào với đường phù hợp nhất. RSME và MAE cao hơn đã được quan sát thấy. Theo theo Kebonye et al. 46 và john et al. 54, RMSE và MAE càng gần 0 thì kết quả càng tốt. SVMR và EBK_SVMR có giá trị RSME và MAE lượng tử hóa cao hơn. Người ta quan sát thấy rằng ước tính RSME luôn cao hơn giá trị MAE, cho thấy sự hiện diện của các giá trị ngoại lai. Theo Legates và McCabe83, mức độ RMSE vượt quá sai số tuyệt đối trung bình (MAE) được khuyến nghị là một chỉ báo về sự hiện diện của các giá trị ngoại lai. Điều này có nghĩa là tập dữ liệu càng không đồng nhất thì giá trị MAE và RMSE càng cao. Độ chính xác của đánh giá xác thực chéo của mô hình hỗn hợp Ca_Mg_K-EBK_SVMR để dự đoán hàm lượng Ni trong đất đô thị và ngoại thành là 63,70%. Theo Li et al. 59, mức độ chính xác này là tỷ lệ hiệu suất mô hình có thể chấp nhận được. Các kết quả hiện tại được so sánh với một nghiên cứu trước đây của Tarasov et al. 36 có mô hình lai tạo ra MLPRK (Multilayer Perceptron Residual Kriging), liên quan đến chỉ số đánh giá độ chính xác EBK_SVMR được báo cáo trong nghiên cứu hiện tại, RMSE (210) và MAE (167,5) cao hơn kết quả của chúng tôi trong nghiên cứu hiện tại (RMSE 95,479, MAE 77,368). Tuy nhiên, khi so sánh R2 của nghiên cứu hiện tại (0,637) với nghiên cứu của Tarasov et al. 36 (0,544), rõ ràng là hệ số xác định (R2) cao hơn trong mô hình hỗn hợp này. Biên độ sai số (RMSE và MAE) (EBK SVMR) cho mô hình hỗn hợp thấp hơn hai lần. Tương tự như vậy, Sergeev et al.34 ghi nhận 0,28 (R2) cho mô hình lai đã phát triển (Multilayer Perceptron Residual Kriging), trong khi Ni trong nghiên cứu hiện tại ghi nhận 0,637 (R2). Mức độ chính xác dự đoán của mô hình này (EBK SVMR) là 63,7%, trong khi độ chính xác dự đoán thu được bởi Sergeev et al. 34 là 28%. Bản đồ cuối cùng (Hình 5) được tạo bằng cách sử dụng mô hình EBK_SVMR và Ca_Mg_K làm yếu tố dự đoán cho thấy dự đoán về các điểm nóng và vừa phải đến niken trên toàn bộ khu vực nghiên cứu. Điều này có nghĩa là nồng độ niken trong khu vực nghiên cứu chủ yếu là vừa phải, với nồng độ cao hơn ở một số khu vực cụ thể.
Bản đồ dự đoán cuối cùng được biểu diễn bằng mô hình lai EBK_SVMR và sử dụng Ca_Mg_K làm yếu tố dự đoán.[Bản đồ phân bố không gian được tạo bằng RStudio (phiên bản 1.4.1717: https://www.rstudio.com/).]
Hình 6 trình bày nồng độ PTE dưới dạng mặt phẳng thành phần bao gồm các tế bào thần kinh riêng lẻ. Không có mặt phẳng thành phần nào thể hiện cùng một mẫu màu như được hiển thị. Tuy nhiên, số lượng tế bào thần kinh thích hợp trên mỗi bản đồ được vẽ là 55. SeOM được tạo ra bằng cách sử dụng nhiều màu sắc khác nhau và các mẫu màu càng giống nhau thì các đặc tính của mẫu càng có thể so sánh được. Theo thang màu chính xác của chúng, các nguyên tố riêng lẻ (Ca, K và Mg) cho thấy các mẫu màu tương tự với các tế bào thần kinh cao đơn lẻ và hầu hết các tế bào thần kinh thấp. Do đó, CaK và CaMg có một số điểm tương đồng với các tế bào thần kinh bậc rất cao và các mẫu màu từ thấp đến trung bình. Cả hai mô hình đều dự đoán nồng độ Ni trong đất bằng cách hiển thị các sắc thái màu từ trung bình đến cao như đỏ, cam và vàng. Mô hình KMg hiển thị nhiều mẫu màu cao dựa trên tỷ lệ chính xác và các mảng màu từ thấp đến trung bình. Trên thang màu chính xác từ thấp đến cao, mẫu phân bố mặt phẳng của các thành phần của mô hình cho thấy một mẫu màu cao biểu thị nồng độ niken tiềm ẩn trong đất (xem Hình 4). Mặt phẳng thành phần của mô hình CakMg cho thấy một mẫu màu đa dạng từ thấp đến cao theo thang màu chính xác. Hơn nữa, dự đoán của mô hình về hàm lượng niken (CakMg) tương tự như phân bố không gian của niken được thể hiện trong Hình 5. Cả hai biểu đồ đều hiển thị tỷ lệ nồng độ niken cao, trung bình và thấp trong đất đô thị và ven đô. Hình 7 mô tả phương pháp đường đồng mức trong nhóm k-means trên bản đồ, được chia thành ba cụm dựa trên giá trị dự đoán trong mỗi mô hình. Phương pháp đường đồng mức biểu thị số cụm tối ưu. Trong số 115 mẫu đất được thu thập, loại 1 thu được nhiều mẫu đất nhất, 74. Cụm 2 nhận được 33 mẫu, trong khi cụm 3 nhận được 8 mẫu. Tổ hợp dự báo mặt phẳng bảy thành phần đã được đơn giản hóa để cho phép giải thích cụm chính xác. Do nhiều quá trình nhân sinh và tự nhiên ảnh hưởng đến sự hình thành đất, nên rất khó để có các mẫu cụm được phân biệt đúng cách trong bản đồ SeOM phân tán78.
Đầu ra mặt phẳng thành phần của mỗi biến Máy hỗ trợ vectơ Kriging Bayesian theo kinh nghiệm (EBK_SVM_SeOM).[Bản đồ SeOM được tạo bằng RStudio (phiên bản 1.4.1717: https://www.rstudio.com/).]
Các thành phần phân loại cụm khác nhau [Bản đồ SeOM được tạo bằng RStudio (phiên bản 1.4.1717: https://www.rstudio.com/).]
Nghiên cứu hiện tại minh họa rõ ràng các kỹ thuật mô hình hóa cho nồng độ niken trong đất đô thị và cận đô thị. Nghiên cứu đã thử nghiệm các kỹ thuật mô hình hóa khác nhau, kết hợp các phần tử với các kỹ thuật mô hình hóa, để có được cách tốt nhất để dự đoán nồng độ niken trong đất. Các đặc điểm không gian mặt phẳng thành phần SeOM của kỹ thuật mô hình hóa thể hiện một mẫu màu cao từ thấp đến cao trên thang màu chính xác, cho thấy nồng độ Ni trong đất. Tuy nhiên, bản đồ phân bố không gian xác nhận sự phân bố không gian mặt phẳng của các thành phần do EBK_SVMR thể hiện (xem Hình 5). Kết quả cho thấy mô hình hồi quy máy vectơ hỗ trợ (Ca Mg K-SVMR) dự đoán nồng độ Ni trong đất như một mô hình duy nhất, nhưng các tham số đánh giá độ chính xác và xác thực cho thấy lỗi rất cao về RMSE và MAE. Mặt khác, kỹ thuật mô hình hóa được sử dụng với mô hình EBK_MLR cũng bị lỗi do giá trị hệ số xác định (R2) thấp. Kết quả tốt đã thu được khi sử dụng EBK SVMR và các phần tử kết hợp (CaKMg) với lỗi RMSE và MAE thấp với độ chính xác là 63,7%. Hóa ra là việc kết hợp thuật toán EBK với Thuật toán học máy có thể tạo ra một thuật toán lai có thể dự đoán nồng độ PTE trong đất. Kết quả cho thấy việc sử dụng Ca Mg K làm yếu tố dự báo để dự đoán nồng độ Ni trong khu vực nghiên cứu có thể cải thiện khả năng dự đoán Ni trong đất. Điều này có nghĩa là việc liên tục sử dụng phân bón gốc niken và ô nhiễm đất công nghiệp của ngành công nghiệp thép có xu hướng làm tăng nồng độ niken trong đất. Nghiên cứu này cho thấy mô hình EBK có thể giảm mức độ lỗi và cải thiện độ chính xác của mô hình phân bố không gian đất ở đất đô thị hoặc ven đô. Nhìn chung, chúng tôi đề xuất áp dụng mô hình EBK-SVMR để đánh giá và dự đoán PTE trong đất; ngoài ra, chúng tôi đề xuất sử dụng EBK để lai với nhiều thuật toán học máy khác nhau. Nồng độ Ni được dự đoán bằng cách sử dụng các nguyên tố làm biến phụ thuộc; tuy nhiên, việc sử dụng nhiều biến phụ thuộc hơn sẽ cải thiện đáng kể hiệu suất của mô hình, đây có thể được coi là hạn chế của công trình hiện tại. Một hạn chế khác của nghiên cứu này là số lượng tập dữ liệu là 115. Do đó, nếu cung cấp nhiều dữ liệu hơn, hiệu suất của phương pháp lai tối ưu được đề xuất có thể được cải thiện.
PlantProbs.net.Niken trong thực vật và đất https://plantprobs.net/plant/nutrientImbalances/sodium.html (Truy cập ngày 28 tháng 4 năm 2021).
Kasprzak, KS Những tiến bộ của niken trong độc chất học môi trường hiện đại.môi trường xung quanh.độc chất học.11, 145–183 (1987).
Cempel, M. & Nikel, G. Nickel: Tổng quan về nguồn gốc và độc chất học môi trường của nó. Tạp chí Môi trường Ba Lan. Nghiên cứu. 15, 375–382 (2006).
Freedman, B. & Hutchinson, TC Đầu vào chất ô nhiễm từ khí quyển và sự tích tụ trong đất và thảm thực vật gần nhà máy luyện niken-đồng ở Sudbury, Ontario, Canada.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980).
Manyiwa, T. et al. Kim loại nặng trong đất, thực vật và rủi ro liên quan đến động vật nhai lại gặm cỏ gần mỏ đồng-niken Selebi-Phikwe ở Botswana. Môi trường xung quanh. Địa hóa học. Sức khỏe https://doi.org/10.1007/s10653-021-00918-x (2021).
Cabata-Pendias.Kabata-Pendias A. 2011. Các nguyên tố vi lượng trong đất và… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (Truy cập ngày 24 tháng 11 năm 2020).
Almås, A., Singh, B., Nông nghiệp, TS-NJ năm & 1995, chưa xác định. Tác động của ngành công nghiệp niken của Nga đến nồng độ kim loại nặng trong đất nông nghiệp và cỏ ở Soer-Varanger, Na Uy.agris.fao.org.
Nielsen, GD et al.Sự hấp thụ và giữ lại niken trong nước uống có liên quan đến lượng thức ăn nạp vào và độ nhạy cảm với niken. Độc tính học. Ứng dụng. Dược động học. 154, 67–75 (1999).
Costa, M. & Klein, CB Niken gây ung thư, đột biến, biểu sinh hoặc chọn lọc.môi trường xung quanh.Quan điểm về sức khỏe.107, 2 (1999).
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, ​​​​NM; Phân tích xu hướng các nguyên tố có khả năng gây độc: đánh giá thư mục. Địa hóa học môi trường và sức khỏe. Springer Science & Business Media BV 2020. https://doi.org/10.1007/s10653-020-00742-9.
Minasny, B. & McBratney, AB Bản đồ đất kỹ thuật số: Lịch sử tóm tắt và một số bài học.Geoderma 264, 301–311.https://doi.org/10.1016/j.geoderma.2015.07.017 (2016).
McBratney, AB, Mendonça Santos, ML & Minasny, B. Về bản đồ đất kỹ thuật số.Geoderma 117(1-2), 3-52.https://doi.org/10.1016/S0016-7061(03)00223-4 (2003).
Deutsch.CV Geostatistical Reservoir Modeling,… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (Truy cập ngày 28 tháng 4 năm 2021).


Thời gian đăng: 22-07-2022