Nature.com にアクセスいただきありがとうございます。ご利用のブラウザ バージョンでは、CSS のサポートが制限されています。最適なエクスペリエンスを得るには、更新されたブラウザを使用する (または Internet Explorer の互換モードをオフにする) ことをお勧めします。その間、継続的なサポートを確保するため、スタイルと JavaScript なしでサイトを表示します。
土壌汚染は、人間の活動によって引き起こされる大きな問題です。潜在的に毒性のある元素(PTE)の空間分布は、ほとんどの都市部および都市周辺部で異なります。そのため、そのような土壌中のPTE含有量を空間的に予測することは困難です。チェコ共和国のフリーデック・ミステックから合計115のサンプルが採取されました。カルシウム(Ca)、マグネシウム(Mg)、カリウム(K)、ニッケル(Ni)の濃度は、誘導結合プラズマ発光分析法を用いて測定されました。応答変数はNi、予測変数はCa、Mg、Kです。応答変数と予測変数間の相関行列は、元素間で良好な相関を示しています。予測結果では、サポートベクターマシン回帰(SVMR)が良好なパフォーマンスを示しましたが、推定二乗平均平方根誤差(RMSE)(235.974 mg/kg)および平均絶対誤差(MAE)(166.946 mg/kg)は、適用した他の方法よりも高くなりました。経験ベイズ法の混合モデルクリギング多重線形回帰(EBK-MLR)は、決定係数が0.1未満であることからもわかるように、パフォーマンスが低いです。経験的ベイジアンクリギングサポートベクターマシン回帰(EBK-SVMR)モデルは、RMSE(95.479 mg / kg)およびMAE(77.368 mg / kg)値が低く、決定係数が高かった(R2 = 0.637)ため、最良のモデルでした。EBK-SVMRモデリング手法の出力は、自己組織化マップを使用して視覚化されます。ハイブリッドモデルCakMg-EBK-SVMRコンポーネントの平面でクラスター化されたニューロンは、都市部および都市周辺部の土壌のNi濃度を予測する複数のカラーパターンを示しています。結果は、EBKとSVMRを組み合わせることが、都市部および都市周辺部の土壌のNi濃度を予測するための効果的な手法であることを示しています。
ニッケル(Ni)は、種子の発芽に必要な大気中の窒素固定(N)と尿素代謝に寄与するため、植物にとって微量栄養素と考えられています。種子の発芽に寄与することに加えて、Niは真菌や細菌の抑制剤として作用し、植物の発育を促進します。土壌中のニッケルが不足すると、植物がニッケルを吸収し、葉がクロロシス状態になります。例えば、ササゲやインゲンは、窒素固定を最適化するためにニッケルベースの肥料を施用する必要があります2。土壌を豊かにし、マメ科植物が土壌中の窒素を固定する能力を高めるためにニッケルベースの肥料を継続的に施用すると、土壌中のニッケル濃度が継続的に増加します。ニッケルは植物にとって微量栄養素ですが、土壌への過剰摂取は有益よりも有害となる可能性があります。土壌中のニッケルの毒性は、土壌のpHを低下させ、植物の成長に必須の栄養素である鉄の吸収を妨げます1。Liu3によると、Niは植物の発育に必要な17番目の重要な元素であることがわかりました。ニッケルは植物の発育と成長に重要な役割を果たすだけでなく、人間もさまざまな用途でニッケルを必要としています。電気メッキ、ニッケル基合金の製造、自動車産業における点火装置やスパークプラグの製造など、さまざまな産業分野でニッケルが使用されています。さらに、ニッケル基合金と電気メッキ製品は、キッチン用品、舞踏会用アクセサリー、食品産業用品、電気、電線、ケーブル、ジェットタービン、外科用インプラント、繊維、造船業にも幅広く使用されています5。土壌(表土など)中の Ni に富むレベルは、人為的発生源と自然発生源の両方に起因するとされていますが、基本的に Ni は人為的発生源ではなく自然発生源です4,6。ニッケルの自然発生源には、火山噴火、植生、森林火災、地質学的プロセスなどがあります。ただし、人為的発生源には、鉄鋼業界のニッケル/カドミウム電池、電気メッキ、アーク溶接、ディーゼル油と燃料油、石炭燃焼と廃棄物およびスラッジ焼却からの大気排出物が含まれます。ニッケルの蓄積7,8。FreedmanとHutchinson9とManyiwaら10によると、すぐ近くの環境および隣接環境における表土汚染の主な発生源は、主にニッケル銅ベースの製錬所と鉱山です。カナダのSudburyニッケル銅精錬所周辺の表土は、26,000 mg / kgでニッケル汚染レベルが最も高かったです11。対照的に、ロシアのニッケル生産からの汚染は、ノルウェーの土壌のニッケル濃度を高めました11。Almsらによると、 12、この地域の主要耕作地(ロシアのニッケル生産)における HNO3 抽出可能ニッケルの量は 6.25 ~ 136.88 mg/kg の範囲で、平均値 30.43 mg/kg、ベースライン濃度 25 mg/kg に相当します。Kabata 11 によれば、連続した作物シーズン中に都市部または都市周辺部の農業用土壌にリン肥料を施すと、土壌にリンが浸透または汚染される可能性があります。ニッケルが人間に及ぼす潜在的な影響は、突然変異誘発、染色体損傷、Z-DNA 生成、DNA 除去修復の阻害、またはエピジェネティック プロセスを通じて、がんを引き起こす可能性があります13。動物実験では、ニッケルはさまざまな腫瘍を引き起こす可能性があることが判明しており、発がん性ニッケル錯体はそのような腫瘍を悪化させる可能性があります。
土壌と植物の関係、土壌と土壌の生物学的関係、生態学的劣化、環境影響評価から生じるさまざまな健康関連の問題のために、近年、土壌汚染評価が盛んに行われています。現在まで、土壌中の Ni などの潜在的に毒性のある元素 (PTE) の空間予測は、従来の方法では面倒で時間のかかる作業でした。デジタル土壌マッピング (DSM) の登場と現在の成功15 により、予測土壌マッピング (PSM) が大幅に改善されました。Minasny と McBratney16 によると、予測土壌マッピング (DSM) は土壌科学の重要な下位分野であることが証明されています。Lagacherie と McBratney (2006) は DSM を「現場および実験室での観測方法と空間的および非空間的な土壌推論システムを使用して、空間的な土壌情報システムを作成および入力すること」と定義しています。McBratney ら17 は、現代の DSM または PSM が、PTE、土壌タイプ、土壌特性の空間分布を予測またはマッピングするための最も効果的な手法であることを概説しています。地質統計学と機械学習アルゴリズム (MLA) は、重要なデータと最小限のデータを使用してコンピューターの助けを借りてデジタル化されたマップを作成する DSM モデリング手法です。
Deutsch18 と Olea19 は、地統計学を「時系列分析が時間データをどのように特徴付けるかなど、主に確率モデルを用いて空間属性の表現を扱う数値手法の集合」と定義しています。地統計学では主に、バリオグラムの評価が行われ、これにより各データセットの空間値の依存関係を定量化および定義できます20。Gumiaux らは、地統計学を「空間属性の表現を扱う数値手法の集合」と定義しています。図 20 はさらに、地統計学におけるバリオグラムの評価は、(a) データ相関のスケールを計算する、(b) データセットの不一致における異方性を識別して計算する、(c) 測定データの固有の誤差をローカル効果から分離して考慮することに加えて、エリア効果も推定するという 3 つの原則に基づいていることを説明しています。これらの概念に基づいて、地統計学では、一般クリギング、コクリギング、通常クリギング、経験的ベイズクリギング、単純クリギング法、その他のよく知られた補間手法など、PTE、土壌特性、および土壌タイプをマップまたは予測する多くの補間手法が使用されています。
機械学習アルゴリズム (MLA) は、大規模な非線形データクラスを使用する比較的新しい手法で、主にデータマイニングやデータ内のパターンの識別に使用されるアルゴリズムによって駆動され、土壌科学やリターンタスクなどの科学分野での分類に繰り返し適用されています。多数の研究論文が、土壌中の PTE を予測するために MLA モデルに依存しています。たとえば、Tan et al. 22 (農業土壌での重金属推定のためのランダムフォレスト)、Sakizadeh et al. 23 (サポートベクターマシンと人工ニューラルネットワークを使用したモデリング) 土壌汚染)。さらに、Vega et al. 24 (土壌での重金属保持と吸着をモデリングするための CART)、Sun et al. 25 (土壌中の Cd の分布に対するキュービストの適用) などの他のアルゴリズムや、k 最近傍法、一般化ブースト回帰、ブースト回帰ツリーも、土壌中の PTE を予測するために MLA を適用しました。
DSM アルゴリズムを予測やマッピングに適用すると、いくつかの課題に直面します。多くの著者は、MLA は地統計学よりも優れていると考えており、その逆もまた同様です。どちらか一方が他方より優れているということもあります。しかし、この 2 つを組み合わせることで、DSM でのマッピングや予測の精度が向上します15。Woodcock と Gopal26、Finke27、Pontius と Cheuk28、および Grunwald29 は、予測された土壌マッピングの欠陥といくつかのエラーについてコメントしています。土壌科学者は、DSM マッピングと予測の有効性、精度、予測可能性を最適化するためにさまざまな手法を試してきました。不確実性と検証の組み合わせは、有効性を最適化し、欠陥を減らすために DSM に統合されている多くの異なる側面の 1 つです。ただし、Agyeman ら 15 は、マップの作成と予測によってもたらされる検証動作と不確実性は、マップの品質を向上させるために個別に検証する必要があると述べています。DSM の制限は、不確実性の要素を含む、土壌の品質が地理的に分散していることによるものです。ただし、DSM の不確実性は、共変量エラー、モデル エラー、位置エラー、分析エラーなど、複数のエラー ソースから発生する可能性があります31。MLA および地統計プロセスで誘発されるモデリングの不正確さは理解不足に関連しており、最終的には実際のプロセスの過度な単純化につながります32。モデリングの性質に関係なく、不正確さはモデリング パラメーター、数学モデル予測、または補間に起因する可能性があります33。最近、マッピングと予測での地統計学と MLA の統合を推進する新しい DSM のトレンドが登場しました。Sergeev ら34、Subbotina ら35、Tarasov ら36、Tarasov ら37 などの土壌科学者や著者は、地統計学と機械学習の正確な品質を利用して、予測とマッピングの効率を向上させるハイブリッド モデルを生成しました。品質。これらのハイブリッドまたは複合アルゴリズム モデルには、人工ニューラル ネットワーク クリギング (ANN-RK)、多層パーセプトロン残差クリギング (MLP-RK)、一般化回帰ニューラル ネットワーク残差クリギング (GR-NNRK)36、人工ニューラル ネットワーク クリギング - 多層パーセプトロン (ANN-K-MLP)37、および Co-Kriging とガウス過程回帰38 などがあります。
Sergeevらによると、様々なモデリング手法を組み合わせることで、単一のモデルを開発するよりも、結果として得られるハイブリッドモデルの欠陥を排除し、効率を高めることができる可能性がある。この文脈において、この新しい論文は、都市部および都市周辺地域におけるNi濃縮を予測するための最適なハイブリッドモデルを作成するには、地統計学とMLAを組み合わせたアルゴリズムを適用する必要があると主張している。この研究では、経験的ベイジアンクリギング(EBK)をベースモデルとして、サポートベクターマシン(SVM)および多重線形回帰(MLR)モデルと組み合わせる。EBKとMLAのハイブリッド化は知られていない。見られる複数の混合モデルは、通常、残差、回帰クリギング、およびMLAの組み合わせである。EBKは、定義された局所化パラメータを持つ非定常/定常ランダムフィールドとして局所化された空間的に確率的なプロセスを利用する地統計学的補間法であり、空間的変動を許容する39。EBKは、分布の分析など、さまざまな研究で使用されている。農地土壌中の有機炭素40、土壌汚染の評価41、土壌特性のマッピング42。
一方、自己組織化グラフ (SeOM) は、Li et al. 43、Wang et al. 44、Hossain Bhuiyan et al. 45、Kebonye et al. 46 などのさまざまな論文で適用されている学習アルゴリズムです。要素の空間属性とグループ化を決定します。Wang et al. 44 は、SeOM は非線形問題をグループ化して想像する能力で知られる強力な学習手法であると概説しています。主成分分析、ファジークラスタリング、階層的クラスタリング、および多基準意思決定などの他のパターン認識手法とは異なり、SeOM は PTE パターンの整理と識別に優れています。Wang et al. 44 によると、SeOM は関連するニューロンの分布を空間的にグループ化し、高解像度のデータ視覚化を提供できます。SeOM は Ni 予測データを視覚化して、直接解釈できるように結果を特徴付ける最適なモデルを取得します。
本論文の目的は、都市部および都市周辺部の土壌中のニッケル含有量を予測するための、最適な精度を備えた堅牢なマッピングモデルを作成することです。混合モデルの信頼性は、主にベースモデルに追加された他のモデルの影響に依存すると仮定しています。DSMが直面している課題を認識しており、これらの課題は複数の方面で対処されていますが、地統計学とMLAモデルの進歩の組み合わせは漸進的であると思われます。そのため、混合モデルを生み出す可能性のある研究上の質問に答えるように努めます。しかし、対象元素を予測する際のモデルの精度はどの程度でしょうか。また、検証と精度評価に基づく効率評価のレベルはどの程度でしょうか。したがって、本研究の具体的な目標は、(a)EBKをベースモデルとして使用してSVMRまたはMLRの複合混合モデルを作成し、(b)結果として得られたモデルを比較し、(c)都市部または都市周辺部の土壌中のNi濃度を予測するための最良の混合モデルを提案し、(d)SeOMを適用してニッケルの空間変動の高解像度マップを作成することでした。
この研究はチェコ共和国、具体的にはモラビア・シロンスク地方のフリーデク・ミーステク地区で行われています (図 1 を参照)。研究対象地域の地形は非常に険しく、大部分がモラビア・シロンスク地方ベスキディ地域の一部であり、カルパティア山脈の外縁の一部です。研究対象地域は北緯 49° 41′ 0′ から東経 18° 20′ 0′ の間に位置し、標高は 225 〜 327 m です。しかし、この地域の気候状態に関するケッペンの分類システムは、Cfb = 温帯海洋性気候と評価されており、乾季でも降雨量が多い。気温は年間を通じて -5 °C から 24 °C の間でわずかに変化し、-14 °C を下回ったり 30 °C を超えたりすることはめったにないが、年間平均降水量は 685 から 752 mm47 である。地域全体の推定調査面積は 1,208 平方キロメートルで、耕作地の 39.38%、森林被覆の 49.36% を占めている。一方、本研究で使用された地域は約 889.8 平方キロメートルである。オストラバとその周辺では、鉄鋼業と金属工場が非常に活発である。金属工場、ニッケルがステンレス鋼 (大気腐食に対する耐性など) や合金鋼 (ニッケルは合金の強度を高めながら、優れた延性と靭性を維持する) に使用される鉄鋼業、リン酸肥料の施用などの集約的農業と畜産は、この地域におけるニッケルの研究対象となっている潜在的な供給源です (例: 子羊にニッケルを投与して、子羊や低栄養の牛の成長率を高める)。研究対象となっているその他のニッケルの工業的用途には、電気めっき (電気ニッケルめっきおよび無電解ニッケルめっきプロセスを含む) での使用があります。土壌の特性は、土壌の色、構造、炭酸塩含有量から簡単に区別できます。土壌の質は中程度から細粒で、母材に由来します。それらは、性質上、崩積土、沖積土、または風成土です。一部の土壌領域は、表土と下層土にまだら模様が見られ、多くの場合、コンクリートと漂白されています。ただし、この地域で最も一般的な土壌タイプは、カンビソルと停滞土です48。標高が 455.1 m から 493.5 m の範囲であるチェコ共和国では、カンビソルが大部分を占めています49。
調査地域マップ [調査地域マップは、ArcGIS Desktop (ESRI, Inc、バージョン 10.7、URL: https://desktop.arcgis.com) を使用して作成されました。]
フリーデク・ミステク地区の都市部および都市周辺地域の土壌から、合計 115 個の表土サンプルが採取されました。サンプルパターンは、土壌サンプルが 2 × 2 km 間隔で配置された規則的なグリッドでした。表土は、携帯型 GPS デバイス (Leica Zeno 5 GPS) を使用して 0 ~ 20 cm の深さで測定されました。サンプルはジップロック バッグに梱包され、適切なラベルが貼られて研究室に送られました。サンプルは空気乾燥されて粉砕サンプルが作成され、機械システム (Fritsch ディスク ミル) によって粉砕され、ふるい分け (ふるいサイズ 2 mm) されました。乾燥、均質化、ふるい分けされた土壌サンプル 1 グラムを、明確にラベルを貼ったテフロン ボトルに入れました。各テフロン容器に、7 ml の 35% HCl と 3 ml の 65% HNO3 (自動ディスペンサーを使用 – 各酸につき 1 つ) を分配し、軽く蓋をしてサンプルを一晩放置して反応させます (王水プログラム)。上澄み液を熱い金属板(温度:100 W、160 °C)に2時間置いてサンプルの分解を促進し、その後冷却します。上澄み液を50 mlのメスフラスコに移し、脱イオン水で50 mlに希釈します。その後、希釈した上澄み液を脱イオン水を入れた50 ml PVCチューブに濾過します。さらに、希釈溶液1 mlを脱イオン水9 mlで希釈し、PTE擬似濃縮用に準備した12 mlチューブに濾過します。PTE(As、Cd、Cr、Cu、Mn、Ni、Pb、Zn、Ca、Mg、K)の濃度は、標準的な方法と合意に従って、ICP-OES(誘導結合プラズマ発光分光法)(Thermo Fisher Scientific、米国)によって測定しました。品質保証および管理(QA / QC)手順を確実に実行します(SRM NIST 2711a Montana II Soil)。検出限界が半分以下のPTEは本研究から除外しました。本研究で使用したPTEの検出限界は0.0004でした。(あなた)。さらに、各分析の品質管理および品質保証プロセスは、参照標準を分析することによって保証されます。エラーが最小限に抑えられるように、二重分析が実行されました。
経験的ベイジアンクリギング(EBK)は、土壌科学などの多様な分野のモデリングに用いられる多くの地統計学的補間手法の1つです。他のクリギング補間手法とは異なり、EBKはセミバリオグラムモデルによって推定される誤差を考慮する点で従来のクリギング法とは異なります。EBK補間では、補間中に単一のセミバリオグラムではなく、複数のセミバリオグラムモデルが計算されます。補間手法は、十分なクリギング法の非常に複雑な部分を構成するセミバリオグラムのプロットに関連する不確実性とプログラミングを可能にします。EBKの補間プロセスは、Krivoruchko50によって提案された3つの基準に従います。(a)モデルは入力データセットからセミバリオグラムを推定します。(b)生成されたセミバリオグラムに基づいて、各入力データセットの位置の新しい予測値を計算し、(c)最終的なモデルはシミュレートされたデータセットから計算されます。ベイジアン方程式のルールは事後確率として与えられます。
ここで、 \(Prob\left(A\right)\) は事前確率、 \(Prob\left(B\right)\) はほとんどの場合に無視され、 \(Prob (B,A)\ ) となります。セミバリオグラムの計算はベイズの規則に基づいており、これはセミバリオグラムから作成できる観測データセットの傾向を示しています。セミバリオグラムの値はベイズの規則を使用して決定され、これはセミバリオグラムから観測データセットが作成される可能性を示しています。
サポート ベクター マシンは、同一だが線形独立ではないクラスを区別するための最適な分離超平面を生成する機械学習アルゴリズムです。Vapnik51 は意図分類アルゴリズムを作成しましたが、最近では回帰指向の問題の解決に使用されています。Li et al.52 によると、SVM は最良の分類器手法の 1 つであり、さまざまな分野で使用されています。この分析では、SVM の回帰コンポーネント (サポート ベクター マシン回帰 – SVMR) を使用しました。Cherkassky と Mulier53 は、カーネル ベースの回帰として SVMR を開発しました。SVMR の計算は、複数の国の空間関数を持つ線形回帰モデルを使用して実行されました。John et al.54 は、SVMR モデリングでは、非線形関係を作成し、空間関数を可能にする超平面線形回帰を採用していると報告しています。Vohland et al. 55、イプシロン(ε)-SVMRは、トレーニングされたデータセットを使用して、相関データのトレーニングから最適なイプシロンバイアスを使用してデータを独立してマッピングするために適用されるイプシロン非感受性関数としての表現モデルを取得します。実際の値からの事前設定された距離誤差は無視され、誤差がε(ε)よりも大きい場合は、土壌特性によって補正されます。このモデルは、トレーニングデータの複雑さをサポートベクトルのより広いサブセットに削減します。Vapnik51によって提案された式を以下に示します。
ここで、b はスカラーしきい値、\(K\left({x}_{,}{ x}_{k}\right)\) はカーネル関数、\(\alpha\) はラグランジュ乗数、N は数値データセット、\({x}_{k}\) はデータ入力、\(y\) はデータ出力を表します。使用される主要なカーネルの 1 つは、ガウス放射基底関数 (RBF) である SVMR 操作です。RBF カーネルは、PTE トレーニング データの最も微妙なペナルティ セット係数 C とカーネル パラメーター ガンマ (γ) を取得するために重要な最適な SVMR モデルを決定するために適用されます。最初に、トレーニング セットを評価し、次に検証セットでモデルのパフォーマンスをテストしました。使用されるステアリング パラメーターはシグマで、メソッド値は svmRadial です。
多重線形回帰モデル(MLR)は、最小二乗法を用いて計算された線形プールパラメータを使用して、応答変数と複数の予測変数の関係を表す回帰モデルです。MLRでは、最小二乗モデルは説明変数を選択した後の土壌特性の予測関数です。説明変数を使用して線形関係を確立するには、応答を使用する必要があります。説明変数との線形関係を確立するために、PTEが応答変数として使用されました。MLR方程式は
ここで、y は応答変数、\(a\) は切片、n は予測変数の数、\({b}_{1}\) は係数の偏回帰、\({x}_{i}\) は予測変数または説明変数、\({\varepsilon }_{i}\) はモデルの誤差(残差とも呼ばれる)を表します。
EBKをSVMRとMLRで挟むことで混合モデルが得られました。これは、EBK補間から予測値を抽出することによって行われます。補間されたCa、K、Mgから得られた予測値は、組み合わせプロセスを通じて得られ、CaK、CaMg、KMgなどの新しい変数が得られます。次に、Ca、K、Mgの要素を組み合わせて、4番目の変数CaKMgを取得します。全体として、得られた変数はCa、K、Mg、CaK、CaMg、KMg、CaKMgです。これらの変数は予測子となり、都市部および都市周辺部の土壌中のニッケル濃度の予測に役立ちました。SVMRアルゴリズムは予測子に対して実行され、混合モデル経験ベイジアンクリギング-サポートベクターマシン(EBK_SVM)が得られました。同様に、変数はMLRアルゴリズムにもパイプされ、混合モデル経験ベイジアンクリギング-多重線形回帰が得られます。 (EBK_MLR)。通常、変数 Ca、K、Mg、CaK、CaMg、KMg、および CaKMg は、都市部および都市周辺部の土壌の Ni 含有量の予測子として共変量として使用されます。得られた最も適切なモデル (EBK_SVM または EBK_MLR) は、自己組織化グラフを使用して視覚化されます。この研究のワークフローを図 2 に示します。
SeOM は、金融、ヘルスケア、産業、統計、土壌科学などの分野でデータの整理、評価、予測を行うための一般的なツールとなっています。SeOM は、整理、評価、予測を行うために人工ニューラル ネットワークと教師なし学習法を使用して作成されます。この研究では、SeOM を使用して、都市部および都市周辺部の土壌の Ni を予測する最適なモデルに基づいて Ni 濃度を視覚化しました。SeOM 評価で処理されたデータは、n 入力次元のベクトル変数として使用されます43,56。Melssen ら。 57は、単一の入力層を介して入力ベクトルをニューラルネットワークに接続し、単一の重みベクトルを持つ出力ベクトルに接続することを説明しています。SeOMによって生成される出力は、近接性に応じて六角形、円形、または正方形の位相マップに織り込まれた異なるニューロンまたはノードで構成される2次元マップです。メトリック、量子化誤差(QE)、およびトポグラフィックエラー(TE)に基づいてマップサイズを比較すると、それぞれ0.086と0.904のSeOMモデルが選択され、これは55マップユニット(5×11)です。ニューロン構造は、経験式のノード数に応じて決定されます。
この研究で使用したデータの数は 115 サンプルです。ランダム手法を使用して、データをテスト データ (検証用 25%) とトレーニング データ セット (キャリブレーション用 75%) に分割しました。トレーニング データセットは回帰モデル (キャリブレーション) を生成するために使用され、テスト データセットは一般化能力を検証するために使用されます58。これは、土壌中のニッケル含有量を予測するためのさまざまなモデルの適合性を評価するために行われました。使用したすべてのモデルは、10 倍のクロス検証プロセスを 5 回繰り返しました。EBK 補間によって生成された変数は、ターゲット変数 (PTE) を予測するための予測子または説明変数として使用されます。モデリングは、パッケージ library(Kohonen)、library(caret)、library(modelr)、library(“e1071″)、library(“plyr”)、library(“caTools”)、library(“spectr”)、および libraries (“Metrics”) を使用して RStudio で処理されます。
土壌中のニッケル濃度を予測するのに最適なモデルを決定し、そのモデルとその検証の精度を評価するために、さまざまな検証パラメータが使用されました。ハイブリダイゼーション モデルは、平均絶対誤差 (MAE)、二乗平均平方根誤差 (RMSE)、および決定係数 (R2) を使用して評価されました。R2 は、回帰モデルによって表される答えの割合の分散を定義します。独立した測定における RMSE と分散の大きさはモデルの予測力を説明し、MAE は実際の定量値を決定します。検証パラメータを使用して最適な混合モデルを評価するには、R2 値が高くなければなりません。値が 1 に近いほど、精度が高くなります。Li ら 59 によると、R2 基準値が 0.75 以上であれば、良好な予測子であると考えられます。 0.5~0.75は許容可能なモデル性能であり、0.5未満は許容できないモデル性能です。RMSEおよびMAE検証基準評価方法を使用してモデルを選択する場合、得られた値が低いほど十分であり、最良の選択であると見なされました。次の式は検証方法を説明しています。
ここで、nは観測値の大きさを表し、\({Y}_{i}\)は測定された応答を表し、\({\widehat{Y}}_{i}\)も予測された応答値を表します。したがって、最初のi回の観測値に対する応答値です。
予測変数と応答変数の統計的説明は表1に示されており、平均、標準偏差(SD)、変動係数(CV)、最小値、最大値、尖度、歪度を示しています。元素の最小値と最大値は、それぞれMg < Ca < K < Ni、Ca < Mg < K < Niの降順です。調査地域から採取された応答変数(Ni)の濃度は、4.86~42.39 mg/kgの範囲でした。Niを世界平均(29 mg/kg)およびヨーロッパ平均(37 mg/kg)と比較すると、調査地域の全体的な計算された幾何平均は許容範囲内であることが示されました。しかし、Kabata-Pendias11が示すように、現在の研究における平均ニッケル(Ni)濃度をスウェーデンの農業土壌と比較すると、現在の平均ニッケル濃度の方が高いことがわかります。同様に、現在の研究における都市部および都市周辺部の土壌のFrydek Mistekの平均濃度は、 (Ni 16.15 mg/kg) は、Różański らが報告したポーランドの都市土壌の Ni の許容限度 60 (10.2 mg/kg) よりも高かった。さらに、Bretzel と Calderisi61 は、トスカーナの都市土壌で現在の研究と比較して非常に低い平均 Ni 濃度 (1.78 mg/kg) を記録した。Jim62 も香港の都市土壌のニッケル濃度が低いことを発見した (12.34 mg/kg)。これは、この研究の現在のニッケル濃度よりも低い。Birke ら63 は、ドイツのザクセンアンハルト州の古い鉱山と都市工業地帯で平均 Ni 濃度が 17.6 mg/kg であると報告したが、これはその地域の平均 Ni 濃度 (16.15 mg/kg) よりも 1.45 mg/kg 高かった。現在の研究。研究対象地域の一部の都市部と郊外地域の土壌の過剰なニッケル含有量は、主に鉄鋼産業と金属産業に起因する可能性がある。これは、鉄鋼業界と金属加工業が土壌中のニッケル汚染の主な発生源であるというKhodadoustら64の研究と一致している。しかし、予測因子も、Caでは538.70~69,161.80 mg/kg、Kでは497.51~3535.68 mg/kg、Mgでは685.68~5970.05 mg/kgの範囲であった。Jakovljevicら64 65 は、セルビア中央部の土壌中のマグネシウムとカリウムの総含有量を調査しました。彼らは、総濃度 (それぞれ 410 mg/kg と 400 mg/kg) が、現在の研究のマグネシウムとカリウムの濃度よりも低いことを発見しました。区別がつかないことに、ポーランド東部では、Orzechowski と Smolczynski66 が、カルシウム、マグネシウム、カリウムの総含有量を評価し、カルシウム (1100 mg/kg)、マグネシウム (590 mg/kg)、カリウム (810 mg/kg) の平均濃度を示しました。表土の含有量は、この研究の単一元素よりも低いです。Pongrac らによる最近の研究 67 では、英国スコットランドの 3 つの異なる土壌 (マイルフィールド土壌、バルラダリー土壌、ハートウッド土壌) で分析したカルシウムの総含有量が、この研究でより高いカルシウム含有量を示していることが示されました。
採取された元素の測定濃度が異なるため、元素のデータ セット分布は異なる歪度を示します。元素の歪度と尖度は、それぞれ 1.53 ~ 7.24、2.49 ~ 54.16 の範囲でした。計算されたすべての元素の歪度と尖度は +1 を超えているため、データ分布は不規則で、右方向に歪んでおり、ピークに達していることがわかります。また、元素の推定 CV は、K、Mg、および Ni が中程度の変動性を示す一方で、Ca が非常に高い変動性を示すことを示しています。K、Ni、および Mg の CV は、それらの均一な分布を説明しています。さらに、Ca の分布は不均一であり、外部ソースがその濃縮レベルに影響を及ぼす可能性があります。
予測変数と応答要素の相関関係は、要素間で良好な相関関係があることを示しました (図 3 を参照)。相関関係では、CaK は r 値 = 0.53 で中程度の相関関係を示し、CaNi も同様でした。Ca と K は互いに適度な関連性を示していますが、Kingston らなどの研究者は、Ca と K の間には中程度の関連性があると考えています。 68 および Santo69 は、土壌中のそれらのレベルが反比例することを示唆しています。ただし、Ca と Mg は K と拮抗しますが、CaK はよく相関します。これは、カリウムが 56% 高い炭酸カリウムなどの肥料の施用によるものと考えられます。カリウムはマグネシウムと中程度の相関がありました (KM r = 0.63)。肥料業界では、硫酸マグネシウムカリウム、硝酸マグネシウムカリウム、カリが土壌の欠乏レベルを高めるために施用されるため、これら 2 つの要素は密接に関連しています。ニッケルは、Ca、K、Mg と中程度の相関があり、r 値はそれぞれ 0.52、0.63、0.55 です。カルシウム、マグネシウム、ニッケルなどの PTE が関係する関係は複雑ですが、マグネシウムはカルシウムの吸収を阻害し、カルシウムは過剰なマグネシウムの影響を軽減し、マグネシウムとカルシウムは両方とも土壌中のニッケルの毒性影響を軽減します。
予測変数と応答変数の関係を示す要素の相関行列 (注: この図には要素間の散布図が含まれており、有意水準は p < 0.001 に基づいています)。
図4は、元素の空間分布を示しています。Burgosら70によると、空間分布の適用は、汚染地域のホットスポットを定量化し、強調表示するために使用される手法です。図4のCaの濃縮レベルは、空間分布図の北西部で確認できます。図は、中程度から高いCa濃縮ホットスポットを示しています。地図の北西部におけるカルシウムの濃縮は、土壌の酸性度を下げるための生石灰(酸化カルシウム)の使用と、製鋼工程におけるアルカリ性酸素として製鉄所で使用されていることによるものと考えられます。一方、酸性土壌ではpHを中和するために水酸化カルシウムを使用する農家もおり、これも土壌のカルシウム含有量を増加させます71。カリウムも、地図の北西部と東部でホットスポットを示しています。北西部は主要な農業コミュニティであり、カリウムの中程度から高いパターンは、NPKとカリの施用によるものと考えられます。これは、MadarasとLipavsky72、Madarasら73などの他の研究と一致しています。 al.73、Pulkrabová et al.74、Asare et al.75は、土壌安定化とKClおよびNPK処理によって土壌中のK含有量が増加したことを報告しています。分布図の北西部におけるカリウムの空間的な増加は、貧弱な土壌のカリウム含有量を高めるために、塩化カリウム、硫酸カリウム、硝酸カリウム、カリ、カリなどのカリウム系肥料が使用されたことによるものと考えられます。Zádorová et al.76およびTlustoš et al.77は、土壌のカリウム含有量を増加させるために、カリウム系肥料(塩化カリウム、硫酸カリウム、硝酸カリウム、カリ、カリなど)が使用されたことによるものと考えられます。 77 では、カリウムベースの肥料を施用すると、土壌のカリウム含有量が増加し、長期的には土壌養分含有量が大幅に増加すると概説されており、特にカリウムとマグネシウムは土壌にホット スポットを示しています。地図の北西部と南東部には、比較的中程度のホット スポットがあります。土壌のコロイド固定により、土壌中のマグネシウムの濃度が枯渇します。土壌中のマグネシウムが不足すると、植物は黄色がかった葉脈間クロロシスを示します。硫酸カリウムマグネシウム、硫酸マグネシウム、キーザーライトなどのマグネシウムベースの肥料は、正常な pH 範囲の土壌の欠乏 (植物は紫、赤、または茶色になり、マグネシウム欠乏を示します) を治療します6。都市部および都市周辺地域の土壌表面へのニッケルの蓄積は、農業などの人為的活動と、ステンレス鋼製造におけるニッケルの重要性による可能性があります78。
要素の空間分布 [空間分布マップは、ArcGIS Desktop (ESRI, Inc、バージョン 10.7、URL: https://desktop.arcgis.com) を使用して作成されました。]
この研究で使用した要素のモデル性能指標の結果を表2に示します。一方、NiのRMSEとMAEは両方ともゼロに近いです(0.86 RMSE、-0.08 MAE)。一方、KのRMSEとMAEの値は両方とも許容範囲内です。カルシウムとマグネシウムのRMSEとMAEの結果は大きくなっていました。CaとKのMAEとRMSEの結果は、データセットが異なるために大きくなっています。EBKを使用してNiを予測するこの研究のRMSEとMAEは、同じ収集データを使用して土壌中のS濃度を予測するために相乗クリギングを使用したJohnら54の結果よりも優れていることがわかりました。私たちが研究したEBKの出力は、特にKとNiにおいて、Fabijaczykら41、Yanら79、Beguinら80、Adhikaryら81、Johnら82の出力と相関しています。
都市部および都市周辺部の土壌中のニッケル含有量を予測する個々の方法のパフォーマンスは、モデルの性能を使用して評価されました(表3)。モデルの検証と精度評価により、Ca_Mg_K予測子とEBK SVMRモデルを組み合わせたものが最高のパフォーマンスを発揮することが確認されました。較正モデルCa_Mg_K-EBK_SVMRモデルのR2、二乗平均平方根誤差(RMSE)、平均絶対誤差(MAE)は、それぞれ0.637(R2)、95.479 mg/kg(RMSE)、77.368 mg/kg(MAE)でした。Ca_Mg_K-SVMRは0.663(R2)、235.974 mg/kg(RMSE)、166.946 mg/kg(MAE)でした。それにもかかわらず、Ca_Mg_K-SVMR(0.663 mg/kg R2)とCa_Mg-EBK_SVMRでは良好なR2値が得られました。 (0.643 = R2); RMSEとMAEの結果はCa_Mg_K-EBK_SVMR(R2 0.637)よりも高かった(表3を参照)。さらに、Ca_Mg-EBK_SVMR(RMSE = 1664.64およびMAE = 1031.49)モデルのRMSEとMAEはそれぞれ17.5と13.4であり、Ca_Mg_K-EBK_SVMRよりも大きい。同様に、Ca_Mg-K SVMR(RMSE = 235.974およびMAE = 166.946)モデルのRMSEとMAEは、それぞれCa_Mg_K-EBK_SVMRのRMSEとMAEよりも2.5と2.2大きい。計算されたRMSEの結果は、データセットが最適な直線にどれだけ集中しているかを示している。より高いRSMEとMAEが観測された。 Kebonye et al. 46 および john et al. 54 によれば、RMSE と MAE がゼロに近いほど、結果は良好です。SVMR と EBK_SVMR は、より高い量子化 RSME 値と MAE 値を持ちます。RSME 推定値は MAE 値よりも一貫して高く、外れ値の存在を示していることが観察されました。Legates と McCabe83 によると、RMSE が平均絶対誤差 (MAE) を超える程度が、外れ値の存在の指標として推奨されています。つまり、データセットの異質性が高いほど、MAE 値と RMSE 値が高くなるということです。都市部と郊外の土壌の Ni 含有量を予測するための Ca_Mg_K-EBK_SVMR 混合モデルのクロス検証評価の精度は 63.70% でした。Li et al. 59 によると、このレベルの精度は許容できるモデル性能率です。本研究で報告されたEBK_SVMR精度評価指標に関連するMLPRK(多層パーセプトロン残差クリギング)を作成したハイブリッドモデル36のRMSE(210)とMAE(167.5)は、本研究の結果(RMSE 95.479、MAE 77.368)よりも高かった。ただし、本研究のR2(0.637)をTarasovらの結果と比較すると、R2はTarasovらのR2とほぼ同等であった。 36(0.544)から、決定係数(R2)は、この混合モデルの方が高いことがわかります。混合モデルの誤差(RMSEおよびMAE)(EBK SVMR)は、2倍低くなります。同様に、Sergeev et al.34は、開発されたハイブリッドモデル(多層パーセプトロン残差クリギング)で0.28(R2)を記録しましたが、現在の研究のNiは0.637(R2)を記録しました。このモデル(EBK SVMR)の予測精度レベルは63.7%ですが、Sergeev et al. 34によって得られた予測精度は28%です。EBK_SVMRモデルとCa_Mg_Kを予測子として使用して作成された最終的なマップ(図5)は、研究対象地域全体でホットスポットと中程度からニッケルの予測を示しています。これは、研究対象地域のニッケルの濃度は主に中程度であり、特定の地域では高濃度であることを意味します。
最終的な予測マップは、ハイブリッド モデル EBK_SVMR を使用し、Ca_Mg_K を予測子として使用して表されます。[空間分布マップは、RStudio (バージョン 1.4.1717: https://www.rstudio.com/) を使用して作成されました。]
図6は、PTE濃度を個々のニューロンからなる構成平面として示しています。どの構成平面も、示されているように同じ色パターンを示しませんでした。ただし、描画されたマップあたりの適切なニューロン数は55です。SeOMはさまざまな色を使用して作成され、色パターンが類似しているほど、サンプルの特性がより類似していることを示します。正確な色スケールによると、個々の元素(Ca、K、Mg)は、単一の高ニューロンとほとんどの低ニューロンに類似した色パターンを示しました。したがって、CaKとCaMgは、非常に高次のニューロンと低から中程度の色パターンといくつかの類似点を共有しています。どちらのモデルも、赤、オレンジ、黄色などの中程度から高い色相の色を表示することで、土壌中のニッケルの濃度を予測します。KMgモデルは、正確な割合と低から中程度の色パッチに基づいて、多くの高色パターンを表示します。低から高までの正確な色スケールでは、モデルのコンポーネントの平面分布パターンは、土壌中のニッケルの潜在的な濃度を示す高色パターンを示しました(図4を参照)。 CakMg モデルのコンポーネント プレーンは、正確なカラー スケールに従って、低から高までの多様なカラー パターンを示しています。さらに、モデルのニッケル含有量 (CakMg) の予測は、図 5 に示すニッケルの空間分布と似ています。両方のグラフは、都市部および都市周辺部の土壌におけるニッケル濃度の高、中、低の割合を示しています。図 7 は、各モデルの予測値に基づいて 3 つのクラスターに分割された、マップ上の k 平均グループ化のコンター メソッドを示しています。コンター メソッドは、クラスターの最適数を表しています。収集された 115 個の土壌サンプルのうち、カテゴリ 1 が最も多くの土壌サンプル (74 個) を取得しました。クラスター 2 は 33 個のサンプルを受け取り、クラスター 3 は 8 個のサンプルを受け取りました。7 つのコンポーネントの平面予測子の組み合わせは、クラスターの正しい解釈を可能にするために簡略化されました。土壌の形成に影響を与える人為的および自然的プロセスが多数あるため、分散 SeOM マップで適切に差別化されたクラスター パターンを持つことは困難です
各 Empirical Bayesian Kriging Support Vector Machine (EBK_SVM_SeOM) 変数によるコンポーネント プレーン出力。[SeOM マップは RStudio (バージョン 1.4.1717: https://www.rstudio.com/) を使用して作成されました。]
さまざまなクラスター分類コンポーネント [SeOM マップは RStudio (バージョン 1.4.1717: https://www.rstudio.com/) を使用して作成されました。]
本研究は、都市部および都市周辺部の土壌におけるニッケル濃度のモデリング手法を明確に示している。本研究では、土壌中のニッケル濃度を予測する最良の方法を得るために、要素とモデリング手法を組み合わせた様々なモデリング手法をテストした。モデリング手法のSeOM組成平面空間特性は、正確な色スケール上で低から高までの高色パターンを示し、土壌中のニッケル濃度を示している。しかし、空間分布マップは、EBK_SVMRによって示された成分の平面空間分布を裏付けている(図5参照)。結果は、サポートベクターマシン回帰モデル(Ca Mg K-SVMR)が単一モデルとして土壌中のニッケル濃度を予測しているが、検証および精度評価パラメータはRMSEおよびMAEに関して非常に高い誤差を示していることを示している。一方、EBK_MLRモデルで採用されたモデリング手法も、決定係数(R2)の値が低いため欠陥がある。EBK SVMRと複合要素(CaKMg)を使用することで、低いRMSEおよびMAE誤差と精度で良好な結果が得られた。 EBK アルゴリズムと機械学習アルゴリズムを組み合わせることで、土壌中の PTE の濃度を予測できるハイブリッド アルゴリズムを生成できることがわかりました。結果は、研究地域の Ni 濃度を予測するための予測因子として Ca Mg K を使用すると、土壌中の Ni の予測を改善できることを示しています。これは、ニッケルベースの肥料の継続的な使用と鉄鋼業界による土壌の産業汚染が、土壌中のニッケルの濃度を高める傾向があることを意味します。この研究では、EBK モデルによりエラー レベルが低減し、都市部または都市周辺部の土壌における土壌空間分布モデルの精度が向上することが明らかになりました。一般に、土壌中の PTE を評価および予測するために EBK-SVMR モデルを適用することを提案します。さらに、EBK を使用してさまざまな機械学習アルゴリズムをハイブリッド化することを提案します。Ni 濃度は、元素を共変量として使用して予測されました。ただし、より多くの共変量を使用するとモデルのパフォーマンスが大幅に向上しますが、これは現在の作業の限界であると考えられます。この研究のもう1つの限界は、データセットの数が115であることです。したがって、より多くのデータが提供されると、提案された最適化されたハイブリダイゼーション方法のパフォーマンスを向上させることができます。
PlantProbs.net.植物と土壌中のニッケル https://plantprobs.net/plant/nutrientImbalances/sodium.html (2021年4月28日にアクセス)。
Kasprzak, KS「ニッケルの現代環境毒性学の進歩.surroundings.toxicology.11, 145–183 (1987)」
Cempel, M. & Nikel, G. ニッケル:その発生源と環境毒性学のレビュー。Polish J. Environment.Stud.15、375–382 (2006)。
Freedman, B. & Hutchinson, TC カナダ、オンタリオ州サドベリーのニッケル銅製錬所付近における大気からの汚染物質の流入と土壌および植生への蓄積.can.J. Bot.58(1), 108-132.https://doi.org/10.1139/b80-014 (1980)。
Manyiwa, T. et al.ボツワナのセレビ・ピクウェ銅ニッケル鉱山付近の土壌、植物中の重金属と放牧反芻動物に関連するリスク。surroundings.Geochemistry.Health https://doi.org/10.1007/s10653-021-00918-x (2021)。
Cabata-Pendias.Kabata-Pendias A. 2011. 土壌中の微量元素と植物… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=Kabata-Pendias+A.+2011.+Trace+ Elements+in+soils+and+plants.+4th+ed.+New+York+%28NY%29%3A+CRC+Press&btnG= (2020 年 11 月 24 日にアクセス).
Almås, A.、Singh, B.、農業、TS-NJ、1995 年、不明。ロシアのニッケル産業がノルウェーの Soer-Varanger の農業用土壌および牧草地の重金属濃度に与える影響。agris.fao.org。
Nielsen, GD et al.飲料水中のニッケルの吸収および保持は食物摂取およびニッケル感受性と関連している。toxicology.application.Pharmacodynamics.154, 67–75 (1999)。
Costa, M. & Klein, CB ニッケルの発がん性、突然変異、エピジェネティクス、または選択。周囲。健康展望。107、2 (1999)。
Ajman, PC; Ajado, SK; Borůvka, L.; Bini, JKM; Sarkody, VYO; Cobonye, NM; 潜在的に毒性のある元素の傾向分析:書誌学的レビュー。環境地球化学と健康。Springer Science & Business Media BV 2020.https://doi.org/10.1007/s10653-020-00742-9。
Minasny, B. & McBratney, AB デジタル土壌マッピング:簡単な歴史といくつかの教訓。Geoderma 264、301–311。https://doi.org/10.1016/j.geoderma.2015.07.017 (2016)。
McBratney, AB、Mendonça Santos, ML、Minasny, B. デジタル土壌マッピングについて。Geoderma 117(1-2)、3-52。https://doi.org/10.1016/S0016-7061(03)00223-4 (2003)。
Deutsch.CV 地統計的貯留層モデリング、… – Google Scholar https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=CV+Deutsch%2C+2002%2C+Geostatistical+Reservoir+Modeling%2C +Oxford+University+Press%2C+376+pages.+&btnG= (2021年4月28日にアクセス).
投稿日時: 2022年7月22日


