都市化した河川の水質動態を説明するための機械学習アプローチ

ニュース

ホームページホームページ / ニュース / 都市化した河川の水質動態を説明するための機械学習アプローチ

Jan 25, 2024

都市化した河川の水質動態を説明するための機械学習アプローチ

Rapporti scientifici Volume 12,

Scientific Reports volume 12、記事番号: 12346 (2022) この記事を引用

2719 アクセス

2 引用

10 オルトメトリック

メトリクスの詳細

人間の活動により河川の水質と水量が変化し、都市化された河川の生態系に影響を及ぼします。 水質の時空間パターンの制御における人為的要因の役割を定量化することは、都市河川の生態学的健全性を改善するための成功する戦略を開発するために重要です。 ここでは、Citizen Science プロジェクト中にイングランド南東部のチェス川から収集された高周波の電気伝導率と温度のデータを分析します。 機械学習を利用することで、ブーストされた樹木が GAM よりも優れたパフォーマンスを示し、誤差 1% 未満で水質の動態を正確に記述することがわかりました。 SHapley の加法説明では、川の水位や下水処理施設 (WWTW) の流出量など、個々の変数の重要性とそれらの間の (相互) 依存関係が明らかになります。 下水処理施設の流出により、年間を通じて検出可能な電気伝導度の日内変動が生じ、下水処理施設の下流 2 km の範囲で平均水​​温が 1 \(\rm{^o}C\) 上昇します。低流量時。 全体として、Citizen Science プロジェクトによって開始された高周波水質測定と機械学習技術が、都市化したチョーク川の水質動態の主要な要因を解明するのにどのように役立つかを紹介します。

世界中で、都市化などの人間の活動により、流域の水循環に変化が生じ、河川の水量、水質、生態系に重大な影響を与えています1、2。 都市化は、集水域の水文学をさまざまな形で変化させます3。 不透水性表面の導入と人工排水システムの併用により、河川のピーク流量 3 が増加し、降雨に対する水文学的応答時間が短縮され 4,5 、基礎流量と地下水涵養量 6 が減少します。 多くの国では、合流式下水道システムが、乾燥した状態で生活排水と産業排水を下水処理施設に運び、雨が降ったときに舗装されたエリアからの雨水を排水します。 処理された排水は、人間の活動によって決定される独特の流れパターンを河川に引き起こす可能性があります7,8。

都市化に伴う人間の活動も化学的な水質に影響を及ぼし、暴風雨9、10、11 や「ファーストフラッシュ」現象 12、13 における都市河川の水質変化の特徴を明らかにすることに多くの努力が注がれています。 また、下水処理施設の能力を超えた激しい降雨の後、合流した下水のオーバーフローが水質に重大な影響を与える可能性があります14、15、16、17。 また、都市部の河川は地方の河川に比べて平均電気伝導率と主要イオン濃度が高い傾向があることもわかっています18、19、20。これは点汚染源と拡散汚染源の組み合わせから生じます。 たとえば、塩化物、硫酸塩、ナトリウム、カリウムは尿中の一般的な電解質であるため、廃水中に濃縮されます19。 しかし、都市システムにおける個々のイオンの主な発生源を特定することは困難であることが判明しています21。 このような溶質レベルの上昇により、生態学者は現在、都市河川生態系の健全性と回復力に対するイオン濃度の上昇の潜在的な影響についての仮説を立てています22。

人間の活動により、河川の水質が広範に悪化し、生態系の健全性に影響を及ぼしています23。 これらの活動は、(降雨事象に応じて)数時間から毎日、季節的、および年々のサイクルに至る入れ子状のタイムスケールにわたって作用する受水域の水質の変化につながります24,25。 人間の活動が河川に及ぼす影響を完全に理解するには、水質における人為的変動と自然変動を区別する必要があります。 これを行うには、リアルタイムの高周波水質センサーを使用することで利用できるようになる、都市化されたシステムの高解像度かつ長期監視データにアクセスする必要があります26。

詳細なデータが利用できるため、機械学習 (ML) はプロセスベースまたは従来の統計モデルに代わる重要な手段となりつつあります。 ML モデルが従来のアプローチと比較して優れた予測パフォーマンス 27 を示すたびに、この開発はさらに加速されます。 たとえば、最近、下水処理施設 (WWTW) からの 15 分間の流量データでトレーニングすると、機械学習を使用して未処理の下水排出を検出できることが実証されました。 具体的な機械学習手法には、一般化加算モデル (GAM) やブースト ツリーなどがあります。 GAM 技術は、クロロフィル a と他の水質パラメータの間の相関関係を調査するために使用されています29。 一方、ブーストツリー分析は、たとえば、地下水中の硝酸塩濃度に影響を与える要因の重要性をランク付けしたり、硝酸塩脆弱性マップを作成したりするために使用されています30。 ブースト ツリーの基本的な考え方は、多くの「弱学習器」、つまり単純な回帰ツリーを 1 つのアンサンブル予測器に結合することです 31。 ブーストされたツリーは、特に表形式データでニューラル ネットワークよりも優れたパフォーマンスを発揮することがよくあります 32 が、将来のイベントを予測したり、以前に記録された値を超えて外挿したりするのに問題があります。

機械学習を適用する場合、ブラックボックス ソリューションはプロセスベースの科学的洞察を提供しないため、それを避けることが重要です33。 「説明可能な」または「解釈可能な」機械学習 (IML) の出現により、機械学習はデータに含まれる関連関係の理解を強調するように強化されました。 しかし、これらの IML 手法はこれまで水質分析には広く使用されていません 27,34,35。 ここでは、IML を使用して、水質の動態を制御するさまざまな環境要因と人的要因の相対的な重要性を判断し、川の水位と導電率または温度の関係の性質を明らかにする方法を示します。 この場合、ブースト ツリーを使用し、Shapley 値 36,37 を介してこれらの従来のブラック ボックスを解釈し、全体的なパフォーマンスをより伝統的な GAM アプローチと比較します。 私たちは、分析自体が透過的で再現可能であることを強調します。私たちはコードをオンラインで利用できるようにしており、すべての結果は、Python や R などの公的に利用可能なオープン ソース パッケージに基づいています。

英国では、人間の活動によって最も大きな圧力を受けていると思われる河川の 1 つが、地下水を供給されるチョーク川です。 世界の白亜の小川 (224 の川) のほとんどはイングランドにあり 38、それらはその特徴的な水文学、水質、生態系、美観から国際的に重要であると考えられています。 しかし、これらの河川の 77% は、過度の抽象化、農業活動、都市化から生じる圧力により、欧州連合 (EU) 水枠組み指令 39 が定義する「良好な」生態学的状態を満たしていません。 生息地指令の付属書 1 に基づいて指定されているにもかかわらず、これらはイングランドとウェールズの平均的な川よりも「悪い」または「悪い」状態にある可能性が高くなります38。 優れた自然美を誇るチルターンズ地域 (AONB) の傾斜地にある白亜の小川は、急速に都市化が進む地域に位置する英国の多くの河川が直面する問題の典型であり、そこでは処理された排水が全河川流量の高い割合を占めています。 さらに、気候変動はこれらの河川生態系の回復力を脅かしています40。 夏がより暑く乾燥する気候変動シナリオでは、これらのシステムにおける地下水に対する処理排水の割合がさらに増加する可能性があります。 さらに、集中豪雨の頻度の増加が予測されるため、合流式下水道網から水を受け取る下水処理施設にさらなる圧力がかかり、雨水タンクの放流現象がより頻繁になり、水質がさらに変化する可能性があります。 このような可能性は、都市化された河川の水質パターンに対するさまざまな(自然および人間の)寄与の重要性を理解する手段を開発するさらなる推進力となります。 これらの貢献の中で、排水管理は、特に低流量状況における水質に関して最も差し迫った問題の 1 つです41,42。

最後に、私たちの研究は、地域や公的支援がなければ不可能だったかもしれないデータセットを収集する機会により、学術文献での注目と関心を集めている市民科学の取り組みにも関連しています。 これらの大規模なデータ セットは、あらゆる機械学習アプリケーションを実現するために重要です。 さらに、市民科学者は地域社会でこのテーマを推進し、それによって特に環境問題に対する意識を高めています43,44。

ここでは、複数の課題に取り組み、市民科学を活用するパートナーシップ プロジェクトを通じて集水域管理を改善することを目的としており、テムズ ウォーターによって創設された「スマートな集水域イニシアチブ」のパイロット集水域であるチェス川に焦点を当てます。 この取り組みにより、市民科学者が保守するセンサーを使用して、温度と電気伝導率の長期時系列を 15 分間隔で収集する機会が得られました。 この論文では、(総溶解溶質の代用として)温度と電気伝導率の時系列変化に焦点を当てています。これらは、代謝などの他の重要な生態学的プロセスに重要な影響を与える人為的要因によって変更される可能性のある水質パラメータであるためです26。 45 そして、それらは安価で、市民科学グループが監視しやすいからです。

私たちの全体的な目的は、機械学習ツール、特に GAM、ブースト ツリー、SHAP 解析の使用を実証して、地下水供給河川の点状および拡散都市流出水から生じる温度と電気伝導率の時空間パターンを分析することです。 私たちはこれらの機械学習ツールを使用して、観察された時空間パターンに対する廃水処理作業の影響を明らかにします。 最後に、私たちの発見に照らして、私たちのような電気伝導率データセットが都市化された河川の水質問題を調査する市民科学グループにとってどのように役立つかを評価します。

私たちのモニタリング期間は、流量が異常に少ない干ばつ期間(2019年9月)と集水域の地下水位が低い期間をカバーしています。 2020年の秋から冬にかけての総降雨量が多かったことに加え、集中豪雨が発生したことを受けて地下水位が上昇したため、2020年2月から3月にかけて流量が異常に多くなりました。 地下水と河川の水位は、流域内の降雨パターンの変化に応じて明確な季節サイクルを示します(図 1)。

(a) 日次総降雨量 (Chenies、EA 観測点) の時系列グラフ。 (b) 地下水位 (アシュリー グリーン、EA 観測点)。 (c) 2019 年 6 月 1 日から 2020 年 6 月 1 日までのリックマンズワースのチェス川の川の水位 (EA 測水所)46。

季節動態は、チェシャム WWTW (LP および WB) の下流のサイトの電気伝導度データセットでも観察されます。「マップの方法」も参照してください。 これらの場所では、地下水と河川の水位が低いときに電気伝導度が最も高く、地下水と川の水位が上昇すると低下します(図2a)。一方、WWTWの上流の場所では電気伝導度に明らかな季節パターンはありません(BHとBH)。 LC)。 河川の水温は、すべての地点で強い季節シグナルを示しており、夏(2019年7月から9月)の水温が高く、秋にかけて冬の最低値まで低下し、その後春に再び上昇します(図3a)。 1 週間の導電率データをプロットすると (図 2b)、上流の場所では観察できない、WWTW の下流側の導電率の日次サイクルも観察できます (図 2b)。 川の水温もすべての地点で顕著な日内変動を示します(図3b)。

電気伝導度の時系列 (a) 2019 年 6 月から 2020 年まで。 (b) 2019 年 8 月 23 日から 8 月 30 日まで。

気温時系列 (a) 2019 年 6 月から 2020 年。 (b) 2019 年 8 月 23 日から 8 月 30 日まで。

時系列は、PDF (ヒストグラムから抽出) を介してより体系的に分析でき、サイト間の全体的な差異を示します (図 4)。重要な統計パラメータは表 1 にまとめられています。平均電気伝導率は、下流 2 km の位置で最も高くなります。 WWTW (LP で 734 \(\rm{\mu S cm^{-1}}\))、さらに 5 km 下流 (648 \(\rm{\mu S cm^{-1}}\) WBで)。 これは、WWTW の上流の電気伝導率が低い (LC と BH でそれぞれ 565 と 575 \(\rm{\mu S cm^{-1}}\)) とは対照的です。 電気伝導率データセットはガウス分布に従わず、特に尖度 \(\kappa >3=\kappa _\text {Gaussian}\)47 である WWTW の上流で重い裾を示します。 対照的に、川の水温は、チェシャムから下流に離れるにつれて平均値が徐々に上昇しており、BH と WB の間に \(1.1^{\rm{\circ } C}\) の差があり、尖度 \(\kappa < 3\)。

(a) 電気伝導率の正規化されたヒストグラム。 (b) すべてのセンサー位置の温度。 y 軸の対数スケールに注目してください。BH の重い尾部が強調表示されています。

測定期間には 2020 年の春、つまり英国での Covid-19 パンデミックの始まりが含まれていることに注意してください。 データを分析すると、英国での 3 月のロックダウンによる影響は小さいものの重大ではないことがわかりました。詳細についてはコードを参照してください。

下水処理施設 (WWTW) からの処理排水の排出量と河川水の導電率の間に明確な一致があることが観察されます (図 5)。 プラントで記録されている下水処理場の排出量と、LP および WB サイトの下流センサーに到達する水の間の時間遅延を考慮して、河川水の電気伝導率測定値をそれぞれ約 2.5 時間および 8.5 時間遅らせます。

下水処理事業 (WWTW) で処理された排水の排出量と電気伝導率 (EC) の正規化された時系列。 EC は LP と WB で測定され、下水処理排出がセンサーサイトに到達するまでの時間遅延を考慮して、それぞれ 2.5 時間と 8.5 時間ずらして測定されました。

WWTW と EC からの処理排水排出量の関係をさらに定量化するために、フーリエ変換解析を実行して、システム内に存在する主な周波数を明らかにします (図 6)。 4 つの測定地点すべてにおいて、処理排水排出量のフーリエ解析と河川水 EC のフーリエ解析を比較します。 特に、下流の 2 か所 (LP および WB) における WWTW の放電と電気伝導率は両方とも、24、12、8、および 6 時間の周波数で顕著なピークを示していますが、LC または BH ではそのような周期的な挙動は観察されません。

廃水処理施設の処理排水排出量とECのフーリエ解析。 すべてのサイトでの電気伝導率 (EC) と下水処理施設 (WWTW) の排出量の両方のフーリエ振幅をプロットします。 WWTW の放電および LP および WB の導電率において、24、12、8、および 6 時間で関連する周波数ピークが認められます。

次に、 \(p=7\) の特徴によって特徴付けられるターゲット変数 (y) として電気伝導率 (EC) を記述するための 2 つのデータ駆動型アプローチを追求します。 2 つのローカル変数: 温度、pH (ローカル センサー変数)、および 5 つのグローバル変数変数: 降雨量、川の水位、タイムスタンプ。月、日、時間に分割されます。 すべての時系列について、2019 年 6 月 1 日から 2020 年 6 月 1 日までのデータを使用し、必要に応じて NaN エントリを削除してから、GAM 分析とブースト ツリー分析の両方を実行します。「メソッド」も参照してください。 すべての地点の川の水位は、すべての測定地点から数キロメートル下流にあるリックマンズワースで記録された値を使用していることに注意してください。 後で、センサーのローカル時系列をリックマンズワースの測点と位置合わせするモデル実行についても検討します。

すべてのサイトで GAM (一般化加算モデル) 分析を実行しましたが、ここでは下流の 2 か所に焦点を当てています。上流の 2 か所の結果は補足で提供されています。 寄与するスプラインの大きさに基づく最も重要な特徴は、pH 値と川の水位であり、どちらも導電率と負の相関があります (図 7)。 モデルとテスト セット間の偏差は \(\text {SMAPE}\およそ 1...2\%\) です。ここで、SMAPE は対称平均絶対パーセント誤差を表します48。

LP (a) および WB (b) の GAM 分析の結果。 完全に適合した GAM アプローチにおけるさまざまな特徴 \(x_{i}\) の最適な適合スプラインと、それらが導電率 (EC) に及ぼす影響。 青い曲線は最良の近似を示し、赤い破線は単一の信頼区間 (基礎となるガウスの不確実性を仮定した \(68\%\)) を囲みます。 最後に、モデルを以前に保留したテストセットに適用したときの対称平均絶対パーセント誤差 (SMAPE)48 を報告します。

次に、SHAP を使用して結果を解釈するブースト ツリー アプローチを適用します。 まず、個々の説明がどのように得られるかについて説明します (図 8)。この特定のデータでは、約 723 \(\rm{\mu S/cm}\) の「ベース値」(LP の平均導電率) が変更されています。 「日」機能 (曜日) のプラスの影響によってポイントが上昇する一方で、「月」、「川の水位」、「気温」、および「時間」はすべて、予測をより低い値に押し上げます。 したがって、モデルは 662.7 \(\rm{\mu S/cm}\) の値を予測し、最も影響力のある特徴は月です。

SHAP によるブーストされたツリー結果の説明。 基本値 (ここでは約 723) から開始して、各特徴により、導電率値の予測が基本値 (アンサンブル平均) と比較して低い値 (青) または高い値 (赤) に押し上げられます。 ここでは、LP測定サイトにおけるSHAPによるEC測定について説明します。

我々は、予測に対する各特徴の影響をランク付けすることにより、より体系的な研究を継続し、それによって単一の局所的な説明から全体的なモデルの特性に移行します37。 ここで、川の水位、温度、pH、および時間 (月または時間) は、最も重要な記述特徴の 1 つです (図 9)。 前と同様に、負の SHAP 値は電気伝導率の予測をより低い量に向けて押し出しますが、正の値はより高い総溶解溶質値を示すより高い EC に予測を押し上げます。 色は特徴値を示し、高 (赤) から低 (青) に向かって変化します。 これにより、ここでの依存関係についての第一印象が得られます。河川レベル フィーチャは、負の値の場合はほとんど赤、正の SHAP 値の場合は青です。つまり、導電率と負の相関があります。 最後に、モデルとテスト セット間の偏差を \(\text {SMAPE}\about 0.2...0.4\%\) として計算します。

SHAP によるブーストされたツリーの機能ランキング。 特徴は、LP (a) および WB (b) の平均 EC からの偏差を予測する際の重要度によって並べ替えられています。図 8 も参照してください。GAM アプローチと同様に、対称平均絶対パーセント誤差 (SMAPE) を報告します。テスト セットに適用されるモデル。

各特徴がモデルにどのように寄与するかを調査するために、3 つの最も重要な特徴の部分依存関係プロットを分析します。 LP では川の水位、月、水温、WB では川の水位、pH、時刻です(図 10)。 各部分依存プロットでは、観察された分散の大部分を説明する相互作用する特徴の値が色で表示されます (図 10a、月)。電気伝導率と川の水位との間に負の関係が一貫して観察されています (図 10a、 e)、電気伝導度および pH 値 (図 10d)、つまり、川の水位または pH 値が高いほど、EC 予測は低くなります。すべてのプロットは、色コードを使用して、ほとんどの変動を説明する二次的な特徴を表示していることに注意してください。したがって、8 か月から 12 か月 (8 月から 12 月) の低い河川水位は、LP での最高の河川水の導電率と関連していることが観察できます (図 10a)。WB での河川水の最高の導電率値は次のとおりです。 8 月から 12 ヶ月目 (8 月から 12 月) の pH 7.4 から 7.8 の低さに関連しています。さらに、時間と月の特徴には興味深い時間的傾向があります。たとえば、WB では午後 (13:00 から 16:00) はpHが高くなる傾向にある時期(7.8から8.1)に、川の水の電気伝導率が低下するのが特徴です。 上流サイトの機能ランキングと部分的な依存関係プロットが補足に表示されます。

LP (ac) および WB (df) の EC ブースト ツリーの部分依存関係プロット。 両方の下流測定サイトの 3 つの最も重要な特徴をプロットします。 色 (および左側の軸) は、プロットされたフィーチャと 2 次フィーチャの間の 2 次相互作用を強調表示します。

以前に導出された結果を拡張して、3 つの新しい特徴を組み込んでいます。河川の総流量、下水処理場の総流量、および下水処理水の割合 (下水処理水の流量と総流量の比)、異なる測定ステーション間の時間遅延を調整します (補足を参照)。詳細)。 このような追加の便利な機能を組み込むことでモデルのパフォーマンスが向上することを強調します (図 11 を参照)。特に、最も重要な機能である川の水位と月は、この拡張機能セットでも依然として重要です。 さらに、川の水位の部分的な依存関係 (図 11b) は、新しい特徴を追加してもほとんど変更されません。 最後に、モデル内の EC 値は、WWTW に起因する流量の割合にほぼ直線的に依存していることに注意してください (図 11c)。これは、以前に観察されたフーリエ スペクトルと時系列の一致と非常によく一致しています。 ECが高くなります。 この線形依存関係は、単純な散布図と比較して、モデルでははるかに明確になります。

LP サイトの拡張 EC モデルの機能ランキングと部分依存関係プロット。 特徴のランキング (a)、最も重要な特徴 (b)、および WWTW からのフローの割合への依存性 (c) をプロットします。 下水処理場と計測所の敷地の間の河川における地表水と地下水の交換により、下水処理施設の割合 \(> 1\) の値が得られる可能性があることに注意してください。

EC を詳細に分析したので、次に温度依存性を調べます。 拡張データ セット (つまり、絶対流量と WWTW 割合を含む) を使用すると、非常に良好な適合が得られます。図 12 を参照: 平均 \(\text {SMAPE}\およそ 0.5\%\) の偏差。 EC 分析と同様に、川の総水位は特徴リストで非常に上位にランクされていますが、月はさらに上位にランクされており、気温の季節依存性が強いことを示しています。 ここでは WWTW 部分は上位 3 つの機能にランクされていませんが、ハイパーパラメーターのわずかな変化により機能ランクの並べ替えが発生し (詳細についてはコードを参照)、WWTW 部分機能に対する温度の依存性は依然として強固です。 WWTW 割合の増加には温度の上昇が伴います。 ここに示すモデルでは、川の水位が最も低いとき(青いデータ点、図12c)、WWTWの流量の上昇は気温予測に最大\(1^{\rm{\circ }}C\)の影響を与える可能性があります。 河川の水位が高い場合(赤から紫のデータ点、図 12c)、WWTW の割合は低くなり、温度への影響は少なくなります。

LPサイトの温度分析。 特徴のランキング (a)、最も重要な特徴 (b)、および WWTW からのフローの割合への依存性 (c) をプロットします。

チェシャムのWWTWから川への流量の寄与は、地下水位と降雨現象の短期的な影響に応じて40から70\(\%\)の間で変動します。 河川流量に対するこの重要な点源の寄与により、WWTW の流出口の下流の地表水の平均電気伝導度が著しく高くなります (図 4a、表 1)。 したがって、この研究は、都市化した河川流域での電気伝導度の上昇を引き起こす際に、処理された下水処理施設投入水が果たす役割のさらなる証拠を提供する18、19、20、21。 WWTW の放流口は河川系への溶質の点源ですが、イギリスでは一般的であるように、WWTW は家庭排水と産業排水と拡散源からの道路流出水からなる合流式下水道システムから水を受け取ります。 したがって、下水処理場からの処理排水中の溶質の組成は、降雨だけでなく人間の活動によっても変化します。 さらに、寄与している下水道網は、地下水位が上昇している期間(例:2020 年 3 月以降)に地下水の浸入の影響を受けやすく、排水の導電率を制御する要因のリストに追加されます。 それにもかかわらず、下水処理水の排水における電気伝導率の変動のこれらの潜在的な原因にもかかわらず(この決定要因は水道会社によって監視されていません)、河川へのこの点源の寄与から生じる河川の電気伝導率の一貫した時間的傾向が見られます。

自然の河川システムでは、降雨と浅い地下流によって支配されるハイドログラフの急流成分と比較して地下水には溶質が豊富であるため、EC のベースフローは比較的高いと考えられます49。 この地下水供給システムでは、河川の水位と流量の季節的および超年変動は主に地下水位によって制御されます(図1)。 下水処理場の上流にある地下水湧出地(LC)では EC が年間を通じて安定していることが観察され、地下水の深さや水源の変化による EC の変動がほとんどないことを示しています(図 2a、表 1)。 上流の都市部サイト (BH) には、より変動しやすい EC 信号があります。 この変動は、都市部の急速な流出による水路への雨水の流入によって生じ、強度の高い降雨イベントに応じて EC の急激な低下を引き起こします (図 2a、表 1)。 しかし、EC の最大の変動は、WWTW の下流のサイトで観察されます。 これらのサイト(LP および WB)では、EC の季節サイクルに対する川の水位と下水処理場の排水の割合の影響は明らかであり、川の水位が最も低いときに最高の EC が記録され(図 10)、下水処理場の排水の寄与が顕著です。ベースフローへの割合が最も高くなります (図 11b、c)。

EC には顕著な季節変化があるだけでなく、WWTW からの処理排水排出量の変化によって引き起こされる 24 時間の顕著なパターンやより短い時間スケールもあります (図 5、6c、d、10f)。 WWTW には 2 つのピーク排水期間があります。 13:00~14:00 GMTと21:00~22:00 GMTは、流域における人間の家事活動のパターンに関連しています。 活動中のこれらのピークからのこの電気伝導率の特徴は、下流では減衰しますが、流出口の 5 km 下流では依然として観察可能です。 春(2020年2月から5月)に川の水位が高くなったときでも。 この「署名」を使用して、サイト間の平均水移動時間または速度を推定できます。 下水処理場から LP および WB までの水のおおよその移動時間は、それぞれ 2.5 時間と 8.5 時間です。 したがって、WB の川の日中 (09:00 から 17:00) の状態は、WWTW からの 1 日の寄与が最も少ない時間帯に相当します。

ここでは、電気伝導度の毎日の変化が英国の他の都市化された河川でも測定可能かどうか、そして私たちの観察がどの程度応用可能であるかを検討します。 この点に関して、考慮すべき有用なパラメータは「希釈係数」であり、これは集水域出口における河川流量と家庭廃水総排出量の比率として定義されます50。 希釈係数は、処理排水からの化学物質への地表水の「最悪の場合の暴露」を予測するために、EU の法律に基づく生態学的リスク評価に使用されます51。 これらの分析では、固定希釈係数 10 が使用されます。 チェシャムからの処理排水流量データとリックマンズワース測量所の河川流量に基づいて、調査中の平均希釈係数は 2.67 と推定され、調査開始時の干ばつ期間中の最小値は 0.87、最大値は 6.81 と推定されます。 2020 年 2 月から 3 月にかけて。この期間全体を通じて、川では電気伝導度の日周サイクルが観察されました。50 は、英国の河川の 25\(\%\) の平均希釈係数が \(< 6.26\) であると推定しています。これらの川は主にイングランド南東部などの人口密度の高い地域に見られます。 これに基づいて、英国の多くの低地河川で電気伝導率の日内変化が観察できる可能性があると予測していますが、これらのサイクルは河川測定所の上流で複数の下水処理施設の影響により複雑になる可能性があります。 ヨーロッパの河川の希釈係数に関する包括的なレビューはありませんが、\(> 10,000\) 人口に相当する規模のドイツの大規模下水処理場の最近の分析では、希釈係数の 60\(\%\) が 10 未満であることが示唆されており、河川の日内変化が示唆されています。電気伝導度は、より広範囲で観察できる可能性があります52。

ブースト ツリー解析の部分依存プロットにより、WWTW からの流量の割合 (導電率を代用として使用) と WB の pH との関係を考慮することもできます。 図 10e は、河川全体の流れに対する下水処理場からの寄与が最も高い期間が、最も低い pH 条件と関連していることを示しています。 図 10f は、WWTW からの流れの寄与が最も低い WB の河川の日中の状態 (09:00 ~ 17:00) が、最も高い pH 状態と関連していることを示しています。 日中は光合成によって川の水のアルカリ性も高まりますが、この分析は、光合成と処理された排水の組み合わせが川のpHサイクルの振幅を増加させている可能性があることを示唆しています。

最後に、この分析により、河川の水温を制御する特徴を解明することもできます。 SHAP 分析は、季節と川の水位との間の気温に関するこれまでに知られている重要な相互作用を裏付けています53。 たとえば、54 人は以前、気温と水位を使用して、人工ニューラル ネットワーク モデリング アプローチを使用して水温の時間ごとの変化を予測しました。 私たちのモデリングでは、上流の下水処理施設からの流量の割合が、約 100 ℃ の河川水温の変化と正の相関があることも示しています。 1\(\rm{^{o}C}\) 川の水位が低い期間には、この分野でさらなる研究が必要になります。 特に夏の低流量条件時の水温が 20 \(\rm{^{o}C}\) を超えていたことを考えると、 この温度は、ブラウントラウト、Salmo trutta、ヨーロッパハイイリング、Thymallus thymallus などのサケ科の魚の加入の成功に影響を与える可能性があります55。 下水処理施設は温水の供給源であり、これまでほとんど注目されていませんでしたが、56 による英国全国規模の分析では、下水処理施設から熱を回収して気候変動目標の達成に役立つ可能性があり、さらに次のような利点があることが示されました。河川への環境影響を軽減します。 私たちの分析は、処理排水排出からの熱回収などの緩和オプションが、処理排水からの流れの高い割合を受け取るチェス川などのチョーク川に利益をもたらす可能性があることを示しています。 これは、人口増加により毎日川に到達する処理排水の量が増加すると予測される現在、特に重要です。

GAM 分析と SHAP 分析は両方とも、導電率に対するさまざまな変数の影響に関して良好な一致を示しました。 たとえば、両方の手法により、pH と河川の水位は電気伝導率と負の相関があることが示されました。 ただし、SHAP アプローチは、対称平均絶対パーセント誤差 (それぞれ \(\text {SMAPE} =0.2\) と 1.5) によって測定されるように、GAM と比較してモデルのパフォーマンスでほぼ 1 桁の向上を達成しました。 決定的に重要なのは、ブースト ツリー分析は SHAP 分析を使用して視覚化および解釈するのが簡単であり、その回帰ツリー アプローチでは変数の相互作用を考慮できるのに対し、GAM アプローチは独立変数を前提としています。 さらに、ブースト ツリー アプローチは非線形性に対処し、表形式のデータでも良好に実行できます31。 代替アプローチとしてはニューラル ネットワークが考えられますが、これらでは通常、ここで説明した SHAP アプローチほど適切な解釈は可能ではありません 57。

ここでは、Python パッケージ、特に自動機械学習 58 のアイデアを活用し、これらの機械学習手法を広範な研究コミュニティで試しやすくすることを期待しています。 ブースト ツリーによる分析は、キャレット パッケージ 60 などを介して R59 でも利用できますが、SHAP 値を介してここで行われる派生モデルの詳細な解釈はまだ利用できませんが、将来的には含まれる可能性があります。

「ロービング」低コスト電気伝導率センサーは、集水域内を移動して汚染物質の空間パターンを調査するのに役立ちます。 これらのセンサーは、下水道の接続ミスによる潜在的な汚染源の特定に役立ち、場所を特定するためのツールとして「Outfall Safaris」(https://catchmentbasedapproach.org/learn/outfall-safari-guide/) に埋め込まれる可能性があります。さらなる調査に値する総溶解溶質の多さが特徴です。 電気伝導率の測定を溶存酸素と組み合わせて、希釈能力の測定を生態学的機能および水枠組み指令に基づく生態学的状態に結び付けることができます。

ここでは、河川グループの電気伝導率を高周波モニタリングする利点も示します。 水質決定要因の高頻度モニタリングは、都市化された集水域の規制当局や科学者にとってますます一般的な手法となっており20,49、水質の時間的変動の原因について重要な洞察が得られる61。 モノのインターネット (IoT) アプローチ 62 を使用したセンサー技術の最近の進歩により、導電率と温度の高周波モニタリングが、Citizen Science グループや参加型研究にとって費用対効果の高い調査ツールとなる可能性が高まっています。

水質の日周サイクルを理解することは、河川団体にとって重要なはずです。 電気伝導率データの周期的な毎日の変化は、都市の水質監視キャンペーンを計画するための基礎として使用できます。 このような情報は、点源投入物(栄養素や医薬品など)から生じる化学物質濃度に関して、考えられる最善のシナリオと最悪のシナリオを調査するために、日周サイクルにわたっていつサンプリング活動と労力に焦点を当てるかを決定する可能性があります。 電気伝導率信号が下流でどのように減衰するかを理解することで、市民科学者は点源入力の下流のさまざまな点での最適なサンプリング時間を特定することも可能になります。 このような種類の分析は、英国の CaBa などの取り組みによって現在開発中のツールキットに組み込まれ、水道会社や規制当局と協力してグループが河川の行動計画に優先順位を付けるのに役立つ可能性があります。

人間の活動により、世界的に淡水中の総溶質濃度が増加しています。 現在、人間の健康への影響(例えば、水枠組み指令に基づいて指定された飲料水保護地域の地下水基準値 1880 \(\rm{\mu S cm^{-1}}\))と灌漑に焦点が当てられていますが、潜在的な影響は次のとおりです。生態学的影響は現在、特定のイオンとその混合物に対する生態学的基準を開発するための推奨事項とともに、より多くの注目を集めています22。 例えば、将来の優れた実践には、資源採取を通じて淡水への塩の点源放出を最小限に抑えながら、塩負荷を削減することが含まれる可能性がある22。 チェス川で観察された電気伝導率の変化は、それ自体が生態学的リスクを引き起こす可能性は低いものの、川への排水由来の化学物質の負荷の変化を示すものとなるでしょう63。 これらの新興化学物質を高周波で継続的に測定する現場センサーは現在存在しないため、都市化した河川のリスク基準を作成する際には、導電率が代替手段として考慮される可能性があります49。

電気伝導度の変化は、部分的には、河川中の塩化物61、リン酸塩、硝酸塩などの陰イオンの濃度の変化によっても発生し、改善するにはこれらの陰イオンの高周波変化をより詳細に調査する必要があることを示唆しています。荷重の計算の精度。 これらの化学物質の日周サイクルが排出量の季節変化に応じてどのように変化するかを理解することは、河川系の生物学的機能に対する特定の点源排出量の潜在的な全体的な影響を理解するためにも重要です。 河川機能に対する処理排水の影響は、半乾燥地域と地中海地域で顕著であることが示されているが64,65,66、我々のデータは、希釈能力が限られているということは、処理排水が温帯における河川内の生物地球化学サイクルに重大な影響を及ぼしている可能性があることを示している。 、都市化した小川。

SHAP 分析 (解釈可能な機械学習 (IML) の分野の手法) は、都市化された河川の電気伝導率と温度のサイクルを制御する相互依存要因についての有用な洞察を提供するブラック ボックス モデルを切り開きました。 これらの分析により、総流量を構成する下水処理場排水の割合が、この都市化したチョーク流における電気伝導率と温度の季節的および日周期的サイクルと一致する重要な変数であることを実証することができました。 チェス川の処理排水に関連する希釈係数は、イングランドやウェールズの他の多くの河川と同等であるため、電気伝導率の安価な高周波測定は、他の都市化された河川系における下水処理場の影響を調査するのに役立つ可能性があると仮説を立てています。 また、この分析を使用して、下水処理施設が川の水温に及ぼす影響を実証しました。この場合、下水処理施設は 2 km の距離で水温の 1 \(\rm{^oC}\) の上昇と関連していることが強調されました。最低流量条件時に処理排水出口から排出されます。 さらに、他の Citizen Science グループは、安価で費用対効果の高い電気伝導率測定を使用して、都市河川での採水活動を指示できる可能性があります。 上流と下流の導電率の同時測定を使用して、さまざまな水質や生態学的パラメータを測定する最適な時間を目標とし、都市河川系を通る水の移動時間を定量化できる可能性があります。

チェス川 (長さ 8 マイル、集水域面積 105 \(\rm{km^2}\)) は、チルターンズ自然美麗地域 (AONB) の傾斜地を流れている 9 本の低勾配のチョーク川のうちの 1 つです。地図は図13。 この集水域の標準化された平均年間降雨量は 753 mm (1961 ~ 1990 年、46) で、ベースフロー指数は 0.95 です。 流域の土地被覆は、都市化された土地被覆 12%、森林 18%、草地 35%、耕地被覆 35% と混合されています。 チェシャムの町の周囲の川のウィンターボーン (一時的な) セクションは都市化されており、地下水の泉に加えて多数の自噴井戸によって水路が整備されています。 チェシャムの下流では風景がより田園になり、川がリックマンズワースでコルネ川との合流点に達するまでは草原と耕作可能な土地利用が支配的になります。 リックマンズワース計測所の平均年間流量は 0.54 \(\rm{m^3s^{-1}}\)46 です。 チェシャム廃水処理施設(人口相当 = 37,300、図 13 の ST1)からの処理排水は、流れの状況に応じて、チェシャムの下流の川の流れの約 40 ~ 70% を占めます。 図 13 の ST2 は、人口 50 人相当の小規模な地方の下水処理施設です。

(a) イングランド南東部の傑出した自然美を誇るチルターン地域 (AONB) の位置を示す地図 (b) チルターン AONB から流れるチェス川。 (c) チェス川の 4 つの監視サイト: BH、LC、LP、WB。 ST1 と ST2 は、川にある 2 つの下水処理施設の位置を示します。 OpenStreetMap のオープン データを使用して作成されたマップは、オープン データベース ライセンスの下で利用できます。詳細については、67 を参照してください。

当社の水質モニタリング プログラムは、地域の廃水処理がどのようにチェス川の水質に影響を与えているかを理解したいと考えていた地元の河川団体 (River Chess Association) と共同設計されました。 2019 年 4 月から 4 台の Eureka Manta 2 水質ゾンデがチェス川に設置され、15 分間隔で測定を行うようにプログラムされました。 各ゾンデには、水温、pH、電気伝導率、濁度、溶存酸素を測定するためのセンサーが装備されていました。 ここでは、温度補償された電気伝導率 (25 \(\rm{^{o}C}\) に補正されたと報告) と水温のデータセットに焦点を当てます。 ゾンデには、各測定前にセンサーを清掃するための拡張ワイパー アームが取り付けられており、汚れを防ぐためにシチズン サイエンティスト チームによって 2 週間ごとに手動で清掃およびチェックが行われました。 各センサーの校正は学術チームによって毎月チェックされました。 水温と電気伝導率は、研究全体を通じてセンサーの検出範囲内に留まりました(水温は – 5 ~ 50\(\rm{^{o}C}\)、電気伝導率は 0 ~ 100 mS/cm)。

Citizen Science プログラムは、都市化されたチェス川の源流の下流の水質を調査するために設計されました。 したがって、センサー 1 (BH) はチェシャム (チェス川の源流にある町) の下流に設置されました。 センサー 2 (LC) は、都市化区域内にあるチェス川の側水路に設置され、自噴井戸と天然の湧水から水を受け取ります。 センサー 3 (LP) は、チェシャム下水処理場 (WWTW) の約 2 km 下流、ただし他の主要な支流や泉の上流に設置されました。 センサー 4 (WB) はセンサー 3 の 3 km 下流に位置し、チェシャム WWTW からの下流への影響がどの程度検出可能であるかを示しました。 センサー 2 とセンサー 3 の間にはチェス川に水を供給する泉が多数あります。地図については図 13 も参照してください。

15 分間の総降雨量 (Chenies、観測所番号 278744TP)、河川流量 (リックマンズワース観測所番号 2859TH)、および地下水位データ (Ashley Green) は環境庁から入手しました。 チェシャム廃水処理工場の処理排水排出データ (15 分分解能) は、テムズ ウォーター 46 から取得されました。 工場から最終的に排出される処理排水の量を測定するために「処理排水排出量」を使用していることに注意してください。

データ分析は、12 か月間の 15 分間のセンサー データ (2019 年 6 月 1 日から 2020 年 6 月 1 日) に対して実行されました。 4 つの監視サイトに関連する要約統計的特性を比較するために、電気伝導率と温度について経験的な確率密度関数 (PDF) が導かれました。 導電率と温度のデータセットの支配的な周波数はフーリエ解析を使用して特定され、導電率が下水処理施設の排出の支配性の代理として機能するかどうかをテストするために、下水処理施設の処理排水排出の周期的パターンと比較されました。 GAM および勾配ブースト ツリー解析を 12 か月のデータセットに適用して、さまざまな変数とそれらの相互作用 (時間、水位、pH) が導電率に及ぼす影響を調査しました。 分析を実行するために、データをシャッフルし、70% のトレーニング データと 30% のテスト データに分割しました。 最後に、結果の詳細な解釈を支援するために、ブーストされたツリー出力に SHAP 分析が適用されました。 各データ分析方法については、以下のセクション a ~ f で詳しく説明します。 すべてのデータとコードはオンラインで無料で入手できることに注意してください (コードの入手可能性に関する声明を参照)。 したがって、興味のある読者は、ここで提供される一般的でより高度な説明に加えて、コードを参照することをお勧めします。

経験的確率密度関数 (PDF) 特定の観測値 y の可能性を評価するには、経験的確率密度関数 (PDF) を使用します。 各測定インスタンス \(y_1\)、\(y_2\)、\(y_3\)、... \(y_j\)、...、\(y_N\) は、n 個のビンの 1 つに集約されます。 各ビン i は区間 \(\left[ y_\text {min}(i),y_\text {max}(i)\right)\) をカバーします。ここで \(y_\text {min}(i+ 1)=y_\text {max}(i)\)。 各ビン i に該当する測定値の数を数えた後、各ビンが \(\sum _i p(i)=1\) で確率 p(i) を表すように合計カウント数で正規化します。 これにより、正規化されたヒストグラムが得られます。 このヒストグラムに加えて、一変量カーネル密度推定値である経験的に適合した曲線も表示します。つまり、これは基礎となるヒストグラムを次のように近似する関数です。

ここではガウス カーネル K を選択しました。技術的には、Python68 の seaborn パッケージを使用して経験的な密度を推定し、表示します。

フーリエ解析 多くの生態系では、季節周期や日周期などの周期性が観察されます。 これらのサイクルを分析するには、時系列 y(t) を時間領域から、つまり引数 t を使用して周波数領域に変換するフーリエ解析を使用します。

ここで、i は虚数単位です。 新しい系列 \({\tilde{y}}(k)\) は周波数 k の関数であり、逆フーリエ変換を適用して元の時系列 y(t) を再取得します。 \({\tilde{y}}(k)\) は時系列 y(t) の固有周波数でピークに達するため、周期的な動作は \({\tilde{y}}(k)\) を使用して簡単に分析できます。 。 たとえば、周期 1 時間の正弦関数である時系列は、\(k=(1h)^{-1} で \({\tilde{y}}(k)\) のデルタ関数になります。 \)、いくつかの頻度と顕著な日周期を持つ現実的な時系列では、\({\tilde{y}}\left( (24h)^{-1}\right)\) に有限のピークが表示されます。 フーリエ変換 \({\tilde{y}}(k)\) のピークが大きいほど、元の時系列 y(t) におけるこの周波数がより支配的になります。

GAM さまざまな変数 (特徴) がターゲットにどのような影響を与えるかを導き出すための可能なアプローチの 1 つとして、一般化加算モデル (GAM) 31 を採用します。 GAM は、スプライン、つまり区分的に滑らかに接続された多項式を使用して、ローカルな依存関係を記述します。 これらのスプラインのいくつかは、異なる状態空間量の間の関係の完全なモデルを取得するために追加されます。 特に、観測可能な y を記述するために、次のモデルを構築します。

ここで、c は定数 (切片またはバイアス)、\(s_{i}\) は各特徴 \(x_{i}\) の 3 次 B スプラインであり、すべてのスプライン項を単純に加算すると、加算モデル。 技術的には、Python pyGAM パッケージ69を利用して GAM を実装し、ランダムにシャッフルされたデータの 70% のトレーニングと 30% のテスト分割を使用します。 一貫性を保つために、すべてのサイトで同じ数のスプライン、つまり 10 を使用します。各サイトに合わせてスプラインの数を微調整することで誤差をわずかに低くすることができ、誤差を最大 \(5\%\) まで減らすことができます。 。

GAM の利点は、簡単に解釈できることです。 GAM アプローチから部分的な依存関係を取得するためにこれ以上の手順は必要ありません。スプライン \(s_{i}\) を視覚化するだけで、特定の特徴 \(x_i\) がターゲット y にどのような影響を与えるかを確認できます。

勾配ブースト ツリー GAM の代替として、機能の相互作用と相互依存関係を記述するために勾配ブースト ツリーも使用します。 重要なアイデアは、不偏だが分散の高いツリーなどの「弱い学習器」のアンサンブルを使用して、より正確で、理想的には低バイアス、低分散の予測子を 1 つ生成するということです。 単一のツリーを初期化し、損失、つまり検証セットでの予測誤差を計算し、この損失の勾配を計算します。 次に、新しい回帰ツリーを勾配に当てはめます。 新しい予測子は、新しく適合したツリーと前の予測子を合計することによって取得されます。 学習率 \(\eta\) は、勾配に沿ってどれだけ移動するかを制御し、それによって次に追加された木が前の予測をどれだけ修正するかを制御します。 ツリーの合計で構成されるこの更新された予測子について、損失と勾配を再度計算し、更新を実行します。 このプロセスは、一定回数の反復が完了するか、損失しきい値を超えるまで繰り返されます。

技術面では、Boosted は LightGBM70 を利用して Python で実装されており、可能なパラメータを自動的に探索する自動機械学習フレームワークである FLAML58 を使用して適切なハイパーパラメータを見つけます。 ハイパーパラメータの探索を 1000 秒に制限し、高い精度を実現しました。 いくつかのテストでは、モデルの解釈は、パラメーター検索に割り当てられる時間を変更しても (たとえば 100 秒まで) ほんのわずかしか影響を受けないことが明らかになりました。 したがって、得られ、以下で説明する結果は、使用された特定のハイパーパラメータ ソリューションとは無関係であると確信しています。 モデルごとにハイパーパラメーターを変更できるようにし、\(\alpha \sim 0.02...0.05\) 程度の学習率と葉の数 \(\sim 300\) を取得します。 実装の詳細については、公開されたコードを参照してください。

Shapley 値 GAM とは対照的に、ブーストされたツリーでは詳細な解釈を可能にするためにより多くの労力が必要です。 ここでは、Shapley 値 57 を適用して、完全にトレーニングされたツリーを解釈します。 シャプレー値の考え方はゲーム理論に由来しており、協力ゲームの各プレイヤーが獲得した価値にどれだけ貢献したかを定量化します。 したがって、プレイヤーの勝利連合は、成功に対する価値に比例して各プレイヤーに支払うことで、ゲームに勝利した場合の報酬をプレイヤー間で公平に分配することができます。

機械学習では、Shapley 値は非常によく似た質問に答えます。機械学習モデル (この場合はブーストされたツリー) の予測結果が与えられた場合、(プレーヤーではなく) 各機能がモデルによって達成された決定にどの程度貢献しましたか? より正確には、特徴 i の Shapley 値は、考えられるすべての特徴の組み合わせに対して重み付けされて合計された特徴の影響です。

ここで、S はモデルで使用される特徴のセット、\(x=(x_1, x_2, ..., x_p)\) は説明されるインスタンスの特徴ベクトルです。 さらに、p は特徴の数、val(S) はセット S 内の特徴を考慮したターゲット y の予測です。 ここで、どの特徴が S に入るのか、どの特徴が周辺化されるのかを変えることによって、さまざまな特徴連合における寄与を評価できます。 。 重要なことに、Shapley 値には、効率的、対称的、加算的、ダミー特徴の追加下で不変であるなど、いくつかの望ましい特性があります。詳細については、57 も参照してください。

Shapley 値は多くの場合、計算に非常に要求が厳しいものですが、36 および 37 では、ツリーベースの手法の SHAP 値を計算するための計算効率の高いアルゴリズムと並行して、SHAP (SHapley Additive exPlanations) が導入されました。 Shapley 値と同様に、SHAP は各特徴が予測にどの程度寄与しているかを示します。 具体的には、正の SHAP 値は、特定の特徴によって予測が平均値を上回ることを示し、負の SHAP 値は、その特徴が通常、予測値を減少させることを意味します。 SHAP 値の大きさを使用して、特徴 (特徴の重要度) をランク付けできます。 最後に、部分依存プロットは、特徴値とその SHAP 寄与をプロットすることによって取得されます。つまり、特定の特徴 i についてペア \((\phi (x_i),\phi _i)\) をプロットします。

データ クリーニング GAM またはブースト ツリー アプローチを適用する場合、ギャップや NaN (非数値) エントリのないクリーンなデータ セットに依存します。 したがって、トレーニングとテストの分割用にデータセットを準備するときは、少なくとも 1 つのエントリが欠落しているか NaN がある各行を削除します。 これにより利用可能なデータが減少しますが、欠落したデータを代入するために必要なモデリングの仮定を課すことは避けられます。 すべての測定サイトで同時に NaN が測定されるわけではないため、あるサイトでは夏と秋しかモデル化できず、別のサイトでは一年全体をモデル化できるため、「月」の範囲が異なることに注意してください。価値。 さまざまなサイトに残っている「クリーンな」データ ポイントの総数は、LC と BH で約 17,000、LP で 27,000、WB で 18,000 で、クリーン データの合計 177 ~ 288 日間に相当します。 この使用可能なデータのほとんどは、長期間にわたる連続的なものです。

最後に、LC サイトについては、センサー キャビティ内の障害物が原因で、電気伝導率が短期間に通常よりも低い値に系統的にオフセットしていることに気付きました。 次の期間に一致するように値を増やすことで、このオフセットを修正しました。詳細については、公開されているコードを参照してください。

リバー Chess からのデータは、次の ChessWatch Web サイト https://rhysh.shinyapps.io/ChessWatch/ で入手できます。 データの分析に使用されたコードは、https://osf.io/txjv3/ で入手できます。

Astaraie-Imani, M.、Kapelan, Z.、Fu, G.、Butler, D. 英国の統合都市下水システムにおける河川水質に対する都市化と気候変動の複合的な影響を評価。 J.Environ. 管理。 112、1–9 (2012)。

論文 CAS PubMed Google Scholar

Miller, JD & Hutchins, M. 都市化と気候変動が都市洪水と都市水質に及ぼす影響: 英国に関する証拠のレビュー。 J.ハイドロール。 地域スタッド。 12、345–362 (2017)。

記事 Google Scholar

ミラー、JD et al. 遮水層の歴史的変化を使用して、都市近郊の集水域における暴風雨の流出に対する都市化の影響を評価します。 J.ハイドロール。 515、59–70 (2014)。

記事 ADS Google Scholar

カリフォルニア州シールズらチェサピーク湾流域の都市部と農村部の集水域からの非点源窒素輸出のストリームフロー分布。 水資源。 解像度 44 (2008)。

Huang, J.、ying, H.、Chapra, SC、Zhou, Q. 中国の都市河川における溶存酸素低下のモデル化。 ウォーター 9, 520 (2017)。

記事 CAS Google Scholar

シモンズ、DL & レイノルズ、RJ 選択された南岸河川の基本流量に対する都市化の影響、ニューヨーク州ロングアイランド 1. JAWRA J. Am. 水資源。 准教授 18、797–805 (1982)。

記事 ADS Google Scholar

ジョンソン、AC 他未来のイギリスの川: 気候変動と人間の活動が、イギリスの 2 つの対照的な河川生態系にどのような影響を与える可能性があるか。 科学。 トータル環境。 407、4787–4798 (2009)。

論文 ADS CAS PubMed Google Scholar

Lokhande, S. & Tare, V. 流れと水質の時空間傾向: 都市化に対するヤムナ川の反応。 環境。 モニト。 評価。 193、1–14 (2021)。

記事 CAS Google Scholar

マサチューセッツ州マリン、VL ジョンソン、SH エンサイン 都市部、郊外、地方の河川の水質に対する雨水流出の影響の比較。 環境。 モニト。 評価。 159、475–491 (2009)。

論文 CAS PubMed Google Scholar

ヤン、Y.-Y. & Toor、GS 都市住宅集水域における雨水流出によるリン輸送: 都市流域の水質保護への影響。 科学。 議員 8、1–10 (2018)。

Google スカラー

Gaafar, M.、Mahmoud, SH、Gan, TY & Davies, EG 雨水システムの水質に関する実用的な GIS ベースの危険性評価フレームワーク。 J. クリーン。 製品。 245、118855 (2020)。

記事 CAS Google Scholar

Stenstrom, MK および Kayhanian, M. ファーストフラッシュ現象の特徴付け (カリフォルニア州運輸省環境分析部門の技術担当者、2005 年)。

ピーター、KT 他ファーストフラッシュ以上のもの: 都市部のクリーク暴風水路図は、広範囲にわたる汚染物質の汚染状況を示しています。 環境。 科学。 テクノロジー。 54、6152–6165 (2020)。

論文 ADS CAS PubMed Google Scholar

Peters、PE & Zitomer、DH 雨天時の流れ管理に対する現在および将来のアプローチ: レビュー。 水環境。 解像度 93、1179–1193 (2021)。

論文 CAS PubMed Google Scholar

ルンド、A.ら。 ジョージア州アトランタの都市部の主要な西ナイルウイルスベクターであるアカイエカの水質と個体数動態に対する、下水道の氾濫修復の併用による長期的影響。 環境。 解像度 129、20–26 (2014)。

論文 CAS PubMed Google Scholar

Crocetti, P. et al. 地中海沿岸地域における合流式下水道オーバーフロー(CSOS)の流域全体で検証された評価と、微生物汚染を軽減するための可能な消毒方法。 環境。 Res.196 (2021)。

Dittmer, U.、Bachmann-Machnik, A. & Launay, MA 都市河川の水質に対する合流式下水道システムの影響: 微量汚染物質濃度の上昇の頻度と期間。 ウォーター12(2020)。

Conway, TM 米国ニュージャージー州の都市化が進む沿岸地帯における ph と比伝導率の指標としての不浸透性表面。 J.Environ. 管理。 85、308–316 (2007)。

論文 CAS PubMed Google Scholar

Rose, S. チャタフーチー川流域 (米国ジョージア州) 内の塩基流の流体化学に対する都市化の影響。 J.ハイドロール。 341、42–54 (2007)。

記事 ADS Google Scholar

ネブラスカ州ピーターズ 米国ジョージア州アトランタ市の河川水質に対する都市化の影響。 ハイドロール。 国際プロセス J. 23、2860–2878 (2009)。

記事 ADS CAS Google Scholar

Moore, J.、Bird, DL、Dobbis, SK、Woodward, G. 非点源の寄与により、都市流域の主要イオンと溶存無機炭素濃度が上昇します。 環境。 科学。 テクノロジー。 レット。 4、198–204 (2017)。

記事 CAS Google Scholar

Cañedo-Argüelles, M. et al. 淡水を塩から守る。 サイエンス 351、914–916。

論文 ADS PubMed Google Scholar

Billen, G.、Garnier, J.、Ficht, A. & Cun, C. 過去 50 年間の流域における人間活動に対するセーヌ川河口の水質の反応をモデル化。 河口 24、977–993 (2001)。

記事 CAS Google Scholar

アボット、BW et al. 農業流域における河川栄養塩の傾向と季節性: フランスにおける 18 年間にわたる毎週の市民科学。 科学。 トータル環境。 624、845–858 (2018)。

論文 ADS CAS PubMed Google Scholar

Duan、W. et al. 中国の長江流域の高周波水質データにおける長期傾向と季節性の特定。 PLoS One 13、e0188889 (2018)。

論文 PubMed PubMed Central CAS Google Scholar

Arroita, M.、Elosegi, A. & Hall, RO Jr. 20 年間の毎日の代謝は、下水削減後の河川の回復を示しています。 リムノール。 海洋学者。 64、S77–S92 (2019)。

記事 ADS CAS Google Scholar

Schmidt, L.、Heße, F.、Attinger, S. & Kumar, R. 水文学的推論に機械学習モデルを適用する際の課題: ドイツ全土の洪水イベントのケーススタディ。 水資源。 解像度 56、e2019WR025924 (2020)。

記事 ADS Google Scholar

Hammond, P.、Suttie, M.、Lewis, VT、Smith, AP、Singer, AC 機械学習を使用して水路への未処理の下水排出を検出。 NPJ クリーン ウォーター 4、1–10 (2021)。

CAS Google スカラー

リュー、L.ら。 太湖の包括的な水質管理に向けて: 一般化された添加物モデルを使用したクロロフィル a と水質パラメーターの相関付け。 科学。 トータル環境。 705、135993 (2020)。

論文 ADS CAS PubMed Google Scholar

モテヴァリ、A. et al. ブースト回帰木と k 最近傍法を使用した逆法により、地下水の点源および非点源の硝酸塩汚染の影響を定量化します。 J. クリーン。 製品。 228、1248–1263 (2019)。

記事 CAS Google Scholar

Friedman , J. 、Hastie , T. & Tibshirani , R. The Elements of Statistical Learning 、vol. 1 (ニューヨーク統計誌の Springer シリーズ、2001)。

Shwartz-Ziv, R. & Armon, A. 表形式データ: 必要なのはディープラーニングだけではありません。 情報フュージョン 81、84 ~ 90 (2022)。

記事 Google Scholar

Roscher, R.、Bohn, B.、Duarte, MF、Garcke, J. 科学的な洞察と発見のための説明可能な機械学習。 IEEE Access 8、42200–42216 (2020)。

記事 Google Scholar

Yang、Y.、Chui、TFM 説明可能な機械学習手法を使用した、持続可能な都市排水システムの水文学的応答のモデリングと解釈。 ハイドロール。 地球システム科学。 ディスカッション 1 ~ 41 (2020)。

Jiang, S.、Zheng, Y.、Wang, C. & Babovic, V. 代表的な集水域に関する解釈深層学習を通じて、米国本土全域にわたる洪水メカニズムを明らかにします。 水資源。 解像度 e2021WR030185 (2022)。

ルンドバーグ、SM & リー、S.-I. モデル予測を解釈するための統一されたアプローチ。 神経情報処理システムの進歩、4765–4774 (2017)。

ルンドバーグ、SM et al. 樹木の説明可能な AI を使用して、ローカルな説明からグローバルな理解まで。 ナット。 マッハ。 知性。 2、2522–5839 (2020)。

記事 Google Scholar

パーキンソン、A. WWF: イングランド州のチョーク ストリーム (2014)。

WFD。 「水政策の分野における共同体行動の枠組みを確立する2000年10月23日の欧州議会および理事会の指令2000/60/EC」、つまり、簡単に言うとEU水枠組み指令。 欧州共同体公式ジャーナル L 327、1–72 (2000)。

Visser, A.、Beevers, L.、Patidar, S. チョーク川の水文学的反応に対する気候変動の影響。 水 11, 596 (2019)。

記事 Google Scholar

Dąbrowska, J.、Bawiec, A.、Pawęska, K.、Kamińska, J. & Stodolak, R. 廃水排水の分流が水質に与える影響の評価。 ポーランドの J. Environ。 Stud.26 (2017)

イッサ、HM およびアルシャテリ、AH カラール市からの廃水排出がイラクのディヤラ・シルワン川の水質に及ぼす影響: 汚染評価、重金属汚染の健康リスク。 応用水科学 11、1–13 (2021)。

記事 CAS Google Scholar

Jordan、RC、Gray、SA、Howe、DV、Brooks、WR & Ehrenfeld、JG 市民科学プログラムにおける知識の獲得と行動の変化。 保守します。 バイオル。 25、1148–1154 (2011)。

論文 PubMed Google Scholar

Bonney, R.、Phillips, TB、Ballard, HL & Enck, JW 市民科学は科学に対する国民の理解を高めることができますか? 公共の理解。 科学。 25、2–16 (2016)。

論文 PubMed Google Scholar

パイク、A.ら。 確率力学アプローチを使用してリアルタイムで河川水温を予測します。 水資源研究 49、5168–5182 (2013)。

NERC 生態学および水文学センター。 全国河川流アーカイブ 2020: 全国河川流アーカイブ。 http://nrfa.ceh.ac.uk (2020)。 (2020 年 10 月 27 日にアクセス)。

Schäfer, B.、Heppell, CM、Rhys, H. & Beck, C. 河川の水質時系列の変動は超統計に従います。 iサイエンス24(2021)。 https://doi.org/10.1016/j.isci.2021.102881https://www.cell.com/iscience/pdf/S2589-0042(21)00849-X.pdf。

Kreinovich, V.、Nguyen, HT & Ouncharoen, R. 予測品質の推定方法: 対称平均絶対パーセント誤差 (smape) およびその他の同様の特性のシステム主導型導出 (2014)。

Guo、D.ら。 河川の水質の時間的変動に影響を与える主な要因。 水資源。 解像度 55、112–129 (2019)。

Keller, VDJ、Williams, RJ、Lofthouse, C. & Johnson, AC 希釈係数を使用した、下水処理場に由来するあらゆる化学物質の河川濃度の世界規模の推定。 環境。 有毒。 化学。 33、447–452 (2014)。

エチャ。 情報要件および化学物質の安全性評価に関するガイダンス: 第 r.16 章: 環境暴露評価。 (2016年)。

Link, M.、von der Ohe, PC、Voss, K. & Schafer, RB 受水流におけるドイツの下水処理施設流出物の希釈係数と、化学物質のリスク評価からの固定希釈係数との比較。 科学。 トータル環境。 598、805–813 (2017)。

論文 ADS CAS PubMed Google Scholar

Zhu、SL および Piotrowski、AP 人工知能モデルを使用した河川/河川の水温予測: 体系的なレビュー。 Acta Geophysica 68、1433–1442 (2020)。

記事 ADS Google Scholar

Hebert, C.、Caissie, D.、Satish, MG、El-Jabi, N. 人工ニューラル ネットワークを使用した時間ごとの河川水温のモデリング。 水質研究所 J. カナダ 49、144–162 (2014)。

Basic, T., Britton, JR, Cove, RJ, Ibbotson, AT & Gregory, SD 南方生息域限界付近の冷水魚、ヨーロッパハイイロ thymallus thymallus の加入における排出量と温度の役割。 エコル。 淡水魚 27、940–951 (2018)。

Wilson, M. & Worrall, F. 「廃水」の熱回収可能性: 下水流出水の排出温度の全国分析。 環境。 科学。 水耐性テクノロジー。 7、1760 ~ 1777 年。 https://doi.org/10.1039/D1EW00411E (2021)。

記事 CAS Google Scholar

Molnar、C. 解釈可能な機械学習 (Lulu.com、2020)。

Wang, C.、Wu, Q.、Weimer, M. & Zhu, E. Flaml: 高速で軽量な automl ライブラリ。 手順マッハ。 学ぶ。 Syst.3 (2021)。

スレーター、LJ 他水文学における R の使用: 最近の開発と将来の方向性のレビュー。 ハイドロール。 地球システム科学。 23、2939–2963 (2019)。

記事 ADS Google Scholar

Kuhn, M. キャレット パッケージを使用して R で予測モデルを構築します。 J.Stat. ソフトウェア。 28、1–26 (2008)。

記事 Google Scholar

マクグレン、SJ 他英国の小さな流域で嵐が続く冬の間、水文学と水質の反応は田舎から都市への明確な勾配に従います。 J. Hydrol.545、463–477 (2017)。

記事 ADS CAS Google Scholar

チャン、KS 他環境研究用の低コスト電子センサー: 落とし穴とチャンス。 物理学を進めます。 地理-地球環境。 45、305–338 (2021)。

マンロー、K.ら。 高度に都市化された潮汐河川流域(英国ロンドン)における短期的な医薬品および違法薬物の発生に対する合流式下水道の氾濫の影響の評価。 科学。 トータル環境。 657、1099–1111 (2019)。

論文 ADS CAS PubMed Google Scholar

ベルナル、S.ら。 下水処理プラントの排水入力は、断続的な流れの低流量時には大きな生物地球化学的変化を引き起こしますが、昼夜のパターンでは小さな変化を引き起こします。 科学。 Total Environ.714、136733 (2020)。 https://www.ncbi.nlm.nih.gov/pubmed/31982751。

Marti, E.、Aumatel, J.、Gode, L.、Poch, M. & Sabater, F. 下水処理プラントから投入物を受け取る流れの栄養塩保持効率。 J.Environ. クオリティ 33、285–293 (2004)。

Arnon, S.、Avni, N.、Gafny, S. 処理された廃水を受け取る高度に規制された地中海の河川における栄養素の摂取と大型無脊椎動物の群集構造。 水生科学 77、623–637 (2015)。

記事 CAS Google Scholar

OpenStreetMap の貢献者。 オープンストリートマップ。 https://www.openstreetmap.org/copyright (2022)。

Waskom、ML Seaborn 氏: 統計データの視覚化。 J. オープンソース ソフトウェア。 6、3021 (2021)。

記事 ADS Google Scholar

Servén, D. & Brummitt, C. pygam: Python の一般化された加算モデル。 ゼノド 10 (2018)。

Ke、G.ら。 Lightgbm: 非常に効率的な勾配ブースティング デシジョン ツリー。 上級ニューラル。 情報プロセス。 システム。 30、3146–3154 (2017)。

Google スカラー

リファレンスをダウンロードする

著者らは、ChessWatch プロジェクトに関与し匿名を希望したすべての市民科学者、およびセンサーをホストした地主に感謝したいと思います。 このプロジェクトは彼らの助けなしでは不可能でした。 また、この分野での技術サポートをしていただいた Tom Kelly 博士にも感謝いたします。 このプロジェクトは、マリー・スクウォドフスカ・キュリー助成協定第840825号に基づく欧州連合のHorizo​​n 2020研究革新プログラム、助成金第840825号に基づくヘルムホルツ協会からの資金提供を受けています。 VH-NG-1727、クイーン メアリー大学ロンドン センター フォー パブリック エンゲージメント、2022 QMUL Research England Policy Impact Grant、およびテムズ ウォーターから。

Projekt DEAL によって実現および組織されたオープンアクセス資金調達。

クイーンメアリー大学ロンドン数理科学部、マイルエンドロード、ロンドン、E1 4NS、英国

ベンジャミン・シェーファー & クリスチャン・ベック

ノルウェー生命科学大学科学技術学部、1432、オース、ノルウェー

ベンジャミン・シェーファー

オートメーションおよび応用情報学研究所、カールスルーエ工科大学、76344、エッゲンシュタイン レオポルトスハーフェン、ドイツ

ベンジャミン・シェーファー

アラン・チューリング研究所、96 Euston Road、ロンドン、NW1 2DB、英国

クリスチャン・ベック

フランシス・クリック研究所、フローサイトメトリー科学技術プラットフォーム、ロンドン、英国

ヘフィン・リス

Thames Water、Clearwater Court、Vastern Road、レディング、RG1 8DB、英国

ヘレナ・ソテリオウ

リバーチェス協会、クロックスリーグリーン、イギリス

ポール・ジェニングス

チルターンズチョークストリームプロジェクト、チルターンズ保護委員会、チンナー、オックスフォードシャー、OX39 4HA、英国

アレン・ビーチー

クイーンメアリー大学ロンドン校地理学院、マイルエンドロード、ロンドン、E1 4NS、英国

キャサリン・M・ヘペル

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

CMH、PJ、AB が ChessWatch プロジェクトを考案し、CMH と PJ がデータを収集し、HR がデータ調査用の水質オンライン ダッシュボードを作成し、BS がデータ分析を実行し、CB と他のすべての著者が結果を解釈し、原稿を執筆してレビューしました。 。

ベンヤミン・シェーファーへの通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Schäfer, B.、Beck, C.、Rhys, H. 他。 都市化された河川の水質動態を説明するための機械学習アプローチ。 Sci Rep 12、12346 (2022)。 https://doi.org/10.1038/s41598-022-16342-9

引用をダウンロード

受信日: 2022 年 3 月 17 日

受理日: 2022 年 7 月 8 日

公開日: 2022 年 7 月 19 日

DOI: https://doi.org/10.1038/s41598-022-16342-9

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。