広く

ニュース

Jul 15, 2023

広く

Rapporti scientifici Volume 13,

Scientific Reports volume 13、記事番号: 1720 (2023) この記事を引用

5206 アクセス

129 オルトメトリック

メトリクスの詳細

この記事は更新されました

気候変動を緩和するには、温室効果ガス排出量の削減に加えて、陸上生態系における炭素吸収源を増やすための行動が必要です。 このような吸収源を定量化し、モデルを校正するための重要な測定方法は、渦共分散法ですが、生態系の年間炭素収支を決定するには、欠損データの補完、つまりギャップを埋める必要があります。 これまでのギャップ充填手法の比較では、周辺分布サンプリング (MDS) などの一般的に使用される手法は炭素収支推定に大きな影響を与えないと結論付けられています。 広範な地球規模のデータセットを分析することにより、MDS が北部 (緯度 \(>60^\circ\)) の地点で重大な炭素バランス誤差を引き起こすことを示しました。 MDS は体系的に炭素源の二酸化炭素 (CO\(_2\)) 排出量を過大評価し、炭素吸収源の CO\(_2\) 隔離を過小評価します。 また、これらの偏りの理由を明らかにし、極度勾配ブースティングと呼ばれる機械学習手法または MDS の修正実装を使用して北側サイトの偏りを大幅に軽減する方法を示します。

気候変動は人類が直面する最も深刻な課題の 1 つです。 化石燃料や土地利用からの温室効果ガスの排出を制限することに加えて、すでに大気中に存在する炭素 (C)、特に二酸化炭素 (CO\(_2\)) を隔離する効果的な方法を見つける必要があります。 気候変動に配慮した農業、植林、再植林、泥炭地の回復などの自然気候の解決策が、このための最も実現可能な手段と考えられています1,2。 これらのソリューションを気候政策や炭素市場にとって信頼できるものにするためには、炭素隔離の信頼性の高い検証が必要です3。 この検証には、生態系と大気の間の CO\(_2\) フラックスを直接測定する重要な方法である微気象学的渦共分散 (EC) 手法も含まれます4。 この手法の人気は、長年にわたり世界中で 900 を超える EC サイトが登録されている FLUXNET ネットワークに顕著に表れています5。 原則として、EC は、CO\(_2\) と大気の短期純生態系交換 (NEE) に関する継続的なデータを提供します。これは、生態系の関連する炭素バランスを決定するために時間的に統合できます。 EC 測定は継続的に実行できますが、実際には、たとえば技術的な障害や、最も重要なことに、EC 技術の有効性を損なう大気条件下で収集されたデータのフィルタリングの必要性などにより、収集されたデータにギャップが生じます。 。 たとえば、1532 サイト年分のデータ 6 を含む世界規模の FLUXNET2015 データセットでは、30 分ごとの CO\(_2\) フラックスの平均 68% が欠落しています 7。 2 か月を超えるギャップがあるサイト年を除外したとしても、平均データ カバレッジは 40% です。 60% を超えるカバレッジを持つのは 50 サイト年だけであり、70% を超えるカバレッジは 5 サイト年だけです。

欠損データの補完やギャップ埋めには、単純な線形補間や平均日内変動から人工ニューラル ネットワーク (ANN) などのより複雑な方法まで、さまざまな方法が使用されてきました。 15 の CO\(_2\) フラックス ギャップ充填法の比較では、年間 C バランスに対するギャップ充填の影響はわずかであり、最もパフォーマンスの高い方法の精度は非線形であることが判明したと結論付けられました。回帰、ルックアップ テーブル、周辺分布サンプリング (MDS)、セミパラメトリック モデル、および ANN は、すでに測定のノイズ限界に達しています8。 ただし、この比較には \(20^\circ\) 緯度範囲の森林サイトのみが含まれていました。 他の比較では、現在最も一般的に使用されているギャップを埋める手法9、つまり MDS および機械学習ベースのアプローチが欠けているか、長いギャップに焦点を当てています7、10、11。 これらの欠点にもかかわらず、さまざまな機械学習手法、特に MDS が EC データのギャップを埋めるための標準的な手法となっています。 特に、MDS は、FLUXNET6 および欧州の研究インフラである統合炭素観測システム (ICOS) によって提供される標準化されたオープンアクセス NEE データのギャップを埋めるために使用されます。 MDS は、無料のギャップ充填ツール REddyProc12 内にも、EC データ後処理用の商用ソフトウェアである Tovi\(^{TM}\) の一部としても実装されています 13。 ただし、北部の高緯度 (緯度 \(>60^\circ\)) サイトからのデータについては、さまざまなギャップ充填手法、特に MDS のパフォーマンスに関する知識が不足しています。 北部の生態系では生育期が短く、CO\(_2\) 交換の主要な環境要因である日射量は年間を通じて非常に不均一に分布しています。 したがって、北部の短い成長期に利用できる可能性のある夜間データの量は、データ品質をフィルタリングする前でさえ少ないのです。

ここでは、ギャップ充填によって引き起こされる不確実性が北緯での炭素隔離推定値を検証する能力を制限するかどうかを明らかにすることを目的として、ギャップ充填 CO\(_2\) フラックス時系列に対する 2 つの方法のパフォーマンスを調査しました。 検討されたギャップを埋める手法は、MDS と eXtreme gradient Boosting (XGBoost) と呼ばれる機械学習手法でした。 XGBoost は、ギャップ充填 CO\(_2\) およびメタン フラックス データに関する以前の研究でデシジョン ツリー ベースの手法が良好な結果を示したため、幅広い機械学習手法から選択されました 7,10,14。 まず、少なくとも 20% の時間 CO\(_2\) フラックス データ カバレッジを持つ北半球からの 30 分ごとのデータの年次時系列を含むグローバル FLUXNET2015 データ セットでの MDS と XGBoost のパフォーマンスを比較しました。 次に、北部の 10 か所のサイトのギャップ充填パフォーマンスを調査することで、北部の生態系の特殊なケースに焦点を当てました。 私たちは、最大 3 日間のデータ ギャップと、気温 (T\(_{air}\))、入ってくる短波放射 (SWR)、および大気蒸気という、すぐに利用できる環境要因のみを使用する、基本的なギャップを埋めるタスクに取り組みました。圧力不足 (VPD)。 より具体的には、ギャップを埋める手法が (1) 同様の C バランス推定値をもたらすか、(2) 北部の生態系でも他の地域と同様に良好に機能するかどうかを知りたかったのです。 これは、実際のデータセットと合成データセットに人為的なギャップを挿入し、その人為的なギャップを埋めて、両方の方法のパフォーマンスを評価することで行いました。 平均磁束バイアスは年間収支の精度に直接反映されるため、主要なパフォーマンス指標として採用しました。 使用されたもう 1 つの重要な指標はバランス誤差で、これは欠落データに対する磁束バイアスの合計です。 これは合成データを使用して計算されました。

この研究では、微気象記号の規則が採用されています。つまり、正の CO\(_2\) フラックスは生態系から大気へのフラックスを示し、負のフラックスは大気から生態系への取り込みを示します。 FLUXNET2015 データセットの 882 サイト年データに挿入された人工ギャップのギャップ充填により、MDS では、日中のギャップ充填フラックスに明らかな正の偏りがあることが明らかになりました (SWR \(\ge\) 20 W m\( ^{-2}\)) 高緯度 (\(>50^\circ\)N、N = 105) (図 1a; 統計的検定については、補足表 S1 を参照)。 夜間(SWR < 20 W m\(^{-2}\))では、負ではあるがはるかに小さいバイアスがあり(図1b)、正の全磁束バイアス(図1c)につながりました。 正の磁束バイアスは放出が過大評価されているか、取り込みが過小評価されているかのいずれかを示し、負のバイアスはその逆を示します。 XGBoostをギャップ充填に使用した場合、いくつかの正および負の磁束バイアスが観察されました(図1d、e)が、これらのバイアスの大きさはMDSの日中バイアスと比較して小さかったです。 XGBoost による総磁束バイアスは、すべての緯度でわずかであるか、非常に小さかった(図 1f および補足表 S1)。

MDS は、北緯のギャップに満たされた NEE に明らかな正の偏りを引き起こします。 (a、b) 昼間、(c、d) 夜間、(e、f) 周辺分布サンプリング (MDS) と極度勾配ブースティング (XGBoost) を使用して埋められた CO\(_2\) フラックス データのギャップの合計バイアス。 このデータは、グローバル FLUXNET2015 データセットの 141 サイトからの 882 サイト年をカバーしています。 各メソッドの出力は、人工ギャップとしてラベル付けされた測定データと比較されました。 合計、日中および夜間の平均磁束バイアスがサイト年ごとにプロットされています。

MDS 法は、NEE と気象変数の間の共変動に基づいており、主に、類似の条件下で測定された利用可能な NEE 値の平均によって、欠落している NEE 観測値のギャップを埋めます。 気象条件の類似性は、各予測変数に指定されたサンプリング許容誤差、つまり実際の条件からの最大許容偏差に基づいて決定されます (詳細については「方法」を参照)。 北緯における日中の正のバイアス(図2a)は、非常に歪んだ放射線分布(図2bおよび補足図S1)に起因し、放射線分布のより低い範囲からより多くのデータがサンプリングされるようになりました(図2c)。 。 過小評価された放射線レベルは、過小評価された光合成の取り込み(負の光束成分)に対応し、したがって過大評価されたNEEに対応します(図2d)。 測定データを使用した例を補足図2a、bに示します。 昼と夜の磁束バイアスの不均衡は、緯度 \(50^\circ\) ~ \(70^\circ\) で明らかであり、選択された地域のサイト年の 15% に相当する 133 サイト年のデータに影響を与えました。 FLUXNET2015 データセットのサブセット。 緯度 \(30^\circ\) ~ \(50^\circ\) にも、負の磁束バイアスを持つサイト年がかなりの数ありました。これは、これらの緯度でのバイアスが他の理由によって引き起こされたことを示しています。 MDS による正の日中磁束バイアスは、緯度 \(60^\circ\) ~ \(70^\circ\) で特に顕著であったため、このゾーン内に位置する 10 か所の地点からのデータをより徹底的に調査しました (表 1)。 北緯では良好なデータ範囲が得られるサイトイヤーがより多かったので、これらのデータは ICOS Warm Winter 2020 EC フラックス製品から取得されました 15。 ICOS データ製品は、FLUXNET2015 データセットと完全な互換性があります。

放射線分布は北緯で偏っており、その結果、サンプルバイアスと正の磁束バイアスが生じます。 (a) 異なる緯度での MDS の昼と夜の CO\(_2\) フラックス バイアス、(b) 異なる緯度での入射短波放射の分布の歪度、(c) 異なる歪度値での昼と夜のサンプル バイアス(d) 正のバイアスがどのように生成されるかを示す概略図。 黒い曲線は、SWR (成長期の短期間の日中の NEE) に対する NEE の実際の依存性の例を示しています。 サンプル バイアス (c) は、欠測観測値を補うために平均化された NEE データを選択するときに、測定値と比較して高い放射線値よりも低い放射線値でさらに多くのデータ ポイントがサンプリングされることを示します。 測定された swr (swr-tol...swr) より下の許容範囲内の測定数 (N) が、それより上の許容範囲内の測定数 (swr...swr+tol) より大きい場合、正のサンプルバイアスがあり、特定の SWR でモデル化された NEE は過大評価される可能性があります。 サンプルサイズは 2 ~ 507 の範囲で、平均は 29 でした。データは 882 サイト年をカバーしています。 すべての箱ひげ図は、個別にプロットされた、外れ値を除いた分布の中央値 (実線)、四分位数 (箱) および残りの分布を示します。 外れ値は、四分位範囲の 1.5 倍の外側にある点として定義されました。 わかりやすくするために、12 (N = 6) を超えるサンプル バイアスと - 3 (N = 4) 未満のサンプル バイアスは示していません。

検出されたバイアスが年間蓄積 CO\(_2\) フラックス、つまり年間 C バランスの推定値にどのような影響を与えるかを評価するために、北部 10 か所で観測された CO\(_2\) フラックスに対応する合成完全時系列を生成しました。 (補足図S3、S4および補足表S2)。 次に、長さとタイミングの両方において現実的な人工ギャップ (データの 30%、50%、70%) を合成データセットに導入し、ギャップを埋めた NEE 時系列から導出された C バランスを真のバランスと比較しました。 これは 2 つの理由から行われました。 研究の最初の部分では、データギャップによって損なわれた利用可能な測定時系列に基づいて磁束バイアスを評価しました。 ただし、ほとんどのギャップは夜間に発生します。つまり、偏りを評価するために使用されたデータの大部分は日中のフラックスでした。 次に、C バランスの推定において、現実的なギャップの長さ、タイミング、時間帯に依存するバイアスが組み合わさった影響がどのようなものかを知りたかったのです。

MDSは、1つのケース(70%ギャップのあるサイトSE-Nor)を除くすべてのケースで年間Cバランスを体系的に過大評価していることがわかりました(図3および補足表S3)。 MDS による部位固有のバランス誤差の中央値は、30% ギャップ レベルでの 2 ~ 10 g C m\(^{-2}\) y\(^{-1}\) から 3 ~ 17 g C m\ の範囲でした。 (^{-2}\) y\(^{-1}\) は 70% ギャップ レベルです。 10 個のデータ セットのうち 5 個では、バランス エラーが 30 g C m\(^{-2}\) y\(^{-1}\) を超え、最大のバランス エラーは 42 g C m\(^{- 2}\) y\(^{-1}\)。 注目に値するのは、年間の絶対収支誤差が、C m\(^{-2} \) y\(^{-1}\)。 また、昼間のデータよりも夜間に多くのギャップが発生すると、夜間の過小評価された NEE 値の数が昼間の過大評価された NEE の数の減少を補ったため、MDS の年間誤差は減少しました。 30 件中 4 件のケースで、XGBoost で計算されたバランスに重大な誤差がありましたが、バランス誤差の中央値はわずか - 4 ~ 2 g C m\(^{-2}\) y\(^{-1} \)。

MDS でギャップを埋めると、C バランス エラーが発生します。 さまざまなギャップパーセンテージに対する、ギャップを埋めた年間 C バランスの誤差。 合成データ セットはサイトごとに 5 回生成され (表 1)、各データ カバレッジ クラスはデータ セットごとに 10 回テストされました。 元のギャップ分布に基づいて、ギャップのタイミングも考慮して、長さ 0.5 時間から 3 日のランダムなギャップが生成されました。 正のバランス エラーは、ギャップが埋められた C バランス推定値がソースが大きすぎるか、シンクが小さすぎることを示していることを意味します。

方法を変更することで MDS が改善できるかどうかをテストし、正の磁束バイアスが偏った放射線サンプリングによって引き起こされたことをさらに検証するために、合成データセット FI-Let を使用して 3 つの変更を加えたモデルのパフォーマンスを調査しました。ほとんど。 (1) 各データ サンプルの SWR 制限を定義する 2 つの許容値設定を狭める、(2) 放射線許容値を 1 つだけ使用する、または (3) 昼間のデータについては、低 SWR サブサンプルと高 SWR サブサンプルの平均 NEE を個別に計算し、次に、これらの平均を平均します。

SWR許容値が低いSWRレベルと高いSWRレベルで異なる場合、日中の正の磁束バイアスが夜間の負のバイアスよりも大きく、正の合計バイアスが生じ、したがってCバランスの過大評価が発生しました(図4a、cおよび補足表S4)およびS5)。 SWRクラスが狭まると、元の実装と比較して誤差は小さくなりましたが、モデル化されたNEEの二乗平均平方根誤差(RMSE)は増加しました(図4bおよび補足表S6)。 一般的な SWR 許容値 25 W m\(^{-2}\) を使用した場合、ギャップ充填 C バランスの誤差は、データの 30% または 50% が欠落している場合はわずかであり、データの 70% が欠落している場合はマイナスでした。欠落しています(図4aおよび補足表S4)。 また、この場合、RMSEは増加しました(図4cおよび補足表S6)。 低SWRと高SWRのサブサンプルを別々に平均し、その平均を取ることで、RMSEに影響を与えることなく、正の日中磁束バイアスと年間バランスの誤差が減少しました(図4a〜cおよび補足表4、5)。 ただし、バランス誤差は完全には解消されず、XGBoost を使用するとさらに低い RMSE が得られました。 最後に、サブサンプル平均化を備えた MDS の実装を使用してすべての合成データ セットのギャップを埋めたところ、1 つのケース (データが 70% 欠落している SE-Nor) でのみ、年間誤差の大きさが元の実装を使用した場合よりも大きかったことがわかりました。 MDSの(補足図S5および補足表S7)。 他のすべてのケースでは、誤差は減少するか、完全に除去されます。

MDS の修正バージョンを使用すると、C バランスのエラーを減らすことができます。 合成データセット FI-Let の MDS ギャップ充填メソッドと XGBoost のさまざまな実装のパフォーマンス。 [20,50]、[10,25]、および [25,25] (W m\(^{-2}\)) は、SWR に使用されるサンプリング許容誤差を示します。 「サブサンプル」とは、日中のデータの低 SWR および高 SWR サブサンプルの平均 NEE の平均を指します。 [20,50] は MDS の標準実装です。 (a) 年間誤差、(b) 二乗平均平方根誤差 (RMSE)、および c ギャップ充填合成 CO\(_2\) フラックス データの昼夜バイアス。 エラーを評価するために、各データ カバレッジ クラスを 10 回テストし、70% の人為的なギャップを持つデータの RMSE とバイアスを計算しました。

特に、負のバイアスと正のバイアスの両方の傾向を持つ方法が異なるサイトに使用されている場合、ギャップを埋めることによって、サイト固有の C バランス間の人為的な差異を生成することができます。 これが、フラックス ネットワークがデータ処理を標準化した理由です。 ただし、同じ方法でギャップを埋める場合でも、バイアスはサイト固有であり、データ範囲に依存するため、データ補完によってサイト間で大きな差異が生じる可能性があります。 以前は、年間タイムスケールでのランダムな不確実性は 10 ~ 40 g C m\(^{-2}\) y\(^{-1}\)16,17 と推定されており、不確実性はギャップを埋めることに関連しています 10 –30 g C m\(^{-2}\) y\(^{-1}\)8,16、ほぼ理想的な位置での C バランスの合計不確実性は ± 50 g C m\(^{ -2}\) y\(^{-1}\)4。 この研究で見つかった年間誤差の大きさは、推定された不確実性と同等です。これは、場合によっては、真のバランスが元の推定値の信頼区間によって捉えられない可能性があることを意味します。 私たちは、機械学習アルゴリズム (ここでは極端な勾配ブースティング手法) がギャップ充填エラーを大幅に削減できることを示しました。

原理的には、他の機械学習手法や回帰モデルなど、NEE とその気象要因との間の共分散を正しく考慮する手法であれば、ギャップ充填誤差を削減できる可能性があります。 元の実装における MDS の主な問題は、より低い放射線レベルが優先され、したがってより高い NEE が優先されるため、特定の放射線間隔内の平均光束が偏った推定値になることです。 放射線に対する NEE の応答の想定された形状が正しくない場合、回帰モデルでは異なるが同様の問題が観察される可能性があります。 データ駆動型の機械学習手法の利点は、応答関数に関してまったく仮定を行わないか、または仮定をほとんど行わないことです。

標準的な方法は比較を行うのに役立ちますが、特に北部のサイトのような特定の環境条件を考慮して、これらの方法を改善する必要があります。 また、ギャップが埋められたデータ、つまりモデル化されたデータの量は通常少なくとも 50% であるため、モデル化されたデータに偏りがないことが重要であることにも注意してください。 私たちは、MDS の元の実装が、放射線分布が非常に偏っている北部のサイトからのデータのギャップを埋めるには次善の方法であることを示しました。 XGBoost や提案されている修正 MDS などの他の方法は、少なくとも北部の高緯度 (緯度 \(>60^\circ\)) サイトでは、FLUXNET の標準化された処理パイプラインで考慮される必要があります。 この結果は、南部の高緯度の場所などの他の場所にも当てはまり、さまざまなドライバーに適用される可能性があります。

この研究で見つかった絶対的な誤差は大きくないように見えますが、系統的な誤差は可能な限り排除する必要があります。 生態系の C 隔離の可能性に対する関心が高まるにつれ、高緯度の生態系の C バランスが一般に小さいことは注目に値します。 観測された年間平均 NEE は、\ の地域をカバーする高緯度の北方およびツンドラ生物群系 (\(>45^\circ\)) では - 17 g C m\(^{-2}\) であると報告されています。 (20.6 \倍\) 10\(^6\) km\(^2\)18。 したがって、ここで発見された体系的なギャップ充填エラーは、北部生態系の C バランス推定値に重大な相対的な影響を及ぼし、C 隔離の検証に影響を与える可能性があります。

FLUXNET2015 データセットと ICOS データ製品 (FLUXNET の 73 ステーションの Warm Winter 2020 生態系渦共分散フラックス積) から取得したデータは、オープンアクセスの渦共分散 CO\(_2\) フラックス データと、処理されたサポート測定で構成されます。標準化された方法で6,15。 FLUXNET データは、世界中に分散した 206 のサイトから収集されています。 FLUXNET2015 データセットから、年間カバー率が少なくとも 20% である北半球のすべてのサイト年を使用しました (補足表 S8)。 品質フラグ NEE_VUT_REF_QC がゼロであるデータ製品 NEE_VUT_REF の値を選択することにより、測定された NEE を利用しました。 選択された環境要因は、短波放射 (SW_IN_F)、大気蒸気圧不足 (VPD_F_MDS)、および気温 (TA_F_MDS) でした。 ドライバーのギャップは、FLUXNET データ処理プロトコル 6 に従って埋められました。 ICOS データ製品から、年間カバー率が少なくとも 30% で、T\(_{air}\)、VPD、SWR、土壌温度が利用可能なすべての北部 (\(>60^\circ\)) 地点からのデータを使用しました。 各サイトについて、データ範囲が最も高かったサイト年を選択しました (表 1)。

この作業では、極端な勾配ブースティングと周辺分布サンプリングという 2 つのギャップ充填方法が使用されました。

極度勾配ブースティング アルゴリズムは、並列ブースト決定ツリーに基づいています。 この方法を適用するには、「xgboost」Python パッケージ 19 が使用されました。 ハイパーパラメータ: 各ツリーを構築するときの列のサブサンプル比 (0.4、0.6、0.8、1)、ツリーの最大深さ (3、5、10、15)、新しいノードの作成に必要なサンプルの最小数を制御します。ツリー内のデータ (2、5、10) と各ツリーでランダムにサンプリングされた観測値の割合 (0.65、0.75、1) は、ランダムに選択された 10 個のデータ セットを使用し、モードを選択することによって、グリッド検索に基づいて FLUXNET2015 データに対して決定されました。各ハイパーパラメータの。 北部のサイトでは、元の人工ギャップフリー データとグリッド検索を使用して、同じハイパーパラメーターが各合成データ セットに対して最適化されました。 学習率にはデフォルト値の 0.1 を使用しました。 二乗誤差を損失関数として使用しました。 MDS は移動データ ウィンドウを使用してフラックス データの時間的相関を解決するため、XGBoost は、月と時刻の両方に対する 2 つの周期関数と、追加のドライバーとしての時間の線形記述によって強化されました。

ここで、i は年の初めからの 30 分の数です。

MDS では、ギャップは、データ サンプリング用の移動ウィンドウを使用して同様の気象条件下で測定されたフラックスの平均で埋められます。十分な大きさのサンプルが見つからない場合は、平均日周コース (MDC) で埋められます。 デフォルトの気象要因とその許容値、または実際の条件から許容される偏差は SWR です。許容値は SWR \(\le\) 50 W m\(^{-) の場合は 20 W m\(^{-2}\) です。 2}\) および 50 W m\(^{-2}\) (SWR > 50 W m\(^{-2}\)、T\(_{air}\)、許容差 2.5 K および VPD の場合許容差は 5 hPa です。 T\(_{air}\) または VPD が欠落している場合は、SWR のみが使用されます。 利用可能な気象ドライバーがない場合、ギャップは MDC で埋められます。 具体的なサンプリング手順は、Wutzler et al.12 に記載されています。 注目に値するのは、REDdyProc ツールでも 20 W m\(^{-2}\) および 50 W m\(^{-2}\) の SWR 許容値を使用していることです (https://github.com/bgctw/REddyProc/tree) /1.1.3) たとえ単一の許容誤差アプローチが報告されていたとしても。

MDS の標準実装に加えて、その修正バージョンもテストしました。 まず、放射線サンプリングの制限のみを変更しました。 元の実装と同様に 2 つの異なる許容値を使用してテストしましたが、SWR 許容値を 10 および 25 W m\(^{-2}\) に下げました。 また、すべての放射線レベルで 1 つの許容値のみを使用してテストし、これには 25 W m\(^{-2}\) の SWR 許容値を使用しました。 最後に、サンプルの偏りをより適切に説明するために、日中のデータについて、現在の SWR よりも高い SWR と低い SWR を持つデータのサブサンプルの平均 NEE を最初に個別に計算し、次にこれら 2 つの NEE 値を平均しました。 MDS のバリアントは、Papale らによって C コードを使用して実装されました20。

人工ニューラル ネットワーク (ANN) を使用して、ギャップ充填手法の比較に使用できるカバレッジ 100% の合成データ セットを生成しました。 ここで使用された ANN は、4 つの隠れ層を持つ逐次モデルで、最初の隠れ層に 16 個のノードがあり、他の層に 32 個のノードがありました。 使用された活性化関数は線形、双曲線正接 (tanh) および修正線形活性化 (relu) であり、ネットワークの構造は線形-tanh-tanh-relu-線形でした。 損失関数として平均二乗誤差を使用しました。 ANN は Keras ライブラリを使用して実装されました21。 気温、土壌温度、SWR、および VPD がニューラル ネットワークの予測変数として使用されました。 各サイトについて、利用可能なすべての測定データを使用して ANN をトレーニングし、1 年間のすべての 30 分期間をモデル化した後、モデル化された 30 分 NEE にノイズを追加しました。 これは、季節 (冬の月 1 ~ 4 と 11 ~ 12、夏の月 5 ~ 10)、時間帯 (SWR \(\le\) 20 W m\(^ {-2}\)、SWR > 20 W m\(^{-2}\) ) の日中、および気温 (同じサイズの 5 つのビン)。 データをビニングした後、正しいビンから残差がランダムに選択され、各 30 分の NEE に追加されました。 この手順全体を部位ごとに 5 回繰り返して、50 の異なる合成データセットを取得しました。

実際には、合成データは、NEE が T\(_{air}\)、SWR、VPD、土壌温度によって駆動されるケースを表しています。 データにはノイズがあり、活動的な夏と冬、昼と夜、温度が異なるとその大きさが異なると仮定しました。 MDS と XGBoost を使用してデータのギャップを埋めるとき、NEE と T\(_{air}\)、SWR と VPD の間の共分散を解決できるはずだと想定しました。 また、バイアスのないギャップ充填法の平均誤差はゼロであると仮定しました。

FLUXNET2015 データのうち、入手可能なすべての測定データをサンプリングして、各サイト年の平均バイアスを計算しました。 MDS では、移動ウィンドウでの実装が簡単であるため、一度に 30 分ずつ人為的なギャップとしてラベルを付けました。 XGBoost の場合、計算時間の制約により 30 分ごとに異なるモデルをトレーニングするのは合理的ではないため、一度に測定データの 1 パーセントを人工的なギャップとしてラベル付けしました。 ただし、30 分ごとに個別のモデルをトレーニングすると、結果が悪化するのではなく改善されるため、XGBoost の結果は控えめな推定値を表しています。

合成データセットの場合、ギャップの長さとタイミングの両方を考慮して、元のギャップ分布から人工ギャップが抽出されました。 より具体的には、元の時系列のギャップは長さと開始時間によってラベル付けされ、人工ギャップは元のギャップからランダムに選択され、30%、50%、または 70% のカバレッジが達成されるまで合成データセットに挿入されました。 人工ギャップを合成データに挿入するとき、各ギャップの開始時刻は保持されました。 人工的なギャップが重なることは許されませんでした。 データ カバレッジごとに、すべての合成データ セットに使用される 10 個の異なるギャップ シーケンスを生成しました。

ギャップ充填値と測定値の比較は、平均バイアス、RMSE、および年間ギャップ充填 C バランスの誤差を使用して実行されました。 この論文では、C バランスを、C の収穫、施肥、浸出および側方輸送の潜在的な影響を除外した EC で測定された C バランスとして定義しました。

平均バイアスとRMSEは次のように定義されました。

ここで、N は人工的なギャップの量に等しく、NEE\(_{gap, i}\) はギャップが埋められた値を示し、NEE\(_{meas, i}\) は測定値を示します。

ギャップを埋めた C バランスの誤差は、ギャップを埋めた C バランスと真の (合成) C バランスの差として計算されました。

ここで、N はデータ内の 30 分 NEE の数に等しく、NEE\(_{synth, i}\) は合成 NEE 値です。

30 分ごとの NEE の平均バイアスとギャップ埋め炭素バランスの誤差がゼロと異なるかどうかを判断するために、ノンパラメトリック Wilcoxon 符号付き順位検定を使用しました。 データの正規性は、最初に Shapiro-Wilk 検定を使用して評価されました。 コノバーの検定とホルムの方法を使用してペアごとの比較を行い、p 値を調整しました。 すべての統計テストは、SciPy パッケージを使用して Python で実行されました22。

FLUXNET2015 データセットは、http://fluxnet.fluxdata.org/data/fluxnet2015-dataset/ で入手できます。 FLUXNET-Archive 形式リリース 2022-1 の 73 ステーション用の ICOS Warm Winter 2020 エコシステム渦共分散磁束積は、http://www.icos-cp.eu/data-products/2G60-ZHAK で入手できます。

XGBoost を使用して合成データを作成し、ギャップを埋めるためのコードは、https://github.com/hvekuri/co2_gapfilling で入手できます。

この記事の元のオンライン バージョンが改訂されました。この記事の元のバージョンでは、コードの可用性へのハイパーリンクが壊れていました。 正しいハイパーリンクは https://github.com/hvekuri/co2_gapfilling です。

Paustian、K. et al. 気候に適応した土壌。 ネイチャー 532、49–57 (2016)。

論文 ADS CAS PubMed Google Scholar

グリスコム、BW et al. 自然気候ソリューション。 手順国立アカド。 科学。 114、11645–11650 (2017)。

論文 ADS CAS PubMed PubMed Central Google Scholar

スミス、P.ら。 大気中の温室効果ガス除去に対する土壌炭素隔離の可能性を実現するために、土壌炭素変化を測定、報告、検証する方法。 グロブ。 バイオルを変更します。 26、219–241 (2020)。

記事 ADS Google Scholar

Baldocchi, DD 生態系の二酸化炭素交換率を評価するための渦共分散手法の評価: 過去、現在、未来。 グロブ。 バイオルを変更します。 9、479–492 (2003)。

記事 ADS Google Scholar

Baldocchi, DD 渦共分散フラックス測定が地球変動生物学の理解にどのように貢献したか。 グロブ。 バイオルを変更します。 26、242–260 (2020)。

記事 ADS Google Scholar

パストレロ、G. et al. FLUXNET2015 データセットと渦共分散データ用の ONEFlux 処理パイプライン。 科学。 データ 7、1 ~ 27 (2020)。

記事 Google Scholar

Zhu, S.、Clement, R.、McCalmont, J.、Davies, CA & Hill, T. より長い渦共分散データ ギャップに対する安定したギャップ充填: 二酸化炭素、水、およびエネルギー フラックスに対する世界的に検証された機械学習アプローチ。 農業。 のために。 メテオロール。 314、108777 (2022)。

記事 ADS Google Scholar

モファット、AM et al. 渦共分散正味炭素フラックスのギャップ充填技術の包括的な比較。 農業。 のために。 メテオロール。 147、209–232 (2007)。

記事 ADS Google Scholar

Falge, E. et al. 防御可能な年間正味生態系交換額のためのギャップ埋め戦略。 農業。 のために。 メテオロール。 107、43–69 (2001)。

記事 ADS Google Scholar

マハバティ、A.ら。 渦共分散磁束のギャップ充填アルゴリズムとそのドライバーの比較。 地理学。 インストラム。 メソッドデータシステム。 10、123–140 (2021)。

記事 ADS CAS Google Scholar

キム、Y.ら。 渦共分散メタンフラックスのギャップ充填アプローチ: 3 つの機械学習アルゴリズムと主成分分析による従来の手法の比較。 グロブ。 バイオルを変更します。 26、1499–1518 (2020)。

記事 ADS Google Scholar

Wutzler、T. et al. REddyProc を使用した渦共分散磁束データの基本的かつ拡張可能な後処理。 生物地球科学 15、5015–5030 (2018)。

記事 ADS CAS Google Scholar

LI-COR バイオサイエンス、米国。 https://www.licor.com/env/support/Tovi/manuals.html。

アービン、J.ら。 ギャップ充填渦共分散メタンフラックス: FLUXNET-CH4 湿地における機械学習モデルの予測と不確実性の比較。 農業。 のために。 メテオロール。 308、108528 (2021)。

記事 ADS Google Scholar

Warm Winter 2020 チーム、および ICOS エコシステム テーマ センター。 (2022年)。 FLUXNET アーカイブ形式リリース 2022-1 (バージョン 1.0) の 73 ステーションの Warm Winter 2020 エコシステム渦共分散フラックス積。 アイコスカーボンポータル。 https://doi.org/10.18160/2g60-zhak (2022)。

AD の Richardson と DY の Hollinger は、CO\(_2\) フラックス記録の長いギャップに起因するギャップ充填 NEE の追加の不確実性を推定する方法です。 農業。 のために。 メテオロール。 147、199–208 (2007)。

記事 ADS Google Scholar

リュー、M.ら。 亜熱帯の常緑針葉樹林における CO\(_2\) フラックス成分の不確実性解析。 科学。 中国シリアル D 地球科学。 52、257–268 (2009)。

記事 ADS CAS Google Scholar

ヴィルカラ、A.-M. 他。 陸上ツンドラと北方領域にわたる生態系 CO\(_2\) フラックスの統計的アップスケーリング: 地域パターンと不確実性。 グロブ。 バイオルを変更します。 27、4040–4059 (2021)。

記事 CAS Google Scholar

Chen, T. & Guestrin, C. Xgboost: スケーラブルなツリー ブースト システム。 知識発見とデータ マイニングに関する第 22 回 ACM SIGKDD 国際会議議事録、785 ~ 794 (2016)。

Papale, D. et al. 渦共分散手法で測定されるネット エコシステム交換の標準化された処理に向けて: アルゴリズムと不確実性の推定。 Biogeosciences 3、571–583 (2006)。

記事 ADS CAS Google Scholar

Chollet, F. c. et al. ケラス。 https://keras.io (2015)。

Virtanen、P. et al. Python での科学技術コンピューティングの基本的なアルゴリズム。 SciPy1.0。 ナット。 方法 17、261–272 (2020)。

論文 CAS PubMed PubMed Central Google Scholar

リファレンスをダウンロードする

この研究は、Maj and Tor Nessling財団(助成金番号202000391)、フィンランド・アカデミー戦略研究センター(助成金番号327214、335204)、フィンランド・アカデミー・フラッグシップ・ファンディング(助成金番号337549)およびアカデミーから資金提供を受けました。フィンランドの(補助金番号 328310、325549)。 DP は、CoCO2 H2020 欧州プロジェクト (GA 958927) および Open Earth Monitor Horizo​​n Europe プロジェクト (GA 101059548) のサポートを認めます。 MA、TL、AL は、ICOS Finland を通じてフィンランド運輸通信省に感謝します。 この作業では、次のネットワークを含む FLUXNET コミュニティによって取得および共有された渦共分散データを使用しました: AmeriFlux、AfriFlux、AsiaFlux、CarboAfrica、CarboEuropeIP、CarboItaly、CarboMont、ChinaFlux、Fluxnet-Canada、GreenGrass、ICOS、KoFlux、LBA、NECC、OzFlux- TERN、TCOS-シベリア、USCCC。 FLUXNET 渦共分散データの処理と調和は、CDIAC、OzFlux、ChinaFlux、AsiaFlux オフィスの支援を受けて、FLUXNET の ICOS エコシステム テーマ センター、AmeriFlux 管理プロジェクト、および Fluxdata プロジェクトによって実行されました。 FI-Qvd と SE-Ros を除く、この研究で使用されたすべての北部サイトは ICOS ヨーロッパ研究インフラストラクチャの一部であり、そのデータは ICOS カーボン ポータルによって配布されています。

フィンランド気象研究所、00101、ヘルシンキ、フィンランド

ヘンリーッカ・ヴェクリ、ユハ=ペッカ・トゥオヴィネン、リーサ・クルマラ、ミカ・アウレラ、トゥオマス・ラウリラ、ヤリ・リスキ、アナレア・ロヒラ

DIBAF トゥシア大学、01100、ヴィテルボ、イタリア

ダリウス・パパレ

欧州地中海気候変動センター CMCC IAFES、01100、ヴィテルボ、イタリア

ダリウス・パパレ

大気地球システム研究所物理学、ヘルシンキ大学、00014、ヘルシンキ、フィンランド

パシ・コラリ & アンナレア・ロヒラ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

HV、JP.T.、および AL が研究を設計しました。 HV がデータ分析を実行しました。 DP は MDS のコードを提供し、MDS の修正バージョンを開発しました。 著者全員が、分析、データ解釈、執筆、原稿の編集に関する議論に参加しました。

ヘンリーッカ・ヴェクリへの対応。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Vekuri, H.、Tuovinen, JP.、Kulmala, L. 他。 広く使用されている渦共分散ギャップ充填法は、炭素収支推定に体系的な偏りを生み出します。 Sci Rep 13、1720 (2023)。 https://doi.org/10.1038/s41598-023-28827-2

引用をダウンロード

受信日: 2022 年 11 月 21 日

受理日: 2023 年 1 月 25 日

発行日: 2023 年 1 月 31 日

DOI: https://doi.org/10.1038/s41598-023-28827-2

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。