Jan 28, 2024
機械学習を使用して化学物質の毒性評価を改善する
Ricercatori dell'Università di Amsterdam e i loro colleghi
アムステルダム大学の研究者は、クイーンズランド大学およびノルウェー水研究所の同僚と協力して、機械学習を使用して化学物質の毒性を評価する戦略を開発しました。彼らは自分たちのアプローチを記事で紹介しています特集「環境科学、工学、技術の進歩のためのデータサイエンス」で環境科学技術の博士号を取得。 この研究で開発されたモデルは、定量的構造活性相関 (QSAR) モデリングに基づく従来のインシリコ評価と比較して、大幅な改善につながる可能性があります。
研究者らによると、機械学習を利用することで、新しい化学物質の安全設計開発と既存化学物質の評価の両方において、分子の危険性評価を大幅に改善できるという。 後者の重要性は、ヨーロッパと米国の化学機関が、長年にわたって開発されてきたものの、環境運命や毒性についての知識がほとんどまたはまったくない約 800,000 の化学物質をリストに挙げているという事実によって示されています。
化学物質の運命と毒性の実験的評価には多くの時間、労力、リソースが必要となるため、ハザード指標を予測するためにモデリングアプローチがすでに使用されています。 特に、原子配列や 3D 構造などの分子の特徴を物理化学的特性や生物学的活性に関連付けるため、定量的構造活性関係 (QSAR) モデリングが頻繁に適用されます。 モデリング結果 (または入手可能な場合は測定データ) に基づいて、専門家は、たとえば化学品の分類および表示に関する世界調和システム (GHS) で定義されているカテゴリに分子を分類します。 特定のカテゴリーについては、分子はさらなる研究、より積極的なモニタリングの対象となり、最終的には法律が制定されることになります。
ただし、このプロセスには固有の欠点があり、その多くは QSAR モデルの制限に原因があると考えられます。 これらは多くの場合、非常に均質なトレーニング セットに基づいており、外挿を行うために線形の構造と活性の関係を想定しています。 その結果、多くの化学物質は既存の QSAR モデルでは十分に表現されておらず、それらの使用は潜在的に重大な予測誤差や化学物質の誤分類につながる可能性があります。
Environmental Science & Technology に掲載された論文の中で、Saer Samanipour 博士とその共著者らは、QSAR 予測ステップを完全にスキップする代替評価戦略を提案しています。 アムステルダム大学ヴァントホフ分子科学研究所の環境分析科学者サマニプール氏は、同大学生物多様性・生態系動態研究所の環境化学者アントニア・プレトリウス博士と協力した。 彼らは、クイーンズランド大学およびノルウェー水研究所の同僚と協力して、分子記述子に基づいて化学物質の急性水生毒性を直接分類するための機械学習ベースの戦略を開発しました。
このモデルは、魚類の急性毒性 (96 時間の LC50 値) について実験的に得られた 907 件のデータに基づいて開発およびテストされました。 新しいモデルは、各化学物質の毒性値 (96h LC50) の明示的な予測をスキップしますが、各化学物質を多数の事前定義された毒性カテゴリーに直接分類します。 これらのカテゴリーは、例えば、急性水生有害性に関する GHS カテゴリーに関する記事で実証されているように、特定の規制や標準化システムによって定義できます。 このモデルは、トレーニング セットで使用されたデータの分散の約 90 パーセント、およびテスト セット データの約 80 パーセントを説明しました。
この直接分類戦略では、QSAR 回帰モデルに基づく戦略と比較して、誤った分類が 5 分の 1 に減少しました。 その後、研究者らは戦略を拡張し、32,000 種類の化学物質からなる大規模なセットの毒性カテゴリーを予測しました。
彼らは、さまざまなソースおよびさまざまな化学ファミリーの実験データセットをグループ化して、より大きなトレーニング セットを生成できるため、直接分類アプローチにより予測精度が高くなることが実証されました。 さまざまな国際規制や分類またはラベル付けシステムで規定されている、さまざまな事前定義されたカテゴリに適合させることができます。 将来的には、直接分類アプローチは、環境運命(移動性や残留性など)だけでなく、他の危険有害性カテゴリー(慢性毒性など)にも拡張することができ、化学危険有害性とリスクに関するインシリコツールを改善する大きな可能性を示しています。評価。
- このプレスリリースはもともとアムステルダム大学のウェブサイトに掲載されたものです
彼らは記事でそのアプローチを紹介しています QSAR 予測をスキップする より高い精度の予測