定量的放射性バイオマーカーの機械学習手法

ニュース

ホームページホームページ / ニュース / 定量的放射性バイオマーカーの機械学習手法

Oct 13, 2023

定量的放射性バイオマーカーの機械学習手法

Rapporti scientifici Volume 5,

Scientific Reports volume 5、記事番号: 13087 (2015) この記事を引用

34k アクセス

600件の引用

16 オルトメトリック

メトリクスの詳細

ラジオミクスは、腫瘍の表現型の特徴を定量化する多数の医療画像特徴を抽出およびマイニングします。 非常に正確で信頼性の高い機械学習アプローチは、臨床ケアにおける放射線医学アプリケーションの成功を促進します。 この放射線学的研究では、全生存期間を予測するためのパフォーマンスと安定性の観点から、14 の特徴選択方法と 12 の分類方法が検査されました。 合計 440 個の放射線特徴が、464 人の肺がん患者の治療前のコンピューター断層撮影 (CT) 画像から抽出されました。 さまざまな機械学習手法の公平な評価を保証するために、報告されたパラメーター構成とともに公開されている実装が使用されました。 さらに、トレーニング (n = 310 人の患者) と検証 (n = 154 人の患者) のために 2 つの独立した放射線コホートを使用しました。 ウィルコクソン検定に基づく特徴選択法 WLCX (安定性 = 0.84 ± 0.05、AUC = 0.65 ± 0.02) および分類法ランダム フォレスト RF (RSD = 3.52%、AUC = 0.66 ± 0.03) が、高い安定性を備えた最高の予後性能を備えていることを確認しました。データの混乱。 私たちの変動分析では、分類方法の選択がパフォーマンス変動の最も主要な原因であることが示されました (分散全体の 34.21%)。 ラジオミクス応用に最適な機械学習方法の特定は、安定した臨床関連のラジオミクスバイオマーカーに向けた重要なステップであり、臨床現場で腫瘍の表現型特性を定量化およびモニタリングする非侵襲的な方法を提供します。

「プレシジョン オンコロジー」とは、個々の患者に合わせて実践や治療が調整されるがん治療のカスタマイズを指します。 このようなカスタマイズ プロセスにより、副作用を最小限に抑えながら、予防および治療介入の成功を最大限に高めることができます。 精密腫瘍学関連の研究のほとんどは、ゲノミクスベースのアプローチを使用した腫瘍の分子特性評価に集中しており、腫瘍生検による組織抽出が必要です。 いくつかのゲノミクスベースのアプローチが臨床腫瘍学に適用されて成功していますが 1、生検ベースのアッセイには固有の制限があります。 腫瘍は空間的および時間的に不均一であり、腫瘍の分子的不均一性を把握するには、患者のリスクを高める反復腫瘍生検が必要になることがよくあります。 生検ベースのアッセイに関連するこれらの倫理的および臨床的課題は、臨床腫瘍学におけるがんの診断と病期分類の日常的な実践である医用画像処理によって対処できます。 生検とは異なり、医療画像処理は非侵襲的であり、腫瘍内の不均一性を含む腫瘍表現型全体に関する情報を提供できます。 さらに、高解像度画像取得機械と計算ハードウェアの最近の進歩により、腫瘍表現型の特徴を詳細かつ効率的に定量化できるようになりました。 したがって、医用画像処理は、高精度腫瘍学にとって前例のない機会を提供します。

新興の有望な分野である「ラジオミクス」は、医療画像が腫瘍の生理機能に関する重要な情報を提供し、それをがん診断の強化に利用できる可能性があると仮説を立てています2。 多数の定量的な画像特徴を抽出およびマイニングすることにより、腫瘍表現型の包括的な定量化を提供します3。 いくつかの研究では、さまざまな臨床設定における予後または予測能力と信頼性の観点から、さまざまな放射線学的特徴が調査されています4、5、6、7、8、9、10。 さまざまな研究で、腫瘍の組織学 6、腫瘍のグレードまたはステージ 11、および臨床転帰 8、12、13 の層別化における放射線学的特徴の識別能力が示されています。 さらに、いくつかの研究では、放射線学的特徴と基礎となる遺伝子発現パターンとの関連性が報告されている8、14、15。

「機械学習」は、パフォーマンスの向上や正確な予測を行うために経験 (データ) を使用する計算手法/モデルとして広く定義できます 16。 これらのプログラム可能な計算方法はデータから「学習」できるため、予測プロセスを自動化および改善できます。 高精度、信頼性、効率性を備えた予測モデルと予後モデルは、ラジオミクスの成功を推進する重要な要素です。 したがって、ラジオミクスベースの臨床バイオマーカーについては、さまざまな機械学習モデルを比較することが不可欠です。 他の高スループット データ マイニング分野と同様に、ラジオミクスも次元の呪いの根底にあり 17、適切な特徴選択戦略によって対処する必要があります。 さらに、特徴の選択は、モデルの過剰適合を減らす (一般化可能性を高める) のにも役立ちます。 したがって、ラジオミクス特徴空間の次元を削減し、ラジオミクスベースの予測モデルのパフォーマンスを向上させるためには、さまざまな特徴選択方法 18 を徹底的に調査する必要があります。 しかし、ラジオミクスは新興の研究分野であるため、発表された研究のほとんどは、さまざまな特徴選択や予測モデリング手法の比較に重点を置くことなく、ラジオミクス特徴の予測能力を評価するだけでした。 ラジオミクスに基づく臨床予測に対するさまざまな特徴選択および機械学習分類法の影響を調査した最近の研究はわずか 19,20 ですが、サンプルサイズは限られています。 さらに、これらの研究には結果の独立した検証が欠けており、結論の一般化可能性が制限される可能性があります。

この研究では、ラジオミクスに基づいた生存予測のための機械学習アプローチの大規模なパネルを調査しました。 14 の特徴選択方法と 12 の分類方法を、予測パフォーマンスとデータの摂動に対する安定性の観点から評価しました。 これらの方法は、文献で人気があるため選択されました。 さらに、報告されたパラメーター構成とともに公開されている実装が分析に使用され、これらのメソッドの公平な評価が保証されました。 トレーニングと検証には 2 つの独立した肺がんコホートが使用され、合計 464 人の患者の画像データと臨床転帰データが使用されました。 特徴選択と予測モデリングは、高スループットのデータ駆動型ラジオミクスの重要な構成要素と見なされます。 したがって、私たちの調査は、ラジオミクスに基づく予測研究のための最適な機械学習アプローチの特定に役立つ可能性があり、臨床腫瘍学における非侵襲的で費用対効果の高いラジオミクスの応用を強化できる可能性があります。

合計 440 の放射性特徴が分析に使用されました。 これらの放射線特徴は CT 画像上の腫瘍の表現型特徴を定量化し、I) 腫瘍強度、II) 形状、III) テクスチャ、IV) ウェーブレット特徴の 4 つの特徴グループに分類されます。 腫瘍強度ベースの特徴は強度ヒストグラムの一次統計を推定するのに対し、形状特徴は腫瘍の 3D 幾何学的特性を記述します。 グレーレベル共起 (GLCM)21 およびランレングス行列 (GLRLM)22 から導出されたテクスチャー特徴は、腫瘍内の不均一性を定量化しました。 これらのテクスチャ特徴は、13 方向すべての値を平均することによって計算されました。 ウェーブレット特徴は、強度とテクスチャ特徴の変換されたドメイン表現です。 これらの特徴は、コイルレット ウェーブレット変換を使用して、元の画像のさまざまなウェーブレット分解に基づいて計算されました。 画像解析には Matlab R2012b (The Mathworks、Natick、MA) を使用しました。 ラジオミクスの特徴は、社内で開発したラジオミクス画像解析ソフトウェアによって自動的に抽出されました。このソフトウェアは、医療画像の前処理に CERR (放射線治療研究のための計算環境)23 と Matlab の適合バージョンを使用しています。 すべての放射性特徴の数学的定義と抽出方法は、以前に説明されています8。

この研究では、オランダの 2 つの異なる施設からの 2 つの NSCLC コホートを採用しました: (1) 肺 1: マーストリヒトの MAASTRO クリニックで治療を受けた NSCLC 患者 422 人。 (2) 肺 2: ナイメーヘンのラドボウド大学医療センターで治療を受けた NSCLC 患者 225 人。 対象となった患者全員について、CT スキャン、手動による描写、臨床データが利用可能でした。 含まれるデータセットの詳細については、補足-A で説明されています。 2 年のカットオフタイムを使用して、打ち切りされた連続生存データを二分化しました。 カットオフ時間を超えて生存した患者は 1 とラベル付けされ、死亡した患者は 0 とラベル付けされました。研究の目的は、ラベル付けされたこれら 2 つの生存クラスに患者を階層化することでした。 NSCLC 患者の適切な生存期間は 2 年と考えられており、他のいくつかの研究では 2 年の生存カットオフを使用して予測モデルを設計しています 24,25,26。 追跡期間が2年未満の患者は除外した。 その結果、トレーニングコホート (肺 1) には 310 人の患者が、検証コホート (肺 2) には 154 人の患者が含まれました。 すべての特徴は、Z スコア正規化を使用して正規化されました。

分析では、フィルター アプローチに基づく 14 の特徴選択方法が使用されました (Fisher スコア (FSCR)、Relief (RELF)、T スコア (TSCR)、カイ 2 乗 (CHSQ)、Wilcoxon (WLCX)、ジニ指数 (GINI)、相互情報最大化 (MIM)、相互情報機能選択 (MIFS)、最小冗長性最大関連性 (MRMR)、条件付き情報最大特徴抽出 (CIFE)、結合相互情報量 (JMI)、条件付き相互情報量最大化 (CMIM)、インタラクション キャッピング (ICAP) )、二重入力対称関連性 (DISR))。 この原稿の読みやすさを向上させるために、特徴選択方法に関連するすべての頭字語を表 1 に定義しました。これらの方法を選択したのは、主に文献での人気、単純さ、計算効率のためです。 さらに、これらのメソッドは公的に利用可能な実装が容易に利用できるため、再利用性が向上します。 フィルター メソッドは、スコア基準を使用して機能をランク付けする機能ランク付けメソッドです。 すべてのフィルターベースの特徴選択方法は、単変量方法と多変量方法の 2 つのカテゴリに分類できます。 単変量手法の場合、スコア基準は特徴の冗長性を無視して特徴の関連性のみに依存しますが、多変量手法では特徴内の多変量の相互作用が調査され、スコア基準は特徴の関連性と冗長性の加重合計になります。 特徴の関連性は、特徴とターゲット/結果変数の関連性の尺度ですが、特徴の冗長性は、すでに選択されている特徴のセットに関して特定の特徴に存在する冗長性の量です。 特徴選択問題の理論的定式化と使用される各特徴選択方法に関する詳細な説明は、オンラインのSupplementary-Bから入手できます。

機械学習では、分類は、ラベル付きトレーニング データから関数を推測する教師あり学習タスクとして考慮されます16。 トレーニング データは一連の例で構成され、各例は入力ベクトル (特徴) と目的の出力値 (ターゲットまたはカテゴリ ラベル) のペアとして表されます。 分類アルゴリズム (分類器) はトレーニング データを分析し、まだ見ぬ観測のラベルを予測するために使用できる仮説 (関数) を推論します。 コンピューターサイエンスと統計のさまざまな分野に属する多くの分類器が、機械学習の文献で提案されています29。 私たちの研究では、12 の分類子ファミリー (バギング (BAG)、ベイジアン (BY)、ブースティング (BST)、決定木 (DT)、判別分析 (DA)、一般化線形モデル (GLM)) から派生した 12 の機械学習分類子を使用しました。 、多重適応回帰スプライン (MARS)、最近傍 (NN)、ニューラル ネットワーク (Nnet)、部分最小二乗回帰および主成分回帰 (PLSR)、ランダム フォレスト (RF)、およびサポート ベクター マシン (SVM))。 分類子に関連する頭字語は表 1 で定義されています。すべての分類子は R パッケージ caret30 を使用して実装されました。これは、R の多くの機械学習アルゴリズムにアクセスするための優れたインターフェイスを提供します。さらに、さまざまな機械をトレーニングするための使いやすいフレームワークも提供します。学習モデル。 分類子は、トレーニング コホート (Lung1) の繰り返し (3 回反復) 10 倍交差検証を使用してトレーニングされ、その予測パフォーマンスは検証コホート (Lung2) で ROC 曲線下面積 (AUC) を使用して評価されました。 我々は、179 の分類器と 121 の異なるデータセットの包括的な比較研究において、Fernandez-Delgado らによって以前に定義されたパラメータ構成を使用しました31。 オンラインの Supplementary-C には、分類方法とそのパラメーターおよび対応する R パッケージをリストしました。

さまざまな特徴選択および分類方法を調査および比較するために、分析用の 3 次元パラメーター グリッドを作成しました。 14 の特徴選択方法のそれぞれについて、5 から 50 までの範囲の特徴を 5 特徴ごとに段階的に選択しました (n = 5、10、15、20、…、50)。 次に、選択された特徴のこれらのサブセットが、12 の機械学習分類器と ROC 曲線下面積 (AUC) のそれぞれを使用して評価されました。

特徴選択法の安定性を評価するために、ハード データ摂動設定 33 の下で Yu ら 32 によって提案された安定性測定を使用しました。 手法の安定性を、トレーニング コホート (Lung1) の重複しない 2 つのパーティション (サイズ N/2) に適用した場合に、同じ特徴選択手法によって得られた結果間の類似性として定量化しました。 結果として得られる 2 つの特徴セット間の類似性を計算するために、重み付けされた完全な 2 部グラフが構築されました。ここで、2 つのノード セットは、選択された 2 つの特徴セットに対応します。 エッジの重みは、ノードのフィーチャ間の絶対スピアマン相関係数として割り当てられました。 次に、ハンガリーのアルゴリズム 34 を適用して 2 つのノード セット間の最大の重み付きマッチングを特定し、類似性 (安定性) を最終的なマッチング コストとして定量化しました。 各特徴選択方法について、ブートストラップ アプローチを使用して安定性を 100 回計算し、結果の中央値 ± 標準値を報告しました。

分類器の経験的な安定性は、相対標準偏差 (RSD %) とブートストラップ アプローチを使用して定量化されました。 まず、Wilcoxon ベースの特徴選択手法 WLCX を使用して 30 の代表的な特徴を選択し、それらを使用して分類器の安定性を計算しました。 各分類方法について、サブサンプリングされたトレーニング コホート (サイズ N/2) でモデルをトレーニングし、AUC を使用して検証コホートでのパフォーマンスを検証しました。 トレーニング コホートのサブサンプリングは、ブートストラップ アプローチを使用して 100 回実行されました。 RSD は変動係数の絶対値であり、多くの場合パーセンテージで表されます。 ここでは次のように定義されました

ここで、 と はそれぞれ 100 AUC 値の標準偏差と平均です。 分類器の場合のより高い安定性は、より低い RSD 値に対応することに注意してください。

信頼性が高く正確な方法を特定するために、AUC と安定性の中央値を閾値として使用しました。 AUC と安定性に基づいて 2 つのランク リストを作成し、精度と信頼性が高い方法として挙げ、両方のランク リストの上位半分にランクされました。 安定性 ≥0.735 (すべての特徴選択法の安定性中央値) および AUC ≥ 0.615 (すべての特徴選択法の AUC 中央値) を持つ特徴選択法は、信頼性が高く正確な方法とみなされます。 同様に、RSD ≤ 5.97 (すべての分類子の RSD 中央値) および AUC ≥ 0.61 (すべての分類子の AUC 中央値) を持つ分類方法は、信頼性が高く正確なものとみなされます。

ラジオミクスに基づく生存予測の予測に影響を与える可能性がある主な実験要素は 3 つあります。それは、特徴選択方法、分類方法、選択された特徴の数です。 多因子分散分析を使用して、これらの因子およびそれらの相互作用によって寄与される AUC スコアの変動を定量化しました。 各要因による変動を比較するために、推定された分散成分を合計分散で割りました。

すべての解析は、R ソフトウェア (R Core Team、オーストリア、ウィーン) バージョン 3.1.2 および Matlab R2012b (The Mathworks、マサチューセッツ州ナティック) と Windows 7 を使用して行われました。

予後放射線バイオマーカーの機械学習アプローチを調査するために、2 つの独立した NSCLC コホートの治療前 CT 画像のセグメント化された腫瘍領域から合計 440 個の放射線特徴が抽出されました。 特徴の選択と分類のトレーニングはトレーニング コホート Lung1 (患者 n = 310) を使用して行われ、検証コホート Lung2 (患者 n = 154) は予測パフォーマンスの評価に使用されました [図 1 を参照]。

合計 440 の放射線特徴が、464 人の NSCLC 患者の治療前の CT 画像のセグメント化された腫瘍領域から抽出されました。

特徴の選択と分類のトレーニングはトレーニング コホート Lung1 (n = 310) を使用して行われ、Lung2 (n = 154) コホートは検証コホートとして使用されました。

さまざまな特徴選択および分類方法の予測パフォーマンスは、受信者オペレーター特性曲線下面積 (AUC) を使用して評価されました。 図 2 は、選択された 30 個の特徴 (特徴選択の結果、上位 30 個の特徴) を使用した特徴選択 (行) と分類方法 (列) のパフォーマンスを示しています。 各分類方法には、14 の異なる特徴選択方法に対応する 14 の AUC 値があります。 分類器の代表的な AUC として、14 個すべての AUC 値の中央値を使用しました。 同様に、各特徴選択方法について、12 個の AUC (12 個の分類方法に対応) の中央値が代表 AUC として使用されます。 分類および特徴選択方法の代表的な AUC 値を表 2 に示します。分類方法では、ランダム フォレスト (RF) が最高の予測パフォーマンス (AUC: 0.66 ± 0.03) (中央値 ± 標準) を示したのに対し、デシジョン ツリー (DT) は ( AUC: 0.54 ± 0.04) は最も低い予測性能を示しました。 特徴選択方法に関する限り、ウィルコクソン検定に基づく方法 WLCX は最高の予測性能 (AUC: 0.65 ± 0.02) を示しましたが、方法 CHSQ (AUC: 0.60 ± 0.03) および CIFE (AUC: 0.60 ± 0.04) の中央値が最も低かったです。 AUC。 選択した特徴の数 (範囲 5 ~ 50) を変更して、上記の実験を繰り返しました。 10、20、40、および 50 の代表的な (上位にランク付けされた) 特徴に対応する結果は、オンラインの補足図 S1、S2、S3、および S4 に報告されます。 さらに、各実験要素 (特徴選択方法、分類方法、および選択された特徴の数) の中央値 AUC 値が、オンラインの補足図 S5、S6、および S7 のヒートマップによって示されます。 ここでも、ランダム フォレスト (RF) (分類子) とウィルコクソン テストに基づく手法 WLCX (特徴選択) が、ほとんどのケースで最も高い AUC 中央値を示しました。

特徴選択 (行) および分類 (列) 方法の予測パフォーマンス (AUC) を示すヒートマップ。

多くの場合、RF、BAG、BY 分類法と特徴選択法 WLCX、MRMR、MIFS が比較的高い予測パフォーマンスを示すことがわかります。

我々は、ハードデータ摂動設定を使用したデータリサンプリングに対する安定性の観点から、特徴選択方法を評価しました33。 MIM が最も安定した方法 (安定性 = 0.94 ± 0.02) (中央値 ± 標準)、次に RELIEF (安定性 = 0.91 ± 0.05)、WLCX (安定性 = 0.84 ± 0.05) であったのに対し、GINI (安定性 = 0.68 ± 0.10) であることが観察されました。 、JMI (安定性 = 0.68 ± 0.05)、CHSQ (安定性 = 0.69 ± 0.09)、DISR (安定性 = 0.69 ± 0.05)、および CIFE (安定性 = 0.69 ± 0.05) は比較的低い安定性を示しました [表 2]。

分類法の経験的安定性は、相対標準偏差 (RSD) とブートストラップ アプローチを使用して定量化されました。 BY が最も安定した分類方法 (RSD = 0.86%) であり、次に GLM (RSD = 2.19%)、PLSR (RSD = 2.24%)、RF (RSD = 3.52%) であることがわかりました。 BST は AUC スコアの相対標準偏差が最も高く (RSD = 8.23%)、したがって分類方法の中で安定性が最も低くなりました。 12 個すべての分類子に対応する RSD (%) 値を表 2 に示します。

図 3 の散布図は、安定性と予測パフォーマンスを評価します。 特徴選択方法 WLCX (安定性 = 0.84 ± 0.05、AUC = 0.65 ± 0.02)、MIFS (安定性 = 0.8 ± 0.03、AUC = 0.63 ± 0.03)、MRMR (安定性 = 0.74 ± 0.03、AUC = 0.63 ± 0.03) および FSCR (安定性 = 0.78 ± 0.08、AUC = 0.62 ± 0.04) は、その安定性と予測パフォーマンスがすべての特徴選択方法の対応する中央値 (安定性 = 0.735、AUC = 0.615) よりも高かったため、推奨されるべきです。 分類方法も同様に、RF (RSD = 3.52%、AUC = 0.66 ± 0.03)、BY (RSD = 0.86%、AUC = 0.64 ± 0.05)、BAG (RSD = 5.56%、AUC = 0.64 ± 0.03)、GLM (RSD) = 2.19%、AUC = 0.63 ± 0.02) および PLSR (RSD = 2.24%、AUC = 0.63 ± 0.02) の安定性と予測性能は、対応する中央値 (RSD = 5.93%、AUC = 0.61) よりも高かった。

特徴選択 (FS) (左) と分類方法 (CF) (右) の安定性と予測パフォーマンス (AUC) の間の散布図。

安定性 ≥0.735 (FS の安定性中央値) および AUC ≥ 0.615 (FS の AUC 中央値) を持つ特徴選択方法は、信頼性の高い予測方法とみなされます。 同様に、RSD ≤ 5.97 (CF の RSD 中央値) および AUC ≧ 0.61 (CF の AUC 中央値) を持つ分類方法は、信頼性が高く正確なものとみなされます。 信頼性の高い予測手法は灰色の四角い領域に表示されます。

3 つの実験要因 (特徴選択方法、分類方法、および選択された特徴の数) の効果を定量化するために、AUC スコアに対して多因子分散分析 (ANOVA) を実行しました。 私たちは、3 つの実験パラメーターすべてとその相互作用が、予測パフォーマンスに影響を与える重要な要因であることを観察しました [図 5]。 4]。 分類方法は、AUC スコアの合計分散の 34.21% を説明するため、変動の最も主要な原因でした。 特徴の選択は 6.25% を占めましたが、分類器と特徴の選択の相互作用は変動全体の 23.03% を説明しました。 選択された (代表的な) 特徴サブセットのサイズは、総分散の 1.65% のみを共有していました [図 2]。 4]。

実験要因とその相互作用によって説明される AUC の変動。

分類方法が変動の最も支配的な原因であることがわかります。 選択された (代表的な) 特徴サブセットのサイズが、合計分散の最小値を共有しました。

医療画像は、臨床腫瘍学において日常的に使用され、簡単にアクセスできる情報源です。 非侵襲的で費用対効果の高いがん診断ツールとして機能します。 ラジオミクスは、がん治療のカスタマイズに医療画像データを利用し、高精度腫瘍学に新たな有望な側面を追加します 2,3,8。 さらに、腫瘍学において重要なバイオマーカーと考えられることが多い腫瘍内の不均一性も捕捉できます 12、35、36、37。 多くの研究により、さまざまな臨床因子(腫瘍の悪性度、生存転帰、治療反応など)に対するラジオミクスに基づく予測モデルが構築されています12。 ラジオミクスに基づく予測分析を成功裏に実現するには、さまざまな特徴選択および予測モデリング手法を評価および比較する必要があり、これがこの研究の主な目的でした。

高スループットのデータ マイニング問題には、さまざまな特徴選択方法が採用されています 38。 一般に、特徴選択方法は、(1) フィルター方法、(2) ラッパー方法、および (3) 埋め込み方法の 3 つの主要なカテゴリに分類されます。 この研究では、ラジオミクスに基づいた生存予測のための 14 の異なるフィルターベースのアプローチを調査しました。 フィルターベースのアプローチのみを使用しました。これは、フィルターベースのアプローチがラッパーや埋め込みメソッドよりも計算効率が高く、オーバーフィッティングの傾向が低いためです18、27。 さらに、ラッパー メソッドや埋め込みメソッドとは異なり、フィルター メソッドは分類子に依存しません。 したがって、予測分析のモデリングと特徴選択コンポーネントを分離できるため、各コンポーネントの一般化可能性が高まり、分析全体が向上します。

また、12 の異なる分類子ファミリーに属する 12 の機械学習分類方法も調査しました。 機械学習の文献では多くの分類器が提案されています。 理論的に言えば、これらの分類器はコンピューター サイエンスと統計の異なる分野 (分類器ファミリー) に属します。 したがって、すべての分類器の基礎となる仮定を理解し、偏りのない方法でパラメーターを調整することは、実際には困難になる可能性があります。 パラメーターの調整は、一部の分類子に関するユーザーの専門知識が他の分類子よりも高い (または不足している) ことによって偏る可能性があります。 通常、新しい分類器を提案する研究では、それを他の分類器ファミリーを除く同じファミリーの参照分類器とのみ比較します。 異なるファミリーに属する分類器が比較のために考慮される場合でも、これらの参照分類器は通常、提案された分類器を慎重に調整しながら、単純なツールと限られたパラメーター構成を使用して実装されます。 これらは結果として、提案された分類器を優先して結果を偏らせる可能性があります31。 私たちの研究では、新しい分類子は提案しておらず、すべての分類子に同じ実装ツール (R パッケージ キャレット) を使用しました。 さらに、分類器の公平な使用を保証するために、121 の異なるデータセットにわたって 179 の分類器を比較する徹底的な研究において、Fernandez-Delgado らによって以前に定義されたパラメータ構成を使用しました 31。 これらのパラメーター構成は文献から選択され、さまざまな分野に属する多数 (121) のデータセットで以前に検証されています。 さらに、私たちの研究では、トレーニング データのみの繰り返し相互検証を使用してパラメーターを調整しました。 したがって、私たちの実験計画により、さまざまな分類方法を公平な方法で評価することができました。

私たちの結果は、ウィルコクソン テスト ベースの特徴選択手法 WLCX が、大部分の分類器で最高の予測パフォーマンスをもたらすことを示しています。 興味深いことに、WLCX はランクに基づく単純な単変量手法であり、特徴のランク付け中に選択された特徴の冗長性が考慮されていません。 ほとんどの特徴選択方法は、ランダム フォレスト (RF) 分類器と併用した場合に最高の予測パフォーマンスをもたらしました。 パラメーター構成が異なると、分類法のパフォーマンスがさらに向上する可能性があると主張する人もいます。 予測パフォーマンスの改善を評価するために、徹底的なパラメーター調整を調査できます。 ただし、必要な計算リソースと高い時間の複雑さが、徹底的な検索を妨げる可能性があります。 私たちは、さまざまな臨床転帰や同様の分析枠組みに焦点を当てた将来の放射線医学研究により、この点についてより良い理解が得られると期待しています。 限られた数のメソッドは、さまざまなラジオミクス研究にわたって一貫して高いパフォーマンスを示しており、徹底的なパラメータ調整によってさらに評価できる可能性があります。 それにもかかわらず、ランダム フォレスト (RF) は、他のいくつかの生物医学および他の分野のアプリケーションでも同様に高い予測パフォーマンスを示していることに注意する必要があります 31。 これらの結果は、WLCX 特徴選択方法や RF 分類方法を選択すると、ラジオミクスの予測パフォーマンスが向上することを示しています。

安定性解析に関連する結果は、特徴の選択と分類方法を選択するための別の側面を提供します。 アプリケーションによっては、予測パフォーマンスや安定性を重視し、必要な方法を選択する場合があります。 多因子 ANOVA に関連した結果は、分類方法が予測パフォーマンス (AUC) の変動の最も主要な原因であるため、慎重に選択する必要があることを示しました。 選択された特徴サブセットのサイズは、AUC の合計変動に最も寄与しませんでした。

ラジオミクスに基づく臨床予測のためのさまざまな特徴選択および機械学習モデリング方法を調査および比較した研究はわずかです19、20。 最近、Hawkins ら 19 は、NSCLC 患者の CT ベースの生存予測のための 4 つの異なる特徴選択および分類方法を比較しました。 ただし、最終結果が得られたのはわずか 40 人の患者であったため、この研究はコホート サイズが小さいことによって制限されました。 さらに、結果の独立した検証も欠けていました。 それどころか、サイズ 310 と 154 の患者の 2 つの独立した放射線コホートが分析に使用され、結果の独立した検証が報告されました。

私たちのラジオミクス解析は、NSCLC 患者の 2 年生存率の予測に焦点を当てています。 これは、特徴の選択と分類のさまざまな機械学習方法の公平な評価を提供します。 これは、将来のラジオミクスに基づく予測研究の参考として考慮される可能性があります。 我々の結果は、ウィルコクソン検定に基づく特徴選択法 WLCX および/またはランダム フォレスト (RF) 分類法を選択すると、ラジオミクスに基づく生存予測で最高のパフォーマンスが得られることを示しました。 さらに、これらの方法はデータの摂動に対してかなり安定していることが判明したため、ラジオミクスに基づく予測研究に適している可能性があります。 これらの結果は、異なる画像診断法および異なる種類のがんを使用した、他のラジオミクスに基づく予測研究でさらにテストされる必要があります。

NSCLC 患者については、患者の腫瘍と治療の特徴に基づく統計モデルの方が、人間の専門家よりも大幅に優れた予測を提供することが以前に示されています 24。 さらに、他のいくつかの研究は、末期癌患者に対する医師の予後予測能力の限界を浮き彫りにしている 39,40,41。 人間の専門家の予測は、観察者間のばらつきの影響を受ける可能性があります。 逆に、パラメータ構成とトレーニング フレームワークが固定されている場合、統計モデルは予測システムをより決定論的にすることができます。

ラジオミクスに基づく予後モデルの潜在的な臨床的有用性は、以前の研究で述べられています8。 ラジオミクスのコホートと特徴の次元が拡大することで、将来のラジオミクス研究における予測パフォーマンスの向上が期待されます。 さらに、標準的な臨床共変量と組み合わせたラジオミクスとゲノミクスのような統合研究も、予測性能を即興で向上させ、臨床現場でのこれらの方法の有用性をさらに検証する可能性があります。 全体として、私たちの分析は、ラジオミクスに基づく臨床予測の強化に向けて一歩前進したものです。

この記事を引用する方法: Parmar, C. et al. 定量的放射性バイオマーカーのための機械学習手法。 科学。 議員 5、13087; 土井: 10.1038/srep13087 (2015)。

Doroshow, J. & Kummar, S. 腫瘍学におけるトランスレーショナル研究 - 10 年間の進歩と将来の展望。 ナット。 クリン牧師。 オンコル。 11、649 (2014)。

記事 CAS Google Scholar

ランビン、P.ら。 放射線腫瘍学の結果の予測 - 多要素意思決定支援システム。 ナット。 クリン牧師。 オンコル。 10、27–40 (2013)。

記事 Google Scholar

ランビン、P.ら。 ラジオミクス: 高度な特徴分析を使用して医療画像からより多くの情報を抽出します。 ユーロ。 J. of Cancer 48、441–446 (2012)。

記事 Google Scholar

Coroller、TP et al. CT ベースの放射線サインは肺腺癌の遠隔転移を予測します。 ラジオテ。 オンコル。 (2015)、http://dx.doi.org/10.1016/j.radonc.2015.02.015 (2015)。

クック、GJら。 非小細胞肺がんにおける治療前の 18F-FDG PET 腫瘍組織の特徴は、化学放射線療法後の反応および生存と関連していますか? J.Nucl. 医学。 54、19–26 (2013)。

記事 Google Scholar

ガネーシャン、B.ら。 非小細胞肺がん: CT における組織病理学的パラメータは組織学的に相関します。 放射線学 266、326–336 (2013)。

記事 Google Scholar

Gevaert, O. et al. 多形神経膠芽腫: 定量的画像特徴を使用した探索的放射性ゲノム分析。 放射線学 273、168–174 (2014)。

記事 Google Scholar

アーツ、HJら。 定量的ラジオミクスアプローチを使用した非侵襲的イメージングによる腫瘍の表現型の解読。 ナット。 共通。 5 (2014)。

Leijenaar、RT et al. FDG-PET ラジオミクス機能の安定性: 検査と再検査および観察者間のばらつきの統合分析。 アクタ・オンコル。 52、1391–1397 (2013)。

記事 CAS Google Scholar

Parmar, C. et al. 堅牢なラジオミクス機能は、半自動体積セグメンテーションを使用した定量化を備えています。 PLOS ONE 9、e102107 (2014)。

記事 ADS Google Scholar

Ganeshan, B.、Abaleke, S.、Young, RC、Chatwin, CR & Miles, KA 非造影コンピューター断層撮影法による非小細胞肺がんの組織解析: 腫瘍のグルコース代謝および病期との関係に関する最初の証拠。 がんイメージング 10、137 (2010)。

記事 Google Scholar

Alic, L.、Niessen, WJ & Veenland, JF 腫瘍画像におけるバイオマーカーとしての不均一性の定量化: 系統的レビュー。 PLOS ONE 9、e110300 (2014)。

記事 ADS Google Scholar

ジェイン、R.ら。 画像バイオマーカー、臨床バイオマーカー、およびゲノムバイオマーカーを使用した神経膠芽腫患者の転帰予測: 腫瘍の非増強成分に焦点を当てます。 放射線学 272、484–493 (2014)。

記事 Google Scholar

Nicolasjilwan, M. et al. MR 画像機能と遺伝的バイオマーカーの追加により、TCGA 患者における膠芽腫の生存予測が強化されます。 J. Neuroradiol. (2014)、10.1016/j.neurad.2014.02.006。 (2014年)。

シーガル、E.ら。 非侵襲的イメージングによる肝がんにおける全体的な遺伝子発現プログラムの解読。 ナット。 バイオテクノロジー。 25、675–680 (2007)。

記事 CAS Google Scholar

Mohri, M.、Rostamizadeh, A.、Talwalkar, A. 機械学習の基礎。 Ch. 1、1–3、(MIT プレス、2012)。

Google スカラー

Pękalska, E. & Duin, RP パターン認識の相違表現: 基礎と応用。 Vol. 64 (ワールドサイエンティフィック、2005)。

Guyon, I. & Elisseeff, A. 変数と特徴の選択の概要。 J.マッハ。 学ぶ。 解像度 3、1157–1182 (2003)。

数学 Google Scholar

ホーキンス、SH et al. CT 画像特徴を使用した非小細胞肺がんの転帰の予測。 IEEE Access 2、1418–1426 (2014)。

記事 Google Scholar

Basu, S. et al. 2011 年の IEEE 国際会議、システム、人間、サイバネティクス (SMC) で受賞。 1306 ~ 1312 (IEEE)。

haralick, RM、Shanmugam, K. & Dinstein, IH 画像分類のためのテクスチャ特徴。 IEEEトランス。 システム、マンサイバーン。 6、610–621 (1973)。

記事 Google Scholar

Galloway, MM グレーレベルランレングスを使用したテクスチャ分析。 計算します。 ビジョングラフ。 4、172–179 (1975)。

Google スカラー

Deasy、JO、Blanco、AI & Clark、VH CERR: 放射線療法研究のための計算環境。 医学。 物理学。 30、979–985 (2003)。

記事 Google Scholar

オベリジェ、C. et al. 肺がん患者の治療結果について医師の予測とモデルを比較した前向き研究:個別化されたケアと共有された意思決定への一歩。 ラジオテ。 オンコル。 112、37–43 (2014)。

記事 Google Scholar

Hoang, T.、Xu, R.、Schiller, JH、Bonomi, P. & Johnson, DH 東部協同組合に基づく第 3 世代化学療法レジメンで治療された進行性非小細胞肺がんの化学療法治療を受けていない患者の生存を予測する臨床モデル腫瘍学グループのデータ。 J.クリン. オンコル。 23、175–183 (2005)。

記事 CAS Google Scholar

シスタロ、A. et al. 18F-FDG PET/CT SUV quantifica を利用した、ステージ I および II の非小細胞肺がん患者の 2 年生存率の予測。 ラジオル。 オンコル。 47、219–223 (2013)。

記事 Google Scholar

ブラウン、G.、ポーコック、A.、チャオ、M.-J. & Luján, M. 条件付き尤度の最大化: 情報理論的な特徴選択のための統一フレームワーク。 J.マッハ。 学ぶ。 解像度 13、27–66 (2012)。

MathSciNet MATH Google Scholar

Zhao、Z.ら。 特徴選択の研究を進めています。 ASU 機能選択リポジトリ (2010)。

コツィアンティス、ソティリス B.、イオアニス、D. ザハラキス、パナイオティス、E. ピンテラス。 機械学習: 分類と結合技術のレビュー。 アーティフ。 知性。 改訂 26.3、159–190 (2006)。

記事 Google Scholar

Kuhn, M. キャレット パッケージを使用して R で予測モデルを構築します。 J.Stat. ソフトウェア。 28、1–26 (2008)。

記事 Google Scholar

Fernández-Delgado, M.、Cernadas, E.、Barro, S.、Amorim, D. 現実世界の分類問題を解決するには何百もの分類器が必要ですか? J.マッハ。 学ぶ。 解像度 15、3133–3181 (2014)。

MathSciNet MATH Google Scholar

Yu, L.、Ding, C.、Loscalzo, S.、知識発見とデータ マイニングに関する第 14 回 ACM SIGKDD 国際会議の議事録。 803-811 (ACM)。

Haury、A.-C.、Gestraud、P.、Vert、J.-P. 分子シグネチャの精度、安定性、解釈可能性に対する特徴選択方法の影響。 PLOS ONE 6、e28210 (2011)。

記事 CAS ADS Google Scholar

Kuhn, HW 割り当て問題に対するハンガリーの方法。 海軍研究所ロジス。 Q. 2、83–97 (1955)。

記事 MathSciNet Google Scholar

Fisher, R.、Pusztai, L. & Swanton, C. がんの不均一性: 標的治療への影響。 Br. J Cancer 108、479–485 (2013)。

記事 CAS Google Scholar

Ng, C.、Pemberton, H. & Reis-Filho, J. 乳がんの腫瘍内遺伝的不均一性: 原因と影響。 抗がん療法専門家牧師。 12、1021–1032 (2012)。

記事 CAS Google Scholar

Brown, JR、DiGiovanna, MP、Killelea, B.、Lannin, DR & Rimm, DL 乳がんにおける術前化学療法に対する反応を予測するための定量的評価 Ki-67 スコア。 研究室投資する。 94、98–106 (2014)。

記事 CAS Google Scholar

Bolón-Canedo, V.、Sánchez-Maroño, N.、Alonso-Betanzos, A.、Benítez, J. & Herrera, F. マイクロアレイ データセットと適用された特徴選択方法のレビュー。 知らせるサイエンス 282、111–135 (2014)。

記事 Google Scholar

Christakis, NA、Smith, JL、Parkes, CM & Lamont, EB 末期患者における医師の予後の誤差の範囲と決定要因: 前向きコホート研究 解説: なぜ医師は過大評価するのでしょうか? 解説: 予後は直観ではなく実証された指標に基づくべきです。 Bmj 320、469–473 (2000)。

記事 CAS Google Scholar

グレア、P. et al. 末期がん患者における医師の生存予測の体系的レビュー。 Bmj 327、195 (2003)。

記事 Google Scholar

Clément-Duchêne, C.、Carnin, C.、Guillemin, F. & Martinet, Y. 医師は進行性肺がんの患者の生存率をどの程度正確に予測していますか? 腫瘍学者 15、782–789 (2010)。

記事 Google Scholar

リファレンスをダウンロードする

著者らは、国立衛生研究所 (NIH-USA U24CA194354 および NIH-USA U01CA190234)、EU 7th Framework Program (EURECA、ARTFORCE)、リンブルク健康財団の Kankeronderzoekfonds Limburg、およびオランダがん協会 (KWF UM 2009–4454) からの財政的支援を認めています。 、KWF MAC 2013–6425)。

Parmar Chintan と Grossmann Patrick も同様にこの作業に貢献しました。

放射線腫瘍科、

チンタン・パルマー、パトリック・グロスマン、ヒューゴ・JWL・アーツ

米国マサチューセッツ州ボストン、ハーバード大学医学部、ダナ・ファーバー癌研究所、ブリガム・アンド・ウィメンズ病院、放射線科

ヒューゴ JWL アーツ

放射線腫瘍学 (MAASTRO)、マーストリヒト大学、GROW 研究所、マーストリヒト、オランダ

チンタン・パルマル & フィリップ・ランバン

インド統計研究所、機械知能ユニット、コルカタ、インド

チンタン・パルマル

米国マサチューセッツ州ボストンのダナ・ファーバー癌研究所生物統計および計算生物学部門

パトリック・グロスマン & ヒューゴ JWL アーツ

オランダ、ナイメーヘンのラドボウド大学医療センター放射線腫瘍科

ヨハン・ブシンク

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

HJWLA、CP、PG はこのプロジェクトを発案し、データを分析し、論文を執筆しました。 JB と PL は、専門家の指導、データ、または分析ツールを提供し、原稿をレビューしました。

著者らは、競合する経済的利害関係を宣言していません。

この作品は、クリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされています。 この記事内の画像またはその他のサードパーティ素材は、クレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材がクリエイティブ コモンズ ライセンスに含まれていない場合、ユーザーは素材を複製するためにライセンス所有者から許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Parmar, C.、Grossmann, P.、Bussink, J. 他定量的放射性バイオマーカーのための機械学習手法。 Sci Rep 5、13087 (2015)。 https://doi.org/10.1038/srep13087

引用をダウンロード

受信日: 2015 年 4 月 2 日

受理日: 2015 年 7 月 17 日

公開日: 2015 年 8 月 17 日

DOI: https://doi.org/10.1038/srep13087

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

軍事医学研究 (2023)

BMC 消化器科 (2023)

欧州放射線学 (2023)

がん研究および臨床腫瘍学ジャーナル (2023)

日本放射線医学雑誌 (2023)

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。