banner
ニュース センター
専門的な知識を身につけており、有能です。

検索および分類用アプリケーションを使用して、スライド画像全体から RNA 配列発現を予測する方法を学習します

Apr 04, 2023

Communications Biology volume 6、記事番号: 304 (2023) この記事を引用

3463 アクセス

14 オルトメトリック

メトリクスの詳細

ディープラーニング手法は、予後や診断などの臨床課題に対処するためにデジタル病理学に広く適用されています。 最新のアプリケーションの 1 つとして、スライド画像全体から分子の特徴を抽出するためにディープ モデルも使用されています。 分子検査には豊富な情報が含まれますが、多くの場合、費用と時間がかかり、サンプルとして追加の組織が必要になります。 この論文では、画像からバルク RNA シーケンスを予測することと、スライドガラスのスライド全体の画像を表現することの両方を同時に学習できるアテンションベースのトポロジーである tRNAsformer を提案します。 tRNAsformer は、画像に対してピクセルレベルの注釈が利用できない一方で、マルチインスタンス学習を使用して弱教師問題を解決します。 私たちはいくつかの実験を実施し、最先端のアルゴリズムと比較して、より優れたパフォーマンスとより速い収束を達成しました。 提案された tRNAsformer は、生検サンプルの組織形態と分子フィンガープリントを組み合わせることで、新世代の検索および分類方法を促進する計算病理学ツールとして役立ちます。

病理学者は、生検標本を検査した後、組織病理学を使用して癌を診断し、等級付けします。 デジタル病理学の導入、コンピューティング技術の進歩、大規模なデータセットの利用可能性の拡大により、さまざまな臨床タスク向けにますます複雑な深層学習モデルをトレーニングすることが可能になりました。 畳み込みニューラル ネットワーク (CNN) は、深層学習アーキテクチャの中でも、がんのサブタイピング 1、全スライド画像 (WSI) の検索と分類 2、有糸分裂の検出 3、グレーディング 4 などの幅広い臨床アプリケーションにおいて、他のすべての従来のコンピューター ビジョン アルゴリズムを上回りました。

しかし、最近では、画像に埋め込まれた形態学的特徴を分子の特徴に結び付ける試みがいくつか行われている5、6、7、8。 たとえば、最近の研究では、統計モデルが組織形態学的特徴を肺や前立腺などの臓器の突然変異と関連付けることができることが明らかになりました9,10。 突然変異とエピゲノム修飾は、遺伝子発現に大きな変動を引き起こすことが知られています。 したがって、遺伝子発現の特徴付けは、診断と治療にとって極めて重要です11。 遺伝子情報を研究するための、より手頃な価格の全トランスクリプトーム配列決定ツールが確立されているとはいえ、医療センターで広く使用されるまでにはまだ長い道のりがあります 12。 一方、ヘマトキシリン&エオシン(H&E)染色された WSI からの分子特徴の回復は、より迅速で安価なオプションの 1 つです。 WSI を中間モダリティまたは結果として使用して遺伝子発現を予測する機能は、診断と予後を支援することが実証されています 5,8。 これまでの研究では、WSI を使用した遺伝子発現予測に注目が集まっています。 ただし、WSI のサイズと適切に注釈が付けられたデータの量により、依然として深刻な課題が課せられています。 特に、サンプルの選択と WSI の表現は未解決のトピックであり、恣意的に扱われることがよくあります。

最新の世界がん統計報告書によると、2020 年には世界で推定 431,288 人が新たに腎がんに罹患し、179,368 人が死亡しました13。 腎細胞癌 (RCC) は最も一般的な腎臓癌であり、悪性症例の 85% の原因となっています 14。 単一の悪性表現型から不均一な腫瘍グループに至るまで、RCC に関する知識は時間の経過とともに進化してきました 14。 すべての腎細胞癌の組織学的サブタイプの中で、ccRCC、pRCC、および crRCC はそれぞれ、腎細胞癌全体のほぼ 75%、16%、および 7% を占めます 14。 この不均一性の結果として、RCC サブタイプは、その組織学、分子特性、臨床転帰、および治療反応性が異なります。 たとえば、5 年生存率はサブタイプによって異なるため、適切なサブタイプ診断が重要です 15。 この研究のすべての方法は、検索と分類を使用してサブタイプを識別するために RCC スライドに適用されます。

ここでは、エンドツーエンド遺伝子予測と WSI 表現の学習を同時に行う深層学習モデルである tRNAsformer (t-RNAs-former と発音します) を紹介します (図 1 および補足図 1)。 私たちのモデルは、WSI 表現の学習に必要な情報を収集するために、アテンション メカニズムに基づいて構築された変換モジュールを採用しています。 注意ベースのメカニズムにより、画像内の特定の特徴に起因する情報を学習し、他の特徴と比較してスコアを付けることができます。 そうすることで、モデルは、ある特徴が画像内の他の特徴とどのように関連しているかを把握し、画像の関連部分に焦点を当てることができます。 さらに、tRNAsformer は、マルチ インスタンス学習 (MIL)16 の概念を採用して、タイルごとではなく WSI ごとに実際の遺伝子発現値を持つという問題を処理します。 MIL は、トレーニング インスタンスがバッグ (セット) に配置され、バッグ全体にラベルが提供される、弱教師あり学習の形式です。 モデルをトレーニングするために、The Cancer Genome Atlas (TCGA) 公開データセットのデータを使用して腎臓 WSI とそれに関連する RNA-seq データを収集しました。 WSI については、遺伝子予測と内部表現に関する研究結果を発表しました。 最後に、オハイオ州立大学の外部腎臓がんデータセットを使用して、学習された WSI 内部表現の観点からモデルの一般化を最先端のベンチマークと比較してテストしました。

WSI 内の 49 個の空間クラスターから選択されたサイズ 224 × 224 × 3 の 49 個のタイルが DenseNet-121 に埋め込まれます。 DenseNet-121 には最後のプーリング後に 1024 個の深い特徴があるため、結果はサイズ 49 × 1024 の行列になります。 次に、行列は再形成され、224 × 224 の行列に再配置されます。この行列では、各 32 × 32 ブロックが 1 × 1024 のタイル埋め込みに対応します。 b カーネル 32、ストライド 32、および 384 カーネルで 2D 畳み込みを適用すると、各 32 × 32 ブロックは次のようになります。 384 次元のベクトルを線形にマッピングします。 次に、クラス トークンが残りのタイル 埋め込みと連結され、L Encoder レイヤーに入る前に Epos がマトリックスに追加されます。 クラス トークンに関連付けられている結果の最初の行は、分類ヘッドに供給されます。 すべてのタイル エンベディングに関連付けられている残りの内部エンベディングは、遺伝子予測ヘッドに渡されます。 学習可能な変数を含むすべての部分は紫色で表示されます。

このセクションでは、tRNAsformer がトレーニングされた 2 つの主なタスク (WSI からの遺伝子発現予測と、画像検索と分類のための WSI 表現) の観点から、tRNAsformer のパフォーマンスを評価します。 遺伝子発現の予測における tRNAsformer のパフォーマンスは、HE2RNA と呼ばれる最先端モデルの 1 つのパフォーマンスと比較されています。 WSI を表すための豊富な情報を学習するという点での tRNAsformer のパフォーマンスは、他の 2 つの方法、つまり Yottixel と Low Power と比較されています。

この研究では、60,483 個の Ensembl 遺伝子 ID を含む FPKM-UQ ファイルが利用されました 17。 前処理ステップ (「遺伝子発現の前処理」セクションで説明) 中に、遺伝子発現値の一部が選択され、最初に変換されました。

tRNAsformer と HE2RNA の両方のモデルを、3 つの異なる基準、つまり、予測の平均相関係数、ランダムなベースラインよりも有意に良く予測された遺伝子の数、および予測誤差に関して比較しました。 最初の実験では、ピアソン相関係数とスピアマン相関係数を使用して、相関関係が遺伝子ごとに個別に評価されます。 データセットが正規分布している場合、ピアソン相関係数はデータセット間の線形接続を測定します。 ピアソン相関係数は、-1 から +1 まで変化します。 -1 または +1 の相関は、それぞれ完全な線形の負または正の関係を示しますが、相関 0 は相関がないことを示します。 p 値は、相関のないシステムが、これらのデータセットから計算されたものと少なくとも同じくらい高いピアソン相関を持つデータセットを生成できる確率を大まかに表します。 スピアマン相関では、ピアソン相関とは異なり、両方のデータセットが正規分布である必要はありません。 図 2 は、さまざまなモデルによって予測された 31,793 個の遺伝子の相関係数の分布を示しています。

バイオリンの図は、相関係数の分布、最小値、最大値、平均値を示しています。 a はピアソンの相関係数を示すヴァイオリン ダイアグラム、b はスピアマンの相関係数を示すヴァイオリン ダイアグラムです。 バイオリン図は、L = (1、2、4、8、12) および HE2RNAbb1024 の tRNAsformerL についてプロットされています。 相関係数の平均と標準偏差は、バイオリンの凡例に左から右に示されています。

図 1 は、TCGA のテスト セットにおける、さまざまなモデルによって予測された 31,793 個の遺伝子の相関係数の分布とその真の値を示しています。 図 2 に見られるように、平均相関係数 R は、L = 1 から L = 8 まで深さとともに増加しました。平均 R 値は、Transformer エンコーダーの 8 ブロック後に減少し、層の数を増やしても遺伝子発現予測が強化されないことを示唆しています。 予測された遺伝子発現と実際の値の相関関係に関しては、L = 2 から L = 8 までの tRNA モデルは、HE2RNA と比較してわずかに改善されたものの、同等の結果を達成しました。 相関値を超えて、文献ではバイオリンプロット 18、19、20、21 が使用されています。これは、散布図 22 などの他の方法を使用すると、患者あたりのデータポイントの数が多く、解釈可能な手がかりの可視性が大幅に低下するためです。

ピアソンとスピアマンの相関係数と p 値は、各遺伝子の遺伝子発現の予測値と真の値の間で計算されました。 p 値を調整するために、Holm-Šidák (HS) と Benjamini-Hochberg (BH) という 2 つの多重仮説検定法が利用されました。 複数仮説検定の補正後の R 係数の p 値が 0.01 未満の場合、予測はランダムなベースラインとは大きく異なります 23,24。 refに似ています。 5. HS 補正と BH 補正の両方を使用して多重仮説検定を実行しました。 すべてのアーキテクチャの結果を表 1 に示します。

表 1 に示されているように、tRNA フォーマーの深さを 1 から 8 に増やすと、ランダムなベースラインと大きく異なる遺伝子の数が増加します。 図 2 の結果と同様に、深さが Transformer Encoder の 12 ブロックに達すると、遺伝子の数が減少します。 一方、HE2RNA の設計に基づくモデルは、他のほぼすべての tRNA モデルよりもスコアが劣りました (L = 1 を除く)。

予測値と実際の遺伝子発現値の間の誤差を計算するために、MAE、RMSE、および RRMSE25 を選択しました。 MAE、RMSE、RRMSE は次のように定義されます。

ここで、Dtest はテスト セットを表し、(xi, yi) はグラウンド トゥルースを持つ i 番目のサンプル xi \({y}_{i},{\hat{y}}_{i}\) は次の予測値です\({y}_{i},\bar{y}\) はテスト セット内のターゲットの平均値であり、|Dtest| はテスト セット内のターゲットの平均値です。 はテストセット内のサンプル数です。 結果を表 2 に示します。

図 2 および表 1 の結果と同様に、Transformer Encoder ブロックの数を 8 から 12 に増やすと、モデルのパフォーマンスが大幅に低下します。 tRNAsformer によって達成された相関値は、HE2RNA モデルの値に匹敵します。

tRNAsformer モデルと HE2RNA モデルの両方のハイパーパラメーターは、実験を行う前に最適化されました。 HE2RNA は、WSI のすべてのタイルを使用してモデルをトレーニングし、すべてのタイルの予測を生成します。 これは、多数のタイル予測を平均してスライドごとに 1 つの予測を取得する際のエラー率を改善するのに役立ちます。 複数の予測値 (タイル予測) を平均すると、この方法を適用すると、すべての予測の誤り率を平均してすべてのタイルの単一の代表値を取得するような効果が得られるため、実際の値により類似した値が得られる可能性が高くなります。 ただし、HE2RNA のようにタイルごとに遺伝子発現スコアを生成すると、実際の値はタイルごとではなく WSI ごとであるため、WSI のタイル間の依存関係が無視されることになります。 tRNAsformer は、WSI を全体として処理し、WSI ごとに 1 つの予測を生成することでこの問題を解決します。 このモデルは、マルチインスタンス学習の概念を採用して、タイルごとではなく WSI ごとに実際の遺伝子発現値を持つという問題を処理します。 さらに、計算の観点から見ると、単一の WSI には簡単に数千のタイルが含まれる可能性があるため、ネットワークをトレーニングするためにすべてのタイルを考慮すると、法外な時間とリソースが消費されます。 したがって、tRNAsformer では、トレーニング プロセスにアテンション メカニズムと複数インスタンス学習の概念を組み込むことで、この問題に対処しました。

全体として、上記の結果からわかるように、L = 2 ~ 8 の tRNAsformer モデルのパフォーマンスは同等です。 ただし、モデルの評価に使用されるすべてのメトリクスを考慮すると、L = 4 の tRNAsformer が最も優れたパフォーマンスを発揮します。 この論文では、利用可能なリソースに基づいてモデルの深さを選択できるため、さまざまな深さでの tRNAsformer のパフォーマンスを示しています。 たとえば、リソースが限られている場合、より少ないリソース要件でより深いモデルと同等のパフォーマンスを達成できる L = 2 を使用できます。

分類実験は、提案されたモデルによって学習された内部表現の品質を評価するために実行されました。 まず、各 TCGA テスト WSI から 100 個のバッグが作成されました。 補足表 1 によると、WSI が 80 個あったため、TCGA テスト セットから合計 8000 個のバッグが作成されました。 RCC サブタイプを予測するために前のセクションでトレーニングされたのと同じモデルが、分類タスクでも評価されました。 すべてのモデルの精度、マクロ、および加重 F1 スコアを表 3 に示します。さまざまなモデルの混同行列を補足図 2 に示します。ここで報告されるすべての値は、スライド レベルの分類結果に基づいています。 スライド レベルの値を計算するために、すべてのバッグに対して予測が行われます。 各テスト スライドのラベル予測は、そのスライドから作成されたすべてのバッグの中で最も一般的な予測として選択されます。 モデルによって学習された WSI 表現は、PCA を使用して見つかった最初の 2 つの主成分によって作成された平面に投影され、2 次元空間でのモデルの内部表現が描画されます。 2 次元 PCA 投影を補足図 3 に示します。

組織の処理、スライドの準備、およびデジタル化プロトコルの病院の基準と方法が異なるため、WSI の外観は大幅に異なる可能性があります。 結果として、データ ソースを使用して構築されたモデルがデータ ソース固有のバイアスに耐性があり、トレーニング中に使用されなかったソースからの実世界の臨床データに一般化されていることを確認することが重要です26。 トレーニング済みモデルの一般化をテストするために、オハイオ州立大学の 142 個の RCC WSI が独立したテスト コホートとして使用されます (セクション「オハイオ州立大学の腎臓データセット」を参照)。

まず、各外部テスト WSI から 100 個のバッグが作成されました。 補足表 1 によると、WSI が 142 あったため、TCGA テスト セットから合計 14,200 個のバッグが作成されました。 前のセクションで RCC サブタイプを予測するためにトレーニングされたのと同じモデルが、外部データセットの分類結果をレポートするために使用されます。 すべてのモデルの精度、マクロ、および加重 F1 スコアを表 3 に示します。表 3 に示すように、tRNAsformer の精度は、外部検証では約 13% 低下しました。 これらの結果は、特に精度が約 20% 低下した同等のパフォーマンスを考慮すると、依然として妥当なパフォーマンスを示しています。 過学習、バイアス、ショートカットによる一般化の欠如は、深層学習における一般的な問題です 27,28。 ただし、より高度な前処理を適用すると、モデルのパフォーマンスが向上し、外部データセットを使用する際の感度が向上する可能性があります。 モデルのパフォーマンスは、より大きなデータセットでトレーニングすることによっても改善できます。 ただし、再現性を確保するため、TCGA で利用できる WSI の数は制限されています。 さらに、RNA-seq プロファイルが TCGA で利用可能な WSI のみを考慮できます。 さまざまなモデルの混同行列を補足の図4に示します。モデルによって学習されたWSI表現は、PCAを使用して見つかった最初の2つの主成分によって作成された平面に投影され、2次元空間でのモデルの内部表現を表します。 2 次元 PCA 投影を補足図 5 に示します。 図3、5は、tRNA形成モデルから抽出されたWSI表現が異なるクラス間でどの程度よく区別できるかを示している。 言い換えれば、これらの図は、各 tRNA 形成モデルによって学習された特徴の識別力を示しています。

参考文献の推奨モデル。 「低電力」技術としても知られる 29 は、すべてのタイルベースおよび最先端の WSI レベルのアプローチを上回りました。 「低電力」法の精度、F1 スコア (マクロおよび重み付け)、および AUC は、それぞれ 73.76%、0.7388、0.7385、および 0.893 でした。 表3および図3に示されているように、すべてのtRNA形成モデルは参考文献に記載されている方法を上回っています。 すべての尺度、つまり精度、F1 スコア (マクロおよび加重)、および AUC で 29 でした。 さらに、補足図4に示されているように、混同行列では鮮明な対角線が強調表示されているため、tRNAsformerモデルはすべてのクラスに対してよりバランスの取れた正しい予測を持つ傾向があります。 別の言い方をすると、tRNAsformer モデルはすべてのクラスを区別するのが得意です。

a TCGA テスト セットと b 外部データセットに適用されたさまざまなモデルのマイクロ ROC 曲線。 AUC はすべてのモデルの凡例に報告されます。

WSI 検索実験は、tRNA 形成体の内部表現の品質を評価するために実施されました。 モデルは TCGA と外部データセットの両方でテストされます。 前述したように、TCGA データセット内の各 WSI から 100 個のインスタンスが作成されました。 TCGA テスト セットには、80 枚のスライドに関連付けられた 8000 個のインスタンスが含まれていました。 tRNAsformer をトレーニングした後、特徴 (埋め込み) を抽出するために利用されました。 WSI 検索における tRNAsformer のパフォーマンスを定量化するために、まず、8000 個の TCGA テスト インスタンスから 100 個のインスタンスのサブセットが作成されました。 次に、各サブセットの WSI 埋め込み (特徴ベクトル) を使用してペアワイズ距離行列が計算されます。 ピアソン相関が距離メトリックとして使用されます。 1 人の患者を除外する手順に従って、各インスタンス (WSI) の上位 k 個のサンプルが決定されました。 その後、各サブセットの P@K (Precision@K) と AP@K (Average Precision@K) が計算されました。 P@K は、モデルが提案する上位 k 個の推奨事項に関連する画像がいくつ存在するかを反映し、AP@K は、i = 1,…,K の場合の P@i の平均です。 最後に、MAP@K (Mean Average Precision@K) 値は、100 の検索サブセットに関連付けられた 100 のクエリの平均を取ることによって計算されました。

同様に、外部データセット内の WSI ごとに 100 個のインスタンスが作成されました。 全体として、外部データセット内の WSI 検索用に 142 個の WSI の 100 個のサブセットが生成されました。 その結果、MAP@K 値は 100 回の異なる検索実験から平均を取ることによって評価されました。 TCGA テストと外部データセットの両方の MAP@K 値の概要を表 4 に示します。

tRNAsformer のパフォーマンスは、さまざまな k、MAP@5、MAP@10 での平均精度の観点から、WSI 検索における最先端の Yottixel30 のパフォーマンスと比較されています。 10 回の独立した Yottixel 実行の MAP@5 と MAP@10 は、それぞれ 0.7416 と 0.7092 でした。 tRNAsformer は、MAP@5 と MAP@10 の両方の測定において Yottixel よりも優れています。 さらに、tRNAsformer モデルは、k が増加しても MAP@ K 値が他の検索アルゴリズムほど急激に低下しないため、より安定性を提供します。

この論文では、H&E スライドから遺伝子発現を予測することを学習することで WSI 表現を学習するために、tRNAsformer モデルに基づくマルチタスク MIL フレームワークを提案します。 アテンション メカニズムと Transformer 設計を組み込むことにより、tRNAsformer は WSI からの遺伝子発現をより正確に予測できます。 一方、tRNAsformer は、ハイパーパラメータが少ないにもかかわらず、バルク RNA-seq 予測のベンチマークを上回りました。 さらに、tRNAsformer は、組織サンプルの分子シグネチャーを使用して、WSI の排他的でコンパクトな表現を学習します。 その結果、提案された技術は、マルチモーダルなアプローチで遺伝子情報を統合することにより、画像から診断に関連する表現を学習します。

実際、スライド全体画像 (WSI) は通常、画像全体を処理することによってラベル付けされます (ラベルは画像全体に割り当てられます)。 たとえば、一部の正常組織も含まれている可能性がありますが、スライド画像全体を腫瘍スライドとしてラベル付けできます。 WSI 全体を一度に処理することは、現在のハードウェア テクノロジでは不可能です。 これらのイメージは通常、パッチまたはタイルと呼ばれる、より小さく管理しやすい部分に分割されます。 ただし、ピクセルレベルのエキスパートによるアノテーションにはコストと労力がかかるため、大規模な WSI データセットは通常、ソフトにラベル付けされます。 その結果、一部のタイルには、WSI に関連付けられた診断ラベルに関連する情報が含まれていない可能性があります。 tRNA フォーマーの設計により、サンプルのコレクションをより効率的かつ正確に処理することが可能になりました。 これは、マルチインスタンス学習 (MIL) の概念とともに毎週の教師あり学習を採用しています16。 弱教師あり学習は、与えられたラベル付きデータと、新しいラベル付きデータを取得するための弱い教師の組み合わせを使用して、深いネットワークをトレーニングするアプローチです31。 このアプローチにより、利用可能なラベル付きデータが不十分な場合でも、深いネットワークのトレーニングが可能になります。 さらに、tRNAsformer は MIL の概念を採用して、タイルごとではなく WSI ごとに実際の遺伝子発現値を持つという問題を処理します。 MIL は、トレーニング インスタンスがバッグ (セット) に配置され、バッグ全体にラベルが提供される、弱教師あり学習の形式です。

事前トレーニングされた CNN モデルは、tRNAsformer をトレーニングする前に画像タイルのサンプリングと埋め込みに使用されました。 このアプローチにより、事前トレーニングされた CNN モデルが大規模な画像データセットでトレーニングされたため、画像サンプルから豊富な中間埋め込みを作成できます。 さらに、埋め込みサンプリングされたインスタンスを操作すると、各 WSI をインスタンスとして扱う場合と比較して、計算コストが低くなります。 補足表 2 によると、最小の tRNAsformer モデルは、MLP ベースのモデルと比較して約 60% 少ないハイパーパラメーターを持つことができます。 さらに、トレーニング中は MLP ベースのモデルよりも約 72%、検証中は 15% 高速になります。

tRNAsformer と HE2RNA の比較による私たちの主な目的は、tRNAsformer が形態的特徴と分子的特徴の両方から豊富な WSI 表現を同時に学習しながら、最先端の遺伝子発現アルゴリズムと同じくらい正確に WSI から遺伝子発現を予測できることを実証することです。画像検索などのアプリケーションに使用できる指紋。 tRNAsformer は、HE2RNA によって達成されたものと比較してわずかに改善された相関関係で遺伝子発現スコアを予測することができました。 ただし、tRNAsformer は、遺伝子発現の予測だけでなく、組織形態や生検サンプルの分子フィンガープリントに基づく WSI 表現の学習にも使用できる、マルチタスクの計算病理学ツールであることに留意する必要があります。画像の検索と分類に統合できます。 相関指標は、遺伝子発現予測という 1 つのタスクのみを評価するために使用されました。 もう 1 つのタスク (つまり、画像検索および分類のための WSI 表現のトランスクリプトーム学習) は、外部データセットと他の 2 つの比較方法、つまり「Yottixel」および「低電力」方法を考慮することによって評価されました。

参考文献とは対照的に。 図 7 では、空間トランスクリプトミクス データセットが利用可能でしたが、この研究で提案されたアプローチではバルク RNA-seq データが使用されます。 結果として、この研究で説明されているモデルは、一次診断と WSI に関連するバルク RNA-seq の組み合わせを使用して内部表現を学習するため、より弱いタイプの監視を採用しています。 これは、一般に空間トランスクリプトーム データではなくバルク RNA 配列を収集する現在の臨床実践とより一致しています。 さらに、tRNAsformer は WSI を全体的に処理することで問題に対処しますが、参考文献で説明されている方法は WSI 全体を処理します。 7 では、各タイルを分離し、そのタイルの遺伝子発現値を推定します。 したがって、参考文献に記載されている方法。 7 はタイル間の依存関係を無視します。 参考文献との比較。 図8に示すように、この原稿で提案されている技術は、より広い視野でかなり小さいサンプルのセットを処理します。 特に、提案された手法では 224 × 224 × 3 の 49 個のインスタンスのバッグをサンプリングしますが、他の手法 8 では、バッグごとにサイズ 32 × 32 × 3 の少なくとも 2500 個のタイルを使用するいくつかのサンプリング オプションを展開しました。 さらに、tRNAsformer は、ピクセルから遺伝子への変換を学習することで排他的な WSI 表現を学習します。 一方で、どの方法論にも独立した表現学習パラダイムはありません5、7、8。

結論として、結果は、tRNAsformer が、開発された最先端の分類および検索アルゴリズムのパフォーマンスと同等またはそれを上回る、病理スライドの大規模アーカイブの信頼できる内部表現を学習できることを示しました 29,30。 さらに、tRNAsformer は、他の最先端の方法と比較して、ある程度の改善はあるものの、同等のパフォーマンスで H&E スライドからの遺伝子発現を予測できます5。 我々は、バルク細胞(主に異なる組織切片から単離されたもの)から得られた RNA-Seq プロファイルでも、tRNAsformer は、バルク RNA-seq プロファイルの真のスコアと相関する遺伝子発現スコアの予測という点で良好に機能することを示しました。 H&E 染色に使用される組織切片で発現される遺伝子のほとんどは、RNA-seq 定量化に使用される組織切片でも発現します。 ただし、将来の研究では、RNA-seq プロファイリングと H&E 染色の両方を標本の同じスライス上で実行する空間トランスクリプトーム データを使用してその性能を検証することで、tRNA フォーマーを厳密に調査できるようになります。

この研究で使用されたデータは TCGA (https://portal.gdc.cancer.gov/) から取得されました。 WSI および RNAseq プロファイルを持つケースのみが考慮されました。 H&E 染色したホルマリン固定パラフィン包埋 (FFPE) 診断スライドを選択しました。 検索された症例には、明細胞癌 ICD-O 8310/3 (ccRCC)、嫌色素性腎細胞癌 ICD-O 8317/3 (crRCC)、および乳頭癌 ICD-O 8260/3 の 3 つのサブタイプが含まれていました。 、(pRCC)。 トランスクリプトーム データについては、100 万あたりのマッピングされたリードの上位 4 分の 1 あたりのトランスクリプトのキロベースあたりのフラグメント (FPKM-UQ) ファイルを利用しました。 ケースに関する詳細情報は補足表1に含まれています。各遺伝子のFPKM-UQデータの平均値はプロジェクトごとに大きく異なる可能性があるため、FPKM-UQの遺伝子発現スコアを予測するためにtRNAsformerモデルとHE2RNAモデルの両方が評価されています。 TCGA という 1 つのプロジェクトのみからのデータ。 TCGA からは、TCGA-KIRC、TCGA-KIRP、TCGA-KICH の 3 つの腎臓データセットが考慮されています。 さらに、結果の解釈可能性を向上させるために、発現中央値がゼロの遺伝子を除外しました。 データはケースごとにトレーニング (%80)、検証 (%10)、テスト (%10) セットにそれぞれ分割されました。 言い換えれば、各患者はいずれかのセットにのみ属していました。

FPKM-UQ ファイルには、60,483 個の Ensembl 遺伝子 ID が含まれていました。 すべての腎症例から中央値がゼロの遺伝子を除外し、31,793 個の遺伝子を残しました。 他の研究でも、結果の解釈可能性を高めるために同じ戦略が採用されています5。 遺伝子発現値の順序は大幅に変化し、高発現遺伝子の場合にのみ平均二乗誤差に影響を与える可能性があるため、遺伝子発現の変換には → log10(1 + a) 変換を使用しました。

デジタル化されたガラス スライドのサイズは、ピクセルで 100,000 × 100,000、あるいはそれ以上になる場合があります。 そのため、現在の技術ではスライド全体を一度に処理することはできません。 これらの画像は通常、タイルと呼ばれる、より小さく管理しやすい部分に分割されます。 さらに、ピクセルレベルの専門家によるアノテーションにはコストと労力がかかるため、大規模な WSI データセットは一般に弱くラベル付けされます。 その結果、一部のタイルには、WSI に関連付けられた診断ラベルに関連する情報が含まれていない可能性があります。 したがって、MIL はこのシナリオに適している可能性があります。 学習者は、個別にラベル付けされた例のコレクションを受け取る代わりに、MIL のいくつかのインスタンスで構成されるラベル付きバッグのセットを受け取ります。 インスタンスのバッグを作成するための最初のステップは、組織の境界がどこにあるかを把握することです。 参考文献で説明されているアルゴリズムを使用します。 図29では、背景およびマーカーピクセルが除去されている一方で、組織領域がサムネイル(倍率1.25倍)に配置されている。 サイズ 14 × 14 ピクセルのタイルは、1.25 × 組織マスクを使用して処理され、組織が 50% 未満であるタイルは破棄されました。 1.25 倍の 14 × 14 ピクセル タイルは、20 倍の倍率で 224 × 224 ピクセルの領域に相当することに注意してください。

K 平均法アルゴリズムは、各 WSI から固定数のタイルをサンプリングするために、以前に選択されたタイルの位置に展開されます。 この研究のすべての実験では、k の値は 49 に設定されました。 その後、クラスターはクラスター中心の大きさに基づいて空間的に分類されます。 空間的にクラスタ化されたタイルの利点は 2 つあります。 (1) 類似性の概念は狭い半径内で当てはまる可能性が高く 32,33、(2) 2 つの変数による座標のクラスタリングは高次元の特徴ベクトルよりも計算コストが低くなります。 クラスタリング アルゴリズムの手順を図 4 に示します。

a は WSI のサムネイルを示し、b は WSI をセグメント化することで得られた組織マスクを示し、c は k 平均法を使用してクラスター化された WSI を示します。

tRNA フォーマーは、L 個の標準トランスフォーマー エンコーダー層 34 で構成され、その後に 2 つのヘッド、つまり分類ヘッドと遺伝子予測ヘッドが続きます。 補足図 1 は、提案された方法のアーキテクチャを示しています。 Transformer Encoder は、入力の埋め込み (クラス トークンとも呼ばれる) を、各 WSI に関連付けられた一連の機能インスタンスとして扱うことによって学習します。 バッグまたは WSI を表すクラス トークンを学習しながら、各インスタンスの内部埋め込みを学習します。

線形層である分類ヘッドは、WSI 表現 c を受け取ります。 次に、線形レイヤーを使用して WSI 表現が WSI のスコア \(\hat{y}\) に投影されます。 次に、tRNAsformer は、予測スコア \(\hat{y}\) と WSI の真のラベル y の間のクロスエントロピー損失を使用して、一次診断を学習します。 Transformer Encoder と分類ヘッドを使用すると、モデルのトレーニング中に WSI の表現を学習できます。

バッグを検討しています \({{{{{\rm{X}}}}}=[{{{{{{\bf{x}}}}}}}_{1},{{{{{{ \bf{x}}}}}}}_{2},\ldots ,{{{{{{\bf{x}}}}}}_{k}]\)、ここで \({{{ {{{\bf{x}}}}}}_{i}\in {{\Bbb{R}}}^{d},i=1,\ldots ,k\) は DenseNet による埋め込みタイルです-121、L 層標準トランスフォーマーは次のように定義できます。

ここで、MSA、LN、MLP、L、E、および Epos は、マルチヘッドセルフアテンション、layernorm、多層パーセプトロンブロック (MLP)、線形層、タイル埋め込み投影、および位置埋め込みです (詳細については、参考文献 34 を参照してください)。 )。 変数 E と Epos は学習可能です。 layernorm は、入力のミニバッチに対して正規化を適用します。 Layernorm では、シーケンス (つまり、タイルのバッグ) 内の各インスタンス (つまり、タイル) の特徴次元全体にわたって統計が独立して計算されます。 多層パーセプトロン ブロックは、2 つの線形層とそれに続くドロップアウト層で構成されます。 最初の線形層は GELU 活性化関数 35 を持ちます。 埋め込みは最初のレイヤーでより高い次元に投影され、次に 2 番目のレイヤーで元のサイズにマッピングされます。 補足の図5bは、Transformer EncoderのMLPブロックの構造を示しています。

残りの内部埋め込みはドロップアウト層に渡され、続いて遺伝子予測ヘッドの 1D 畳み込み層に渡されます。 遺伝子予測ヘッドは、参考文献で紹介された HE2RNA モデルと同様に、出力層としてドロップアウト層と 1D 畳み込み層を使用します。 5. ただし、HE2RNA の特徴抽出を担当する 2 つの 1D 畳み込み層である最初の 2 層は、すべてのインスタンス間の関係をキャプチャするために Transformer Encoder に置き換えられました。 モデルはインスタンスごとに遺伝子ごとに 1 つの予測を生成するため、参考文献で説明されているのと同じ集約戦略が使用されます。 5 は、各 WSI の遺伝子予測を計算するために適合されました。 特に、Schmauch et al. 反復ごとに乱数 n をサンプリングし、WSI (バッグ) 内のタイルによる上位 n の予測を平均することで各遺伝子の予測を計算しました。 彼らは、このアプローチが正則化手法として機能し、過学習の可能性を減らすことを提案しました5。 各バッグには 49 個のタイル埋め込みがあったため、n は {1,2,5,10,20,49} からランダムに選択されました。 トレーニング中にランダムに選択された n について、遺伝子予測結果は次のように書くことができます。

ここで \({{{{{\bf{z}}}}}}_{L}^{1:{{{{{\rm{end}}}}}}}\in {{\mathbb {R}}}^{D\times k},{{{{{\bf{s}}}}}\in {{\mathbb{R}}}^{D\times k}\)、および\({{{{{\bf{S}}}}}}({{{{{\rm{n}}}}}})\in {{\mathbb{R}}}^{{d} _{g}}\) は、それぞれクラス トークン、タイルごとの遺伝子予測、およびスライド レベルの遺伝子発現予測を除いた内部埋め込みです。 テスト中に、最終的な予測 S は、n のすべての可能な値の平均として計算されます。

平均二乗誤差損失関数は、遺伝子予測を学習するために使用されます。

最後に、tRNAsformer の総損失は次のように計算されます。

ここで、 \(\theta ,\lambda ,\gamma ,B,{{{{{{\bf{y}}}}}}}^{g}\) は、モデル パラメーター、重み正則化係数、スケーリング用のハイパーパラメーターです。損失、バッチ内のサンプル数、スライドに関連する真のバルク RNA-seq。 提案されたアプローチの概要を図 1 に示します。

まず、TCGA ケースは、トレーニング、検証、およびテスト セットの 80%、10%、および 10% のサブセットに分割されます。 各ケースは 1 人の患者に関連付けられており、複数の診断 WSI または RNA-seq ファイルが含まれている可能性があります。 トレーニング プロセス中、バッグの数はモデルのパフォーマンスを最適化するためのハイパーパラメーターとして考慮されます。 ハイパーパラメーターを最適化した後、各 WSI から 100 個のバッグがサンプリングされました。 その結果、トレーニング セットは 63,400 個のバッグで構成されました (補足表 1 を参照)。

tRNAsformer の内部表現サイズは 384 に設定されました。MLP 比とセルフ アテンション ヘッドの数は両方とも 4 でした。 tRNAsformer は、サイズ 64 のミニバッチで 20 エポック間トレーニングされました。AdamW が、開始学習率 3 × 10−4 36 のオプティマイザーとして選択されました。過学習を避けるために、重み正則化係数は 0.01 に設定されました。 学習率をスケジュールするために、reduce-on-plateau 法が選択されました。 したがって、検証損失は改善されずに、学習率は 2 エポックごとに 10 ずつ減少しました。 スケーリング係数γは0.5とした。 最後のドロップアウト層の確率は 0.25 に設定されました。 検証損失が最も低いモデルの値が報告されます。 すべての実験は、1 枚の NVIDIA GeForce RTX 2080 SUPER グラフィック カードを使用して行われます。 デスクトップのCPUはIntel(R) Core(TM) i9-10900Xでした。

HE2RNA と呼ばれる別のモデルは、参考文献に記載されている MLP アーキテクチャに基づいてトレーニングされました。 5. トレーニング済み HE2RNA モデルは、HE2RNA 論文の著者によって提供されたものではありません。 したがって、現在の文献に基づいて公正なベンチマークを作成できるように、tRNA フォーマーのトレーニングに使用したのと同じデータセットを使用して HE2RNA モデルを構築およびトレーニングしました。 MLP 設計の実用性により、完全に接続された層は、スライド データへのカーネル サイズ 1 とストライド 1 の連続 1D 畳み込みに置き換えられました5。 ドロップアウト層は連続する層の間に適用され、活性化関数は ReLU でした。 参考文献で提案されている MLP 設計に基づくモデル。 5 は、この論文で使用される TCGA トレーニング セットでトレーニングされたため、HE2RNAbb (bb はバックボーンを表します) と呼ばれます。 HE2RNA Rbb モデルは 3 つの 1D 畳み込み層で構成されています。 最初の 2 つの層にはそれぞれ h 個の入力チャネルと出力チャネルが含まれていましたが、最後の層には遺伝子の数と同じ数の出力チャネルがありました。 言い換えれば、h はモデルの内部表現のサイズです。 HE2RNAbb1024 の h は 1024 に設定されました。 モデルは、AdamW オプティマイザーと開始学習率 3 × 10−4 36 を使用して 20 エポックでトレーニングされました。2 エポックで検証損失の改善が観察されない場合、学習率は 10 だけ減少しました。 ミニバッチ サイズは 64 に設定されました。検証損失が最も低いモデルの値が提供されています。 各モデルのパラメータの数は、比較のために補足表 2 に示されています。 トレーニングと検証のための単一エポックの実時間も、パラメーターの数と同じテーブルに提供されます。

これは、モデルの内部表現を評価するために使用した内部データセットです。 病理学部門の外科病理学ファイルは、明細胞癌 (ccRCC)、嫌色素性腎細胞癌 (crRCC)、または乳頭状腎細胞癌 (pRCC) に分類された腎細胞癌の連続症例について検査されました。 データセットは検索の最後に作成され、142 件の腎細胞癌が含まれていました。 ccRCC、crRCC、pRCC の WSI はそれぞれ 48、44、50 でした。 各患者には代表的ながんスライドが 1 枚あり、アペリオ XT スキャンスコープ (ライカ バイオシステムズ、カリフォルニア州) を使用して 20 倍でスキャンされる前に、認定病理学者 (アニル V. パルワニ) によって検査されました。 認定病理医 (AP) が WSI 画像をレビューし、画像の品質と診断の正しさを保証するために分類を再度検証しました。

TCGA 腎臓データセットでトレーニングされたモデルを使用して、外部データセットを埋め込みました。 次に、提案されたパイプラインに対するドメイン変更の影響を調査するために、分類と WSI 検索の調査が実行されました。

研究デザインの詳細については、この記事にリンクされている Nature Portfolio Reporting Summary を参照してください。

NCI Genomic Data Commons Portal (https://portal.gdc.cancer.gov) には、一般公開されているすべての TCGA デジタル スライドがあります。 再現性を高めるために、TCGA プロジェクトから取得した各ケースの処理済みデータは https://doi.org/10.5281/zenodo.7613408 で入手できます。 データには、各ケースの CSV ファイルが含まれており、実験で考慮した 31,793 個の遺伝子発現スコアがすべてリストされています。

私たちのソースコードとトレーニングされた tRNAsformer モデルは、https://doi.org/10.5281/zenodo.7613349 で入手できます。

ホウ、L.ら。 スライド組織画像全体を分類するためのパッチベースの畳み込みニューラル ネットワーク。 コンピュータービジョンとパターン認識に関する IEEE 会議議事録 2424–2433 (2016)。

カルラ、S.ら。 人工知能を使用したアーカイブ病理組織画像の検索による汎がん診断のコンセンサス。 NPJ 桁。 医学。 3、1–15 (2020)。

記事 Google Scholar

Wang, H. et al. 手作りの畳み込みニューラル ネットワーク機能を組み合わせることによる、乳がんの病理画像における有糸分裂の検出。 J.Med. 画像 1、034003 (2014)。

記事 Google Scholar

ブルテン、W.ら。 生検を使用した前立腺がんのグリーソン等級分けのための自動深層学習システム: 診断研究。 ランセット・オンコル。 21、233–241 (2020)。

論文 PubMed Google Scholar

Schmauch, B. et al. スライド画像全体から腫瘍の rna-seq 発現を予測する深層学習モデル。 ナット。 共通。 11、1–15 (2020)。

記事 Google Scholar

Levy-Jurgenson, A.、Tekpli, X.、Kristensen, VN & Yakhini, Z. 病理学の全スライド画像から推論された空間トランスクリプトミクスは、腫瘍の不均一性と乳がんおよび肺がんの生存を結びつけます。 科学。 議員 10、1–11 (2020)。

記事 Google Scholar

彼、B.ら。 ディープラーニングを介して空間遺伝子発現と乳房腫瘍の形態を統合します。 ナット。 バイオメッド。 工学 4、827–834 (2020)。

論文 CAS PubMed Google Scholar

タヴォラーラ、TE et al. ディープラーニングは、結核菌に感染した多様性異系交配マウスの感受性パターンを特定するための中間データモダリティとして遺伝子発現を予測します。 EBioMedicine 67、103388 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Coudray, N. et al. 深層学習を使用した非小細胞肺がんの病理組織画像からの分類と変異予測。 ナット。 医学。 24、1559–1567 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

Schaumberg, AJ、Rubin, MA & Fuchs, TJ H&E 染色された全スライド画像ディープラーニングは、前立腺がんにおける spop 変異状態を予測します。 BioRxiv https://doi.org/10.1101/064279 (2017) のプレプリント。

Segal, E.、Friedman, N.、Kaminski, N.、Regev, A. & Koller, D. シグネチャからモデルへ: マイクロアレイを使用したがんの理解。 ナット。 ジュネット。 37、S38–S45 (2005)。

論文 CAS PubMed Google Scholar

Kamps、R. et al. 腫瘍学における次世代シーケンシング: 遺伝子診断、リスク予測、がん分類。 内部。 J.Mol. 科学。 18、308 (2017)。

論文 PubMed PubMed Central Google Scholar

Sung, H. et al. 2020 年の世界のがん統計: Globocan は、185 か国の 36 のがんについて、世界中での罹患率と死亡率を推定しています。 CA: がん J. Clin. 71、209–249 (2021)。

PubMed Google Scholar

Shuch、B.ら。 腎細胞癌の病理学的変異の理解: 生物学的複雑さから治療の機会を抽出します。 ユーロ。 ウロル。 67、85–97 (2015)。

論文 PubMed Google Scholar

Tabibu, S.、Vinod, P. & Jawahar, C. 深層学習を使用した組織病理学画像からの汎腎細胞癌の分類と生存予測。 科学。 議員番号 9、10509 (2019)。

論文 PubMed PubMed Central Google Scholar

Dietterich, TG、Lathrop, RH & Lozano-Pérez, T. 軸に平行な長方形を使用した複数インスタンスの問題の解決。 アーティフ。 知性。 89、31–71 (1997)。

記事 Google Scholar

ハバード、T.ら。 アンサンブルゲノムデータベースプロジェクト。 核酸研究所 30、38–41 (2002)。

論文 CAS PubMed PubMed Central Google Scholar

バーサ、Á. & Győrffy、B. Tnmplot。 com: 正常組織、腫瘍組織、転移組織における遺伝子発現を比較するための Web ツール。 内部。 J.Mol. 科学。 22、2622 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Luo、M.-S.、Huang、G.-J. & リュー、B.-X. 遺伝子発現に基づく上咽頭癌における免疫浸潤。 医学 98、e17311 (2019)。

論文 CAS PubMed PubMed Central Google Scholar

Hoffman, GE & Schadt, EE variancepartition: 複雑な遺伝子発現研究における変動要因の解釈。 BMCバイオインフォマ。 17、1–13 (2016)。

記事 Google Scholar

Campbell-Staton, SC、Velotta, JP & Winchell, KM 都市部のヒートアイランドへの熱適応における適応的および非適応的な遺伝子発現可塑性に関する選択。 ナット。 共通。 12、1–14 (2021)。

記事 Google Scholar

アヴセック、Ž. 他。 長距離相互作用を統合することにより、配列から効果的に遺伝子発現を予測します。 ナット。 方法 18、1196–1203 (2021)。

論文 CAS PubMed PubMed Central Google Scholar

Holm, S. 単純な逐次拒絶多重テスト手順。 スキャン。 J.Stat. 6、65–70 (1979)。

Benjamini, Y. & Hochberg, Y. 誤検出率の制御: 複数のテストに対する実用的で強力なアプローチ。 JR駅学会:Ser. B 57、289–300 (1995)。

Google スカラー

Spyromitros-Xioufis, E.、Tsoumakas, G.、Groves, W. & Vlahavas, I. 入力空間拡張による複数ターゲット回帰: ターゲットを入力として扱う。 マッハ。 学ぶ。 104、55–98 (2016)。

記事 Google Scholar

Stacke, K.、Eilertsen, G.、Unger, J. & Lundström, C. 組織病理学におけるディープラーニングのためのドメインシフトの詳細。 プレプリントは https://arxiv.org/abs/1909.11575 (2019) にあります。

Asilian Bidgoli, A.、Rahnamayan, S.、Dehkharghanian, T.、Grami, A. & Tizhoosh, H. 深い特徴選択を使用した組織病理学画像の表現におけるバイアスの削減。 科学。 議員第 12 号、1–12 (2022)。

記事 Google Scholar

Dehkharghanian、T. et al. 偏ったデータ、偏った AI: ディープ ネットワークが TCGA 画像の取得場所を予測します。 BMC 診断病理学 (2023)。

Safarpoor, A.、Shafiei, S.、Gonzalez, R.、Parwani, A.、Tizhoosh, H. 深層学習を使用した腎細胞癌の全スライド画像分類と検索。 リサーチスクエア https://doi.org/10.21203/rs.3.rs-971708/v1 (2021)。

カルラ、S.ら。 Yottixel - 病理組織学の全スライド画像の大規模アーカイブ用の画像検索エンジン。 医学。 アナル画像。 65、101757 (2020)。

論文 PubMed Google Scholar

Dehghani, M.、Zamani, H.、Severyn, A.、Kamps, J. & Croft、WB 監視が弱いニューラル ランキング モデル。 情報検索の研究開発に関する第 40 回国際 ACM SIGIR 会議議事録 65–74 (2017)。

Sikaroudi、M. et al. 表現学習に対する監視とソース ドメインの影響: 組織病理学のケーススタディ。 2020 年の第 42 回 IEEE Engineering in Medicine & Biology Society (EMBC) 年次国際会議 1400–1403 (IEEE、2020)。

Gildenblat, J. & Klaiman, E. デジタル病理学のための自己教師あり類似性学習。 プレプリントは https://arxiv.org/abs/1905.08139 (2019) にあります。

Dosovitskiy、A. et al. 画像は 16 × 16 ワードの価値があります: 大規模な画像認識のためのトランスフォーマー。 プレプリントは https://arxiv.org/abs/2010.11929 (2020) にあります。

Hendrycks, D. & Gimpel, K. ガウス誤差線形単位 (ゲルス)。 プレプリントは https://arxiv.org/abs/1606.08415 (2016) にあります。

Loshchilov, I. & Hutter, F. 分離された重み減衰正則化。 プレプリントは https://arxiv.org/abs/1711.05101 (2017) にあります。

リファレンスをダウンロードする

このプロジェクトは、オンタリオ州政府による ORF-RE コンソーシアムの一環として資金の一部を提供されました。

米国ミネソタ州ロチェスターのメイヨークリニック、人工知能と情報学、Rhazes Lab

アリージ・アルサーフィン & HR ティズーシュ

Kimia Lab、ウォータールー大学、ウォータールー、オンタリオ州、カナダ

アリージ・アルサーフィン、アミール・サファープール、ミラド・シカルーディ、HR ティズーシュ

米国ミネソタ州ロチェスターのメイヨークリニック、計算病理学および AI 部門

ジェイソン・D・ヒップ

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

AA は主要なアイデアの構想に貢献し、論文を再構成し、データを再分析し、原稿を修正しました。 AS は、最初のアイデアに貢献して議論し、最初の実験を設計して実行し、結果を分析して解釈し、最初の草稿を書きました。 MS はデータ処理と分析に貢献しました。 HRT は最初のアイデアを考案し、研究全体を監督し、データ/結果を分析し、論文の一部を執筆しました。 JDH はプロジェクト管理に貢献し、論文を改訂し、批判的なフィードバックを提供しました。

HRティズーシュへの対応。

著者らは競合する利害関係を宣言していません。

この研究は、オハイオ州立大学の機関研究委員会によって承認されました。 研究に参加したすべての個々の患者から書面によるインフォームドコンセントを得た。 すべての方法は、関連するガイドラインおよび規制に従って実行されました。 すべてのデータは、誠実なブローカー システムを使用して匿名化されました。

Communications Biology は、この研究の査読に貢献してくれた安尾宣明氏と他の匿名の査読者に感謝します。 主な取り扱い編集者: Eirini Marouli および Luke R. Grinham。 査読者レポートが利用可能です。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Alsaafin, A.、Safarpoor, A.、Sikaroudi, M. 他検索と分類のためのアプリケーションを使用して、スライド画像全体から RNA 配列発現を予測する方法を学習します。 Commun Biol 6、304 (2023)。 https://doi.org/10.1038/s42003-023-04583-x

引用をダウンロード

受信日: 2022 年 3 月 22 日

受理日: 2023 年 2 月 13 日

公開日: 2023 年 3 月 22 日

DOI: https://doi.org/10.1038/s42003-023-04583-x

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。