banner
ニュース センター
専門的な知識を身につけており、有能です。

手術のパフォーマンスを定量化し、患者の転帰を予測する方法としての手術ジェスチャー

Oct 19, 2023

npj デジタルメディスン 第 5 巻、記事番号: 187 (2022) この記事を引用

2050 アクセス

3 引用

27 オルトメトリック

メトリクスの詳細

手術がどれだけうまく行われるかは、患者の転帰に影響を与えます。 しかし、パフォーマンスの客観的な定量化は未解決の課題のままです。 手順を個別の器具と組織の「ジェスチャー」に分解することは、手術を理解するための新たな方法です。 パフォーマンスが患者の転帰にとって最も重要な要素である手術においてこのパラダイムを確立するために、我々は、2 つの国際医療センターによる 80 件の神経温存ロボット支援根治的前立腺切除術で行われた 34,323 の個別のジェスチャーを特定しました。 ジェスチャは、9 つ​​の異なる解剖ジェスチャ (例: ホットカット) と 4 つのサポートジェスチャ (例: 撤回) に分類されます。 私たちの主な成果は、根治的前立腺切除術後の患者の 1 年間の勃起機能 (EF) 回復に影響を与える要因を特定することです。 統計的には、ホットカットの使用が少なく、ピール/プッシュの使用が多いほど、1 年間の EF 回復の可能性が高いことがわかりました。 私たちの結果は、外科医の経験とジェスチャーの種類との間の相互作用も示しています。同様のジェスチャーを選択しても、外科医の経験に応じて EF 回復率が異なります。 このフレームワークをさらに検証するために、2 つのチームがジェスチャー シーケンスと従来の臨床特徴を使用して個別の機械学習モデルを個別に構築し、1 年間の EF を予測します。 どちらのモデルでも、ジェスチャー シーケンスは従来の臨床特徴 (チーム 1: AUC 0.69、95% CI 0.65 ~ 0.73; チーム 2: AUC 0.65、95% CI 0.62 ~ 0.68)。 私たちの結果は、ジェスチャーが手術のパフォーマンスと結果を客観的に示すための詳細な方法を提供することを示唆しています。 この方法論を他の手術に応用すると、手術を改善する方法の発見につながる可能性があります。

過去 10 年間で、手術のパフォーマンスが手術の結果に大きな影響を与えることを示す証拠が増えてきました 1,2。 たとえば、腹腔鏡下胃バイパス術の手術スキルが低いと、合併症発生率が高く、死亡率が高く、手術時間が長くなり、再手術や再入院の率が高くなります1。 手術の結果を向上させるには、まず手術のパフォーマンスを定量化する必要があります3。 しかし、客観的にそれを達成することは依然として困難です。

手術のジェスチャーは、手術器具と人間の組織との最小の意味のある相互作用として定義され4,5、手術を解体するための新しいアプローチです。 これらは、手術を客観的に定量化すると同時に、研修生に実用的なフィードバックを提供する可能性を秘めています。 以前、我々は、9 つ​​の異なる解剖ジェスチャー (例: コールドカット) と 4 つの補助ジェスチャー (例: 開創) から構成される解剖手術ジェスチャー分類システムを開発しました (図 1a)。 われわれは、ロボット支援による腎部分切除術の肺門切開ステップにおける手術ジェスチャーの選択の違いによって、外科医の専門知識を区別できることを発見した5。 しかし、さまざまな手術ジェスチャーが手術後の患者の転帰と関連しているかどうかはまだ不明です。

9 つの解剖ジェスチャーと 4 つのサポート ジェスチャーを含むジェスチャー分類。 b 色分けされた神経を節約するジェスチャ シーケンス (最初の 100 のジェスチャのみを表示)。 色は、a の対応するジェスチャを表します。 c 1年間のEF回復予測モデル構築プロセス。 2 つのチームが独自に予測モデルを構築およびテストし、結果の再現性を確認しました。

前立腺がんの最も一般的な治療法であるロボット支援による根治的前立腺切除術(RARP)は、手術のパフォーマンスと高度に関連する具体的で簡単に測定できる機能的結果が得られるため、手術のジェスチャーが患者の転帰に関連しているかどうかを評価するための理想的なテストケースです6。 RARP 後の勃起不全は男性の生活の質に重大な影響を及ぼし、60% 以上の男性が前立腺に沿って走る神経の損傷によりこの長期にわたる合併症を経験します7。 神経予備術 (NS) 中に、外科医はこれらの神経を前立腺から丁寧に剥がします。 外科医の解剖技術のわずかな変更が、患者の能力回復に大きな影響を与える可能性があります8。 外科医の能力が重要であることを示す十分な証拠があり、一流の外科医の患者は能力を回復する可能性が 50% 近くあるのに対し、下位の外科医の患者の可能性は 20% 未満です9。

神経温存の質と術後の勃起不全のリスクとの関連性を考慮して、我々は主に、RARP の NS ステップ中に使用されるジェスチャーが術後の ED 率を予測できるかどうかを調べることを目的としています。 第二の目的は、さまざまな経験レベルの外科医による手術ジェスチャーの選択を研究し、神経温存のさまざまな解剖技術についての理解を深めることです。 私たちは、手術のジェスチャーが技術スキルを定量化し、手術の結果を示す可能性がある効果的なツールとして使用できるという仮説を立てています。

この国際的な二施設研究では、NS中のホットカットの使用が少なく、ピール/プッシュの使用が多いほど、1年間のEF回復の可能性が高いことがわかりました。 さらに、NS 中の解剖ジェスチャー シーケンスを使用すると、EF 回復を正確に予測するための ML モデルを構築できます。 さらに、経験レベルの異なる外科医が NS 中に異なる手術ジェスチャーを使用していることがわかりました。 これらの結果は、手術を手術のジェスチャーのレベルにまで分解することは、手術のパフォーマンスを測定する新しい方法として機能する可能性があることを示唆しており、この方法は、手術結果を予測し、実用的なフィードバックを提供するために、さまざまな外科専門分野に幅広く応用できる可能性があります。

619 の連続した RARP 症例がこの研究の候補となり、最終的に 2 つの国際外科センターの 21 人の外科医からの 80 症例が包含/除外基準を満たしました (図 2)。 ほとんどの患者は、手術中に維持できるベースラインの勃起機能を持たなかったため、除外されました。 これら 21 名の現役外科医の過去のロボット手術症例数の中央値は 450 件 (範囲 100 ~ 5,800) でした。 6 人の超専門家からなるグループ (中央値 3000 件、範囲 2000 ~ 5800) と 15 人の専門家からなるグループ (中央値 275 件、範囲 100 ~ 750) との間には、ロボット手術の経験に差がありました (補足表 1)。

80件のRARP症例を登録。

全体として、術後 1 年の EF 回復率は 34/80 (43%) でした。 EFを回復した患者は有意に若く(p = 0.02、カイ二乗検定)、米国麻酔学会(ASA)の身体状態も良好でした(p = 0.03、カイ二乗検定)(表1)。 EF を回復した患者は、完全な神経温存率が高かった (76.5% 対 69.6%) が、これは統計的に有意ではありませんでした (p = 0.49、カイ二乗検定)。

NS 症例ごとに中央値 438 の個別のジェスチャー (IQR 254 ~ 559) が特定されました。 積極的な解剖ジェスチャーは全ジェスチャーの 65.7% を占め、支援ジェスチャーは残りの 34.3% を占めました (表 2)。

ジェスチャーのタイプが 1 年間の EF 回復に有意に関連しているかどうかを評価するために、EF が回復した患者と回復していない患者の間で、症例内のジェスチャーの各タイプの割合を比較しました。 EFが回復した患者では、ホットカットは少なかったが(中央値1.4% vs 1.9%、p = 0.016、一般化線形混合モデル[GLMM])、ピーリング/プッシュが多かった(中央値33.4% vs 29.7%、p < 0.001、GLMM)(図1)。 3a)。 結果を確認するために、エキスパート (図 3b) とスーパーエキスパート グループ (図 3c) でそれぞれサブグループ分析を行いました。 どちらのグループでも、EF が回復した患者の方がピール/プッシュが多かった (p ≤ 0.001、GLMM)。 ホットカットの使用は専門家グループでのみ有意であり、EFが回復した患者はより多くのホットカットを行っていました(p = 0.001、GLMM)。 さらに、専門家グループでは、1年EFを回復した患者はコールドカットが少なく、広がりが多く、フックが多く、収縮が少なく、凝固が少なかった(すべてp<0.05、GLMM)。 スーパーエキスパートグループでは、1年でEFを回復した患者は広がりが少なく、フックが少なく、凝固が多かった(すべてp<0.05、GLMM)。

a コホート全体。 b 専門家グループ。 c 超専門家集団。

次に、ジェスチャー シーケンスと臨床的特徴を 2 つのチームが使用して、1 年間の EF 回復に向けた機械学習 (ML) 予測モデルを独立して構築し、結果の再現性を確保しました。 手術ジェスチャーシーケンスのみを含めた場合、両方のモデルは、1 年間の EF 回復を予測する中程度に高い能力を達成しました (AUC: チーム 1: 0.77、95% CI 0.73 ~ 0.81; チーム 2: 0.68、95% CI 0.66 ~ 0.70)。これは臨床的特徴のみを上回りました(AUC、チーム 1: 0.69、95% CI 0.65 ~ 0.73、チーム 2: 0.65、95% CI 0.62 ~ 0.68)。 モデルに手術ジェスチャーと臨床的特徴の両方が含まれている場合(AUC、チーム 1: 0.75、95% CI 0.72 ~ 0.77、チーム 2: 0.67、95% CI 0.65 ~ 0.70)、モデルは手術ジェスチャーのみを含むモデルと同様のパフォーマンスを示しました(図4)。

1 年間の EF 回復予測モデルのパフォーマンスを示すヴァイオリン プロット。

これらのモデルがどのように予測を行うかを理解するために、パフォーマンスが優れているチーム 1 のモデルを選択し、1 年間の EF 予測に重要な臨床的特徴 (図 5a) であるグリーソン スコア、年齢、BMI、PSA、前立腺体積をランク付けしました。 。 また、1年間のEF回復と正または負に関連する重要なジェスチャーシーケンスも出力しました(図5b)。

a 重要な臨床的特徴。 b 重要な手術ジェスチャーシーケンスの例。

ML モデルがジェスチャー シーケンス自体から実際に学習したのではなく、NS 中に使用されたジェスチャーの数によって 1 年間の EF 回復の予測を学習しただけである可能性を排除するために、ジェスチャーの数に基づいて 80 のケースをランク付けし、ケースを分類しました。 4つの四分位に分けます。 四分位全体で同様の1年EF回復率が見つかりました(p = 0.66、カイ二乗検定、補足表2)。

超専門家は、NS ステップ中に専門家よりも少ないジェスチャーを使用しました (中央値 317 対 530、p = 0.014、マン-ホイットニー U 検定)。 この傾向は、アクティブな解剖ジェスチャー (つまり、剥がす/押す) とサポートするジェスチャー (つまり、カメラの移動、格納) の両方に存在しました (表 3)。

NS で利用されるジェスチャーの割合を比較すると、スーパーエキスパートはより多くのコールドカット (中央値 18.0% vs 13.0%、p = 0.001、GLMM)、より多くの凝固 (中央値 3.5% vs 2.0%、p = 0.005、GLMM) を利用していることがわかりました。ただし、ピール/プッシュは少なく(中央値 27.0% vs 34.0%、p = 0.024、GLMM)、リトラクション調整も少なくなります(中央値 10.5% vs 16.0%、p = 0.001、GLMM)。

注目すべきことに、報告されたEF回復率は、専門家によって手術された患者(11/27、40.7%、p = 0.82、カイ二乗検定)と比較して、超専門家によって手術された患者(23/53、43.4%)の間で同様であった。 これら 2 つの患者グループの臨床的特徴も同様でした (補足表 3)。

この国際的な二施設共同研究で、我々は、(a) ホットカットの使用が少なく、ピール/プッシュの使用が多いほど、1 年間の EF 回復の可能性が高まることを実証した。 (b) 手術ジェスチャーシーケンスは、RARP 後の 1 年間の EF 回復を首尾よく予測できます。 (c) 手術ジェスチャーの選択は外科医の経験レベルと関連していました。 さらに、2 つのチームに独立して、手術ジェスチャーのシーケンスと手術結果の関係を確認してもらいました。 このデュアルエフォート法は、堅牢性を高め、ML 所見の再現性を確認する目的で、ML 研究コミュニティによって広く提唱されていますが、臨床文献ではほとんど実施されていません 10,11。 これらの発見は、外科的ジェスチャーが外科的パフォーマンスを定量化し、RARP 後の機能的転帰を予測するための新しい方法として機能する可能性があることを示唆しています。

この研究では、手術のジェスチャーと手術結果との関連性を実証します。 私たちの結果は、特に(超専門家ではなく)専門家グループにおいて、NSのホットカットが少ないほど、より良い効力回復と関連していることを示しています。 これは、NS での広範なエネルギー使用が近くの神経血管束に悪影響を及ぼし、EF 回復に影響を与えることを報告した先行研究と一致しています 8,12。 より多くのピール/プッシュはより良い効力回復と関連しており、これは専門家グループと超専門家グループの両方で確認されました。 私たちは、ピール/プッシュは NS 中に正しい切断面を見つけるための適切なジェスチャーであり、結果的により良い結果をもたらす可能性があると考えています。 注目すべきことに、この結果は、外科医の専門知識とジェスチャーの種類との間の相互作用も示しており、経験レベルの異なる外科医が使用する同じ種類のジェスチャーは、EF 回復に異なる影響を与える可能性があります。 たとえば、専門家グループでは、拡散が多く、フックが多く、凝固が少ないほど、EF 回復の可能性が高くなりますが、スーパーエキスパート グループでは、拡散が少なく、フックが少なく、凝固が多いと、EF 回復の可能性が高くなります。 EFの回復。 これらの調査結果は、ジェスチャーの種類だけが結果に影響するのではなく、ジェスチャーの実行とコンテキストも重要である可能性が高いことを示しています。 最近の研究では、同じタイプのジェスチャの有効性とエラー率が、ドライ ラボ設定の初心者、中級者、専門家の間で異なることがわかりました 13。 次のステップでは、これらの違いがライブ手術での手術結果にどのような影響を与えるかを調査します。

同じ概念が他の外科手術にも適用できるはずです。手術をジェスチャーに分解することで、さまざまなジェスチャーが手術結果に与える影響を定量的かつ客観的に研究できます。 手術を客観的に評価し定量化することは、従来は困難でした。 一般的な解決策は、GEARS や DART などの客観的評価ツールを使用して手術スキルを評価することです 14、15、16。 残念ながら、これらのツールには主観性があり、最も詳細なレベルで手術データを取得することはできません17。 外科手術のパフォーマンスを定量化する別の方法は、器具の運動学データなどの自動パフォーマンス測定基準 (APM) を使用することです18。 APM は専門知識を区別し、患者の転帰を予測することができました 19,20。 しかし、主に外科医の効率の尺度である APM の欠点の 1 つは、APM を実用的なフィードバックに変換するのが難しいことです 18、19、21。 手術のジェスチャーは、手術を客観的に定量化すると同時に、研修医に実用的なフィードバックを提供する可能性を秘めています。 これらの指標は外科医のパフォーマンスを異なる方法で評価し、関連する異なる情報を含みます。 ジェスチャーは、手術ビデオに基づいて、器具と組織の相互作用の文脈で手術行為を包括的に分解します。 運動学は、座標に基づいた器具の動きに関する要約情報を提供し、器具の効率をより反映する可能性があります。 これらの異なる評価方法は、外科手術のパフォーマンスの全体像を描くために相互に補完する必要があります。

手術のジェスチャーを ML モデルに組み込むことで、術後 1 年間の EF 回復が効果的に予測されました。 調査結果の再現性を確認するために、2 つの ML チームが 2 つの予測モデルを個別に構築し、評価しました。 両チームは、一連の手術ジェスチャーの中に、中程度から強いAUCでEFの回復を予測できる有益なシグナルがあることを確認した。 NS で使用されるさまざまな手術ジェスチャー タイプ (例: ホット カットの割合) は、モデルがどのように予測を行ったかを部分的に説明できます。 さらに、ML モデルは、従来の統計的手法では捉えることが困難な、手術ジェスチャーの時間的 (連続的) 情報 (つまり、手術ジェスチャーの順序) を利用することもできます。 注目すべき点は、フルレンジの時間 (シーケンス) 情報 (シーケンス全体) を利用するトランスフォーマー ベースのモデルを使用したチーム 1 が、短距離の時間情報を利用するロジスティック回帰を使用したチーム 2 よりも高い AUC を達成したことです。 (シーケンス全体を 20 のジェスチャの重複しないセグメントに分割します)。 これは、ジェスチャーの種類だけでなく、ジェスチャーの組み合わせや順序も患者の転帰を決定する役割を果たしている可能性があります。

私たちの以前の研究では、NS22 の期間中、スーパーエキスパートはエキスパートに比べて NS を完了するまでの時間が短く、両手の器用さが優れていたことがわかりました。 ここでは、解剖ジェスチャー分類システムを使用して、超専門家がより速く、より効率的である (つまり、使用するジェスチャーが少ない) ことを確認しました。 超専門家と専門家が利用した解剖ジェスチャーの割合を比較すると、超専門家は専門家と比べて異なるジェスチャーを選択していることがわかりました。 これは、専門知識を区別するために外科手術のジェスチャーが使用される可能性を示唆しています。

臨床的特徴に関しては、EF から回復した患者は若く、全体的な状態が良好であることがわかりました。これは以前の文献 23、24 と一致しています。 臨床的特徴のみを使用して 1 年間の EF 回復を予測すると、中程度の AUC が達成されました。 以前の出版物では、患者のベースラインの効力状態が、RARP 後の EF 回復にとって重要な要素であることが示唆されています 23,24。 この研究に含まれたすべての症例は、術前のEFが無傷であり、男性の性的健康インベントリ(SHIM)スコアが非常に高かった(中央値24、25段階評価)ため、EFの回復に対する患者要因の影響が軽減された可能性があることは注目に値する。予測。

この研究での発見は重要な臨床的意味を持っています。 ML ベースの予測システムが存在しない場合、外科医は術後数か月から数年後に勃起機能などの患者の転帰に関するフィードバックしか受け取ることができません。 この時間的なずれ(手術から結果まで)により、今日の行動が将来的に患者にどのような影響を与えるかを評価することが困難になります。 私たちの論文で紹介されている訓練された ML モデルを使用すると、手術直後にフィードバックを提供できる可能性があり、外科医はその後の手術に改善を迅速に組み込むことができる可能性があります。 さらに、私たちのグループは最近、ジェスチャの認識と分類のタスクを自動化する ML アルゴリズムを構築しました25。 現在の研究の ML モデルと組み合わせることで、手術ビデオのアノテーションから患者の転帰予測まで、リアルタイムで患者の転帰を直接予測するプロセス全体を完全に自動化できる可能性があります。 私たちの今後の研究は、患者の転帰にとって重要な特定の解剖ジェスチャーシーケンスを正確に特定し、外科医の訓練にさらに実用的なフィードバックを提供できるようにするために、モデルの解釈可能性に専念する予定です。

現在の研究にはいくつかの制限があります。 まず、サンプル サイズが比較的小さかったため、将来的には拡大する可能性があります。 それにもかかわらず、一般化可能性に対処するために 2 つの機関からのデータを含めました。 第二に、NS 中に行われる外科的ジェスチャーの状況を考慮しませんでした。 今後の研究では、ジェスチャーを特定の解剖学的構造(椎弓根、外側筋膜など)に帰属させ、その効果が類似しているかどうかを研究する可能性があります。 第三に、この研究では 1 種類の外科手術 (つまり NS) のみが使用されており、所見は専門分野にわたる複数の手術で検証される必要があります。 最後に、症例の複雑さの客観的な測定が欠如しているため、今回の研究では症例の複雑さは調整されませんでした。 これは、依然として、手術のジェスチャーと手術結果との関連性を混乱させる要因となっています。

要約すると、NS中に実行された解剖ジェスチャーはRARP後のEF回復を予測することがわかりました。 ホットカットの使用を減らし、ピール/プッシュの使用を増やすと、EF 回復の可能性が高くなります。 ML モデルは、EF 回復を正確に予測するために構築されています。 さらに、手術のジェスチャーと外科医の経験を相関させます。 これらの発見は、手術を手術動作の粒度まで分解することが、手術のパフォーマンスを定量化する新しい方法として機能する可能性があることを示唆しており、この方法は、手術結果を予測し、実用的なフィードバックを提供するために、さまざまな外科専門分野に広く応用できる可能性があります。

南カリフォルニア大学と聖アントニウス病院からの治験審査委員会の承認の下、これら2つの国際機関から2016年7月から2018年11月までに一次RARPを受けた男性が前向きに収集され、以下の条件が存在する場合にこの研究に含まれた。 ) 完全なベースライン EF。 (b) 完全な NS 手術ビデオ映像。 (c) 術後 1 年以上の追跡調査。 両側性の非神経温存症例は除外された。 この研究に参加したすべての患者から書面による同意を得ました。 主要評価項目は、RARP 後の 1 年間の EF 回復でした。 無傷のベースラインEFおよび1年間のEF回復はどちらも、ホスホジエステラーゼ5型阻害剤の有無にかかわらず、試行の50%以上(SHIMの2番目の質問でスコア4以上)で性交に十分な硬さの勃起を達成することと定義されました26。

含まれた症例の NS は、上級外科医フェローと学部外科医によって行われました。 外科医は、過去の出版物に基づいて、100 ~ 1999 件のロボット手術を行った専門家と、2000 件以上のロボット手術を行った超専門家の 2 つの手術経験レベルに分けられました 22,27。

臨床データは、年齢、術前 SHIM スコア 28、ASA の身体状態 29、NS 範囲などの患者および治療因子の両方から構成されるカルテレビューによって取得されました (表 1)。 12か月時点の追跡データは、患者から報告された結果を利用して、独立した研究コーディネーターによるカルテレビューまたは電話によって取得されました。

双方向の NS ビデオ映像は手動でレビューされました。 合計 7 人のアノテーター (RM、IR、GD、AD、SC、MO、SR) が標準化されたトレーニングを受け、その後 3 つのトレーニング ビデオのジェスチャ シーケンス (合計 365 個のジェスチャ) に独立してラベルが付けられました。 7 人のアノテーター間のジェスチャー分類一致率は、ジェスチャーの総数における 7 人のアノテーター全員の間で一致するジェスチャー ラベルの割合を計算することによって評価されました。 高い評価者間の一致率 (328/365、89.9%) が達成され、その後 80 の正式な NS ビデオが分割され、アノテーター間で注釈が付けられました。

ビデオ内のすべての個別の手術動作は、我々の分類システムに従って特定のジェスチャとしてラベル付けされており、これには 9 つのアクティブな切開ジェスチャと 4 つのサポート ジェスチャ (つまり、切開ジェスチャを促進することを目的としたジェスチャ、たとえば、撤回) が含まれます (図 1)5。 複数の器具が同時に動く場合、コンソール外科医の利き手の器具の動きは主要なジェスチャーとして注釈が付けられました。

マン・ホイットニーの U 検定とカイ二乗検定を使用して、それぞれ連続的およびカテゴリ別の患者人口統計データを比較しました。 マルチレベル混合効果モデルを使用して、1 年間の EF 回復状態 (独立変数) とケース内の各種類のジェスチャーの割合 (従属変数) との関係を評価しました。同時に、複数のケースが存在することを前提としたデータ クラスタリングを考慮しました。同じ外科医によって行われました。 外科医の経験 (独立変数) と症例内の各タイプのジェスチャーの割合 (従属変数) の間の関係も、解剖技術の違いを特定するためにマルチレベル混合効果モデルによって評価されました。 統計分析は、IBM® SPSS v24 を使用して実施され、p < 0.05 (両側) が統計的に有意であるとみなされます。

ジェスチャーシーケンス (すなわち、時間順に NS で使用されるすべてのジェスチャー) と臨床的特徴 (すなわち、表 1 に示されるすべての変数) の両方を使用して、1 年間の EF 回復の予測モデルを構築しました。 結果の再現性を確認するために、2 つの ML チームが ML アルゴリズムを使用して予測モデルを個別に構築し、モデルのパフォーマンスをテストしました。

ML チーム 1 (JX、LT、LY) は、ジェスチャ シーケンス全体 (トランスフォーマー ベースのネットワーク、つまり IMV-LSTM30) と臨床特徴 (FT トランスフォーマー、すなわち、臨床的特徴の表形式のネットワークです31)。 ネットワークは、すべてのエンコードされたジェスチャ表現ベクトルの加重合計を計算することを学習するモジュールであるアテンション メカニズムによって選択されました。これにより、モデルが長期的な依存関係を柔軟に把握し、分析全体の最も関連性の高い部分に注意を集中させることができます。順序。 トレーニングの最初のフェーズでは、両方のサブネットワークが確率的勾配降下法で収束するまでトレーニングされました。 第 2 フェーズでは、各ネットワークから抽出された表現が連結され、完全に接続された層に供給されて、単一の EF 回復予測が生成されました。 次に、モデルはモンテカルロ法によって合計 100 回の反復で評価されました。 各反復では、モデルのパフォーマンスを独立してテストするために、トレーニング データとして 70 のケースをランダムに選択し、残りの 10 のケースをホールドアウト セットとして選択しました。 100 回の反復にわたるテストセットの ROC 曲線下面積 (AUC) と 95% 信頼区間 (CI) を報告します。 EF 予測にとって重要なシーケンスを説明するために、チーム 1 はシーケンス内の各ジェスチャの注意スコアを抽出し、オクルージョン技術を使用して、EF 回復と正または負の相関関係があるジェスチャ シーケンスの指標として方向性を抽出しました。

ML チーム 2 (DK、AA) は、1 年間の EF 回復のためのロジスティック回帰予測モデルを構築しました。 このモデルは、その単純さと、データの記憶 (つまり、過剰適合) を避けるために選択されました。 臨床的特徴のみを考慮すると、ロジスティック回帰モデルはそのような特徴を 1 年間の EF 回復結果に直接マッピングしました。 ジェスチャ シーケンスだけを考慮した場合、チーム 2 は弱い教師によるアプローチを採用しました。 これには、ジェスチャ シーケンス全体を、20 個のジェスチャからなる重複しない同じサイズのセグメントに分割することが含まれます (セグメントごとのジェスチャの数は、保持されたセットに基づいて経験的に決定されました)。 モデルのトレーニング段階で、各セグメントは、対応する症例固有の 1 年間の EF 回復結果にマッピングされました。 たとえば、ケースに 440 のジェスチャがある場合、440/20 = 22 のジェスチャのサブシーケンスが発生します。 各サブシーケンスは、データベース内の個別のサンプルとして等価に考えることができます。 これらのサブシーケンスは同じ手術症例に属し、手術症例は単一のターゲット (つまり、EF 回復) に関連付けられているため、そのようなすべてのサブシーケンスに症例のターゲットを使用しました。 これにより、入力ジェスチャ サブシーケンスと出力 EF 回復値で構成される 22 の入出力ペアが生成されます。 ロジスティック回帰のトレーニングに使用する完全なデータベースを生成するために、すべての手術症例に対してこの戦略を繰り返しました。 このような設定は「弱教師あり学習」と呼ばれ、モデルがトレーニングされるデータセットのサイズを拡大するためによく採​​用されます。 長さが 20 で割り切れないジェスチャ シーケンスの場合、ジェスチャ シーケンスの末尾が削除され、モデルに表示されないことに注意してください。 これは、ロジスティック回帰モデルが一貫した次元の入力を期待するためです。 モデルは、前述のジェスチャ サブシーケンスと EF 回復値のデータベースでトレーニングされました。 ジェスチャのサブシーケンス (20 のジェスチャで構成される) が与えられると、モデルは患者が 1 年後に EF を回復するかどうかを反映する 1 つの予測を返しました。 これらの 20 のジェスチャは、NS ステップ中に外科医によって実行されるアクション全体を捉えているわけではありません。 弱教師あり学習ではよくあることですが、推論中にそのようなアクションをすべて捉えるために、同じ手術症例に属するサブシーケンスのすべてのモデル予測を集約します。 すべての症例固有のサンプルにわたって最も可能性の高い予測が、その特定の手術症例の最終予測とみなされる多数決ルールを実装しました。 たとえば、15/22 サンプルが EF 回復予測に関連付けられている場合、モデルはこのケースでは 1 年で EF が回復すると予測します。 解剖ジェスチャーシーケンスと臨床的特徴の両方を考慮する際、このチームは前述の弱い教師付きアプローチを引き続き採用しました。 チーム 2 はチーム 1 と同じ評価設定を実装し、100 回の反復にわたって 95% CI の AUC を報告しました。

研究デザインの詳細については、この記事にリンクされている Nature Research レポートの概要をご覧ください。

現在の研究中に生成されたデータセット、および/または現在の研究中に分析されたデータセットは、合理的な要求に応じて責任著者から入手できます。

この記事のコードは、https://github.com/crseusc/NS-Gestures-and-EF-outcomes で見つけることができます。

バークマイヤー、JD et al. 肥満手術後の手術技術と合併症発生率。 N.Engl. J.Med. 369、1434–1442 (2013)。

記事 CAS Google Scholar

Fecso, AB、Szasz, P.、Kerezov, G. & Grantcharov, TP 手術における患者の転帰に対する技術的パフォーマンスの影響: 系統的レビュー。 アン。 外科。 265、492–501 (2017)。

記事 Google Scholar

Hung、AJ、Liu、Y.、Anandkumar、A. ロボット手術における技術スキル評価を自動化するためのディープラーニング。 JAMA Surg. 156、1059 (2021)。

記事 Google Scholar

オレゴン州メイレレスら。 手術ビデオの注釈フレームワークに関する SAGES のコンセンサス推奨事項。 外科。 エンドスク。 35、4918–4929 (2021)。

記事 Google Scholar

Ma、R.ら。 腎門解剖のためのロボット解剖技術を特徴付けるための新しい解剖ジェスチャー分類。 J.ウロル。 205、271–275 (2021)。

記事 Google Scholar

Siegel, RL、Miller, KD、Fuchs, HE & Jemal, A. がん統計、2022 年。カリフォルニア州がん J. Clin。 72、7–33 (2022)。

記事 Google Scholar

米国予防サービス特別委員会。 他。 前立腺がんのスクリーニング: 米国予防サービス特別委員会の推奨声明。 JAMA 319、1901–1913 (2018)。

記事 Google Scholar

Basourakos、SP et al. 勃起不全を軽減するためのロボット支援による根治的前立腺切除術の手技: 技術的な説明とビデオ編集。 J.エンドロール。 https://doi.org/10.1089/end.2021.0081 (2021)。

ヴィッカース、A.ら。 手術の質のマーカーとしての根治的前立腺切除術後のがん制御と機能的転帰:単一がんセンターにおける外科医間の不均一性の分析。 ユーロ。 ウロル。 59、317–322 (2011)。

記事 Google Scholar

チェン、AB 他。 泌尿器科における人工知能の応用: 泌尿器科医の流暢さを実現するための報告基準。 ウロル。 クリン。 49、65–117 (2022)。

記事 Google Scholar

ランビン、P.ら。 ラジオミクス: 医療画像と個別化医療の間の架け橋。 ナット。 クリン牧師。 オンコル。 14、749–762 (2017)。

記事 Google Scholar

Ahling, TE、Skarecky, D. & Borin, J. 神経血管束の焼灼と非焼灼保存が能力の早期回復に及ぼす影響。 J.エンドロール。 20、586–589 (2006)。

記事 Google Scholar

イノウエ、DA et al. ロボット手術における解剖ジェスチャーの有効性を評価する。 J.ロボット。 外科。 https://doi.org/10.1007/s11701-022-01458-x (2022)。

ヴァンストラム、EB 他。 外科的解剖を評価するための客観的スコアリングツールの開発と検証:ロボット技術のための解剖評価(DART)。 ウロル。 練習してください。 8、596–604 (2021)。

記事 Google Scholar

マサチューセッツ州アガザデ 他 Global Evaluative Assessment of Robotic Skills (GEARS) の外部検証。 外科。 エンドスク。 29、3261–3266 (2015)。

記事 Google Scholar

Goh、AC、Goldfarb、DW、Sander、JC、Miles、BJ & Dunkin、BJ ロボットスキルのグローバル評価: ロボット手術スキルを測定するための臨床評価ツールの検証。 J.ウロル。 187、247–252 (2012)。

記事 Google Scholar

Ma、R.、Reddy、S.、Vanstrum、EB、Hung、AJ 泌尿器外科トレーニングにおける革新。 カー。 ウロル。 議員第22、26号(2021年)。

記事 Google Scholar

フン、AJ 他ロボット支援による根治的前立腺切除術の客観的なパフォーマンス指標の開発と検証: パイロット研究。 J.ウロル。 199、296–304 (2018)。

記事 Google Scholar

Hung, AJ、Chen, J. & Gill, IS 外科医のパフォーマンスを測定し、ロボット手術の臨床結果を予測するための自動パフォーマンスメトリクスと機械学習アルゴリズム。 JAMA Surg. 153、770–771 (2018)。

記事 Google Scholar

フン、AJ 他機械学習と自動化されたパフォーマンス指標を利用して、ロボット支援による根治的前立腺切除術のパフォーマンスを評価し、結果を予測します。 J.エンドロール。 32、438–444 (2018)。

記事 Google Scholar

Ma、R.ら。 臨床的に関連するパフォーマンス指標に基づいたカスタマイズされたフィードバックにより、ロボット縫合スキルの習得が促進されます。これは、非盲検パイロットランダム化比較試験です。 J.ウロル。 208、414–424 (2022)。

フン、AJ 他専門家と超専門家: ロボット支援による根治的前立腺切除術の自動化されたパフォーマンス指標と臨床転帰の違い。 BJUインターナショナル 123、861–868 (2019)。

記事 Google Scholar

Bhat KRS et al. ロボット支援による根治的前立腺切除術後の術後効力回復の予測術前および術後ノモグラム。 J.ウロル。 206、942–951 (2021)。

マルホール、JP et al. 根治的前立腺切除術後の勃起機能の回復を予測するためのノモグラムの開発。 J.セックス。 医学。 16、1796–1802 (2019)。

記事 Google Scholar

Kiyasseh, D. et al. ビジョンベースの深層学習によるロボット手術の定量化。 プレプリントは https://arxiv.org/abs/2205.03028 (2022) にあります。

グエン、LNら。 根治的前立腺切除術中の海綿状神経血管束温存のリスクと利点:系統的レビューとメタ分析。 J.ウロル。 198、760–769 (2017)。

記事 Google Scholar

アッボウディ、H. et al. 泌尿器科処置の学習曲線: 系統的レビュー。 BJUインターナショナル 114、617–629 (2014)。

記事 Google Scholar

Cappelleri, JC & Rosen, RC 男性のための性的健康インベントリー (SHIM): 研究と臨床経験の 5 年間のレビュー。 内部。 J.インポット研究所 17、307–319 (2005)。

記事 CAS Google Scholar

Mayhew, D.、Mendonca, V. & Murthy, BVS ASA の物理的状態のレビュー - 歴史的観点と現代の発展。 麻酔 74、373–379 (2019)。

記事 CAS Google Scholar

Vaswani、A. et al. 必要なのは注意力だけです。 神経情報処理システムの進歩 vol. 30 (Curran Associates, Inc.、2017)。

Gorishniy, Y.、Rubachev, I.、Khrulkov, V.、Babenko, A. 表形式データの深層学習モデルの再考。 https://arxiv.org/abs/2106.11959 (2021)。

リファレンスをダウンロードする

この研究は、賞番号 R01CA273031 の下、国立がん研究所から一部支援を受けました。

ロボット シミュレーション & 教育センター、Catherine & Joseph Aresty 泌尿器科、USC 泌尿器科研究所、南カリフォルニア大学、ロサンゼルス、カリフォルニア州、米国

Runzhuo Ma、Timothy N. Chu、Elyssa Y. Wong、Ryan S. Lee、Ivan Rodriguez、Aditya Desai、Maxwell X. Otiato、Sidney I. Roberts、Jessica H. Nguyen、Jasper Laca & Andrew J. Hung

米国ニューヨーク州ニューヨーク州ワイルコーネル医学泌尿器科

アシュウィン・ラマスワミー、ジーナ・デメオ、ジム・C・フー

米国カリフォルニア州ロサンゼルス、南カリフォルニア大学ビタビ工学部コンピューター サイエンス学科

Jiashu Xu、Loc Trinh、Yan Liu

米国カリフォルニア州パサデナのカリフォルニア工科大学コンピューティングおよび数理科学学部

ダニ・キヤセ & アニマシュリー・アナンドクマール

ドイツ、グローナウの聖アントニウス病院、泌尿器科および泌尿器腫瘍科

カタリナ・ウルバノバ & クリスチャン・ワーグナー

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

AJHがこの研究を発案した。 AJHとJCHは資金を獲得した。 AJH、RM、JL、JHN、および CW は、研究の管理と実施を設計し、監督しました。 RM、TNC、IR、GD、AD、MXO、KU、SIR、CW がデータを収集し、手術ビデオに注釈を付けました。 RM、JX、LT、DK がデータ分析と視覚化を実行しました。 AA と YL はデータ分析の指導と監督を提供しました。 RM、AR、RSL が原稿の草稿を書きました。

アンドリュー・J・ハン氏への通信。

CW は、競合する非財務的利益はないと宣言していますが、Intuitive Surgical, Inc. に財務情報開示を報告しています。AA は、競合する非財務的利益はないと宣言していますが、Nvidia の有給従業員です。 JCH は、競合する非財務的利益は存在しないことを宣言しますが、次の競合する財務的利益があると宣言します: ニューヨークのフレデリック J. アンド テレサ ダウ ウォレス基金からの給与援助および前立腺がん財団チャレンジ賞からの給与援助。 NIH R01 CA241758 および R01 CA259173、PCORI CER-2019C1-15682 および CER-2019C2-17372 からの給与サポートもあります。 AJH は競合する非財務的利益はないと宣言していますが、財務情報開示は Intuitive Surgical, Inc. に報告しています。残りの著者は競合する利益はないと宣言しています。

発行者注記 Springer Nature は、発行された地図および所属機関の管轄権の主張に関して中立を保っています。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Ma、R.、Ramaswamy、A.、Xu、J. 他。 手術のパフォーマンスを定量化し、患者の転帰を予測する方法としての手術ジェスチャー。 npj 数字。 医学。 5、187 (2022)。 https://doi.org/10.1038/s41746-022-00738-y

引用をダウンロード

受信日: 2022 年 8 月 30 日

受理日: 2022 年 11 月 29 日

公開日: 2022 年 12 月 22 日

DOI: https://doi.org/10.1038/s41746-022-00738-y

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

npj デジタルメディシン (2023)

泌尿器科の最新レポート (2023)