• 私たちは

医学生への人工知能教育に関するカナダの視点

Nature.com をご覧いただきありがとうございます。使用しているブラウザのバージョンでは、CSS サポートが制限されています。最良の結果を得るには、ブラウザの新しいバージョンを使用する (または Internet Explorer の互換モードをオフにする) ことをお勧めします。それまでの間、継続的なサポートを確保するために、スタイルや JavaScript を使用せずにサイトを表示しています。
臨床人工知能 (AI) の応用は急速に成長していますが、既存の医学部カリキュラムではこの分野をカバーする教育は限られています。ここでは、私たちが開発してカナダの医学生に提供した人工知能トレーニング コースについて説明し、将来のトレーニングについて推奨します。
医療における人工知能 (AI) は、職場の効率を向上させ、臨床上の意思決定を支援します。人工知能の使用を安全に指導するには、医師が人工知能についてある程度の理解を持っている必要があります。多くのコメントは、AI モデルや検証プロセスの説明 2 など、AI の概念 1 を教えることを主張しています。しかし、特に国家レベルでは、体系化された計画はほとんど実施されていません。ピント・ドス・サントスら3.263 人の医学生が調査を受け、71% が人工知能のトレーニングが必要であることに同意しました。医療関係者に人工知能を教えるには、広範な予備知識を持っている学生が多いため、技術的な概念と非技術的な概念を組み合わせる慎重な設計が必要です。3 つの医学生グループに一連の AI ワークショップを実施した経験を説明し、AI における将来の医学教育についての推奨事項を示します。
医学生向けの 5 週間にわたる医学における人工知能入門ワークショップが、2019 年 2 月から 2021 年 4 月までに 3 回開催されました。各ワークショップのスケジュールとコースの変更点の簡単な説明を図 1 に示します。 3 つの主な学習目標: 生徒は、人工知能アプリケーションでデータがどのように処理されるかを理解し、臨床応用のための人工知能の文献を分析し、人工知能を開発するエンジニアと協力する機会を活用します。
青が講義のテーマ、水色が対話形式の質疑応答の時間です。灰色のセクションは、簡単な文献レビューの焦点です。オレンジ色のセクションは、人工知能のモデルまたは技術を説明する厳選されたケーススタディです。Green は、人工知能に臨床問題の解決とモデルの評価を教えることを目的としたガイド付きプログラミング コースです。ワークショップの内容と期間は、学生のニーズの評価に基づいて異なります。
最初のワークショップは、2019 年 2 月から 4 月にかけてブリティッシュ コロンビア大学で開催され、参加者 8 名全員から肯定的なフィードバックが得られました4。新型コロナウイルス感染症(COVID-19)の影響で、2回目のワークショップは2020年10月から11月にかけてバーチャルで開催され、カナダの8つの医科大学から222人の医学生と3人の研修医が登録した。プレゼンテーションのスライドとコードは、オープン アクセス サイト (http://ubcaimed.github.io) にアップロードされています。最初の反復からの主なフィードバックは、講義が濃すぎること、内容が理論的すぎることでした。カナダの 6 つの異なるタイムゾーンにサービスを提供するには、さらなる課題が生じます。したがって、2 回目のワークショップでは、各セッションが 1 時間に短縮され、コース教材が簡素化され、事例研究が追加され、参加者が最小限のデバッグでコード スニペットを完成できる定型プログラムが作成されました (ボックス 1)。2 回目のイテレーションからの主なフィードバックには、プログラミング演習に関する肯定的なフィードバックと、機械学習プロジェクトの計画をデモンストレーションする要求が含まれていました。そのため、2021 年 3 月から 4 月に 126 人の医学生を対象にバーチャルで開催された 3 回目のワークショップでは、ワークショップのコンセプトをプロジェクトに使用することの影響を実証するために、よりインタラクティブなコーディング演習とプロジェクトのフィードバック セッションを組み込みました。
データ分析: データ パターンを分析、処理、伝達することによって、データ内の意味のあるパターンを特定する統計学の研究分野。
データマイニング: データを識別して抽出するプロセス。人工知能のコンテキストでは、これは多くの場合、各サンプルに複数の変数が含まれる大規模なものになります。
次元削減: 元のデータ セットの重要なプロパティを維持しながら、多くの個別の特徴を含むデータをより少ない特徴に変換するプロセス。
特性 (人工知能の文脈で): サンプルの測定可能な特性。多くの場合、「プロパティ」または「変数」と同じ意味で使用されます。
勾配アクティベーション マップ: 人工知能モデル (特に畳み込みニューラル ネットワーク) を解釈するために使用される手法。ネットワークの最後の部分を最適化するプロセスを分析して、予測性の高いデータまたは画像の領域を特定します。
標準モデル: 同様のタスクを実行するために事前トレーニングされた既存の AI モデル。
テスト (人工知能のコンテキストで): モデルがこれまでに遭遇したことのないデータを使用してタスクをどのように実行するかを観察します。
トレーニング (人工知能のコンテキストで): モデルにデータと結果を提供し、モデルが内部パラメーターを調整して新しいデータを使用してタスクを実行する能力を最適化できるようにします。
ベクトル: データの配列。機械学習では、通常、配列の各要素はサンプルの一意の特徴です。
表 1 は、各トピックの対象となる学習目標を含む、2021 年 4 月の最新コースを示しています。このワークショップは、技術レベルに初めて取り組む人を対象としており、医学学部の学位取得 1 年目以降の数学的知識は必要ありません。このコースは 6 人の医学生と、工学の高度な学位を取得した 3 人の教師によって開発されました。エンジニアは教えるために人工知能理論を開発しており、医学生は臨床関連の内容を学習しています。
ワークショップには、講義、ケーススタディ、ガイド付きプログラミングが含まれます。最初の講義では、データの視覚化、ロジスティック回帰、記述統計と帰納統計の比較など、生物統計におけるデータ分析の選択された概念を復習します。データ分析は人工知能の基礎ですが、データマイニング、有意性テスト、インタラクティブな視覚化などのトピックは除外します。これは時間の制約と、一部の学部生が事前に生物統計学のトレーニングを受けており、よりユニークな機械学習のトピックを取り上げたいと考えていたためです。続く講義では、最新の手法を紹介し、AI の問題の定式化、AI モデルの利点と限界、およびモデルのテストについて説明します。講義は、既存の人工知能デバイスに関する文献と実践的な研究によって補完されます。私たちは、既存の人工知能デバイスの限界の理解など、臨床上の疑問に対処するモデルの有効性と実現可能性を評価するために必要なスキルを重視します。たとえば、Kupperman ら 5 が提案した小児頭部外傷ガイドラインを解釈するよう学生に依頼しました。このガイドラインでは、医師の検査に基づいて CT スキャンが有用かどうかを判断するための人工知能決定木アルゴリズムが実装されています。これは、医師に取って代わるのではなく、AI が医師に解釈を提供する予測分析を提供する一般的な例であることを強調します。
利用可能なオープンソースのブートストラップ プログラミング サンプル (https://github.com/ubcaimed/ubcaimed.github.io/tree/master/programming_examples) では、探索的データ分析、次元削減、標準モデルの読み込み、トレーニングを実行する方法を示しています。 。そしてテスト。私たちは、Web ブラウザから Python コードを実行できる Google Colaboratory ノートブック (Google LLC、カリフォルニア州マウンテンビュー) を使用しています。図 2 に、プログラミング演習の例を示します。この演習では、Wisconsin Open Breast Imaging Dataset6 とデシジョン ツリー アルゴリズムを使用して悪性腫瘍を予測します。
関連トピックに関するプログラムを 1 週間を通して提示し、公開されている AI アプリケーションから例を選択します。プログラミング要素は、臨床試験で使用できるかどうかを判断するためのモデルの評価方法など、将来の臨床実践への洞察を提供することに関連すると考えられる場合にのみ含まれます。これらの例は、医療画像パラメータに基づいて腫瘍を良性または悪性として分類する本格的なエンドツーエンドのアプリケーションとして完成します。
事前知識の不均一性。参加者の数学的知識のレベルはさまざまでした。たとえば、高度なエンジニアリングの背景を持つ学生は、独自のフーリエ変換を実行する方法など、より詳細な資料を探しています。ただし、信号処理に関する深い知識が必要となるため、授業でフーリエ アルゴリズムについて議論することは不可能です。
出席者の流出。フォローアップ会議への参加者は、特にオンライン形式で減少しました。解決策としては、出席状況を追跡し、修了証明書を発行することが考えられます。医学部は学生の課外活動の成績証明書を認めていることが知られており、これにより学生の学位取得を奨励することができます。
コース設計: AI は非常に多くの下位分野にまたがっているため、適切な深さと広さの中核概念を選択するのは困難な場合があります。たとえば、研究室から診療所までの AI ツールの使用の継続性は重要なテーマです。データの前処理、モデルの構築、検証については取り上げていますが、ビッグ データ分析、インタラクティブな視覚化、AI 臨床試験の実施などのトピックは含まれておらず、代わりに最もユニークな AI の概念に焦点を当てています。私たちの基本原則は、スキルではなく読み書き能力を向上させることです。たとえば、モデルが入力特徴をどのように処理するかを理解することは、解釈可能性にとって重要です。これを行う 1 つの方法は、データのどの領域が予測可能であるかを視覚化できる勾配アクティベーション マップを使用することです。ただし、これには多変量微積分が必要であり、導入できません8。数学的形式主義を使わずにデータをベクトルとして扱う方法を説明しようとしていたため、共通の用語を開発するのは困難でした。異なる用語は同じ意味を持つことに注意してください。たとえば、疫学では、「特性」は「変数」または「属性」として説明されます。
知識の保持。AI の応用には限界があるため、参加者がどの程度知識を保持しているかはまだわかりません。医学部のカリキュラムでは、実践的なローテーション中に知識を強化するために間隔をあけた反復に依存することが多く、これは AI 教育にも適用できます。
専門性は読み書き能力よりも重要です。教材の深さは数学的な厳密性を持たずに設計されていますが、これは人工知能の臨床コースを開始する際に問題でした。プログラミング例では、参加者が完全なプログラミング環境のセットアップ方法を理解することなく、フィールドに入力してソフトウェアを実行できるテンプレート プログラムを使用します。
人工知能に関する懸念の解決: 人工知能が臨床業務の一部を置き換える可能性があるという懸念が広く広まっています3。この問題に対処するために、規制当局によって承認されたほぼすべての AI テクノロジーには医師の監督が必要であるという事実を含め、AI の限界について説明します11。また、特にデータセットが多様でない場合、アルゴリズムはバイアスを生じやすいため、バイアスの重要性も強調します12。その結果、特定のサブグループが誤ってモデル化され、不公平な臨床決定につながる可能性があります。
リソースは公開されています: 講義スライドやコードなどの公開リソースを作成しました。同期コンテンツへのアクセスはタイムゾーンにより制限されていますが、AI の専門知識がすべての医学部で利用できるわけではないため、オープンソース コンテンツは非同期学習に便利な方法です。
学際的なコラボレーション: このワークショップは、医学生がエンジニアと共同でコースを計画するために立ち上げた共同事業です。これは、両方の分野におけるコラボレーションの機会と知識のギャップを示し、参加者が将来貢献できる潜在的な役割を理解できるようにします。
AI のコア コンピテンシーを定義します。コンピテンシーのリストを定義すると、既存のコンピテンシーベースの医療カリキュラムに統合できる標準化された構造が提供されます。このワークショップは現在、ブルーム分類学の学習目標レベル 2 (理解)、3 (応用)、および 4 (分析) を使用しています。プロジェクトの作成など、より高い分類レベルのリソースを用意すると、知識をさらに強化できます。そのためには、臨床専門家と協力して AI トピックを臨床ワークフローにどのように適用できるかを決定し、標準的な医療カリキュラムにすでに含まれている反復的なトピックの指導を防ぐ必要があります。
AIを活用して事例を作成します。臨床例と同様に、症例ベースの学習では、臨床上の疑問との関連性を強調することで、抽象的な概念を強化できます。たとえば、あるワークショップ研究では、Google の AI ベースの糖尿病性網膜症検出システム 13 を分析して、外部検証要件や規制当局の承認経路など、研究室から診療所までの経路に沿った課題を特定しました。
経験的な学習を利用する: 技術スキルを習得するには、臨床研修生のローテーション学習と同様に、集中的な練習と反復適用が必要です。考えられる解決策の 1 つは反転授業モデルであり、これは工学教育における知識の保持を向上させることが報告されています14。このモデルでは、学生は理論的な内容を独自に検討し、授業時間はケーススタディを通じて問題を解決することに当てられます。
多分野の参加者に向けたスケーリング: 私たちは、さまざまなレベルのトレーニングを受けた医師や関連する医療専門家など、複数の分野にわたるコラボレーションを伴う AI 導入を想定しています。したがって、カリキュラムは、医療のさまざまな分野に合わせて内容を調整するために、さまざまな学部の教員と相談して開発する必要がある場合があります。
人工知能はハイテクであり、その中心となる概念は数学とコンピューター サイエンスに関連しています。医療従事者に人工知能を理解させるトレーニングを行うには、コンテンツの選択、臨床関連性、提供方法において特有の課題が生じます。AI in Education ワークショップから得られた洞察が、将来の教育者が AI を医学教育に統合する革新的な方法を採用するのに役立つことを願っています。
Google Colaboratory Python スクリプトはオープンソースであり、https://github.com/ubcaimed/ubcaimed.github.io/tree/master/ から入手できます。
Prober, KG と Khan, S. 医学教育の再考: 行動への呼びかけ。アッカド。薬。88、1407–1410 (2013)。
マッコイ、LG など医学生が人工知能について本当に知っておくべきことは何ですか?NPZh 番号。医学 3、1–3 (2020)。
ドス・サントス、DP、他人工知能に対する医学生の態度: 多施設調査。ユーロ。放射線。29、1640–1646 (2019)。
Fan, KY、Hu, R.、Singla, R. 医学生のための機械学習の紹介: パイロット プロジェクト。J.Med.教える。54、1042–1043 (2020)。
クーパーマン N ら頭部外傷後に臨床的に重大な脳損傷のリスクが非常に低い小児を特定する: 前向きコホート研究。ランセット 374、1160–1170 (2009)。
ウェストバージニア州ストリート、ホワイト州ウォルバーグ、OL マンガサリアン。乳房腫瘍診断のための核特徴抽出。生物医学。画像処理。生物医学。ヴァイス。1905 年、861 ~ 870 年 (1993 年)。
Chen, PHC、Liu, Y.、Peng, L. ヘルスケア用の機械学習モデルを開発する方法。ナット。マット。18、410–414 (2019)。
セルバラジュ、RR et al.Grad-cam: 勾配ベースの位置特定による深層ネットワークの視覚的解釈。コンピューター ビジョンに関する IEEE 国際会議議事録、618 ~ 626 (2017)。
Kumaravel B、Stewart K、Ilic D。学部医学教育における OSCE を使用した証拠に基づく医療能力を評価するためのスパイラル モデルの開発と評価。BMK医学。教える。21、1–9 (2021)。
Kolachalama VB および Garg PS 機械学習と医学教育。NPZh 番号。薬。1、1–3 (2018)。
van Leeuwen, KG、Schalekamp, S.、Rutten, MJ、van Pinneken, B.、de Rooy, M. 放射線医学における人工知能: 100 の市販製品とその科学的証拠。ユーロ。放射線。31、3797–3804 (2021)。
トポル、EJ 高性能医療: 人間と人工知能の融合。ナット。薬。25、44–56 (2019)。
Bede, E. et al.糖尿病性網膜症の検出のためにクリニックに導入された深層学習システムの人間中心の評価。コンピューティング システムにおけるヒューマン ファクターに関する 2020 CHI 会議の議事録 (2020)。
Kerr, B. 工学教育における反転授業: 研究レビュー。2015 年対話型共同学習に関する国際会議の議事録 (2015 年)。
著者らは、支援と資金提供をいただいたブリティッシュ コロンビア大学生物医学イメージングおよび人工知能研究クラスターの Danielle Walker、Tim Salcudin、Peter Zandstra に感謝します。
RH、PP、ZH、RS、MA がワークショップの指導コンテンツの開発を担当しました。RH と PP はプログラミング例の開発を担当しました。KYF、OY、MT、PWは、プロジェクトのロジスティクス組織化とワークショップの分析を担当しました。図と表の作成はRH、OY、MT、RSが担当しました。RH、KYF、PP、ZH、OY、MY、PW、TL、MA、RS が文書の起草と編集を担当しました。
Communication Medicine は、この研究のレビューに貢献した Carolyn McGregor、Fabio Moraes、Aditya Borakati に感謝します。


投稿日時: 2024 年 2 月 19 日