• 私たちは

医学生に人工知能を教えることに関するカナダの視点

Nature.comにアクセスしていただきありがとうございます。使用しているブラウザのバージョンには、CSSサポートが限られています。最良の結果を得るには、新しいバージョンのブラウザを使用することをお勧めします(または、インターネットエクスプローラーの互換性モードをオフにします)。それまでの間、継続的なサポートを確保するために、スタイリングやJavaScriptなしでサイトを表示しています。
臨床人工知能(AI)の応用は急速に成長していますが、既存の医学部のカリキュラムは、この分野をカバーする限られた教育を提供しています。ここでは、カナダの医学生に開発および配信した人工知能トレーニングコースについて説明し、将来のトレーニングに関する推奨事項を作成します。
医学の人工知能(AI)は、職場の効率を改善し、臨床的意思決定を支援することができます。人工知能の使用を安全に導くには、医師は人工知能をある程度理解する必要があります。多くのコメントは、AIモデルの説明や検証プロセスなど、AI Concepts1を教えることを提唱しています2。ただし、特に全国レベルでは、構造化された計画がほとんど実施されていません。 Pinto Dos Santos et al.3。 263人の医学生が調査され、71%が人工知能のトレーニングが必要であることに同意しました。医療視聴者に人工知能を教えるには、多くの場合、広範な事前知識を持っている学生のための技術的および非技術的な概念を組み合わせた慎重な設計が必要です。私たちは、一連のAIワークショップを医学生の3つのグループに提供する経験を説明し、AIの将来の医学教育に関する推奨事項を作成します。
医学生のための医学部ワークショップの人工知能の5週間の紹介は、2019年2月から2021年4月の間に3回開催されました。各ワークショップのスケジュールは、コースの変更の簡単な説明を示しています。 3つの主要な学習目標:学生は、人工知能アプリケーションでデータがどのように処理されるかを理解し、臨床アプリケーションについて人工知能の文献を分析し、人工知能を開発するエンジニアと協力する機会を活用します。
青は講義のトピックであり、ライトブルーはインタラクティブな質問と回答期間です。灰色のセクションは、簡単な文献レビューの焦点です。オレンジ色のセクションは、人工知能モデルまたは技術を説明する選択されたケーススタディです。 Greenは、臨床的問題を解決し、モデルを評価するために人工知能を教えるように設計されたガイド付きプログラミングコースです。ワークショップの内容と期間は、学生のニーズの評価に基づいて異なります。
最初のワークショップは、2019年2月から4月までブリティッシュコロンビア大学で開催され、8人の参加者全員が肯定的なフィードバックを与えました4。 Covid-19のため、2番目のワークショップは2020年10月11月に事実上開催され、222人の医学生と8人のカナダ医学部の3人の居住者が登録されています。プレゼンテーションスライドとコードは、オープンアクセスサイト(http://ubcaimed.github.io)にアップロードされています。最初の反復からの重要なフィードバックは、講義が激しすぎて、材料が理論的すぎるということでした。カナダの6つの異なるタイムゾーンにサービスを提供すると、追加の課題が発生します。したがって、2番目のワークショップでは、各セッションを1時間に短縮し、コース資料を簡素化し、ケーススタディを追加し、参加者が最小限のデバッグでコードスニペットを完了できるようにするボイラープレートプログラムを作成しました(ボックス1)。 2回目の反復からの重要なフィードバックには、プログラミング演習に関する肯定的なフィードバックと、機械学習プロジェクトの計画を実証するためのリクエストが含まれていました。したがって、2021年3月から4月にかけて126人の医学生のために実質的に開催された3回目のワークショップでは、よりインタラクティブなコーディング演習とプロジェクトフィードバックセッションを含めて、プロジェクトにワークショップの概念を使用することの影響を実証しました。
データ分析:データパターンを分析、処理、および通信することにより、データの意味のあるパターンを識別する統計の研究分野。
データマイニング:データの識別と抽出のプロセス。人工知能のコンテキストでは、これはしばしば大きく、各サンプルに複数の変数があります。
次元削減:多くの個々の機能を使用してデータを変換するプロセスは、元のデータセットの重要なプロパティを維持しながら、機能を少なくします。
特性(人工知能のコンテキスト):サンプルの測定可能な特性。多くの場合、「プロパティ」または「変数」と同じ意味で使用されます。
勾配活性化マップ:人工知能モデル(特に畳み込みニューラルネットワーク)を解釈するために使用される手法。ネットワークの最後の部分を最適化して、高度に予測的なデータまたは画像の領域を識別するプロセスを分析します。
標準モデル:同様のタスクを実行するために事前に訓練された既存のAIモデル。
テスト(人工知能のコンテキストで):モデルが以前に遭遇したことのないデータを使用してタスクをどのように実行するかを観察します。
トレーニング(人工知能のコンテキスト):モデルが新しいデータを使用してタスクを実行する機能を最適化するためにモデルが内部パラメーターを調整するようにデータと結果をモデルに提供します。
ベクトル:データの配列。機械学習では、各配列要素は通常、サンプルのユニークな機能です。
表1に、各トピックのターゲット学習目標を含む、2021年4月の最新コースを示します。このワークショップは、技術レベルに慣れていない人々を対象としており、学部の医学の初年度を超えて数学的知識を必要としません。このコースは、6人の医学生と3人の教師によって開発されました。エンジニアは教えるために人工知能理論を開発しており、医学生は臨床的に関連する資料を学んでいます。
ワークショップには、講義、ケーススタディ、ガイド付きプログラミングが含まれます。最初の講義では、データの視覚化、ロジスティック回帰、記述的および帰納的統計の比較など、生物統計学のデータ分析の選択概念を確認しました。データ分析は人工知能の基礎ですが、データマイニング、重要性テスト、インタラクティブな視覚化などのトピックを除外します。これは、時間の制約によるものであり、一部の学部生は生物統計学の事前のトレーニングを受けており、よりユニークな機械学習のトピックをカバーしたいと考えていたためです。その後の講義では、最新の方法を導入し、AIの問題の定式化、AIモデルの利点と制限、およびモデルテストについて説明します。講義は、既存の人工知能装置に関する文献と実践的な研究によって補完されています。既存の人工知能デバイスの制限を理解するなど、臨床的な質問に対処するためのモデルの有効性と実現可能性を評価するために必要なスキルを強調します。たとえば、学生に、Kupperman et al。、5が提案した小児頭部傷害ガイドラインを解釈するように依頼しました。これは、人工知能決定ツリーアルゴリズムを実装して、CTスキャンが医師の検査に基づいて役立つかどうかを判断するかどうかを判断しました。これは、医師を置き換えるのではなく、医師が解釈するための予測分析を提供するAIの一般的な例であることを強調します。
利用可能なオープンソースのブートストラッププログラミングの例(https://github.com/ubcaimed/ubcaimed.github.io/master/programming_examples)では、探索的データ分析、寸法削減、標準モデルのローディング、およびトレーニングを実行する方法を示します。 。およびテスト。 Google Colaboratory Notebooks(Google LLC、Mountain View、CA)を使用して、PythonコードをWebブラウザーから実行できるようにします。図2に、プログラミング演習の例を示します。この演習では、ウィスコンシンのオープン乳房イメージングデータセットと決定ツリーアルゴリズムを使用して悪性腫瘍を予測することが含まれます。
関連するトピックと、公開されたAIアプリケーションからの例を選択し、1週間を通してプログラムを提示します。プログラミング要素は、モデルを評価して臨床試験で使用できるかどうかを判断する方法など、将来の臨床診療に関する洞察を提供することに関連すると見なされる場合にのみ含まれます。これらの例は、腫瘍を医療画像パラメーターに基づいて良性または悪性として分類する本格的なエンドツーエンドアプリケーションで頂点に達します。
事前知識の不均一性。私たちの参加者は、数学的知識のレベルが異なりました。たとえば、高度なエンジニアリングの背景を持つ学生は、独自のフーリエ変換を実行する方法など、より詳細な素材を探しています。ただし、クラスでフーリエアルゴリズムを議論することは、信号処理の詳細な知識が必要なため、不可能です。
出席流出。特にオンライン形式では、フォローアップ会議への出席が減少しました。解決策は、出席を追跡し、完了証明書を提供することです。医学部は、生徒の課外学術活動の転写を認識していることが知られています。
コース設計:AIは非常に多くのサブフィールドにまたがっているため、適切な深さと幅のコア概念を選択することは困難です。たとえば、研究室から診療所から診療所までのAIツールの使用の継続性は重要なトピックです。データの前処理、モデルの構築、検証をカバーしている間、ビッグデータ分析、インタラクティブな視覚化、AI臨床試験の実施などのトピックは含まれていません。代わりに、最もユニークなAI概念に焦点を当てます。私たちの指針は、スキルではなくリテラシーを改善することです。たとえば、モデルが入力機能をどのように処理するかを理解することは、解釈可能性にとって重要です。これを行う1つの方法は、勾配活性化マップを使用することです。これにより、データのどの領域が予測可能かを視覚化できます。ただし、これには多変量計算が必要であり、導入することはできません8。一般的な用語を開発することは、数学的形式主義のないベクターとしてデータを使用する方法を説明しようとしていたため、困難でした。異なる用語には、たとえば疫学では、「特性」が「変数」または「属性」と呼ばれるという同じ意味を持っていることに注意してください。
知識保持。 AIの適用は限られているため、参加者が知識を保持する程度はまだ不明です。医学部のカリキュラムは、多くの場合、AI教育にも適用できる実用的なローテーション中に知識を強化するために間隔のある繰り返しに依存しています。
プロフェッショナリズムはリテラシーよりも重要です。材料の深さは、数学的な厳密さなしで設計されています。これは、人工知能の臨床コースを開始するときに問題でした。プログラミングの例では、参加者が完全なプログラミング環境をセットアップする方法を把握せずにフィールドに記入してソフトウェアを実行できるようにするテンプレートプログラムを使用します。
対処された人工知能に関する懸念:人工知能が臨床的義務を置き換えることができるという懸念が広まっています3。この問題に対処するために、規制当局によって承認されたほとんどすべてのAI技術が医師の監督を必要とするという事実を含むAIの限界を説明します11。また、特にデータセットが多様でない場合、アルゴリズムはバイアスに陥りやすいため、バイアスの重要性も強調しています。その結果、特定のサブグループが誤ってモデル化され、不公平な臨床決定につながる可能性があります。
リソースは公開されています。講義スライドやコードなど、公開されているリソースを作成しました。同期コンテンツへのアクセスはタイムゾーンのために制限されていますが、AIの専門知識はすべての医学部で利用できないため、オープンソースのコンテンツは非同期学習のための便利な方法です。
学際的なコラボレーション:このワークショップは、エンジニアと一緒にコースを計画するために医学生によって開始された合弁事業です。これは、両方の分野でのコラボレーションの機会と知識のギャップを示しており、参加者が将来貢献できる潜在的な役割を理解できるようにします。
AIコアコンピテンシーを定義します。コンピテンシーのリストを定義すると、既存のコンピテンシーベースの医療カリキュラムに統合できる標準化された構造が提供されます。このワークショップでは、現在、Bloomの分類法の学習客観的レベル2(理解)、3(アプリケーション)、および4(分析)を使用しています。プロジェクトの作成など、より高いレベルの分類でリソースを持つことで、知識をさらに強化できます。これには、臨床専門家と協力して、AIトピックを臨床ワークフローに適用する方法を決定し、標準的な医療カリキュラムにすでに含まれている繰り返しトピックの教育を防ぐ必要があります。
AIを使用してケーススタディを作成します。臨床例と同様に、症例ベースの学習は、臨床的質問との関連性を強調することにより、抽象的な概念を強化できます。たとえば、あるワークショップの調査では、GoogleのAIベースの糖尿病性網膜検出システム13を分析して、外部検証要件や規制承認経路など、ラボからクリニックへのパスに沿った課題を特定しました。
体験学習の使用:技術的なスキルには、臨床研修生の回転学習体験と同様に、焦点を絞った練習と繰り返しのアプリケーションが習得する必要があります。潜在的な解決策の1つは、エンジニアリング教育の知識保持を改善するために報告されているフリップされた教室モデルです14。このモデルでは、学生は理論的資料を独立してレビューし、授業時間はケーススタディを通じて問題を解決することに専念しています。
学際的な参加者のためのスケーリング:私たちは、さまざまなレベルのトレーニングを受けた医師や同盟の医療専門家を含む複数の分野でのコラボレーションを含むAIの採用を想定しています。したがって、カリキュラムは、さまざまな部門の教員と協議して、さまざまなヘルスケアの分野に合わせてコンテンツを調整する必要がある場合があります。
人工知能はハイテクであり、そのコア概念は数学とコンピューターサイエンスに関連しています。人工知能を理解するための医療担当者のトレーニングは、コンテンツの選択、臨床的関連性、および配信方法におけるユニークな課題を提示します。教育ワークショップでAIから得られた洞察が、将来の教育者がAIを医学教育に統合する革新的な方法を受け入れるのに役立つことを願っています。
Google Colaboratory Pythonスクリプトはオープンソースで、https://github.com/ubcaimed/ubcaimed.github.io/tree/master/で入手できます。
Prober、KG and Khan、S。RethinkingMedical Education:A Callo Call Chrive。 akkad。薬。 88、1407–1410(2013)。
McCoy、LGなど。医学生は人工知能について本当に何を知る必要がありますか? NPZH番号。医学3、1–3(2020)。
Dos Santos、DP、他人工知能に対する医学生の態度:多施設調査。ユーロ。放射線。 29、1640–1646(2019)。
ファン、ケンタッキー、フー、R。、およびシングラ、R。 J. Med。教える。 54、1042–1043(2020)。
Cooperman N、et al。頭部外傷後の臨床的に重大な脳損傷のリスクが非常に低い子供を特定する:前向きコホート研究。 Lancet 374、1160–1170(2009)。
ストリート、WN、Wolberg、WHおよびMangasarian、ol。乳房腫瘍診断のための核特徴抽出。生物医学。画像処理。生物医学。ワイス。 1905、861–870(1993)。
Chen、Phc、Liu、Y。およびPeng、L。ナット。マット。 18、410–414(2019)。
セルバラジュ、RR等。 Grad-CAM:グラデーションベースのローカリゼーションによるディープネットワークの視覚的解釈。コンピュータービジョンに関するIEEE国際会議の議事録、618–626(2017)。
Kumaravel B、Stewart K、およびIlic D.学部医学教育におけるOSCEを使用した証拠に基づいた医療能力を評価するためのスパイラルモデルの開発と評価。 BMK薬。教える。 21、1–9(2021)。
Kolachalama VBおよびGarg PS機械学習と医学教育。 NPZH番号。薬。 1、1–3(2018)。
Van Leeuwen、KG、Schalekamp、S.、Rutten、MJ、Van Ginneken、B。およびDe Rooy、M。放射線学における人工知能:100の商用製品とその科学的証拠。ユーロ。放射線。 31、3797–3804(2021)。
Topol、EJ高性能医学:ヒトおよび人工知能の収束。ナット。薬。 25、44–56(2019)。
Bede、E。et al。糖尿病性網膜症の検出のためにクリニックに展開された深い学習システムのヒト中心の評価。コンピューティングシステムにおけるヒューマンファクターに関する2020 CHI会議の議事録(2020)。
カー、B。工学教育におけるひっくり返った教室:研究レビュー。 2015年のインタラクティブコラボレーションラーニングに関する国際会議の議事録(2015)。
著者は、ブリティッシュコロンビア大学の生物医学イメージングおよび人工知能研究クラスターのダニエルウォーカー、ティムサルクディン、ピーターザンドストラに、支援と資金を提供してくれたことに感謝します。
RH、PP、ZH、RS、およびMAは、ワークショップの教育コンテンツの開発を担当しました。 RHとPPは、プログラミングの例を開発する責任がありました。 KYF、OY、MT、およびPWは、プロジェクトの物流組織とワークショップの分析を担当しました。 RH、OY、MT、RSは、図と表の作成を担当しました。 RH、KYF、PP、ZH、OY、MY、PW、TL、MA、RSは、ドキュメントの起草と編集を担当しました。
コミュニケーション医学、キャロリン・マクレガー、ファビオ・モラエス、アディティア・ボラカティに感謝します。


投稿時間:2月19-2024