感覚予測と報酬予測を統合するメタ学習機構:計算論的理解と脳内基盤の解明

A02感覚予測と報酬予測を統合するメタ学習機構:計算論的理解と脳内基盤の解明

 ヒトが環境やタスクに応じて適応的に学習パラメータ(学習スピードや探索ノイズ)を調整する脳内メカニズムを、人工知能分野で開発が進んでいるメタ学習機構との対照を通じて、数理モデルの構築、行動実験、脳機能イメージングの3点から多角的に解明することを目的とします。我々が運動スキルを学習する際の学習スピードは、過去のトレーニング経験などによって変化することが知られています。例えば、特定の運動スキルを2日間連続で訓練する場合、2日目の学習スピードは1日目の学習スピードよりも速いことが知られています。このような学習パラメータの調整はどのような脳内メカニズムによって実現されているのでしょうか?我々は人工知能分野で提案されたメタ学習機構からヒントを得て、「脳は長期的な学習パフォーマンスを最大化するように学習パラメータを調整する」、具体的には『強化学習によってメタ学習が行われる』という仮説を立てるに至りました。本研究では、記憶の更新量に応じて報酬を制御する新しい運動メタ学習実験パラダイムを開発し、行動データと脳機能イメージングデータの解析や計算論的モデルとの比較を通じて、脳における運動メタ学習機構の統一的な理解を行います。これにより、運動学習に関わる各脳基質の役割を学習機構の階層性の観点から明確化するとともに、この理解に基づいた新しいメタ学習アルゴリズムの開発に資します。

 

研究者リスト

  • 井澤 淳 

    Project Leader

    井澤 淳 

    筑波大学

    准教授

    WEBSITE

  • 森田 昌彦

    Collaborator

    森田 昌彦

    筑波大学

    教授

    WEBSITE

  • 今水 寛

    Collaborator

    今水 寛

    東京大学

    教授

    WEBSITE

  • Nicolas Schweighofer

    Collaborator

    Nicolas Schweighofer

    Associated Professor

    Associated Professor

    WEBSITE

ページトップへ