生成系の深層学習を用いた空間/音の認知に関する研究

A01生成系の深層学習を用いた空間/音の認知に関する研究

 脳には空間表象「認知地図」が存在し、主にラットで見つかった海馬の場所細胞で表現されているとされます。近年この認知地図と場所細胞の関係は深く研究され、地図の成り立ちについてより興味深いことが報告されています。本研究では「生成モデル」としての深層学習を用いることで、主体の自律運動と出来上がる認知地図との関係を解析し、最近の知見に基づいた認知地図の理論構築を目指します。特に「見かけ上の試行錯誤(VTE)」と呼ばれるラットの鼻振り運動と、認知地図をもとにした過去のreplayや未来のpre-play現象を理論的にもつなげて議論します。そのような主体運動と認知地図の生成を通して、「身体的な認知」と「既存のAIの知能」の違いから、身体をベースとした脳の理論を新しく提案していく予定です。特に、生成モデルの深層学習の先駆的なDCGAN(Deep Convolutional Generative Adversarial Network)の準備実験を行ってきました。DCGANのデータセットとして、一人称視点で撮影された動画のフレームを用いて、風景の時間的な変遷が内部状態空間にエンコードされ、実際の空間の構造が反映されることを示し、さらにVAEGAN(Variational AutoEncoder+GAN)という手法により、場所細胞に相当するものが、理論モデルでも構成できることを示唆する結果を得ています。また同様の手法を用いてDCGANによる、一音(周波数)入力のデータ学習をもとに多音階を生成するシステム開発なども行い、こちらも人工知能学会・日本物理学会において発表を行っています。これらの研究を発展させ、ロボットの自律運動生成などに組み込んで、広くその成果を社会に知らしめてゆく予定です。

研究者リスト

  • 池上 高志

    Project Leader

    池上 高志

    東京大学

    教授

    WEBSITE

ページトップへ