Title:自然科学における機械学習の利用
津田 宏治(つだ こうじ)
東京大学/理化学研究所 革新知能統合研究センター
自然科学において測定技術の進展に伴い、高次元のデータが簡単に得られるようになり、機械学習技術がデータ解析のために用いられることも日常的となった。一方で、低次元のデータを対象としてきた従来の統計検定技術が限界を迎え、データ解析結果に対する品質保証の仕組みがないまま、人工知能技術が乱用されているという批判もある。本講演では、多重検定、選択的推論 (post-selection inference)など、複雑なアルゴリズムを用いたデータ解析の信頼性を統計学の枠組みの中で保証しようとする試みを紹介する。
参考文献:
1. A. Terada, M. Okada-Hatakeyama, K. Tsuda and J. Sese. Statistical significance of combinatorial regulations. PNAS, 110(32):12996-13001, 2013.
2. S. Suzumura, K. Nakagawa, Y. Umezu, K. Tsuda, I. Takeuchi, Selective Inference for Sparse High-Order Interaction Models, Proceedings of the 34th International Conference on Machine Learning (ICML 2017), pp. 3338-3347, 2017.