強化学習・確率最適制御によるロボットの運動学習

人の生活環境で活躍するロボットの実現には,動的・不確実な環境下に頑健な制御系設計が重要となります.不確実性下の意思決定理論として,確率最適制御,マルコフ決定過程,さらに環境のダイナミクスや報酬関数が未知とする強化学習などがあります.本研究では,これらの理論を基盤として,高次元ロボットの制御系設計問題に対する実用的解法の研究と実機による実験検証を行っています.

y

着衣支援スキルの学習

カルバック・ライブラー制御とその応用

確率システムについて,期待コストを最小化する制御方策を求める確率最適制御問題において,近年ベルマン方程式を線形化できるサブクラス「カルバック・ライブラー制御問題」が発見され注目を集めています.さらに,カルバック・ライブラー情報量の最小化問題やグラフィカルモデルを使った推論問題などに帰着でき,機械学習分野で開発された近似計算手法の利用による大規模システム制御への展開も期待されます.本研究では,ロボットなどの大規模連続系への応用に適したKL制御の拡張法や活用法を開発しています.

y

確率推論によるKL制御

Gaussian Processに基づく能動探索行動の設計

不確実な環境下で着実にタスクを達成するためには,一度タスクから離脱して,予備的行動(探索行動)を計画・実行することで,環境の不確実性を減少させるアプローチが考えられます.本研究では,Gaussian Processと呼ばれる機械学習手法に基づく探索行動設計の枠組みを開発しています.ロボットハンドと触覚センサーを用いた能動物体認識問題や物体形状推定問題について実用的な方法論の確立を目指しています.

y

能動的物体認識

ユーザ個性に適応するヒューマンロボットインタフェース

外骨格ロボットや筋電装具・ロボットでは,ユーザの生体信号からユーザ意図を読み取ってロボットの制御入力を決定します.しかし,ユーザの生体信号はユーザ特有の特徴を持っているため,従来技術では各ユーザに特化したインタフェースを開発していました.本研究では,誰でも簡便に使えるロボットを実現するため,生体信号からユーザ個性成分を分離して,様々なユーザから汎用的な動作意図を読み取ることができるインタフェースの設計法を開発しています.

y

ユーザの歩き方に適応する歩行支援