遠隔操作型ロボットハンドのための触覚情報に基づく器用さ支援方策の強化学習

背景

遠隔での繊細な作業を行うために指先の器用な操作型ロボットハンドの需要が増加しています.このような遠隔操作型ロボットハンドを用いて繊細な作業を行う場合,操作するロボットハンドの触覚情報が重要になります.触覚情報が欠如した場合,オペレータの動作に過不足が発生し,タスクに失敗する恐れがあります.この問題に対して,ロボットハンドの触覚センサから得られる触覚情報用いてユーザの器用さを支援するShared Controlと呼ばれる手法があります.この手法では図1のようなシステムを構成します.この手法はユーザへの触覚フィードバックシステムが要らず,簡略なシステムでかつユーザへの認知・学習負荷の低い優れた手法として注目されています.

図1 システムの構成

図1 システムの構成


しかしながら,この手法ではオペレータや環境のモデル化に起因してコントローラの設計が困難であるという課題が存在します.

目的

本研究では,Shared Controlを実現するためにオペレータや環境のモデル化を行わず,かつ自律的に設計する手法の提案を目的としています.本研究では,ロボットハンドによるページめくりタスクを対象のタスクとします.実験環境として,図2のようなロボットハンドの指先とページをモデル化した物理シミュレータを作成し,これを用いてページめくりを支援する方策の学習と実験検証を行いました.

図2 物理シミュレータ

図2 物理シミュレータ

手法

本研究では,オペレータとロボットと環境の相互作用から最適なコントローラの設計に強化学習を用います.まず問題を部分観測マルコフ決定過程(POMDP)問題としてモデル化します.その後,EM方策探索法を用いて効率的に最適な方策を学習します.

成果

器用さ支援方策を用いて次の動画のような被験者実験を行いました.
この実験では,複数の被験者がシミュレータによるページめくりタスクを実施します.
この時のページの到達した高さを,器用さ支援のある時とない時で比較します.


実験の結果は,図3のようになりました.
各被験者ごとのタスクに対する慣れや個人の器用さによって差が発生していますが,全被験者共器用さ支援がある時の方が支援がない時よりも,ページのめくられた高さが高いことが確認されました.
図3 実験結果

図3 実験結果


これによって,提案手法を用いて実現されたShared Controlによりオペレータの器用さが向上したことが確認されました.

関連論文

長谷川嵩大, 松原崇充, 杉本謙二,
“ロボットハンド操作のための触覚情報に基づく器用さ支援方策の強化学習”,
第32回 日本ロボット学会学術講演会(RSJ2014), 2I2-07 (DVD), 九州産業大学, 2014/09/05