記事の概要
オムロンの子会社であるオムロン サイニックエックス(OSX)が、強化学習の新たな最適化手法「EpiRC-PGS」を開発しました。
この技術は、マルコフ決定過程(MDP)に基づき、複数の制約条件を同時に満たしながら、状態遷移の変動にも強い最適な方策を導くことができます。
従来は制約付きMDP(CMDP)とロバストMDP(RMDP)を同時に解決する方法が存在しませんでしたが、この新手法により、その適用範囲が大きく広がることが期待されています。
2025年4月には、OSXおよび東京大学の研究者が国際会議「ICLR 2025」でこの成果を発表する予定です。
これにより、AI技術の進展がさらに加速することが予想されます。
記事のポイント
詳しい記事の内容はこちらから(引用元)
日経Robotics(日経ロボティクス)
強化学習の適用範囲を大きく広げ得る基礎技術が登場した。オムロンの研究子会社であるオムロン サイニックエックス(OSX)…
https://xtech.nikkei.com/atcl/nxt/mag/rob/18/012600001/00171/