見出し画像

イラストで学ぶ人工知能概論を再度勉強する 第2章 状態空間と基本的な探索

はじめに

とある理由で
「二重文節構造」のアイデアに触れた時から大ファンになった
谷口忠大先生の名著「イラストで学ぶ人工知能概論」を
じっくり勉強しなおしたくなって
改訂第2版を購入しなおした。

本noteは、その備忘録

ホイールダック2号、宝箱全部探す

第2章 状態空間と基本的な探索

講義スライドと谷口忠大先生本人の講義動画が
谷口忠大先生から提供されています

講義スライド

2.1 状態空間表現

2.1.1 ロボットと状態空間
ホイールダック2号の知覚と行動の循環を計算機上に表現する
2.1.2 システムのモデル化と不確実性
現実の不確実性のあるシステムをそんなに間違っていない数理的表現でモデル化する
2.1.3 連続システム
状態空間Xと行動空間U
(制御工学ではUは入力だった)
2.1.4 離散システム
状態も行動も離散的。空間の要素は自然数である必要はない
2.1.5 離散確定システムとグラフ表現
離散確定システムは、状態をノード、行動を矢印で表すグラフ表現ができる

2.2 迷路からの状態空間構成

仮定:ホイールダック2号は迷路の完全な地図を持っている
迷路の状態空間設定は自由度がある
・すべてのマスを状態空間とする
・分岐と行き止まりのあるマスのみ状態空間とする
迷路ではないが、物体操作タスクも状態空間グラフを作成できる

2.3 基本的な探索

・しらみつぶし 探索済み状態に印をつける必要がある
→未探索(オープンリスト)と探索済み(クローズドリスト)
2.3.3.深さ優先探索
2.3.4.幅優先探索

ホイールダック2号の迷路探索

宝箱の数は不明なため全マスの探索が必要

本章の最重要ポイント

状態空間をノード、行動空間を矢印としてグラフ化して、
オープンリストとクローズドリストで探索状態を管理すれば
全探索が可能になる

おわりに

私が制御工学で習った状態方程式は連続時間系で

次に、離散時間系(z変換)を学習するという流れだった

本書のように状態空間が離散的かつ有限から入ると、微積分は関係なくなり、小学生でも理解できるレベルになっているところがすごい



いいなと思ったら応援しよう!

YANO Tomoaki@
本noteは私の備忘録ですが、自由に読んでください サポートは、興味を持ったnote投稿の購読に使用させていただきます