Sutton本の第8章の内容のメモです 関数近似の背景 これまでの章ではテーブル形式の推定価値関数を用いてきた それぞれの状態(行動対)について1つの推定値を持っておかねばならない 表を保持するためのメモリや、表を埋め尽くすための計算量が膨れ上がる 限定…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。