shugo's kitchen

コンピュータサイエンスを美味しく調理していきたい

読書メモ

強化学習 Sutton本8章 一般化と関数近似

Sutton本の第8章の内容のメモです 関数近似の背景 これまでの章ではテーブル形式の推定価値関数を用いてきた それぞれの状態(行動対)について1つの推定値を持っておかねばならない 表を保持するためのメモリや、表を埋め尽くすための計算量が膨れ上がる 限定…

強化学習 Sutton本5章 モンテカルロ法について

Sutton本の第5章の内容のメモです 前章で扱ったDPとの関係性 価値関数の計算や方策評価,改善といった基本的な考え方は一緒 DPと違って環境の完全な知識(期待報酬, 遷移確率など)は必要とせず、経験のみから価値を推定 エピソード的(=終わりがある)タスク限定…

マスタリングTCP/IP 入門編 読書メモ 【第2章】

今回からいよいよTCP/IPの話に入っていきます。 元書籍→マスタリングTCP/IP 前回の記事→ shugo256.hatenablog.com TCP/IPの概要 インターネット TCP/IPプロトコルの階層モデル ハードウェア(物理層) ネットワークインターフェース層(データリンク層) インタ…

マスタリングTCP/IP 入門編 読書メモ 【第1章 後半】

今回は1.6節から1章の終わりまで行きます。 元書籍→マスタリングTCP/IP 前回の記事→ shugo256.hatenablog.com 通信方式 コネクション型とコネクションレス型 回線交換とパケット交換 通信相手の数による分類 アドレス 唯一性 階層性 ネットワークの構成要素 …

マスタリングTCP/IP 入門編 読書メモ 【第1章 前半】

学科のネットワークの講義がう◯ちだったので自分で勉強してみようということになりました。 だいたい節ごとで気になったところ/勉強になったところを列挙していくスタイルでいきます。 今回は第1章ですが、この章は長めなので1.5節までを一区切りとして分け…