【30日間返品保証】 不当利得法【全訂第2版】 (法律学の森) | 藤原 正則 |本 | 通販 商品説明に誤りがある場合は、無条件で弊社送料負担で商品到着後30日間返品を承ります。SAPIXオープンテスト 5年2021年5月 原本。 Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more