【30日間返品保証】 高校への数学 2024年 08 月号 [雑誌] | 東京出版 |本 | 通販 商品説明に誤りがある場合は、無条件で弊社送料負担で商品到着後30日間返品を承ります。SAPIXオープンテスト 5年2021年5月 原本。 Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more