Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more ■商品名■ 手術 2021年 06 月号 [雑誌] 教学社大学入試シリーズ赤本大阪市立大学理系‐前期日程5カ年2006英語/数学/国語/物理/化学/生物/地学 東大寺学園中学校 2015年度受験用/英俊社(単行本)