1、培訓(xùn)過程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在以后培訓(xùn)班中重聽; 2、培訓(xùn)結(jié)束后,授課老師留給學(xué)員聯(lián)系方式,保障培訓(xùn)效果,免費(fèi)提供課后技術(shù)支持。 3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會?!詈细駥W(xué)員免費(fèi)頒發(fā)相關(guān)工程師等資格證書,提升職業(yè)資質(zhì)。專注高端技術(shù)培訓(xùn)15年,端海學(xué)員的能力得到大家的認(rèn)同,受到用人單位的廣泛贊譽(yù),端海的證書受到廣泛認(rèn)可。 |
Gym是為測試和開發(fā)RL算法而設(shè)計(jì)的環(huán)境/任務(wù)的集合。它讓用戶不必再創(chuàng)建復(fù)雜的環(huán)境。Gym用Python編寫,它有很多的環(huán)境,比如機(jī)器人模擬或Atari 游戲。它還提供了一個(gè)在線排行榜,供人們比較結(jié)果和代碼。
第1章 強(qiáng)化學(xué)習(xí)與常用的仿真環(huán)境平臺介紹(MuJoCo, OpenAI Gym, rllab, DeepMind Lab, TORCS, PySC2等)
第2章 OpenAI gym中的常用仿真環(huán)境介紹,包括Atari 2600 游戲系列、MuJoCo 物理模擬器、Toy text 文本環(huán)境、Robotics機(jī)械手與機(jī)械臂模擬器等
第3章 馬爾科夫決策過程MDP
第4章 基于gym的MDP實(shí)例講解,基于OpenAI Gym構(gòu)建股票市場交易環(huán)境
第5章 基于gym的強(qiáng)化學(xué)習(xí)實(shí)踐:基于值函數(shù)的強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn);基于策略梯度的強(qiáng)化學(xué)習(xí)方法實(shí)現(xiàn)
第6章 虛擬環(huán)境Universe: 一個(gè)用于訓(xùn)練解決通用問題 AI 的基礎(chǔ)架構(gòu)
第7章 基于Universe的強(qiáng)化學(xué)習(xí)實(shí)踐:用OpenAI公司的Gym工具庫和Universe平臺為游戲創(chuàng)建人工智能機(jī)器人 |