国产黑丝在线一区二区三区_亚洲成av人片在线_一区二区三区视频在线看_国产嫩草影院久久久久_26uuu国产电影一区二区_欧美日韩久久久_日韩精品专区在线影院重磅_久久免费视频色_北条麻妃一区二区三区_狠狠色综合日日_中文字幕免费不卡_大胆亚洲人体视频_亚洲成人福利片_欧美日韩国产一区二区三区地区_欧美一激情一区二区三区_成人免费视频在线观看

葉梓
  • 葉梓國內(nèi)知名上市IT企業(yè)的資深技術(shù)專家,高級(jí)工程師
  • 擅長領(lǐng)域: 人工智能 大數(shù)據(jù)
  • 講師報(bào)價(jià): 面議
  • 常駐城市:上海市
  • 學(xué)員評(píng)價(jià): 暫無評(píng)價(jià) 發(fā)表評(píng)價(jià)
  • 助理電話: 13006597891 QQ:2116768103 微信掃碼加我好友
  • 在線咨詢

強(qiáng)化學(xué)習(xí)與深度強(qiáng)化學(xué)習(xí)

主講老師:葉梓
發(fā)布時(shí)間:2021-05-21 14:51:35
課程詳情:

【課程時(shí)長】

3天(6小時(shí)/天)

 

【課程簡介】

強(qiáng)化學(xué)習(xí)是當(dāng)前最熱門的研究方向之一,廣泛應(yīng)用于機(jī)器人學(xué)、電子競技等領(lǐng)域。本課程系統(tǒng)性的介紹了強(qiáng)化學(xué)習(xí)(深度強(qiáng)化學(xué)習(xí))的基本理論和關(guān)鍵算法,包括:馬爾科夫決策過程、動(dòng)態(tài)規(guī)劃法、蒙特卡羅法、時(shí)間差分法、值函數(shù)逼近法,策略梯度法等;以及該領(lǐng)域的最新前沿發(fā)展,包括:DQN及其變種、信賴域系方法、Actor-Critic類方法、多Agent深度強(qiáng)化學(xué)習(xí)等;同時(shí)也介紹大量的實(shí)際案例,包括深度強(qiáng)化學(xué)習(xí)中最著名的工程應(yīng)用:Alpha Go。

 

【課程對(duì)象】

計(jì)算機(jī)相關(guān)專業(yè)本科;或理工科本科,具備初步的IT基礎(chǔ)知識(shí)的人員

 

第一天 強(qiáng)化學(xué)習(xí)

 

第一課 強(qiáng)化學(xué)習(xí)綜述

1.強(qiáng)化學(xué)習(xí)要解決的問題

2.強(qiáng)化學(xué)習(xí)方法的分類

3.強(qiáng)化學(xué)習(xí)方法的發(fā)展趨勢

4.環(huán)境搭建實(shí)驗(yàn)(Gym,TensorFlow等)

5.Gym環(huán)境的基本使用方法

 

第二課 馬爾科夫決策過程

1.基本概念:馬爾科夫性、馬爾科夫過程、馬爾科夫決策過程

2.MDP基本元素:策略、回報(bào)、值函數(shù)、狀態(tài)行為值函數(shù)

3.貝爾曼方程

4.最優(yōu)策略

案例:構(gòu)建機(jī)器人找金幣和迷宮的環(huán)境

 

第三課 基于模型的動(dòng)態(tài)規(guī)劃方法

1.動(dòng)態(tài)規(guī)劃概念介紹

2.策略評(píng)估過程介紹

3.策略改進(jìn)方法介紹

4.策略迭代和值迭代

案例:實(shí)現(xiàn)基于模型的強(qiáng)化學(xué)習(xí)算法

 

第四課 蒙特卡羅方法

1.蒙特卡羅策略評(píng)估

2.蒙特卡羅策略改進(jìn)

3.基于蒙特卡羅的強(qiáng)化學(xué)習(xí)

4.同策略和異策略

案例:利用蒙特卡羅方法實(shí)現(xiàn)機(jī)器人找金幣和迷宮

 

第五課 時(shí)序差分方法

1.DP,MC和TD方法比較

2.MC和TD方法偏差與方差平衡

3.同策略TD方法:Sarsa 方法

4.異策略TD方法:Q-learning 方法

案例:Q-learning和Sarsa的實(shí)現(xiàn)

 

第二天 從強(qiáng)化學(xué)習(xí)到深度強(qiáng)化學(xué)習(xí)

 

第一課 基于值函數(shù)逼近方法(強(qiáng)化學(xué)習(xí))

1.維數(shù)災(zāi)難與表格型強(qiáng)化學(xué)習(xí)

2.值函數(shù)的參數(shù)化表示

3.值函數(shù)的估計(jì)過程

4.常用的基函數(shù)

 

第二課 基于值函數(shù)逼近方法(深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合)

1.簡單提一下深度學(xué)習(xí)

2.深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合

3.DQN 方法介紹

4.DQN變種:Double DQN, Prioritized Replay, Dueling Network

案例:用DQN玩游戲——flappy bird

 

第三課 策略梯度方法(強(qiáng)化學(xué)習(xí))

1.策略梯度方法介紹

2.常見的策略表示

3.常見的減小方差的方法:引入基函數(shù)法,修改估計(jì)值函數(shù)法

案例:利用gym和tensorflow實(shí)現(xiàn)小車倒立擺系統(tǒng)等

 

第四課 Alpha Go(深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)的結(jié)合)

1.MCTS

2.策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)

3.Alpha Go的完整架構(gòu)

 

第五課 GAN(深度學(xué)習(xí))

1.VAE與基本GAN

2.DCGAN

3.WGAN

案例:生成手寫數(shù)字的GAN

 

第三天 深度強(qiáng)化學(xué)習(xí)進(jìn)階

 

第一課 AC類方法-1

1. PG的問題與AC的思路

2. AC類方法的發(fā)展歷程

3. Actor-Critic基本原理

 

第二課 AC類方法-2

1. DPG方法

2. DDPG方法

3. A3C方法

案例:AC類方法的案例

 

第三課 信賴域系方法-1

1.信賴域系方法背景

2.信賴域系方法發(fā)展路線圖

3.TRPO方法

案例:TRPO方法的案例

 

第四課 信賴域系方法-2

1.PPO方法

2.DPPO方法簡介

3.ACER方法

案例:PPO方法的案例

 

第五課 多Agent強(qiáng)化學(xué)習(xí)

1.矩陣博弈

2.納什均衡

3.多人隨機(jī)博弈學(xué)習(xí)

4.完全合作、完全競爭與混合任務(wù)

5.MADDPG

案例:MADDPG的案例等


授課見證
推薦講師

馬成功

Office超級(jí)實(shí)戰(zhàn)派講師,國內(nèi)IPO排版第一人

講師課酬: 面議

常駐城市:北京市

學(xué)員評(píng)價(jià):

賈倩

注冊(cè)形象設(shè)計(jì)師,國家二級(jí)企業(yè)培訓(xùn)師,國家二級(jí)人力資源管理師

講師課酬: 面議

常駐城市:深圳市

學(xué)員評(píng)價(jià):

鄭惠芳

人力資源專家

講師課酬: 面議

常駐城市:上海市

學(xué)員評(píng)價(jià):

晏世樂

資深培訓(xùn)師,職業(yè)演說家,專業(yè)咨詢顧問

講師課酬: 面議

常駐城市:深圳市

學(xué)員評(píng)價(jià):

文小林

實(shí)戰(zhàn)人才培養(yǎng)應(yīng)用專家

講師課酬: 面議

常駐城市:深圳市

學(xué)員評(píng)價(jià):

国产黑丝在线一区二区三区_亚洲成av人片在线_一区二区三区视频在线看_国产嫩草影院久久久久_26uuu国产电影一区二区_欧美日韩久久久_日韩精品专区在线影院重磅_久久免费视频色_北条麻妃一区二区三区_狠狠色综合日日_中文字幕免费不卡_大胆亚洲人体视频_亚洲成人福利片_欧美日韩国产一区二区三区地区_欧美一激情一区二区三区_成人免费视频在线观看

          精品日韩电影| www.欧美日韩| 亚洲在线观看免费| 亚洲国产日韩综合久久精品| 亚洲成人自拍一区| 久久国产精品第一页| 国产曰批免费观看久久久| 国产精品一级片在线观看| 成人高清视频在线| 成人欧美一区二区三区视频xxx| 成人欧美一区二区| 性高潮久久久久久久久| 欧美日韩视频第一区| 精品久久久久久久久久久久久久久 | 亚洲精品电影在线一区| 中文字幕乱码一区二区三区| 中文字幕一区二区中文字幕 | 中文字幕中文字幕在线一区| 亚洲va国产va欧美va观看| 国产在线精品一区二区不卡了| 91丝袜国产在线播放| 欧美亚洲免费高清在线观看| 在线观看免费一区| 久久精品亚洲一区二区三区浴池 | 国产风韵犹存在线视精品| 国产精品一国产精品最新章节| 亚洲欧洲一区二区在线观看| 欧美电影免费观看高清完整版在| 亚洲男女毛片无遮挡| 国产精品白丝jk白祙喷水网站| 好看的日韩精品视频在线| 欧美综合色免费| 中文幕一区二区三区久久蜜桃| 日日摸夜夜添夜夜添国产精品| 91免费视频网| 欧美亚洲综合久久| 中文字幕日韩av资源站| 国产一区二区不卡老阿姨| 久久国产精品一区二区三区| 欧美二区乱c少妇| 一区二区三区产品免费精品久久75| 国产乱码字幕精品高清av | 亚洲国产高清aⅴ视频| 免费成人深夜小野草| 国产精品高清一区二区三区| 欧美日韩亚洲丝袜制服| 中文字幕亚洲成人| 成人丝袜高跟foot| 91国在线观看| 亚洲欧美日韩国产手机在线| 国产一区二三区好的| 欧美午夜精品久久久久久蜜| 精品国产乱码久久久久久1区2区| 51国偷自产一区二区三区| 欧美日韩一级黄| 国产精品天美传媒沈樵| 韩国v欧美v日本v亚洲v| 亚洲国产日韩综合一区| 国产精品毛片久久久久久| 国产精品18久久久久久久久| 亚洲日本无吗高清不卡| 自拍偷拍亚洲综合| 91免费看蜜桃| 欧美成人国产一区二区| 久久91精品久久久久久秒播| 三区精品视频| 亚洲欧美区自拍先锋| 97人人做人人人难人人做| 91麻豆精品国产91久久久久| 日韩av中文字幕一区二区三区| 欧美日韩高清在线一区| 国产三级一区二区三区| 成人av电影在线网| 欧美一区二区不卡视频| 国产做a爰片久久毛片| 在线免费精品视频| 日韩精品91亚洲二区在线观看| 精品日韩电影| 亚洲人成在线播放网站岛国 | 日本高清不卡在线观看| 亚洲综合色噜噜狠狠| 免费国产一区二区| 亚洲精选免费视频| 久久久久无码国产精品一区| 国产日产精品一区| 91传媒视频在线观看| 精品久久久久久综合日本欧美| 成人午夜电影小说| 日韩欧美不卡在线观看视频| 国产91对白在线观看九色| 6080yy午夜一二三区久久| 久久99久久精品| 欧美日韩国产系列| 国产成人在线电影| 精品国产一区久久| 91视频免费看| 中文字幕一区av| 欧美人与物videos另类| 亚洲国产综合人成综合网站| 日韩欧美精品一区二区| 性久久久久久久久久久久| 亚洲国产高清国产精品| 日韩黄色免费电影| 欧美人动与zoxxxx乱| 国产不卡高清在线观看视频| 精品国产网站在线观看| 成人欧美一区二区三区视频xxx| 中文字幕一区二区三区乱码在线| 欧美精品久久| 日韩主播视频在线| 欧美精品视频www在线观看| 国产·精品毛片| 久久久国产精品麻豆| 久久青青草原一区二区| 午夜伦理一区二区| 欧美二区在线观看| 91一区二区三区在线观看| 中文字幕第一区第二区| 色综合视频二区偷拍在线| 麻豆精品一区二区av白丝在线| 91精品国产免费久久综合| 97人人澡人人爽| 亚洲成人精品一区二区| 欧美日本在线一区| 97超碰人人模人人爽人人看| 亚洲欧美电影院| 91国偷自产一区二区三区成为亚洲经典| 国产一区二区三区不卡在线观看 | 国产一区不卡在线观看| 香蕉影视欧美成人| 欧美一区日韩一区| 国产精品 日韩| 亚洲成a天堂v人片| 3atv在线一区二区三区| 成人片在线免费看| 五月综合激情日本mⅴ| 欧美一级高清大全免费观看| 99理论电影网| 免费在线观看一区| 久久色成人在线| 最新国产精品久久| 91在线观看一区二区| 五月天中文字幕一区二区| 精品国免费一区二区三区| 神马一区二区影院| 99国产精品久久| 免费看欧美女人艹b| 国产欧美一区二区三区在线老狼| 亚洲一区三区视频在线观看| av一区二区三区四区| 日韩在线a电影| 国产欧美精品一区二区三区四区| 色噜噜偷拍精品综合在线| 99电影在线观看| 国产麻豆视频一区二区| 亚洲综合色自拍一区| 久久久电影一区二区三区| 欧美色网站导航| 久久综合中文色婷婷| 成人av电影在线观看| 免费人成网站在线观看欧美高清| 中文字幕电影一区| 欧美一区二区三区四区五区| 天堂精品一区二区三区| 99精品视频一区| 极品少妇xxxx精品少妇| 一区二区三区日韩欧美| 久久美女高清视频| 欧美猛男男办公室激情| 青青草成人网| 国产伦视频一区二区三区| 国产成人精品亚洲日本在线桃色| 午夜av电影一区| 亚洲视频一区二区在线观看| 精品88久久久久88久久久| 欧美无砖砖区免费| 先锋影音亚洲资源| 麻豆91av| 国产精品久久久久久久久久久久午夜片 | 水野朝阳av一区二区三区| 日韩免费电影一区| 欧美调教femdomvk| 中文字幕一区二区三区有限公司| 久久草.com| 国产精品免费在线| 99国产在线视频| jizz一区二区| www.亚洲国产| 成人黄色电影在线 | 国产精品视频一二| 久久综合精品国产一区二区三区 | 亚洲成av人片在www色猫咪| 国产精品人妖ts系列视频| 久久蜜桃一区二区| 欧美va天堂va视频va在线| 欧美一二三在线| 日韩午夜小视频| 精品久久国产老人久久综合| 日韩欧美久久久| 欧美tickling网站挠脚心|