图书介绍

人工智能技术丛书 揭秘深度强化学习2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载

人工智能技术丛书 揭秘深度强化学习
  • 彭伟编著 著
  • 出版社: 北京:中国水利水电出版社
  • ISBN:9787517062387
  • 出版时间:2018
  • 标注页数:360页
  • 文件大小:47MB
  • 文件页数:374页
  • 主题词:机器学习-研究

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

人工智能技术丛书 揭秘深度强化学习PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 深度强化学习概览1

1.1 什么是深度强化学习5

1.1.1 俯瞰强化学习6

1.1.2 纵观深度学习17

1.1.3 Hello,深度强化学习18

1.2 深度强化学习的学习策略20

1.3 本书的内容概要22

参考文献24

第2章 强化学习基础25

2.1 真相——经典的隐马尔科夫模型(HMM)27

2.1.1 HMM引例27

2.1.2 模型的理解与推导28

2.1.3 隐马尔科夫模型应用举例31

2.2 逢考必过——马尔科夫决策过程(MDP)33

2.2.1 MDP生活化引例34

2.2.2 MDP模型36

2.2.3 MDP模型引例37

2.2.4 模型的理解38

2.2.5 探索与利用(Exploitation & Exploration)39

2.2.6 值函数和动作值函数42

2.2.7 基于动态规划的强化学习问题求解48

2.3 糟糕,考试不给题库——无模型(Model Free)强化学习54

2.3.1 蒙特卡洛算法55

2.3.2 时序差分算法57

2.3.3 异步强化学习算法61

2.4 学霸来了——强化学习之模仿学习62

2.4.1 模仿学习(Imitation Learning)62

2.4.2 逆向强化学习63

本章总结65

参考文献66

第3章 深度学习基础67

3.1 深度学习简史67

3.1.1 神经网络发展史67

3.1.2 深度学习的分类71

3.1.3 深度学习的应用74

3.1.4 深度学习存在的问题77

3.2 深度学习的基础概念78

3.2.1 深度学习总体感知79

3.2.2 神经网络的基本组成82

3.2.3 深度学习训练85

3.2.4 梯度下降法87

3.2.5 反向传播算法(BP)88

3.3 数据预处理96

3.3.1 主成分分析(PCA)96

3.3.2 独立成分分析(ICA)98

3.3.3 数据白化处理101

3.4 深度学习的硬件基础102

3.4.1 硬件基础介绍102

3.4.2 GPU简介103

3.4.3 CUDA编程108

本章总结112

参考文献117

第4章 功能神经网络层118

4.1 激活函数单元119

4.2 池化层125

4.3 参数开关Dropout127

4.4 批量规范化层(Batch Normalization Layer)129

4.5 全连接层131

4.6 卷积神经网络132

4.7 全卷积神经网络134

4.8 循环神经网络(RNN)137

4.9 深度学习的细节与技巧139

4.9.1 数据扩增140

4.9.2 参数初始化141

4.9.3 训练当中的技巧142

4.9.4 正则化143

4.9.5 训练结果图像分析145

4.9.6 模型集成147

本章总结148

参考文献149

第5章 卷积神经网络(CNN)150

5.1 卷积神经网络基础151

5.1.1 卷积神经网络的历史151

5.1.2 卷积神经网络的核心152

5.2 卷积神经网络结构154

5.2.1 深度卷积神经网络155

5.2.2 深度卷积神经网络可视化158

5.3 经典卷积神经网络架构分析161

5.3.1 一切的开始——LeNet163

5.3.2 王者回归——AlexNet165

5.3.3 起飞的时候——VGG173

5.3.4 致敬经典——GoogLeNet177

5.3.5 没有最深只有更深——ResNet181

5.4 生成对抗网络185

5.4.1 生成对抗网络(GAN)基础185

5.4.2 WGAN介绍189

5.5 R-CNN简介197

5.6 CNN的应用实例201

本章总结204

参考文献205

第6章 循环神经网络(RNN)206

6.1 RNN概览207

6.2 长期依赖(Long Term Dependencies)问题209

6.3 LSTM的变体214

本章总结217

参考文献218

第7章 如何实现CNN——用C语言实现深度学习219

7.1 如何写CMake文件219

7.2 如何实现卷积神经网络223

7.2.1 激活函数223

7.2.2 池化函数226

7.2.3 全连接层229

7.3 卷积神经网络234

7.3.1 CNN的构建234

7.3.2 CNN的前向传播240

7.3.3 CNN的反向传播244

7.4 文件解析246

本章总结253

第8章 深度强化学习254

8.1 初识深度强化学习255

8.1.1 深度强化学习概览255

8.1.2 记忆回放(Memory Replay)机制257

8.1.3 蒙特卡洛搜索树259

8.2 深度强化学习(DRL)中的值函数算法265

8.2.1 DRL中值函数的作用265

8.2.2 DRL中值函数理论推导266

8.3 深度强化学习中的策略梯度(Policy Gradient)算法268

8.3.1 策略梯度算法的作用和优势269

8.3.2 策略梯度算法的理论推导271

8.3.3 REINFORCE算法274

8.3.4 策略梯度算法的优化277

8.3.5 策略子-评价算法(Actor-Critic)279

8.4 深度强化学习网络结构281

参考文献283

第9章 深度强化学习算法框架285

9.1 深度Q学习网络289

9.2 双Q学习292

9.3 异步深度强化学习295

9.4 异步优越性策略子-评价算法298

9.5 DDPG算法301

9.6 值迭代网络303

本章总结308

参考文献309

第10章 深度强化学习应用实例310

10.1 Flappy Bird应用311

10.2 Play Pong应用313

10.3 深度地形-自适应应用(Deep Terrain-Adaptive应用)318

10.4 AlphaGo应用326

10.4.1 独立算法的研究部分328

10.4.2 A1phaGo算法332

本章总结334

参考文献334

附录A常用的深度学习框架335

标准1:与现有编程平台、技能整合的难易程度。335

标准2:和相关机器学习、数据处理生态整合的紧密程度。336

标准3:通过此平台做深度学习之外,还能做什么?336

标准4:对数据量、硬件的要求和支持。336

标准5:深度学习平台的成熟程度。336

A1 Google的TensorFlow340

A1.1 TensorFlow简介340

A1.2 TensorFlow基础341

A2 轻量级的MXNet345

A2.1 MXNet介绍345

A22MXNet基础347

A3 来自UCLA的Caffe349

A3.1 Caffe简介349

A3.2 Caffe基础350

A4 悠久的Theano353

A4.1 Theano简介353

A4.2 Theano基础354

A5 30秒入门Keras355

参考文献360

热门推荐