好书推荐 好书速递 排行榜 读书文摘

深入理解神经网络

深入理解神经网络
作者:张觉非
副标题:从逻辑回归到CNN
出版社:人民邮电出版社
出版年:2019-09
ISBN:9787115517234
行业:因特网
浏览数:4

内容简介

本书以神经网络为线索,沿着从线性模型到深度学习的路线讲解神经网络的原理和实现。本书将数学基础知识与机器学习和神经网络紧密结合,包含线性模型的结构与局限、损失函数、基于一阶和二阶信息的优化算法、模型自由度与正则化、神经网络的表达能力、反向传播与计算图自动求导、卷积神经网络等主题,帮助读者建立基于数学原理的较深刻的洞见和认知。本书还提供了逻辑回归、多层全连接神经网络和多种训练算法的Python实现,以及运用TensorFlow搭建和训练多种卷积神经网络的代码实例。

......(更多)

作者简介

张觉非

本科毕业于复旦大学计算机系,于中国科学院古脊椎动物与古人类研究所取得古生物学硕士学位,目前在互联网行业从事机器学习算法相关工作。

......(更多)

目录

第一部分 线性模型

第1章 逻辑回归  2

1.1 作为一个神经元的逻辑回归  2

1.2 基础向量几何  4

1.2.1 向量  4

1.2.2 向量的和、数乘与零向量  6

1.2.3 向量的内积、模与投影  8

1.2.4 线性空间、基与线性函数  11

1.2.5 直线、超平面与仿射函数  14

1.3 从几何角度理解逻辑回归的能力和局限  17

1.4 实例:根据鸟类骨骼判断生态类群  20

1.5 小结  24

第2章 模型评价与损失函数  25

2.1 训练集与测试集  25

2.2 分类模型的评价  26

2.2.1 混淆矩阵  26

2.2.2 正确率  27

2.2.3 查准率  27

2.2.4 查全率  27

2.2.5 ROC曲线  28

2.3 损失函数  29

2.3.1 K-L散度与交叉熵  29

2.3.2 最大似然估计  31

2.3.3 从几何角度理解交叉熵损失  33

2.4 小结  35

第3章 梯度下降法  36

3.1 多元函数的微分  36

3.1.1 梯度  37

3.1.2 方向导数  40

3.1.3 偏导数  43

3.1.4 驻点  43

3.1.5 局部极小点  44

3.2 梯度下降法  46

3.2.1 反梯度场  47

3.2.2 梯度下降法  49

3.2.3 梯度下降法的问题  50

3.3 梯度下降法的改进  52

3.3.1 学习率调度  52

3.3.2 冲量法  54

3.3.3 AdaGrad  55

3.3.4 RMSProp  56

3.3.5 Adam  57

3.4 运用梯度下降法训练逻辑回归  59

3.5 梯度下降法训练逻辑回归的Python实现  61

3.6 小结  67

第4章 超越梯度下降  68

4.1 矩阵  68

4.1.1 矩阵基础  68

4.1.2 矩阵的逆  71

4.1.3 特征值与特征向量  73

4.1.4 对称矩阵的谱分解  74

4.1.5 奇异值分解  76

4.1.6 二次型  77

4.2 多元函数的局部二阶特性  79

4.2.1 赫森矩阵  79

4.2.2 二阶泰勒展开  79

4.2.3 驻点的类型  82

4.2.4 赫森矩阵的条件数  84

4.3 基于二阶特性的优化  87

4.3.1 牛顿法  87

4.3.2 共轭方向法  92

4.4 运用牛顿法训练逻辑回归  95

4.5 牛顿法训练逻辑回归的Python实现  98

4.6 小结  100

第5章 正则化  102

5.1 概率论回顾  102

5.1.1 随机变量  102

5.1.2 多元随机变量  105

5.1.3 多元随机变量的期望和协方差矩阵  106

5.1.4 样本均值和样本协方差矩阵  106

5.1.5 主成分  108

5.1.6 正态分布  111

5.2 模型自由度与偏置?方差权衡  115

5.2.1 最小二乘线性回归  116

5.2.2 模型自由度  118

5.2.3 偏置?方差权衡  119

5.3 正则化  122

5.3.1 岭回归与L_2正则化  122

5.3.2 L_2正则化的贝叶斯视角  125

5.3.3 L_1正则化  126

5.4 过拟合与欠拟合  127

5.5 运用L_2正则化训练逻辑回归  130

5.6 运用L_2正则化训练逻辑回归的Python实现  132

5.7 小结  135

第二部分 神经网络

第6章 神经网络  138

6.1 合作的神经元  138

6.2 多层全连接神经网络  142

6.3 激活函数  145

6.3.1 Linear  145

6.3.2 Logistic  146

6.3.3 Tanh  148

6.3.4 ReLU  150

6.3.5 Leaky ReLU以及PReLU  151

6.3.6 SoftPlus  153

6.4 多分类与SoftMax  154

6.5 小结  157

第7章 反向传播  158

7.1 映射  158

7.1.1 仿射映射  158

7.1.2 雅可比矩阵  159

7.1.3 链式法则  160

7.2 反向传播  162

7.2.1 网络的符号表示  162

7.2.2 原理  163

7.2.3 实现  166

7.3 相关问题  169

7.3.1 计算量  169

7.3.2 梯度消失  170

7.3.3 正则化  170

7.3.4 权值初始化  170

7.3.5 提前停止  171

7.4 多层全连接神经网络的Python实现  173

7.5 小结  181

第8章 计算图  183

8.1 计算图模型  183

8.1.1 简介  183

8.1.2 多层全连接神经网络的计算图  187

8.1.3 其他神经网络结构的计算图  188

8.2 自动求导  190

8.3 自动求导的实现  192

8.4 计算图的Python实现  195

8.5 小结  214

第9章 卷积神经网络  215

9.1 卷积  215

9.1.1 一元函数的卷积  215

9.1.2 多元函数的卷积  219

9.1.3 滤波器  223

9.2 卷积神经网络的组件  228

9.2.1 卷积层  228

9.2.2 激活层  230

9.2.3 池化层  231

9.2.4 全连接层  233

9.2.5 跳跃连接  234

9.3 深度学习的正则化方法  236

9.3.1 权值衰减  236

9.3.2 Dropout  237

9.3.3 权值初始化  237

9.3.4 批标准化  238

9.3.5 数据增强  239

9.4 小结  239

第10章 经典CNN  241

10.1 LeNet-5  241

10.2 AlexNet  245

10.3 VGGNet  248

10.4 GoogLeNet  251

10.5 ResNet  255

10.6 小结  257

第11章 TensorFlow实例  258

11.1 多分类逻辑回归  258

11.2 多层全连接神经网络  266

11.3 LeNet-5  269

11.4 AlexNet  273

11.5 VGG16  277

11.6 小结  280

附录A CNN与元胞自动机  281

参考文献  311

......(更多)

读书文摘

......(更多)

猜你喜欢

点击查看