nndl / nndl.github.io Goto Github PK

View Code? Open in Web Editor NEW

17.1K 17.1K 3.6K 656.83 MB

《神经网络与深度学习》邱锡鹏著 Neural Network and Deep Learning

Home Page: https://nndl.github.io

HTML 100.00%

nndl.github.io's People

Contributors

Stargazers

Watchers

Forkers

gitsamshi qipengguo chixsh techstone mountain-wisdom asiagood alphadl willsonn cosmmb wuqixiaobai hujian92 dagangwood163 binbinbian benjamesbabala jydemo chongbingbao xsongx am-corporation allensmile yaokaichun logan-lu leezqcst alongwithyou wwwanghao nightwalking lgdkobe24 ziyubiti doudou-z armavrdsp robingong kissmonx lovechang1986 awesome-archive nicholas-yu shiweihappy zhangxt jalor-zj gucasbrg sy1vainm giserh 1445507250 307509256 xuyi33333 dujintao tigerneil 5seasons robertzq xingxingxudong statml fanhuaandluomu dancinghui erin-h xiao2mo chenkaiyu1997 collector-m simon717 jiongxiao cfh0253 hellozjj bigdata-page jkhlot xiaoerlaigeid zongxian ryfan-rs zhujianing hyh21521038 alan-wang0 zxl19941019 yuebin1009 yuki9965 kingleoric2010 snowdj cy2307422 chaoyanjie xiangruipuzhao niu-niu mutual-ai zmxdream kaharjan babooppa6 peakerlee2016 matlabu3d studyhzx cloudstdio zhanghonglishanzai bluejad nagyistoce david082 kaikai-sk dqwang122 huangjin2018 gilese123 caolusg hengqujushi cryan2016 zwjledoc zichengzhou zhuwenxiao yusifu xingxinyu96

nndl.github.io's Issues

第六章卷积

第六章103页卷积的分类有语病“不在某某范围之外”以及宽卷积与等长卷积的定义没有定义清楚

第7章中的公式 7.5是不是少了对f的导数？

第7章中的公式 7.5是不是少了对f的导数？另外，公式中直接将U写出，也未介绍u的含义与数学的定义。

ch6 page111 有一处打字错误

第111页，公式6.21下一句：
原文：其中，up为上采用函数（Upsampling）。
修改：其中，up为上采样函数（Upsampling）。

第二章机器学习错别字

第二章机器学习概述 2.2.3 优化算法第二段
为了可以【早】到最优的模型以及充分利用凸优化中一些高效、成熟的优化方法，

关于图5.2中卷积的计算方式有疑问_20171128版本

关于图5.2的计算方式_20171128版本

96页，第5章，图5.2，二维卷积示例。

示例中的计算，左上角的1，为什么是和卷积核中右下角的“-1”相乘？
是不是应该乘以卷积核中左上角的1？---和其他地方看到的卷积计算方法不一样。
还是因为做了其他的处理呢？--是不是因为做了翻转？如果是这样，好像计算方法是合理的。
谢谢.

--读者：刘永辉
感谢作者的无私共享。

ch7链接错误

目前的链接“https://nndl.github.io/chap-循环神经网络”应改为“https://nndl.github.io/chap-循环神经网络.pdf”

typo: ch12(深度信念网络)

12.1. 2 参数学习中公式(12.13)的求和符号的下标应该是n=1..N，不是 i = 1..N。（小错误）

错别字

机器学习概述，p23，特征学习中最后一句“提高模型泛华参数”应为“提高模型泛化参数”

关于神经网络的层数计算

邱教授您好！看了您的关于中文分词的很多论文，对我帮助很大，在此感谢！

关于这本书中的对于神经网络的层数记法，我怀有疑问，具体如下：
在本书中，显然，输入层是计入神经网络的总层数的，但是我看很多论文以及课程中，输入层是不计入神经网络的总层数的。原因是输入层没有可调的参数，不应该被计入神经网络的层数。

如wikipedia.org中对于Word2vec的描述：Word2vec is a group of related models that are used to produce word embeddings. These models are shallow, two-layer neural networks that are trained to reconstruct linguistic contexts of words.

如斯坦福的cs231n课程中所述：Naming conventions. Notice that when we say N-layer neural network, we do not count the input layer. Therefore, a single-layer neural network describes a network with no hidden layers (input directly mapped to output). In that sense, you can sometimes hear people say that logistic regression or SVMs are simply a special case of single-layer Neural Networks.

如有错误，还望不吝赐教！

十二章《词嵌入与语言模型》中一些问题

我仔细阅读了第十二章的内容，并对绝大部分公式进行了推导，发现以下一些错误（准确说，应该是笔误，细节小问题）

第1页，黑体“局部表示”的下一行中“假设有1000中颜色”的“中”，应为“种”
公式（12.9）中字母 “i” 有点问题，应直接用“t”
公式（12.52）上一行中字母“K”应该为小写"k"，本页倒数第二行也是小写，应统一
公式（12.68）上一行中“趋向于无穷大是”中“是”，应改为“时”
公式（12.73）至（12.75）中出现的h_{t} 与 h 应统一，有些漏掉下标 t，同理（12.84）至（12.88）中建议检查一下是否需要下标 t
第22页，黑体“真实样本”的上2行，句末“是的”，应为“使得”

其实都是一些无关紧要的小细节，如果老师检查后觉得有误就修改一下，非常感谢老师贡献出精彩的写作！供我们学习，谢谢您～

Chap 6 - RNN 章节6.2.2 与 6.2.3内容重复

第六章循环神经网络中，章节6.2.2与章节6.2.3内容是一样的；以及在6.2.2中第一行“在同步的序列到序列模式中（如图6.5所示）”应该是“（如图6.4所示）”

Page 148, Chapter 11, equation (11.24) 错误

log 里面的分式分子和分母写反了

一些小错误或笔误

ch5. page 79，关于记忆网络的描述中“和反馈网络相比,反馈网络具有更强的记忆功能。”应是“记忆网络具有更强的记忆功能。”
ch5. page 100，“每次小批量梯度下降的”应为“每次小批量梯度下降的样本数”

第5章 104页 5.4.1中第4个，60个5 × 5的滤波器应为16个5 × 5的滤波器

修改建议_2017年11月28日版本

1.第93页_第5章_正文第三段。“参数的规模也会极具增加”，应该是“急剧增加”。
2.第95页，倒数第7行，“图5.4给出了一维卷积示例”。我看了上下文，估计作者指的应该是“图5.1”吧.
3.第102页，图5.6中，图形左半部分标注为“高度M、宽度N”,但是下面的正文写的是“高度N、宽度M”。是否需要保持一致？

                                                     --读者：刘永辉

感谢作者的无私共享。

chap-机器学习概述错别字

当前章节第五页，对于特征学习的描述最后一句
“可以简化模型、缩短训练时间、提高模型泛华能力、避免过拟合等。”其中“泛化能力”出现错别字。

Typo of Ch12 (词嵌入与语言模型)

page 161：公式12.31上方，”词汇表V中的每个词……出现的概率“，k的右边少了小于等于号$\leq$。

page 163：底部（”输出层“那一段，公式12.39上方），”其接受的输入为历史信息的向量表示$h_t\mathbb{R}^{d_2}$"，h_t后面少了 \in 。

CNN pooling部分叙述不清晰

100页中页脚部分定义子采样函数时，并未交代子采样函数就是提及的“非线性函数”。
个人觉得可以提一句，此种函数为子采样函数，然后再介绍定义。

ch3 p36

过拟合的标准定义为：给定一个假设空间H，一个假设h 属于H，如果存在其他的假设h
属于H, 使得在训练样例上h 的损失比h 小，但在整个实例分布上h 比h 的损失
小，那么就说假设h 过度拟合训练数据[?]。

这里h应该是两个不同的概念，能否用不同的标识，否则容易造成误解

文字描述&关键内容修订建议

ch5的5.4(87页)

Theano [Bergstra et al., 2010]和Tensorflow [Abadi et al., 2016]都采用了符号微分的方法进行自动求解梯度。

该说法有误. Theano和Tensorflow均采用反向模式自动微分 (Reverse-mode Automatic Differentiation), 相关内容可参考: 1, 2, 3, 4.

概率图11.3节推断

请问这一章是还没有写完吗？第二段"在图模型中，我们可以利用"然后没下文了

第10章若干修改

143页，10.1节最后一句：漏掉了连字符
原文：n元语言模型的困惑度范围一般为501000之间
修改：50-1000
144页，第2行：漏掉了"属于"符号
原文：第 k 列向量 m_{k} R^{d1}表示词汇表中第 k 个词对应的稠密向量
修改：m_{k} \in R^{d1}
159页，第3行：漏了"的"
原文：这两个模型是著名的词嵌入学习工具 word2vec 中包含两种模型
修改：这两个模型是著名的词嵌入学习工具 word2vec 中包含的两种模型
161页，倒数第2行，10.3节的负采样部分：对负样本数量的描述，小规模应改为大规模
原文：通常小规模数据 k 的取值范围在5~20，而小规模数据 k 可以非常小2~5
修改：通常小规模数据 k 的取值范围在5~20，而大规模数据 k 可以小至2~5
Mikolov原文：Our experiments indicate that values of k in the range 5–20 are useful for small training datasets, while for large datasets the k can be as small as 2–5. [arXiv 1310.4546]

关于ch1的部分typo

第三页：
【智能系统如何外部刺激信息（视觉和语音等）进行感知和加工】应为
【智能系统如何对外部刺激信息（视觉和语音等）进行感知和加工】
第八页：
【Kunihiko Fukishima(福岛邦彦）】应为：
【Kunihiko Fukushima(福岛邦彦）】

typo in content about AlexNet chap 5

alexNet的第三个conv layer是384个(3 \times 3 \times 256) kernels connected to the all the outputs of second layer.

语句不通顺等

绪论第二段开头：“要通过真正地通过图灵测试”
2.3.1节“数学小知识 | 笛卡儿乘积”内花色符号缺失{, , , }
2.3.2节开头：“随机事件（或简称事件）指的是一个被赋与机率的事物集合”
2.4.1节公式中有大量下标没有处理，“对应的被加数0 logb 0的值将会是0”
2.4.2节交叉熵的定义为何是英文
7.3节第二段开头：“既然增加深度可以极大前馈神经网络的能力”

ch11中公式(11.12)的负号应为正号

Typo in Ch12.pdf

θ 是需要“实现”估计出来的
应该是需要“实验”吧？

公式11.12与11.13完全一样，11.12应该为”加号“

ch6第五页倒数第二行

乘号两侧都少了括号。

Page37的公式2.50和2.51的分母有问题

两个公式的分母应该对调一下

ch4 P57 公式书写

ch4 57页倒数第二行公式 sign后少了一个左括号。

3.3 风险函数与损失函数错别字

第三行参数θ 的好还通过建立一些准则来衡量应该为参数θ 的好坏通过建立一些准则来衡量

chap-卷积神经网络Lenet5卷积层滤波器个数

卷积神经网络章节，LeNet-5的介绍中，第4条C3层使用60个5X5滤波器，得到16组大小为10X10的特征映射。上一层汇聚层神经元个数为6X14X14个，这一层不应该是6X16=96个5X5的滤波器才能得到16组大小为10X10的特征映射吗？

Ch6 RNN 6.9递归神经网络错别字

131页 “而递归神经网络实在一个有向图无循环图上共享一个组合函数”中的“实在”应为“是在”

252页（A.58） pi 应该是θi

252页推导过程中第一项分母少写了转置

第7章循环神经网络中问题

第2页，图7.1下面第5行，“也成为长期依赖问题”，应该是“也称为长期依赖问题”
第4页，公式(7.6)中字母y是否应该解释一下，突然冒出有点唐突
第7页，图7.4 LSTM结构示例，建议更详细地叙述一下图中信息流动的过程，结合三个门作用，step by step阐述比较好（建议参考http://colah.github.io/posts/2015-08-Understanding-LSTMs/）

LeNet-5模型的C3卷积层处理

卷积神经网络里面的LeNet-5模型的C3卷积层处理的时候，上一层S2的输出数据是6组1414的特征，本层C3输出的时候是16组特征，这里能不能详细讲解一下，
我的理解是，按照梯度计算的表来处理，C3输出的第一组特征是和S2的输出的第1，2，3组特征有关的，也就是说，3组1414的特征，分别对应卷积核w1,w2,w3做卷积操作，其中w1 w2 w3均为55，最后不是应该得到三组1010的特征吗，为啥最后只有一个特征。
中间是不是还有什么处理。大神能不能详细讲解一下。

nndl / nndl.github.io Goto Github PK

nndl.github.io's People

Contributors

Stargazers

Watchers

Forkers

nndl.github.io's Issues

数据的原始表示转换为。

Recommend Projects

Recommend Topics

Recommend Org