coursera 吴恩达深度学习 Specialization 笔记(course 1 week 1)—— 深度学习介绍

本周主要介绍深度学习的概况。

Specializeion的课程设置

  • 神经网络和深度学习
  • 改进神经网络
  • 构建机器学习系统
  • 卷积神经网络CNN
  • 序列模型

什么是神经网络

例子1——single neural network

预测房价(线性回归问题):



  • 输入为房子的尺寸(x)
  • 输出为房价(y)
  • 注意:房价不能为负数,故用不从零开始的 修正线性单元(rectified linear unit)ReLU函数(蓝线) 表示
  • ReLU = max(0,y)
  • 第二张图片中间的圆圈表示一个“神经元”,从 x 到 y 的整个输出表示一个最小的神经网络,是组成神经网络最基本的单元

例子2—— Multiple neural network

用更多特征(房子尺寸、卧室大小、邮政编码、区域富裕程度)来预测房价:

  • 输入的四个特征叫做输入层
  • 每个小圆圈都叫做隐藏神经元(hidden unit),图中每个神经元都把四个特征当作输入(全连接)
  • 神经网络自己决定每个网络节点是什么

我的理解:给定足够的输入x,得到若干输出y,神经网络就是建立起 x 和 y 之间映射关系的一个黑箱系统

神经网络的监督学习

定义

给定一个已知输出的数据集,找到输入与输出之间的函数关系

分类

  • 回归问题:在连续的输出上预测结果,即将输入变量映射到某个连续函数上
  • 分类问题:在离散的输出上预测结果,即将输入变量映射到离散的类别上

例子

神经网络(NN)的分类

  • 标准神经网络(standard NN):用在房地产、广告
  • 卷积神经网络(convolution NN):图片处理
  • 循环神经网络(recurrent NN):语音识别、翻译
  • 混合了其他结构的神经网络: 自动驾驶

数据的分类

  • 结构化数据:基于数据库的数据,即标签化了的、具有清晰定义的信息,例如房价预测中数据有房屋面积和卧室数量等标签
  • 非结构化数据:类似于音频、图片、文本这类的数据,处理更加困难

为何深度学习蓬勃发展

规模驱动深度学习的发展

  • 数字化生活产生的大量数据
  • 算力的巨幅提高
  • 算法的创新:例如 signmoid 函数到 ReLU 函数的迁移

  • 线条从下往上表示神经网络的规模在变大
  • m 表示训练集的大小
  • 为了获得好的表现,要么足够大的神经网络,要么足够多的数据
  • 在小训练集的情况下,模型的好坏与神经网络规模无关

训练神经网络的过程

一个 idea → 代码实践 → 试验 → 修正 idea →…

course 1 的课程计划

  • Week 1 : Introduction
  • Week 2 : Basics of Neural Network programming
  • Week 3 : One hidden layer Networks
  • Weel 4 : Deep Neural Networks
微信捐赠
支付宝捐赠