介绍深度学习

  • 有很多领域是难以用编程(固定逻辑)来让机器完成任务解决问题,例如计算机视觉、自然语言处理、数据挖掘、基因测序...,所以我们需要 "机器学习" : 让机器自己学习怎么解决问题

  • 深度学习是 Machine Learning Atlas 的重要分支,也是目前最为实用和有效的机器学习实现

备注

术语:

  • 卷积神经网络(CNN(s)): 通常用于图像领域

  • 序列模型: 用于自然语言处理(NLP)

    • 有循环神经网络(RNN) 长短期记忆网络(LSTM)

神经网络(Neural Network)

输入 -> 神经元 -> 输出

神经元将输入的数据处理后输出为结果

  • 多个神经元组合(堆叠)成神经网络(也就是层层逻辑交织),可以处理复杂的推理

    • 神经网络擅长计算从x(输入)到y(输出)的 精准映射函数

    • 神经网络需要大量的x和y(训练样本)才能实现 精准映射函数

神经网络的监督学习(Supervised Learning with Neural Networks)

目前几乎所有的神经网络显示出的经济价值,本质上都是一种称为 监督学习 的机器学习类别:

  • 目前非常"成功"的神经网络应用领域是在线广告: 神经网络能够预测你是否点开广告,展示最有可能点开的广告来获取难以置信的利润

  • 深度学习促进了:

    • 计算机视觉: 卷积神经网络CNN 是图像领域最常用的

    • 语音识别: 语音片段输入神经网络可以获得文本记录,音频处理被视为序列数据处理,通常使用RNN,也就是递归神经网络, Recurrent Neural Network

    • 机器翻译: 语言也是顺序数据,会使用更为复杂的RNN来处理

    • 自动驾驶: 卷积神经网络CNN用于处理图像,而雷达数据则需要使用混和的神经网络结构来处理

常见神经网络:

  • 标准神经网络:

../../_images/standard_neural_network.png
  • 卷积神经网络:

../../_images/convolutional_neural_network.png
  • 递归神经网络:

../../_images/recurrent_neural_network.png

通过深度学习和神经网络,现在计算机能够更好解释非结构化数据。所以大量的新的令人兴奋的应用出现: 语音识别,图像识别,自然语言处理...