ElitesAI·动手学深度学习PyTorch版(第一部分)

线性回归

主要内容包括:
1.线性回归的基本要素
2.线性回归模型从零开始的实现
3.线性回归模型使用pytorch的简洁实现
课后习题ElitesAI·动手学深度学习PyTorch版(第一部分)

softmax和分类模型

内容包含:
1softmax回归的基本概念
2如何获取Fashion-MNIST数据集和读取数据
3softmax回归模型的从零开始实现,实现一个对Fashion-MNIST训练集中的图像数据进行分类的模型
4使用pytorch重新实现softmax回归模型
课后习题
ElitesAI·动手学深度学习PyTorch版(第一部分)

多层感知机

内容包含:
1.多层感知机的基本知识
2.使用多层感知机图像分类的从零开始的实现
3.使用pytorch的简洁实现
课后习题
ElitesAI·动手学深度学习PyTorch版(第一部分)

文本预处理

文本是一类序列数据,一篇文章可以看作是字符或单词的序列,本节将介绍文本数据的常见预处理步骤,预处理通常包括四个步骤:

1.读入文本
2.分词
3.建立字典,将每个词映射到一个唯一的索引(index)
4.将文本从词的序列转换为索引的序列,方便输入模型
课后习题
ElitesAI·动手学深度学习PyTorch版(第一部分)

语言模型

一段自然语言文本可以看作是一个离散时间序列,给定一个长度为 ???? 的词的序列 ????1,????2,…,???????? ,语言模型的目标就是评估该序列是否合理,即计算该序列的概率:

????(????1,????2,…,????????).

本节我们介绍基于统计的语言模型,主要是 ???? 元语法( ???? -gram)。在后续内容中,我们将会介绍基于神经网络的语言模型。
ElitesAI·动手学深度学习PyTorch版(第一部分)
ElitesAI·动手学深度学习PyTorch版(第一部分)

循环神经网络

本节介绍循环神经网络,下图展示了如何基于循环神经网络实现语言模型。我们的目的是基于当前的输入与过去的输入序列,预测序列的下一个字符。循环神经网络引入一个隐藏变量 ???? ,用 ???????? 表示 ???? 在时间步 ???? 的值。 ???????? 的计算基于 ???????? 和 ????????−1 ,可以认为 ???????? 记录了到当前字符为止的序列信息,利用 ???????? 对序列的下一个字符进行预测。
ElitesAI·动手学深度学习PyTorch版(第一部分)ElitesAI·动手学深度学习PyTorch版(第一部分)