李嘉璇 TensorFlow技术解析与实战 第一章笔记
深度学习的入门过程
现阶段:需要补充概率论、随机过程知识;学习决策树,RF;熟练使用python;论文、公众号、博客;复现实验;提出创新。
经典机器学习理论与基础算法:
已经接触过:SVM,LR,聚类,ANN,BP,PCA,过拟合,正则化...
未接触:决策树,朴素贝叶斯,随机森林,协同过滤,关联性分析...
掌握编程语言python:重点掌握线性代数库和矩阵操作,尤其是Numpy、pandas第三方库(dataframe和series结构),机器学习库skleran。
看论文:LeNet googlenet Alexnet LSTM GAN(生成式对抗网络) (五月份的汇报介绍RNN LSTM 综述GAN) 。
自己动手训练神经网络:使用外围第三方库,例如keras、tflearn。
计算机视觉领域CV:可以做图像分类、目标检测、视频中的目标检测等。
NLP:做语音识别、语音合成、对话系统、机器翻译、文章摘要、情感分析,还可以结合图像、视频和语音。
Tensorflow支持:CNN,RNN,LSTM(RNN的一个特例,长短期记忆网络)
Imagenet的ILSVRC比赛(大规模视觉识别挑战赛):
Top1错误率:预测输出的概率最高的类别,是否和人工标记的类别一致,如果不一致,此时的概率。
Top5错误率:预测输出的概率最高的前 5 个类别当中,有没有和人工标记的类别一致,当 5 个都不一致时的概率。例如在图片分类任务下,对一张图片进行预测,输出这张图片分类概率最高的 5 个类别,只要有一个预测的类别和人工标注的类别标记一致,就是认为正确。当 5 个都不一致发生的概率就是 Top-5 错误率。
Kaggle
天池大数据竞赛
本章主要介绍了人工智能、机器学习、深度学习的关系,以及深度学习的学习步骤,分析了这个领域的相关人群,以及这个领域的重要赛事。然后,全面介绍了 TensorFlow 的作用、特性,并介绍了国内做人工智能的公司,讲述了目前在产业界进行的探索,和提供给开发者的一些基础平台。