fast-ai系统资料https://www.jianshu.com/p/2fe22a6b0ecb
中文视频
https://www.bilibili.com/video/av10156946/index_6.html#page=9
https://edu.csdn.net/course/play/5192/94180
GPU:图像处理器/图形卡--线代、矩阵 《---游戏
为什么使用英伟达的gpu:因为其支持一种程序编制CUDA
谷歌为了所有人都能使用:推出P2~ 亚马逊aws山注册账号
OVH公司:唯一提供每月的、便宜的gpus
aws是亚马逊的网络服务:服务器,也叫做实例,某些实例每小时14美元左右,提供8/16张图形卡
GTX970适用于深度学习和游戏:深度学习只要求单精度,即只要求相对精度;双精度--核追踪
t2.micro:免费实例,可以在很小的数据库上操作 --》需要更大数据库时,可以转换到收费的实例
微软的Azure和aws相似:但是gpu实例没有像公众开放
谷歌从2012-1016,dl的使用陡增
wget:最简单的将数据放到aws实例或服务器上的方法;wget http://www.,,,,,,/lesson1.ipynb
markdown:快速创建格式化文本的工具
AMIs:aws的便利之处,亚马逊机器镜像,本质是一张计算机快照,在一个特定的时间点;可以开始自己的实例通过使用快照的副本,其中装有所有想要安装的东西。
概念理解:在亚马逊上又有自己的服务器在运行一个程序叫做jupyter notebook,jupyter会打开一个特别的端口8888在这个服务器上。如果你进入这个服务器,它就会给你访问这个jupyter notebook环境的权限。同时打开多个jupyter,就称为服务器同时运行着多个内核。
jupter的使用:
(1)代码+ markdown -- 文学编程:编码时同时记录
(2)shift+enter+ H建:显示所有快捷键 M建:进入markdown模式 Y:回到代码环境
(3)两次ctrl+c推出jupyter,后台中它们只是一些jason文件
kaggle:
(1)永久性的数据
(2)50% -比较好 20%很好 10%-业内专家
tmux、screen程序:
能够让我在服务器上运行程序,当我终端后,过一会再回来会发现程序仍然在按之前的方式运行
安装tmux--》$tmux --》ctrl+b增加窗口 --》ctrl+b+d 退出操作
.bashrc是一个每次运行bash时会运行的文件
数据科学家的素养:
(1)建立工程架构
(2)copy小数据集测试脚本,如val只有8张
库的使用:
(1)%matplotlib inline...
表示命令请将图标嵌入到jupyter notebook中
(2)numpy实现线性运行,可汗学院-矩阵相关
(3)utils--绘图相关的库函数
(4)主要的深度学习库
python的一种分发程序-anaconda,实际在使用aws的AMI脚本时就已经可以直接使用anaconda了。anacond装在主目录下。anaconda是的安装东西变得简单,“conda install 程序包”即可,anaconda上所有东西都是预编译过的,所以不需要等他编译。没有conda安装时可以使用pip。
预训练模型:
Imagenet数据库--
缺点:
照片里只有一种东西;识别错误有的是图片本身的原因,如大片雪地上的小狗;主要用来识别一个种类的,无论该种类是否在数据库中出现过,不适用于识别很多种类的场景
优点:
源代码和权重会在每年image比赛比赛结束后公布赢家的
imagenet比赛:2012年获胜模型时alexnet;2014时vgg;2016resnet
vgg特别之处:强大又简单,容易改变;已经被训练来识别1000种类型的图片
Theano:可以将python代码转换成编译了的图形处理器代码;一般运行在英伟达的cunda编程环境,cuda的一部分是CUDA深度学习神经网络库cuDNN;dl中最重要的就是theano调用cudnn的一个函数
keras:纯python编写,作用是把深度学习框架和代码转换成theano代码,也可以转换成tensorflow代码;theana和tf很相似,都是在cuda上运行的库,都能提供一种适用于gpu绘图的python以及在其基础上的许多库;tf来源于google,在google擅长的领域表现的很出色,特别是能在多个gpu上运行;theano比tf出现的更早,虽然不能很好的多gpu操作但是在其他方面都做得很好。
配置文件:
keras.json:backend~theano改为tensorlow,就tensoflow就可以运行你所有的gpu
teanorc.json:device~gpu T2不支持gpu
为什么要分成batch:仅仅一张图不够让gpu充分利用起来并且会变得很慢;
为什么不所有数据一起:gpu的内存一般为2g-12g,