lesson1-fastai

2023-01-31 10:56:17

fast-ai系统资料https://www.jianshu.com/p/2fe22a6b0ecb

中文视频

https://www.bilibili.com/video/av10156946/index_6.html#page=9

https://edu.csdn.net/course/play/5192/94180

GPU：图像处理器/图形卡--线代、矩阵《---游戏

为什么使用英伟达的gpu：因为其支持一种程序编制CUDA

谷歌为了所有人都能使用：推出P2~ 亚马逊aws山注册账号

OVH公司：唯一提供每月的、便宜的gpus

aws是亚马逊的网络服务：服务器，也叫做实例，某些实例每小时14美元左右，提供8/16张图形卡

GTX970适用于深度学习和游戏：深度学习只要求单精度，即只要求相对精度；双精度--核追踪

t2.micro:免费实例，可以在很小的数据库上操作 --》需要更大数据库时，可以转换到收费的实例
微软的Azure和aws相似：但是gpu实例没有像公众开放

谷歌从2012-1016，dl的使用陡增

wget：最简单的将数据放到aws实例或服务器上的方法；wget http://www.,,,,,,/lesson1.ipynb
markdown：快速创建格式化文本的工具

AMIs：aws的便利之处，亚马逊机器镜像，本质是一张计算机快照，在一个特定的时间点；可以开始自己的实例通过使用快照的副本，其中装有所有想要安装的东西。
概念理解:在亚马逊上又有自己的服务器在运行一个程序叫做jupyter notebook，jupyter会打开一个特别的端口8888在这个服务器上。如果你进入这个服务器，它就会给你访问这个jupyter notebook环境的权限。同时打开多个jupyter，就称为服务器同时运行着多个内核。

jupter的使用：
（1）代码+ markdown -- 文学编程:编码时同时记录
（2）shift+enter+ H建：显示所有快捷键 M建：进入markdown模式 Y：回到代码环境
（3)两次ctrl+c推出jupyter，后台中它们只是一些jason文件

kaggle：
（1）永久性的数据
（2）50% -比较好 20%很好 10%-业内专家

tmux、screen程序：
能够让我在服务器上运行程序，当我终端后，过一会再回来会发现程序仍然在按之前的方式运行
安装tmux--》$tmux --》ctrl+b增加窗口 --》ctrl+b+d 退出操作

.bashrc是一个每次运行bash时会运行的文件

数据科学家的素养：
（1）建立工程架构
（2)copy小数据集测试脚本，如val只有8张

库的使用：
（1)%matplotlib inline...
表示命令请将图标嵌入到jupyter notebook中
(2)numpy实现线性运行，可汗学院-矩阵相关
(3)utils--绘图相关的库函数
(4）主要的深度学习库

python的一种分发程序-anaconda，实际在使用aws的AMI脚本时就已经可以直接使用anaconda了。anacond装在主目录下。anaconda是的安装东西变得简单，“conda install 程序包”即可，anaconda上所有东西都是预编译过的，所以不需要等他编译。没有conda安装时可以使用pip。

预训练模型：
Imagenet数据库--
缺点：
照片里只有一种东西；识别错误有的是图片本身的原因，如大片雪地上的小狗；主要用来识别一个种类的，无论该种类是否在数据库中出现过，不适用于识别很多种类的场景
优点：
源代码和权重会在每年image比赛比赛结束后公布赢家的
imagenet比赛：2012年获胜模型时alexnet；2014时vgg；2016resnet
vgg特别之处：强大又简单，容易改变；已经被训练来识别1000种类型的图片

Theano：可以将python代码转换成编译了的图形处理器代码；一般运行在英伟达的cunda编程环境，cuda的一部分是CUDA深度学习神经网络库cuDNN；dl中最重要的就是theano调用cudnn的一个函数
keras：纯python编写，作用是把深度学习框架和代码转换成theano代码，也可以转换成tensorflow代码；theana和tf很相似，都是在cuda上运行的库，都能提供一种适用于gpu绘图的python以及在其基础上的许多库；tf来源于google，在google擅长的领域表现的很出色，特别是能在多个gpu上运行；theano比tf出现的更早，虽然不能很好的多gpu操作但是在其他方面都做得很好。

配置文件：
keras.json:backend~theano改为tensorlow，就tensoflow就可以运行你所有的gpu
teanorc.json:device~gpu T2不支持gpu

为什么要分成batch：仅仅一张图不够让gpu充分利用起来并且会变得很慢；
为什么不所有数据一起：gpu的内存一般为2g-12g，

码农公寓

相关文章