Python编程及高级数据分析

一、介绍(11月22日)

python数据分析常用的包

Python编程及高级数据分析
数据库实现的功能的在panda包里面找
其中M\S\P是数据可视化工具
深度学习使用的包是pytorch(facebook支持)
中文的nlp:Jieba、pynlpir
英文的nlp:NLTK

学python前的准备工作

Python编程及高级数据分析
Pycharm: 是按照程序员的使用习惯设计的软件
机器语言翻译成人的语言可以分为:
1、编译:一次性翻译
2、解释:顺序翻译,依次进行翻译
Python是解释性语言 C面向软件开发 Java先编译后解释 先转换成class。

Pip和conda是两个服务器:pip是python专用的 pip来源于pip.org
Conda包含多种通用包
两个都会使用 pip位于国外 安装会很慢 通常需要镜像

Anaconda 的兄弟是miniconda(占用内存较小)
门户:Anaconda Navigator(将上面四个功能同一在一起) 在数据分析领域最受欢迎的平台

Jupyter注意事项:cs结构 browser-server (和Tomcat很像)
1、 包含browser端和server端(一台电脑既是服务器又是浏览器)
2、 所有标点符号都是英文
3、 英文大小写要注意好
4、 缩进要正确

常用快捷键

Python编程及高级数据分析
常用的编译的快捷键
Python编程及高级数据分析
高质量python代码
1、优雅 高效 明确
2、Zen:禅
3、PEP8:PYTHON ENHANCE PRESENTATION8
4、基于Guido’s python Style Guide

二、数据加工和数据准备

三、统计学习

四、数据可视化

五、机器学习

六、图像处理

七、nlp

八、Spark编程

九、NoSQL编程

十、数据分析方法与技能

上一篇:MySQL数据库SQL修改数据规范


下一篇:NLP 开源形近字算法补完计划(完结篇)