scikit-learn安装步骤
scikit-learn简介
什么是scikit-learn?
- python的机器学习工具
- 简单高效的数据挖掘和数据分析工具
- 每个人都可以访问,并且可以在各种情况下重用
- 基于NumPy,SciPy和matplotlib构建
- 开源,可商业使用-BSD许可证
scikit-learn可以做什么?
功能 | 简介 | 应用 | 算法 |
---|---|---|---|
分类(Classification) | 识别物体属于哪个类别 | 垃圾邮件检测,图像识别 | SVM, nearest neighbors, random forest, … |
回归 (Regression) | 预测与对象关联的连续值属性 | 药物反应,股票价格 | SVR, ridge regression, Lasso, … |
聚类(Clustering) | 自动将相似对象归为一组 | 客户细分,分组实验结果 | k-Means, spectral clustering, mean-shift, … |
降维(Dimensionality reduction) | 减少要考虑的随机变量的数量 | 可视化,提高效率 | PCA, feature selection, non-negative matrix factorization. |
模型选择(Model selection) | 比较,验证和选择参数和模型 | 通过参数调整提高准确性 | grid search, cross validation, metrics. |
预处理(Preprocessing) | 特征提取和归一化 | 转换输入数据(例如文本)以用于机器学习算法 | preprocessing, feature extraction. |
scikit-learn安装
- 前提条件:
Python (>= 3.5)
NumPy (>= 1.11.0)
SciPy (>= 0.17.0)
joblib (>= 0.11)
- sk-learn绘图功能需要Matplotlib版本>=1.5.1
- 一些scikit-learn示例可能需要一个或多个附加依赖项:scikit-image(> = 0.12.3),pandas(> = 0.18.0)
使用 pip install -U scikit-learn
进行安装,或者conda install scikit-learn