机器学习01

人工智能概述

机器学习01

 

 

 机器学习和人工智能,深度学习的关系

  • 机器学习是人工智能的一个实现途径

  • 深度学习是机器学习的一个方法发展而来

机器学习概述

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。

机器学习算法分类

机器学习01

监督学习(supervised learning)(预测)

  • 定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。
  • 分类 k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络
  • 回归 线性回归、岭回归

无监督学习(unsupervised learning)

  • 定义:输入数据是由输入特征值所组成。
  • 聚类 k-means

机器学习开发流程

机器学习01

 

 

 

特征工程

字典特征提取

作用:对字典数据进行特征值化

  • sklearn.feature_extraction.DictVectorizer(sparse=True,…)
    • DictVectorizer.fit_transform(X) X:字典或者包含字典的迭代器返回值:返回sparse矩阵
    • DictVectorizer.inverse_transform(X) X:array数组或者sparse矩阵 返回值:转换之前数据格式
    • DictVectorizer.get_feature_names() 返回类别名称

代码:

def dict_demo():
    """
    字典特征抽取
    :return:
    """
    data = [{'city': '北京','temperature':100}, {'city': '上海','temperature':60}, {'city': '深圳','temperature':30}]
    # 1、实例化一个转换器类
    transfer = DictVectorizer(sparse=True)

    # 2、调用fit_transform()
    data_new = transfer.fit_transform(data)
    print("data_new:\n", data_new.toarray(), type(data_new))
    print("特征名字:\n", transfer.get_feature_names())

    return None

机器学习01

 

上一篇:tf.keras.Input


下一篇:Matrix Factorization, Algorithms, Applications, and Avaliable packages