基本概念

统计数据类型

  • Numerical data: 有测量measurement的意义或者它们是一个计数,也叫做定量数据quantitative data
    - discrete: 可数的
    - continuous: 表示测量,不可数的,用一个实数区间表示
  • Categorical data: 表示特征characteristics,也可用Numerical值表示,但它们没有数学意义。也叫做定性数据qualitative dataYes/No data
    - Ordinal: 混合以上两类数据。它虽属于Categorical data,但它的值是有意义的
  • 分类数据的最高效表示方式是使用稀疏张量(一种含有极少非零元素的张量),如独热编码one-hot encoding或词袋bag of words
    - 需要的数据量和计算量大
    - 矢量之间缺乏有意义的联系
    - 解决:嵌入embedding,即将大型稀疏矢量映射到一个保留语义关系的低维空间

参考资料

上一篇:tensorflow---识别图像特征(吴恩达课程)


下一篇:Loss: 激活函数