【weka应用技术与实践】过滤器

weka中的过滤器主要用于数据预处理阶段对数据集的各种操作。

今天简单地使用一下过滤器:

首先打开一个自带数据集weather.numeric.arff,这是一个关于通过天气条件,气温以及风力等因素来判断是否要play。可以看到:

【weka应用技术与实践】过滤器

看一下数据的大致情况:

【weka应用技术与实践】过滤器

红色代表no,蓝色代表yes。

问题一:假设我现在要添加一列新的属性叫“心情”,分类三类:好(good),不好(bad),一般(normal)。该怎么做?

方法:

1.AddUserFields过滤器:选择该过滤器:

【weka应用技术与实践】过滤器

new一个:

【weka应用技术与实践】过滤器

apply之后,可以看到:

【weka应用技术与实践】过滤器

这样,属性就已经添加完了。

2.AddValues过滤器:

属性有了,值还没有,所以选择AddValues过滤器:

【weka应用技术与实践】过滤器

输入之后,再去edit就可以选择了:

【weka应用技术与实践】过滤器

简单填写完毕之后,

【weka应用技术与实践】过滤器

3、Reorder过滤器:

因为weka默认最后一列属性是作为分类属性,因此,我们还得使用reorder分类器,把最后一列调整到前面去,还是把play作为分类列:

【weka应用技术与实践】过滤器

apply之后,可以看到列已经换了:

【weka应用技术与实践】过滤器

或者还有一种更快的方法:

【weka应用技术与实践】过滤器

上一篇:【java基础学习】反射


下一篇:【公众号系列】SAP的新零售