weka中的过滤器主要用于数据预处理阶段对数据集的各种操作。
今天简单地使用一下过滤器:
首先打开一个自带数据集weather.numeric.arff,这是一个关于通过天气条件,气温以及风力等因素来判断是否要play。可以看到:
看一下数据的大致情况:
红色代表no,蓝色代表yes。
问题一:假设我现在要添加一列新的属性叫“心情”,分类三类:好(good),不好(bad),一般(normal)。该怎么做?
方法:
1.AddUserFields过滤器:选择该过滤器:
new一个:
apply之后,可以看到:
这样,属性就已经添加完了。
2.AddValues过滤器:
属性有了,值还没有,所以选择AddValues过滤器:
输入之后,再去edit就可以选择了:
简单填写完毕之后,
3、Reorder过滤器:
因为weka默认最后一列属性是作为分类属性,因此,我们还得使用reorder分类器,把最后一列调整到前面去,还是把play作为分类列:
apply之后,可以看到列已经换了:
或者还有一种更快的方法: