Pooling 选择的策略

2023-12-19 15:05:03
Pooling 选择的策略

这里交叉介绍 pooling 选择的策略：

•池化的应用：降维和保留显著的特征

•Max pooling 是取整个 feature map 区域的最大值作为特征，即一个 max feature操作，在自然语言处理中常用于文本分类（text classification），观察到的特征是一般都是句子的强特征，以便可以区分出是哪一个类别，减少噪音影响。

•Average-pooling 通常是用于句子主题模型（topic model），考虑到一个句子往往不止一个主题标签，这时需要尽量多的句子上下文信息，如果是使用 Max-pooling 的话信息过少，所以使用 Average 的话可以广泛反映这个 feature map 的特征

•K-max pooling：在一个 feature map 上返回K组最大值，即选择 top k 的 feature 结果，不至于省略的太多，也不至于太平均，这种方式还保留了这k个特征的位置信息。

•Chunk-Max Pooling：类似于本文的 dynamic pooling，将 feature map 分为好几个块，具体怎么分块完全看你关注句子的哪几个部分，要定下哪几个部分来进行split 。Chunk-max pooling 和 K-max pooling 的区别在于，后者是事先不对 feature map 进行分割，然后根据值选最大的几块并保留这些值的顺序，前者是先选好切割成几块，然后对每块选该块中最大的值作为该块的结果。这种策略不止在本任务中，在情感分析也有用。比如我在分析句子情感时候，可能比较关注但是（but）这个词，我就可以根据 but 进行分割。原因就是比如一个评价说“某个商品很好，很漂亮，等等等等夸了一大堆， BUT 太贵了买不起”，其实是在含有负面情感在这边，如果 max pooling 那肯定判定是位正面情感，但用这种 chunk-max pooling 方法就能有效甄别出这种情感转折，特征的位置信息在这里就体现的尤为重要
参考：研究综述 | 事件抽取及推理 (上) (qq.com)
码农公寓

相关文章