python-识别网页上广告的机制[特别是AdBlock]

我目前正在做一个研究项目,因此我试图找出一种很好的方法来识别可以访问网页html的广告.

我认为从AdBlock开始可能是个好主意. AdBlock是一个阻止广告向用户显示的程序,因此大概它具有一种将事物识别为广告的机制.

我下载了AdBlockPlus的源代码,但发现自己完全迷失了所有文件.我不确定从哪里开始寻找这种检测机制,所以我想知道是否有人对从哪里开始有任何建议.另外,如果您以前接触过AdBlock并熟悉它,我们将不胜感激.

例如,如果需要在真实的浏览器中呈现网页才能使用Adblock,则有些程序可以自动加载网页,因此这不是问题,但是我不确定如何确定这是什么.首先是AdBlock.

注意:AdBlock用Python和Perl编写:)

谢谢!

解决方法:

我建议您先看一下写adblock filter rules.

然后,一旦您了解了这一点,就可以开始分析adblock lists各种语言的版本,以满足您的需求.

上一篇:chrome插件,让你事半功倍


下一篇:AdBlock插件离线安装