我目前正在做一个研究项目,因此我试图找出一种很好的方法来识别可以访问网页html的广告.
我认为从AdBlock开始可能是个好主意. AdBlock是一个阻止广告向用户显示的程序,因此大概它具有一种将事物识别为广告的机制.
我下载了AdBlockPlus的源代码,但发现自己完全迷失了所有文件.我不确定从哪里开始寻找这种检测机制,所以我想知道是否有人对从哪里开始有任何建议.另外,如果您以前接触过AdBlock并熟悉它,我们将不胜感激.
例如,如果需要在真实的浏览器中呈现网页才能使用Adblock,则有些程序可以自动加载网页,因此这不是问题,但是我不确定如何确定这是什么.首先是AdBlock.
注意:AdBlock用Python和Perl编写:)
谢谢!
解决方法:
我建议您先看一下写adblock filter rules.
然后,一旦您了解了这一点,就可以开始分析adblock lists各种语言的版本,以满足您的需求.