浏览器也可以做爬虫

首先爬取的目标是 https://www.ooe.la/

中的这个
https://www.ooe.la/n/62656/
找到下载链接那里
F12
照下图步骤操作
浏览器也可以做爬虫
浏览器也可以做爬虫
第7部将复制的jspath 黏贴到控制台加一个.href(就是下面的代码)这样变得到了一个下载链接

document.querySelector("#jishu > div > ul > li:nth-child(2) > div > span.xl > a").href

分析此代码可以看出 li:nth-child(2) 这个的数字是每个节点也就是每个链接的索引
只要改变 li:nth-child(3)他的数字就能得到下一个链接
目前只要一个for 循环管即可 在for循环之前你要知道你的链接开始多少结束是多少
就是你想要多少集到多少集 假设我们想要下载全集吧 假如全集为63假设我们输出到控制台

for (var i=1;i<43;i++){ 
    console.log(document.querySelector("#jishu > div > ul > li:nth-child("+i+") > div > span.xl > a").href);}

浏览器也可以做爬虫

上一篇:js下载文件


下一篇:初学HTML