teleport使用说明
浏览器下载网页:
只能浏览主页和少数网页,其它不能浏览,容量几百kb
teleport下载项目一
能完全离线看网页,7328多文件 9个JPG文件,大小134M
teleport下载项目二
部分网页采集内容和项目一基本一致,但大几兆
部分网页需要项目二(复制站点)才能浏览,项目一看不到图片
项目二比项目一耗时多,但要全面
视频教程
https://www.youtube.com/watch?v=qt0az3mPK3s
YouTube
https://www.youtube.com/watch?v=qt0az3mPK3s
https://www.youtube.com/watch?v=RWB7tS_NdqI
YouTube
How to use Teleport Pro (Footprinting and Reconnaissance)
离线浏览,网站镜像,文件提取工具
遍历网站的所有链接网址,网站关键字搜索
1. 复制一个可浏览的网站,文件存放在硬盘
2.复制一个网址,包括文件结构
3.在网址搜索指定文件
包括声音,食品,背景图片,zip等等。这种方式速度快。
4.遍历网址所有链接,不会写任何文件到硬盘,此速度很快
5.指定网址下载文件,爬虫不会去其它链接
6.搜索网站关键词
(算法)工作原理:
1.把开始网址作为起点
2.遍历所有链接
3.对每个链接下载文件
4.重复判断
爬虫很灵活,很多参数可以自己设定。
爬虫有记忆功能,不会采集重复链接或文件
项目测试
1.抓取一个网址的所有链接
选择遍历网址所有链接,不会写任何文件到硬盘,此速度很快
详细资料可以看到链接信息:
可以看到网站的树状结构
项目:选择第一项,创建一个可浏览的网站副本
打开所在文件夹,搜索index,就是主页,双击就可浏览
终止测试:
终止后,项目被放弃,如果再次启动项目,会重新开始
暂停测试
暂停后,
项目被放弃,如果再次启动项目,会重新开始
脚本之家项目2测试,
下载的网页不全,有点打不开
工标网不能每页采集,此软件功能有限,寻找新的软件