Typescript爬取网站信息
文中参考:http://www.dell-lee.com/typescript/demo.html?secret=x3b174jsx
搭建爬虫环境
以下命令均在项目根目录的终端执行
- 使用VSCode打开项目文件夹
项目文件夹名为Spider - 初始化项目文件夹
执行命令:npm init -y - 初始化ts运行环境
执行命令:tsc --init - 在项目中安装ts-node
执行命令:npm install --save-dev ts-node - 创建可执行文件
创建文件:./src/crowller.ts - 配置package.json文件
- 在项目文件夹下安装Typescript
执行命令:npm install typescript -D - 安装 superagent 和 翻译文件
执行命令:npm install superagent --save
执行命令:npm i -D @types/superagent
编写爬虫代码
import superaggent from 'superagent'
class Crowller {
private secret = "x3b174jsx";
private url = `http://www.dell-lee.com/typescript/demo.html?secret=${this.secret}`;
private rawHtml = '';
async getRowHtml() {
const result = await superaggent.get(this.url);
console.log(result.text)
}
constructor() {
this.getRowHtml();
}
}
const crowller = new Crowller();
- 运行文件
执行命令:npm run dev - 输出结果