Typescript爬取网站信息

Typescript爬取网站信息

文中参考:http://www.dell-lee.com/typescript/demo.html?secret=x3b174jsx

搭建爬虫环境

以下命令均在项目根目录的终端执行

  1. 使用VSCode打开项目文件夹
    项目文件夹名为Spider
  2. 初始化项目文件夹
    执行命令:npm init -y
  3. 初始化ts运行环境
    执行命令:tsc --init
  4. 在项目中安装ts-node
    执行命令:npm install --save-dev ts-node
  5. 创建可执行文件
    创建文件:./src/crowller.ts
  6. 配置package.json文件
    Typescript爬取网站信息
  7. 在项目文件夹下安装Typescript
    执行命令:npm install typescript -D
  8. 安装 superagent 和 翻译文件
    执行命令:npm install superagent --save
    执行命令:npm i -D @types/superagent

编写爬虫代码

import superaggent from 'superagent'

class Crowller {
    private secret = "x3b174jsx";
    private url = `http://www.dell-lee.com/typescript/demo.html?secret=${this.secret}`;
    private rawHtml = '';

    async getRowHtml() {
        const result = await superaggent.get(this.url);
        console.log(result.text)
    }

    constructor() {
        this.getRowHtml();
    }
}

const crowller = new Crowller();
  1. 运行文件
    执行命令:npm run dev
  2. 输出结果
    Typescript爬取网站信息
上一篇:js实现数字验证码(1.0)


下一篇:TypeScript学习