urllib:http请求库
# urllib, python内置的一个http请求库,不需要额外的安装。只需要关注请求的链接,参数,提供了强大的解析。 import urllib urllb.request #请求模块 urllib.error #异常处理模块 urllib.parse #解析模块
# 导入re库 正则表达式 import re
# 导入random库 随机数 import random
# 网页解析,获取数据 import bs4 from bs4 import BeautifulSoup
# 进行excel操作 import xlwt
# 进行SQLite数据库操作 import sqlite3
# 系统操作,通用的,基本的操作系统交互功能(windows,mac os,linux) import os
# Unicode字符数据库,筛选字符 import unicodedata
# 分词 import jieba
# 绘图,数据可视化,科学绘图,生成图片 from matplotlib import pyplot as plt
# 词云 from wordcloud import wordcloud
# 图像处理 from PIL import Image
# 矩阵运算 import numpy as np