码农公寓

网站首页
编程语言
- Java
- PHP
- C/C++
- IOS
- Android
- C#
- VB
- C语言
- R语言
- 易语言
- css
- html
- js
- JavaScript
- jQuery
- Swift
- ASP.NET
- ASP
- 正则表达式
- vb.net
- Golang
- bat
- VBA
- PowerShell
- Erlang
- autoit
- VBS
- perl
- Lua
- Dos
- Ruby
数据库
服务器知识
系统相关
设计相关
文章分享

首页编程语言html

【python】获取指定网页上的所有超级链接

2023-08-26 23:42:16

# -*- coding: utf-8 -*-

import urllib2

import re

#connect to a URL

website = urllib2.urlopen("http://www.baidu.com")

#read html code

html = website.read()

#use re.findall to get all the links

links = re.findall('"((http|ftp)s?://.*?)"', html)  ###".*?"任意匹配

print links

　　

上一篇：Alpha冲刺报告（9/12）（麻瓜制造者）

下一篇：Promise,Generator（生成器）,async（异步）函数

相关文章

08-26【python】获取指定网页上的所有超级链接
08-26Python获取网页指定内容(BeautifulSoup工具的使用方法)
08-26Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接，并下载这些URL链接的源代码
08-26c# 获取指定目录下的所有文件并显示在网页上
08-26python 动态指定header获取网页源代码的函数

编程语言最新文章

阿里云服务器怎么开启或关闭8080端口？

Python 爬虫IP代理池的实现

centos下nginx启动、重启、关闭

13个Mongodb GUI可视化管理工具，总有一款适合你

SpringBoot和SpringCloud的配置文件的加载(源码级解读)

阿里云服务器设置教程：安装宝塔面板一步到位管理你的ECS

阿里开发者技术交流钉钉群的全向图【2019年】

Linux基础知识——Linux常用命令大全

Github下载速度太慢怎么办？完美解决

当 Kubernetes 遇到阿里云

更多编程技术文章
网站地图

本站所有资源皆搜集自网络，相关版权归版权持有人所有，如有侵权，请电邮告之，本站会尽快删除。

粤ICP备2022053706号

"