小说下载脚本

 

================================

工具准备:

================================
下载与 chome 浏览器版本一致的 chromedriver, chromedriver 国内下载镜像
https://npm.taobao.org/mirrors/chromedriver

将 chromedriver.exe 复制到 python 的scripts目录中, 比如 C:\Anaconda3\Scripts\
并将C:\Anaconda3\Scripts\加到Windows 环境变量PATH 中.  

 


================================
安装 selenium python 包

================================

pip install selenium

 

================================
下载脚本

================================

from selenium import webdriver
web = webdriver.Chrome()
full_text="小说:重生之庶女悠然"
full_text=full_text+"\n" +"\n" +"\n"
home_url="https://www.bxwx123.com/novel/gvWcH/"
#web.get('https://www.bxwx123.com/novel/gvWcH/1.html')
chapter_start=1
chapter_end=32
for i in range(chapter_start,chapter_end+1):
    url=home_url+str(i)+".html"
    #print("第"+str(i)+"章")
    full_text=full_text+"\n" +"\n" +"\n" +"======================"+"\n"+"第"+str(i)+"章"+ "\n"
    web.get(url)
    #'<div id="content" class="showtxt">
    content_tag = web.find_element_by_class_name("showtxt")
    content = content_tag.text
    full_text=full_text+content
print(full_text)
web.close()

 

上一篇:Categorical variable(类别变量)学习笔记


下一篇:《深入理解Java虚拟机》(六) 调优策略 -- 笔记