python 爬去拉钩测试招聘信息

2023-01-23 13:51:09
代码如下：
 #coding:utf-8

 import time

 import urllib.request

 from bs4 import BeautifulSoup

 file=open(r'meituancde.txt','w')

 def get_url(i):

     url='https://www.lagou.com/zhaopin/ceshi/%s/?filterOption=%s'%(i,i)

     return url

 def get_html(i):

     headers={

         'User-Agent':'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'

         }

     response=urllib.request.Request(url=get_url(i),headers=headers)

     html=urllib.request.urlopen(response).read().decode('utf-8')

     sopu=BeautifulSoup(html)

     return sopu

 def parse(i):

     soup=get_html(i)

     me=soup.findAll('',{'class':'money'}) #工资

     me1=soup.findAll('',{'class':'format-time'})#发布时间

     me2=soup.findAll('',{'class':'li_b_r'})#福利

     me3=soup.findAll('',{'data-lg-tj-id':'8F00'})#公司名字

     meitu={}

     i=0

     for title in me:

         meitu['gongzi'] =me[i].text

         for jianjie in me1:

             meitu['发布时间']=me1[i].text

             for sellum in me2:

                 meitu['福利']=me2[i].text

                 for pire in me3:

                     meitu['公司名称']=me3[i].text

         i+=1

         print(meitu)

         if len(meitu) !=0:

             file.write(str(meitu))

             file.write("\n")

             file.close

 if __name__ == '__main__':

     for i in range(1,31):
         parse(i)
结果图：
码农公寓

相关文章