python scrapy to excel

from openpyxl import Workbook

class TuniuPipeline(object):  # 设置工序一
    self.wb = Workbook()
    self.ws = self.wb.active
    self.ws.append(['新闻标题', '新闻链接', '来源网站', '发布时间', '相似新闻', '是否含有网站名'])  # 设置表头


def process_item(self, item, spider):  # 工序具体内容
    line = [item['title'], item['link'], item['source'], item['pub_date'], item['similar'], item['in_title']]  # 把数据中每一项整理出来
    self.ws.append(line)  # 将数据以行的形式添加到xlsx中
    self.wb.save('/home/alexkh/tuniu.xlsx')  # 保存xlsx文件
    return item
import time
import xlsxwriter
import xlrd
from xlutils.copy import copy
from datetime import datetime
from openpyxl import Workbook
import sys
file=datetime.now().strftime('%Y%m%d%H%M%S')+".xlsx"
wb=Workbook()
ws=wb.active
ws['a1']=42
ws.append(['科比', '1997年', '后卫', '赛季报销'])  # 添加一行数据

wb.save(file)  # 保存文件

 

上一篇:豆瓣Top250


下一篇:网页爬虫教程