Skip to main content

Python 技巧 - 抓取页面并保存为PDF

Python 技巧 - 抓取页面并保存为PDF

Python 技巧 - 抓取页面并保存为PDF

技巧要点记录

1、requests和parsel库的安装

2、获取网页内容

发送一个请求

url = ''

headers = {
    'Host': '',
    'Referer': '',
    'User-Agent': ''
}

cookie = {
    'Cookie': ''
}

response = requests.get(url, headers=headers, cookie=cookie)

print(response.text)

获取到内容

3、pdfkit、wkhtmltopdf库的安装

pip install pdfkit

wkhtmltopdf 请去官网下载 https://wkhtmltopdf.org/downloads.html

4、转换为PDF

pdfkit、wkhtmltopdf库的安装

import pdfkit

config = pdfkit.configuration(wkhtmltopdf='xxx/xxx/wkhtmltopdf.exe')

pdfkit.from_file('xx.html', 'xxx.pdf', configuration=config)

 

版权声明

版权声明

张大鹏 创作并维护的 Walkerfree 博客采用 创作共用保留署名-非商业-禁止演绎4.0国际许可证。本文首发于 Walkerfree 博客(http://www.walkerfree.com/),版权所有,侵权必究。本文永久链接:http://www.walkerfree.com/article/268