21番茄网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 21番茄网
查看: 645|回复: 0

python用pdfkit生成PDF

[复制链接]

646

主题

799

帖子

2686

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2686
发表于 2021-3-17 12:06:05 | 显示全部楼层 |阅读模式
python pdfkit生成PDF

pdfkit与wkhtmltopdf介绍

pdfkit:
pdfkit,把HTML+CSS格式的文件转换成PDF格式文档的一种工具。

wkhtmltopdf:
pdfkit是基于wkhtmltopdf的python封装,支持URL,本地文件,文本内容到PDF的转换,所以使用pdfkit需要下载wkhtmltopdf。

python用pdfkit生成PDF  Python爬虫精进 1
                               
登录/注册后可看大图


三步实现自动生成pdf文档:

1.使用pip安装pdfkit库
python 版本 3.x,在命令行输入:pip install pdfkit

2.安装wkhtmltopdf.exe文件
下载地址:https://wkhtmltopdf.org/downloads.html

注意:下载后安装,记住安装路径:将bin文件路径添加到系统变量Path中。方法详见:http://www.pc6.com/softview/SoftView_559241.html

3.使用pdfkit库生成pdf文件
pdfkit可以将网页、html文件、字符串生成pdf文件。
网页生成 pdf:(pdfkit.from_url()
import pdfkit   # 导入库

'''将网页生成pdf文件'''
def url_to_pdf(url, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'文件路径'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件,to_file为文件路径
    pdfkit.from_url(url, to_file, configuration=config)
    print('完成')

url_to_pdf(r'url', '输出文件名.pdf')

python用pdfkit生成PDF  Python爬虫精进 1
                               
登录/注册后可看大图


html 文件生成 pdf:(pdfkit.from_file()
import pdfkit

'''将html文件生成pdf文件'''
def html_to_pdf(html, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'文件路径'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件,to_file为文件路径
    pdfkit.from_file(html, to_file, configuration=config)
    print('完成')

html_to_pdf('html文件名.html','输出文件名.pdf')

python用pdfkit生成PDF  Python爬虫精进 1
                               
登录/注册后可看大图


字符串生成 pdf:(pdfkit.from_string()
import pdfkit

'''将字符串生成pdf文件'''
def str_to_pdf(string, to_file):
    # 将wkhtmltopdf.exe程序绝对路径传入config对象
    path_wkthmltopdf = r'文件路径'
    config = pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
    # 生成pdf文件,to_file为文件路径
    pdfkit.from_string(string, to_file, configuration=config)
    print('完成')

str_to_pdf('字符串','输出文件名.pdf')

python用pdfkit生成PDF  Python爬虫精进 1
                               
登录/注册后可看大图


特别注意:如果网页有加密,无法爬取时,用这种方法就无法保存为pdf。










上一篇:将网页保存为html
下一篇:当网页加密或js太多,或加载复杂时,用selenium+pdfkit+wkhtmltopdf保存pdf的方法
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|21番茄网 ( 粤ICP备10099428号 ) 奇远富

GMT+8, 2024-4-24 09:07 , Processed in 0.823673 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表