请选择 进入手机版 | 继续访问电脑版

21番茄网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 21番茄网
查看: 403|回复: 0

当网页加密或js太多,或加载复杂时,用selenium+pdfkit+wkhtmltopdf保存pdf的方法

[复制链接]

604

主题

753

帖子

2430

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2430
发表于 2021-3-17 16:11:11 | 显示全部楼层 |阅读模式
当网页加密或js太多,或加载复杂时,用selenium+pdfkit+wkhtmltopdf保存pdf的方法

from selenium import webdriver
import pdfkit
import time
driver = webdriver.Chrome()       # 设置引擎为Chrome,真实地打开一个Chrome浏览器

#————————————打开浏览器并获取所有网页代码—————————————
driver.get('https://www.kancloud.cn/rhinostudio/ghuse100/1665412')     # 访问页面
time.sleep(2)       # 暂停两秒,等待浏览器缓冲
pageSource = driver.page_source       # 获取完整渲染的网页源代码

#——————————————————保存为pdf——————————————————
exe=pdfkit.configuration(wkhtmltopdf=r'D:\ProgramData\Anaconda3\wkhtmltopdf\bin\wkhtmltopdf.exe')      #指定wkhtmltopdf.exe的路径
path=r'C:\Users\kw196515\Desktop\grasshopper100个电池讲解'+'\\'       #文件夹路径
name=path+'1'+'.pdf'       #文件保存路径名称

pdfkit.from_string(pageSource,output_path=name,configuration=exe)     #字符串保存为pdf的操作









上一篇:python用pdfkit生成PDF
下一篇:网页保存为图片
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|21番茄网 ( 粤ICP备10099428号 ) 奇远富

GMT+8, 2022-5-17 09:19 , Processed in 0.128588 second(s), 30 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表