21番茄网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 21番茄网
查看: 732|回复: 0

selenium库

[复制链接]

650

主题

805

帖子

2706

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2706
发表于 2021-1-21 15:58:39 | 显示全部楼层 |阅读模式

selenium库

使用selenium时,我们是将浏览器打开,等待所有数据都加载到Elements中之后,再把这个网页当做静态网页爬取

获取数据的格式是这样的

selenium库  Python爬虫精进 155509jhrx3xgemrxhhqxz


使用selenium时,解析和提取是同步的,提取数据的方法有以下几种


selenium库  Python爬虫精进 155539a9mhfs5mux0m4v1v


如果把方法中的element换成复数elements,可以提取多个元素


需要注意的是,用elements提取出来后,返回的是一个列表,需要再把列表内的元素取出来才能继续进一步的操作哦


selenium库  Python爬虫精进 155626qtxu4ezemellfxmf


当然,我们使用自动打开浏览器后,当然也希望浏览器帮我们做一些自动点击和输入的操作


selenium库  Python爬虫精进 155704cuu2zwlnei422une


Selenium操作元素的方法有这么几种


主要使用的还是模拟按键输入,以及点击元素这两个


但是,如果在做爬虫时,不需要打开浏览器,爬虫的目的是爬到数据,而不是观看浏览器的操作过程,在这种情况下,就可以使用浏览器的静默模式


selenium库  Python爬虫精进 155756l728n8apzqe272cz


selenium库  Python爬虫精进 155803xqkfpktfy78kbfiz


总结一下,使用selenium的过程是这样的


selenium库  Python爬虫精进 155830hkalikliuyiahd25







上一篇:多协程主要信息总结
下一篇:爬虫思维导图
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|21番茄网 ( 粤ICP备10099428号 ) 奇远富

GMT+8, 2024-5-16 00:01 , Processed in 1.016253 second(s), 74 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表