21番茄网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 21番茄网
查看: 698|回复: 0

爬虫find()得出来的是一个列表,因此有的时候,也可以用偏移量来获得希望的数据

[复制链接]

705

主题

923

帖子

3047

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3047
发表于 2020-12-16 11:10:15 | 显示全部楼层 |阅读模式
爬虫find()得出来的是一个列表,因此有的时候,也可以用偏移量来获得希望的数据
import requests
from bs4 import BeautifulSoup

res=requests.get('https://www.meishij.net/chufang/diy/wancan/')    #解析链接
Source_code=res.text          #提取所有源代码
jiexi=BeautifulSoup(Source_code,'html.parser')    #解析成BS类型
#————————————————分项全部抽出—————————————————
Large_partition=jiexi.find_all('div',class_="c1")     #得出来的是一个列表
#——————————————————抽出第0项———————————————
Title1=Large_partition[0]   #抽出列表中的第0个项
print(Title1.find('strong').text)


      在爬虫实践当中,其实常常会因为标签选取不当,或者网页本身的编写没做好板块区分,你可能会多提取到出一些奇怪的东西。

      当遇到这种糟糕的情况,一般有两种处理方案:数量太多而无规律,我们会换个标签提取;数量不多而有规律,我们会对提取的结果进行筛选——只要列表中的若干个元素就好。






上一篇:tag标签的text使用
下一篇:使用requests.get()返回404、418的解决办法,采用Request Headers来避开
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|21番茄网 ( 粤ICP备10099428号 ) 奇远富

GMT+8, 2024-11-1 08:18 , Processed in 0.094786 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表