爬虫find()得出来的是一个列表,因此有的时候,也可以用偏移量来获得希望的数据
import requests
from bs4 import BeautifulSoup
res=requests.get('https://www.meishij.net/chufang/diy/wancan/') #解析链接
Source_code=res.text #提取所有源代码
jiexi=BeautifulSoup(Source_code,'html.parser') #解析成BS类型
#————————————————分项全部抽出—————————————————
Large_partition=jiexi.find_all('div',class_="c1") #得出来的是一个列表
#——————————————————抽出第0项———————————————
Title1=Large_partition[0] #抽出列表中的第0个项
print(Title1.find('strong').text)
在爬虫实践当中,其实常常会因为标签选取不当,或者网页本身的编写没做好板块区分,你可能会多提取到出一些奇怪的东西。
当遇到这种糟糕的情况,一般有两种处理方案:数量太多而无规律,我们会换个标签提取;数量不多而有规律,我们会对提取的结果进行筛选——只要列表中的若干个元素就好。
|