21番茄网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 21番茄网
查看: 675|回复: 0

爬过来的文字带有空格,怎么快速去掉空格(\xa0)?

[复制链接]

650

主题

805

帖子

2706

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2706
发表于 2021-1-22 17:34:36 | 显示全部楼层 |阅读模式
爬过来的文字带有空格,怎么快速去掉空格?

\xa0 是不间断空白符  
在解析静态html网页的时候遇到这种情况,使用如下方案解决:

str = "\xa0你好"
str = "".join(str.split())
print(str)


结果:"你好"





上一篇:js网页,用json取不到数据怎么办?
下一篇:网络爬虫中Cookie的两种使用方式
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|21番茄网 ( 粤ICP备10099428号 ) 奇远富

GMT+8, 2024-5-13 17:09 , Processed in 0.274028 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表