230问答网 > python中数据清洗后print很多类似<Element span at 0x182d5d05988>的内容，内容怎么提取出来?

python中数据清洗后print很多类似<Element span at 0x182d5d05988>的内容，内容怎么提取出来?

2025-01-02 23:50:39

推荐回答（4个）

回答1：

html = """item1

item2

"""# 使用 scrapy 的Selectorfrom scrapy.selector import Selector # scrapy 的选择器支持 css和xpath选择。下面是css选择器。如果你了解前端JQuery的知识，# 会发现Selector(text=html).css('span::text').extract()# 输出 : ['item1','item2']Selector(text=html).css('span#s1::text').extract()# 输出 : ['item2']Selector(text=html).css('div>span::text').extract()# 输出 : ['item2'] # 使用bs4from bs4 import BeautifulSoup soup = BeautifulSoup(html,'html.parser')sl = soup.find_all("span")result = [span.get_text() for span in sl]print(result)# ['item1', 'item2']

回答2：

利用 tostring 进行提取

回答3：

加·text.如果是数组就先把数组遍历后再加。这是xpath表达式清洗后的吧。

回答4：

要是用VB的话我能做