python中数据清洗后print很多类似<Element span at 0x182d5d05988>的内容,内容怎么提取出来?

2025-01-02 23:50:39
推荐回答(4个)
回答1:

html = """item1

item2
"""# 使用 scrapy 的Selectorfrom scrapy.selector import Selector # scrapy 的选择器支持 css和xpath选择。下面是css选择器。如果你了解前端JQuery的知识,# 会发现Selector(text=html).css('span::text').extract()# 输出 : ['item1','item2']Selector(text=html).css('span#s1::text').extract()# 输出 : ['item2']Selector(text=html).css('div>span::text').extract()# 输出 : ['item2'] # 使用bs4from bs4 import BeautifulSoup soup = BeautifulSoup(html,'html.parser')sl = soup.find_all("span")result = [span.get_text() for span in sl]print(result)# ['item1', 'item2']

回答2:

利用 tostring 进行提取

回答3:

加·text.如果是数组就先把数组遍历后再加。这是xpath表达式清洗后的吧。

回答4:

要是用VB的话我能做