使用正则,引入re包
import re
str1 = '200'
result = re.findall(r'(\d+)', str1)
print(result)
用beautifulsoup这个库,配合一起使用,通过xpath定位元素
选中元素,右键然后copy xpath或者css
price=driver.find_element_by_xpath(xpath)
price=driver.find_element_by_css_selector(css)
定位好元素后,price.text 就是你要的元素
提取所有链接应该用循环: urls=driver.find_elements_by_xpath("//a") forurlinurls: print(url.get_attribute("href"))如果get_attribute方法报错应该是没有找到a标签对象,如果确定是有的话,可能是页面加载比较慢还没加载出来,selenium默认是不会等待对象出现的,需要在找对象前加一些等待时间;另外如果页面上有iframe的话需要先切换进去才能找到里面的对象。