推荐使用的是 PyCharm,大部分用的都是这个,还有一部分坚守再sublime text上:
mport urllib
from BeautifulSoup import BeautifulSoup
url = 连接;
allData=
content = urllib.urlopen(url).read()
soup = BeautifulSoup(content)
tags1 = soup.findAll('tr', {class: even right})
tags2 = soup.findAll('tr', {class: odd right})
上面的就是利用写的一些代码,是要取出网页中class 为even right 的所有tr和所有class为odd right的所有tr取出之后就可以打印出他的内容。
tags=soup('a')之后的语句改为
sm=sum( int(s.text) for s in soup.select('span.comments'))
print(sm)
假设你提取的标签如下:
1
2
3
然后,你想要显示所有标签,同时得到1+2+3=6的结果
代码如下:
import urllib2
from bs4 import BeautifulSoup
url='8888888888'
ht = urllib2.urlopen(url).read()
soup = BeautifulSoup(ht,"html.parser")
tags = soup.find_all('span')
print tags #得到所有span标签
lst=[]
for item in tags:
number=int(item.get_text())
lst.append(number)
print lst #可以核对数字是否提取的正确
total=0
for i in range(len(lst)):
total+=lst[i]
i+=1
print total #得到数字总合