python 用 beautifulsoup 获得 <div id="z"><⼀div>的东西

2024-12-21 22:35:09
推荐回答(1个)
回答1:

一、你取到的跟浏览器不一样,这一般是因为内容是js生成或者js以ajax取到然后更新进去的。
想要自己写代码解决恐怕你要自己分析一下网页所带的js的功能了,或者想偷懒的话用webbrowser之类的模块通过浏览器来取得内容。
二、要取div的id属性用BeautifulSoup即可达到目的,要是装了PyQuery的就更简单,下面给个BeautifulSoup的例子:
from bs4 import BeautifulSoup
sp = BeautifulSoup('

')
assert(sp.div['id'],'z')
print sp.div['id']