实现方法如下:
加载到XmlDocument,查找p子节点(XPath),如果要在子节点内继续查找,用递归;
string patten_block="
[\\s\\S]*
" 用组获取。是python吗?
from lxml import etree
conturl = 'http://www.xxxx.com.cn'
html = httpget(conturl)
假如html是
内容1
内容2
内容3
用jquery做很简单, $(".top1 p").eq(0).html()
再加一个span的话$(".top1 p span").eq(0).html()
.eq()里面可以传个变量
css/选择器分组就可以