用正则,python的代码improt refor i in re.findall('(?:>\n\s+)(.+\s+/>)',字符串,re.S):print i
使用lxml包进行解析,具体用法请看Official Tutorial
你查下lxml和xpath的用法就知道了,python解析xml优美而简单