你这个错就错在使用了.*在正则里.*指的是匹配所有字符,而且是匹配优先,对于你这个正则来说到结尾的,不符合,所以就再回头向回一个个的查,一直查到(.*[^>])中的.*匹配.好了,最后你这个表达式最终的结果其实就是匹配以])结尾,中间是任意字符的表达式
]*>(.*?)结果中 组1为连接地址 组2为文字
正则表达式我不熟。这类问题我更喜欢用javascript操作。搜索所有的标签,查找它的href属性和innerHTML