Java 正则表达式 提取html超链接

2024-12-15 16:36:21
推荐回答(3个)
回答1:

你这个错就错在使用了.*
在正则里.*指的是匹配所有字符,而且是匹配优先,对于你这个正则来说到结尾的,不符合,所以就再回头向回一个个的查,一直查到(.*[^>])中的.*匹配.
好了,最后你这个表达式最终的结果其实就是匹配以])结尾,中间是任意字符的表达式

回答2:

]*>(.*?)

结果中 组1为连接地址 组2为文字

回答3:

正则表达式我不熟。
这类问题我更喜欢用javascript操作。
搜索所有的标签,查找它的href属性和innerHTML