C#如何使用正则表达式提取超链接中的文字部分?就是<a>文字部分<⼀a>中间的文字。

有一些超链接还比较复杂,&lt;a&gt;&lt;/a&gt;中间还有&lt;img&gt;,真心求详细解答。
2024-12-30 07:51:45
推荐回答(1个)
回答1:

string html = 要匹配的字符串;
Regex reg = new Regex(@"]*>([\s\S]+?)", RegexOptions.IgnoreCase);
Match m = reg.Match(html);
while(m.IsSuccess){
string innerHTML = m.Result("$1");// 得到正则的括号里的内容,就是a的innerHTML
innerHTML = Regex.Replace(innerHTML, @"<[^>]*>", "",RegexOptions.IgnoreCase);// 替换掉里面的html,只保留文字

m = m.NextResult;// 循环匹配html里的下一个结果
}