230问答网 > C#如何使用正则表达式提取超链接中的文字部分?就是<a>文字部分<⼀a>中间的文字。

C#如何使用正则表达式提取超链接中的文字部分?就是<a>文字部分<⼀a>中间的文字。

有一些超链接还比较复杂，<a></a>中间还有<img>,真心求详细解答。

2024-12-30 07:51:45

推荐回答（1个）

回答1：

string html = 要匹配的字符串;
Regex reg = new Regex(@"]*>([\s\S]+?)", RegexOptions.IgnoreCase);
Match m = reg.Match(html);
while(m.IsSuccess){
string innerHTML = m.Result("$1");// 得到正则的括号里的内容，就是a的innerHTML
innerHTML = Regex.Replace(innerHTML, @"<[^>]*>", "",RegexOptions.IgnoreCase);// 替换掉里面的html，只保留文字

m = m.NextResult;// 循环匹配html里的下一个结果
}