js 正则匹配（去掉html标签）

2021-03-23 17:27

阅读：811

1，得到网页上的链接地址：

string matchString = @"]+href=\s*(?:‘(?^‘]+)‘|""(?[^""]+)""|(?[^>\s]+))\s*[^>]*>";

2，得到网页的标题：

string matchString = @"(?<title>.*)";

3，去掉网页中的所有的html标记：

string temp = Regex.Replace(html, "]*>", ""); //html是一个要去除html标记的文档

4, string matchString = @"([\S\s\t]*?)";
5, js去掉所有html标记的函数：

function delHtmlTag(str)
{
      return str.replace(/]+>/g,"");//去掉所有的html标记
}

6. 统计字数

t = $(‘.remarktext‘).html().replace(/]+>/g,"").length;

下一篇：Node.js

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：js 正则匹配（去掉html标签）
文章链接：http://soscw.com/index.php/essay/67852.html

亲，登录后才可以留言！